Johns Hopkins University
Spécialisation Science des données
Johns Hopkins University

Spécialisation Science des données

Lancez votre carrière dans la science des données. Une introduction à la science des données en dix cours, développée et enseignée par d'éminents professeurs.

Roger D. Peng, PhD
Brian Caffo, PhD
Jeff Leek, PhD

Instructeurs : Roger D. Peng, PhD

504 115 déjà inscrits

Inclus avec Coursera Plus

Approfondissez votre connaissance d’un sujet
4.5

(38,836 avis)

niveau Débutant

Expérience recommandée

7 mois à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme
Approfondissez votre connaissance d’un sujet
4.5

(38,836 avis)

niveau Débutant

Expérience recommandée

7 mois à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Utilisez R pour nettoyer, analyser et visualiser des données.

  • Parcourez l'ensemble du pipeline de la science des données, de l'acquisition des données à la publication.

  • Utilisez GitHub pour gérer les projets de science des données.

  • Effectuer des analyses de régression, des moindres carrés et des déductions à l'aide de modèles de régression.

Compétences que vous acquerrez

  • Catégorie : GitHub
  • Catégorie : Analyse exploratoire des données (AED)
  • Catégorie : Contrôle des versions
  • Catégorie : Shiny (Package (R))
  • Catégorie : Inférence statistique
  • Catégorie : Algorithmes d'apprentissage automatique
  • Catégorie : Data wrangling
  • Catégorie : Modélisation prédictive
  • Catégorie : Visualisation interactive des données
  • Catégorie : Analyse de régression
  • Catégorie : La programmation en R
  • Catégorie : Science des données

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Enseigné en Anglais

Améliorez votre expertise en la matière

  • Acquérez des compétences recherchées auprès d’universités et d’experts du secteur
  • Maîtrisez un sujet ou un outil avec des projets pratiques
  • Développez une compréhension approfondie de concepts clés
  • Obtenez un certificat professionnel auprès de Johns Hopkins University

Spécialisation - série de 10 cours

Ce que vous apprendrez

  • Installer R, R-Studio, Github et d'autres outils utiles

  • Comprendre les données, les problèmes et les outils utilisés par les analystes de données

  • Expliquer les concepts essentiels de la conception d'une étude

  • Créer un dépôt Github

Compétences que vous acquerrez

Catégorie : Science des données
Catégorie : La programmation en R
Catégorie : Rmarkdown
Catégorie : R (logiciel)
Catégorie : Analyse des Données
Catégorie : Contrôle des versions
Catégorie : Analyse exploratoire des données (AED)
Catégorie : GitHub
Catégorie : Installation du logiciel
Catégorie : Programmation Statistique
Catégorie : Maîtrise des données
La programmation en R

La programmation en R

COURS 257 heures

Ce que vous apprendrez

  • Comprendre les concepts essentiels des langages de programmation

  • Configurer le logiciel de programmation statistique

  • Utiliser les fonctions de boucle et les outils de débogage de R

  • Recueillir des informations détaillées à l'aide du profileur R

Compétences que vous acquerrez

Catégorie : La programmation en R
Catégorie : Simulations
Catégorie : Optimisation des performances
Catégorie : Débogage
Catégorie : Importation/exportation de données
Catégorie : Programmation Statistique
Catégorie : structures de données
Catégorie : Analyse statistique
Catégorie : Développement du programme
Catégorie : Analyse des Données
Catégorie : Principes de programmation
Catégorie : Outils de programmation informatique

Ce que vous apprendrez

  • Comprendre les systèmes de stockage de données les plus courants

  • Appliquer les principes de base du nettoyage des données pour les mettre en ordre

  • Utilisez R pour la manipulation de textes et de dates

  • Obtenir des données utilisables à partir du web, des API et des bases de données

Compétences que vous acquerrez

Catégorie : Manipulation de données
Catégorie : La programmation en R
Catégorie : Nettoyage des données
Catégorie : Importation/exportation de données
Catégorie : SQL
Catégorie : Gestion des données
Catégorie : Data wrangling
Catégorie : Interface de programmation d'application (API)
Catégorie : MySQL
Catégorie : Collecte de données
Catégorie : Web scraping

Ce que vous apprendrez

  • Comprendre les graphiques analytiques et le système de traçage de base dans R

  • Utiliser des systèmes graphiques avancés tels que le système Lattice

  • Réaliser des représentations graphiques de données à très haute dimension

  • Appliquer des techniques d'analyse en grappes pour repérer des modèles dans les données

Compétences que vous acquerrez

Catégorie : Ggplot2
Catégorie : Tracé (graphique)
Catégorie : La programmation en R
Catégorie : Analyse exploratoire des données (AED)
Catégorie : Diagrammes de dispersion
Catégorie : Logiciel de Visualisation de Données
Catégorie : Histogramme
Catégorie : Graphiques en boîte
Catégorie : Visualisation statistique
Catégorie : Analyse des Données
Catégorie : Apprentissage non supervisé
Catégorie : Réduction de dimensionnalité
Catégorie : Méthodes statistiques
Recherche reproductible

Recherche reproductible

COURS 57 heures

Ce que vous apprendrez

  • Organiser l'analyse des données pour la rendre plus reproductible

  • Rédiger une analyse de données reproductible à l'aide de knitr

  • Déterminer la reproductibilité du projet d'analyse

  • Publier des documents web reproductibles à l'aide de Markdown

Compétences que vous acquerrez

Catégorie : Knitr
Catégorie : Rmarkdown
Catégorie : Validation des données
Catégorie : Analyse des Données
Catégorie : Science et recherche générales
Catégorie : Partage des données
Catégorie : La programmation en R
Catégorie : Contrôle des versions
Catégorie : Communication technique
Catégorie : Rapports statistiques
Catégorie : Analyse exploratoire des données (AED)
Inférence statistique

Inférence statistique

COURS 655 heures

Ce que vous apprendrez

  • Comprendre le processus consistant à tirer des conclusions sur des populations ou des vérités scientifiques à partir de données

  • Décrire la variabilité, les distributions, les limites et les intervalles de confiance

  • Utiliser les valeurs p, les intervalles de confiance et les tests de permutation

  • Prendre des décisions éclairées en matière d'analyse des données

Compétences que vous acquerrez

Catégorie : Inférence statistique
Catégorie : Distribution de probabilité
Catégorie : Probabilité
Catégorie : Tests d'hypothèses statistiques
Catégorie : Méthodes statistiques
Catégorie : Analyse statistique
Catégorie : Statistiques bayésiennes
Catégorie : Probabilités et statistiques
Catégorie : Modélisation statistique
Catégorie : Analyse des Données
Catégorie : Statistiques
Catégorie : Échantillonnage (statistiques)
Catégorie : Détermination de la taille de l'échantillon
Modèles de régression

Modèles de régression

COURS 753 heures

Ce que vous apprendrez

  • Utiliser l'analyse de régression, les moindres carrés et l'inférence

  • Comprendre les cas de modèles ANOVA et ANCOVA

  • Étudier l'analyse des résidus et de la variabilité

  • Décrire les nouvelles utilisations des modèles de régression, telles que le lissage du nuage de points

Compétences que vous acquerrez

Catégorie : Analyse de régression
Catégorie : Modélisation statistique
Catégorie : Analyse de corrélation
Catégorie : Inférence statistique
Catégorie : Analyse des Données
Catégorie : Méthodes statistiques
Catégorie : Modélisation prédictive
Catégorie : Probabilités et statistiques
Catégorie : Analyse statistique

Ce que vous apprendrez

  • Utiliser les éléments de base de la construction et de l'application des fonctions de prédiction

  • Comprendre des concepts tels que les ensembles d'entraînement et de test, l'ajustement excessif et les taux d'erreur

  • Décrire les méthodes d'apprentissage automatique telles que la régression ou les arbres de classification

  • Expliquez le processus complet de construction des fonctions de prédiction

Compétences que vous acquerrez

Catégorie : Algorithme de forêt aléatoire
Catégorie : Modélisation prédictive
Catégorie : Arbre de classification et de régression (CART)
Catégorie : Algorithmes d'apprentissage automatique
Catégorie : La programmation en R
Catégorie : Ingénierie des caractéristiques
Catégorie : Analyse de régression
Catégorie : Collecte de données
Catégorie : Analyse prédictive
Catégorie : Apprentissage automatique appliqué
Catégorie : Traitement des données
Catégorie : Apprentissage supervisé
Catégorie : Apprentissage automatique

Ce que vous apprendrez

  • Développer des applications de base et des graphiques interactifs à l'aide de GoogleVis

  • Utilisez Leaflet pour créer des cartes interactives annotées

  • Construire une présentation R Markdown qui inclut une visualisation de données

  • Créer un produit de données qui raconte une histoire à un large public

Compétences que vous acquerrez

Catégorie : La programmation en R
Catégorie : Visualisation interactive des données
Catégorie : Shiny (Package (R))
Catégorie : Rmarkdown
Catégorie : Rapports statistiques
Catégorie : Applications Web
Catégorie : R (logiciel)
Catégorie : Logiciel de Visualisation de Données
Catégorie : Plotly
Catégorie : Visualisation de Données
Catégorie : Gestion des paquets et des logiciels
Catégorie : Cartographie des données
Catégorie : Présentation des données

Ce que vous apprendrez

  • Créer un produit de données utile pour le public

  • Appliquer vos compétences en matière d'analyse exploratoire des données

  • Construire un modèle de prédiction efficace et précis

  • Produire un dossier de présentation pour exposer vos résultats

Compétences que vous acquerrez

Catégorie : Traitement du langage naturel (NLP)
Catégorie : Modélisation prédictive
Catégorie : Analyse des Données
Catégorie : Apprentissage automatique
Catégorie : Collecte de données
Catégorie : Analyse exploratoire des données (AED)
Catégorie : Storytelling de données
Catégorie : Manipulation de données
Catégorie : Présentation des données
Catégorie : Analyse statistique
Catégorie : La programmation en R
Catégorie : Science des données
Catégorie : Nettoyage des données

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeurs

Roger D. Peng, PhD
Johns Hopkins University
37 Cours1 659 808 apprenants
Brian Caffo, PhD
Johns Hopkins University
30 Cours1 688 342 apprenants
Jeff Leek, PhD
Johns Hopkins University
32 Cours1 724 504 apprenants

Offert par

Partenaires du secteur

Partenaire 1
Partenaire 2

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’
Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’
Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’
Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’
Coursera Plus

Ouvrez de nouvelles portes avec Coursera Plus

Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.

Faites progresser votre carrière avec un diplôme en ligne

Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne

Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires

Améliorez les compétences de vos employés pour exceller dans l’économie numérique

Foire Aux Questions