Formation auto-rythmée de Databricks : un guide d'auto-habilitation sur le Big Data et l'IA

Formations à votre rythme sont proposés par Databrick à l’intérieur de leur programme de l’Académie. Le prix est de 2000$ USD pour un accès illimité aux formations pendant une durée de 1 an, mais aussi gratuit pour les clients et partenaires qualifiés. La liste des cours disponibles est présentée par ordre alphabétique et peut évoluer dans le temps. Au moment de cette publication, il existe 71 cours, conçus pour les cinq principales personnalités du Big Data et de l’IA. Cet article servira de guide pour vous aider à construire votre propre programme d’apprentissage.

Merci à l’équipe Databricks, en particulier Taggart McCurdy, pour vos commentaires, vos critiques et votre contribution à cet article. Adaltas est un Partenaire Databricks situé en France. N’hésitez pas à Nous contacter pour des informations complémentaires.

Nous vous proposons la démarche suivante :

  • Passez les cours fondamentaux de haut niveau, qui sont inclus dans tous les parcours d’apprentissage, et fournissez des informations de haut niveau sur l’espace des données et de l’IA qui sont pertinentes pour tout le monde.
  • Choisissez un métier et son parcours de formation correspondant parmi les suivants :
    • Chef d’entreprise
    • Analyste SQL
    • Administrateur de plateforme
    • Scientifique des données
    • Ingénieur de données
  • Réussir la formation principale, complémentaire et qualifiante du parcours choisi.
  • Veuillez noter que les personnages Administrateur de plate-forme, Scientifique des données et Ingénieur des données ont également des certifications que vous pouvez obtenir, qui incluent des badges numériques.

Chaque parcours que nous proposons ici est conçu comme une succession de plusieurs parcours classés en trois groupes : principale, Additionnel et accréditation. La principale les cours vous aident à construire progressivement les connaissances fondamentales pour chaque parcours connexe. La Additionnel les cours éclairent des sujets très précis et seront le plus souvent utiles pour combler certaines lacunes. Finalement, le accréditations sont là pour mettre en pratique et valider les connaissances acquises lors de votre formation.

D’un point de vue pratique, gardez à l’esprit que certains des cours suivants nécessitent des ressources supplémentaires non fournies par Databricks. Nous préciserons les exigences nécessaires si nécessaire.

La place des formations à votre rythme dans le programme d’apprentissage proposé par Databricks est illustrée par l’image ci-dessous. Le contour vert indique les domaines couverts par ces cours.




Parcours d'apprentissage Databricks

Les cours à votre rythme vous donnent la possibilité d’acquérir trois accréditations et de vous préparer à des formations et des ateliers plus avancés. Nous pourrions recommander les cours à votre rythme comme base solide de votre éducation.

Cours fondamentaux de haut niveau pour tous les parcours d’apprentissage

Si vous venez de commencer votre voyage Big Data & AI et que vous ne connaissez pas grand-chose aux solutions proposées par Databricks, vous devriez commencer par ce chemin. Il vous apportera toutes les connaissances nécessaires en Big Data & IA et la plateforme Databricks pour évoluer vers des rôles plus avancés et tirer parti des possibilités de la plateforme Databricks. Tous ces cours peuvent être suivis avec un compte gratuit Databricks community edition.

Plats principaux

Des cours supplémentaires

Accréditations

Parcours d’apprentissage des chefs d’entreprise

Les cours du Business Leader Learning Path proposent une formation de haut niveau sur plusieurs thématiques liées au Data Engineering et à la Data Science. Ce parcours correspond parfaitement aux personnes ayant une expérience dans la gestion de projets Big Data & IA mais souhaitant acquérir toutes les connaissances techniques fondamentales nécessaires à l’utilisation des solutions Databricks. Tous les cours peuvent être suivis avec un compte Databricks Community Edition gratuit.

Des cours supplémentaires

Parcours d’apprentissage de l’analyste SQL

Si vous souhaitez acquérir des connaissances en analyse de données à l’aide des produits SQL et Databricks, vous devez définitivement vous attaquer à ce parcours d’apprentissage. Il contient plusieurs cours décrivant comment Databricks exploite Spark et SQL pour effectuer des ETL et des analyses de données. Certains cours nécessitent toutefois l’utilisation de Analyse SQL Databricks qui n’est toujours pas ouvert au public mais disponible sur demande sur leur site internet.

Plats principaux

Des cours supplémentaires

Accréditations

Parcours d’apprentissage de l’administrateur de plate-forme

Le chemin d’accès de l’administrateur de la plate-forme fournit les connaissances nécessaires sur la gestion et l’administration des clusters sur Databricks. Il est conseillé d’avoir une bonne connaissance et une expérience pratique du Big Data, des Databricks et du Cloud Engineering avant de choisir cette voie. Étant donné que ces cours nécessitent l’utilisation de fournisseurs Cloud et de privilèges avancés sur la plate-forme Databricks, ils peuvent entraîner des coûts supplémentaires pour provisionner les ressources Cloud. Nous rassemblons et décrivons toutes les exigences dans le tableau ci-dessous. Ce parcours d’apprentissage aura également une certification disponible entre le milieu et la fin de 2021.

Plats principaux

Des cours supplémentaires

Cours nécessitant un compte spécial

Cours Conditions
Déploiement de l’espace de travail AWS Databricks Compte Databricks avec autorisations de propriétaire de compte
Gestion de l’accès aux identités AWS Databricks Déploiement de l’espace de travail Databricks avec droits d’administrateur
Gestion de l’accès aux données AWS Databricks Forfait Premium Databricks
Collecte : Administration de l’espace de travail AWS Databricks Forfait Premium Databricks ; Droits d’administrateur pour un espace de travail AWS Databricks
Administration d’AWS Databricks SQL Analytics Compte Databricks sur le plan Premium (avec SQL Analytics activé) ; Informations d’identification d’administrateur sur l’espace de travail Databricks de votre organisation
Déploiement de l’espace de travail Azure Databricks Accéder à la console d’administration dans l’espace de travail Azure Databricks déployé
Gestion de l’accès aux données Azure Databricks Forfait Premium Azure Databricks
Collection : Administration de l’espace de travail Azure Databricks Forfait Premium Azure Databricks ; Droits d’administrateur pour un espace de travail Azure Databricks
Administration d’Azure Databricks SQL Analytics Compte Databricks sur le plan Premium (avec SQL Analytics activé) ; Informations d’identification d’administrateur sur l’espace de travail Databricks de votre organisation

Parcours d’apprentissage Data Scientist

Le parcours Data Scientist ne consiste pas à vous apprendre à devenir un Data Scientist ! Au lieu de cela, il vous montrera (i) comment tirer parti de la plate-forme Databricks pour effectuer une analyse exploratoire des données, (ii) former et tester vos modèles à l’aide de Spark et (iii) les suivre et les déployer à l’aide de MLflow. Par conséquent, ce cours s’adapte parfaitement aux personnes ayant une expérience en Data Science et souhaitant affiner leurs outils sur la plateforme Databricks. Ce chemin contient beaucoup de contenu supplémentaire qui permettra à l’apprenant de rafraîchir certaines connaissances et de combler certaines lacunes si nécessaire. A noter, un cours complémentaire prépare également le stagiaire à la Développeur associé certifié Databricks pour l’examen Apache Spark. Tous les cours peuvent être suivis avec un compte Databricks Community Edition gratuit.

Plats principaux

Des cours supplémentaires

Parcours d’apprentissage de l’ingénieur de données

Les ingénieurs de données juniors ou seniors qui souhaitent maîtriser les outils proposés par Databricks pour l’ingénierie des données devraient emprunter cette voie. Les cours couvriront toutes les connaissances nécessaires pour utiliser correctement Spark afin de concevoir des pipelines de données. Les deux cours principaux fourniront des connaissances détaillées sur les API Spark (Scala et Python) et présenteront également le fonctionnement interne de l’architecture Spark nécessaire à la conception de pipelines optimisés. Comme pour le parcours Data Scientist, de nombreux cours complémentaires sont associés pour compléter votre formation ou préparer le Développeur associé certifié Databricks pour l’examen Apache Spark. La plupart des cours peuvent être suivis avec un compte gratuit Databricks Community Edition.

Des cours supplémentaires

Conclusion

Nous vous proposons ici une manière d’organiser votre parcours d’apprentissage pour monter en compétence pour utiliser la plateforme Databricks dans différents contextes professionnels. Visez un objectif et plongez dans l’une de ces voies. Sachez que certains des cours mentionnés ci-dessus peuvent nécessiter des coûts supplémentaires et ceux-ci doivent être anticipés avant de décider de commencer l’un d’entre eux. Gardez à l’esprit que nous mettrons à jour cet article au fur et à mesure que Databrick ajoutera du contenu et modifiera ses offres d’apprentissage en ligne.

Leave a Reply