September 19, 2024

Biotechnologie News

Classe Mondiale Technologie

Stage printemps 2022 – création d’un Data Lab

Stage printemps 2022 – création d’un Data Lab

Description de l’emploi

Au cours des dernières années, nous avons développé la capacité d’utiliser des ordinateurs pour traiter de grandes quantités de données. L’écosystème a évolué autour d’une large offre d’outils et de bibliothèques et de la création du domaine de la science des données. Connecter tous ces composants dans une plate-forme cohérente et sécurisée est une tâche ardue. Les nouveaux arrivants, ainsi que les utilisateurs plus expérimentés, bénéficient de plates-formes qui offrent une expérience de développement de premier ordre.

Data Labs fournit aux développeurs une suite complète de logiciels pour les aider à explorer, visualiser, traiter et exposer les données. À l’aide de leurs langages préférés tels que Python, JavaScript ou SQL, ils créent des pipelines pour collecter et stocker des données, créer des tableaux de bord de visualisation et déployer des modèles d’apprentissage automatique.

Dans le cadre de votre stage, vous assemblerez plusieurs technologies open source pour fournir aux data scientists un environnement moderne adapté à leurs besoins. Les scientifiques des données attendent une interface Web conviviale pour provisionner leurs éditeurs de développement préférés, la possibilité d’utiliser leurs bibliothèques préférées sans restriction dans un environnement isolé et autonome, la mise à l’échelle des ressources en fonction de leurs besoins et la possibilité de pousser leur code en fabrication.

La plate-forme Datalab s’appuie sur la flexibilité Kubernetes backend couplé à un stockage de documents compatible avec toute interface standard S3. Les conteneurs à la demande doivent être provisionnés et couvrir un large panel de bases de données (Recherche élastique, MongoDB, PostgreSQLName…), environnements (TensorFlow, VSCode, JupyterName, RStudio…), et des outils complémentaires tels que la gestion des secrets avec Sauterapprovisionnement automatisé avec Argo CD, Connexion OpenID authentification avec Porte-clésplanification de flux de travail, publication d’API, …

Durant ce stage, vous vous familiariserez avec le Kubernetes et le CNCF écosystème, acquérir une compréhension approfondie des rôles et des responsabilités attendus des Data Scientists et devenir à l’aise pour répondre à leurs besoins. Vous intégrerez une équipe agile dirigée par un Experte en science des données.

De plus, vous obtiendrez à la fin du stage une certification d’un Fournisseur de cloudet un Databrick certification.

Présentation de la société

Adaltas est une agence de conseil dirigée par une équipe d’experts open source spécialisés dans la gestion des données. Nous déployons et opérons les infrastructures de stockage et de calcul en collaboration avec nos clients.

Partenaire de Cloudera et Databricks, nous sommes également des contributeurs open source. Nous vous invitons à parcourir notre site et nos nombreuses publications techniques pour en savoir plus sur l’entreprise.

Responsabilités

  • Comprendre et répondre au besoin de science des données
  • apprendre les différentes pièces mobiles d’un Datalab
  • Déployer le Datalab dans un cluster Kubernetes
  • Déployer des flux de travail d’apprentissage automatique

Qualifications attendues

  • Ecole d’ingénieur, stage de fin d’études
  • Analytique et structuré
  • Autonome et curieux
  • Vous êtes une personne ouverte d’esprit qui aime partager, communiquer et apprendre des autres
  • Bonne connaissance des systèmes Python, Spark et Linux

Vous serez en charge de comprendre l’architecture et de l’intégrer à une infrastructure existante. Vous travaillerez avec InfraOps et des data scientists. Nous recherchons une personne qui développera des compétences sur les outils et solutions suivants :

Toutes les expériences complémentaires sont précieuses.

Informations Complémentaires

  • Emplacement: Boulogne-Billancourt, France
  • Langues : français ou anglais
  • Début : Février 2022
  • Durée : 6 mois
  • Télétravail : possibilité de travailler 2 jours par semaine à distance

Matériel disponible

Un ordinateur portable avec les caractéristiques suivantes :

  • 32 Go de RAM
  • SSD 1 To
  • Processeur 8c/16t

Un cluster composé de :

  • 3x 28c/56t Intel Xeon Scalable Gold 6132
  • 3x 192 To de RAM DDR4 ECC 2666 MHz
  • 3x 14 SSD 480GB SATA Intel S4500 6Gbps

Un cluster Kubernetes.

Rémunération

  • Salaire 1200€/mois
  • Tickets restaurants
  • Laissez-passer de transport
  • Participation à une conférence internationale

Dans le passé, les conférences auxquelles nous avons assisté comprenaient la KubeCon organisé par la fondation CNCF, le Sommet Open Source de la Linux Foundation et de la Fosdem.

Pour toute demande d’informations complémentaires et pour déposer votre candidature, merci de contacter David Worms :