Stage printemps 2022 – création d’un Data Lab

Table of Contents

Description de l’emploi

Au cours des dernières années, nous avons développé la capacité d’utiliser des ordinateurs pour traiter de grandes quantités de données. L’écosystème a évolué autour d’une large offre d’outils et de bibliothèques et de la création du domaine de la science des données. Connecter tous ces composants dans une plate-forme cohérente et sécurisée est une tâche ardue. Les nouveaux arrivants, ainsi que les utilisateurs plus expérimentés, bénéficient de plates-formes qui offrent une expérience de développement de premier ordre.

Data Labs fournit aux développeurs une suite complète de logiciels pour les aider à explorer, visualiser, traiter et exposer les données. À l’aide de leurs langages préférés tels que Python, JavaScript ou SQL, ils créent des pipelines pour collecter et stocker des données, créer des tableaux de bord de visualisation et déployer des modèles d’apprentissage automatique.

Dans le cadre de votre stage, vous assemblerez plusieurs technologies open source pour fournir aux data scientists un environnement moderne adapté à leurs besoins. Les scientifiques des données attendent une interface Web conviviale pour provisionner leurs éditeurs de développement préférés, la possibilité d’utiliser leurs bibliothèques préférées sans restriction dans un environnement isolé et autonome, la mise à l’échelle des ressources en fonction de leurs besoins et la possibilité de pousser leur code en fabrication.

La plate-forme Datalab s’appuie sur la flexibilité Kubernetes backend couplé à un stockage de documents compatible avec toute interface standard S3. Les conteneurs à la demande doivent être provisionnés et couvrir un large panel de bases de données (Recherche élastique, MongoDB, PostgreSQLName…), environnements (TensorFlow, VSCode, JupyterName, RStudio…), et des outils complémentaires tels que la gestion des secrets avec Sauterapprovisionnement automatisé avec Argo CD, Connexion OpenID authentification avec Porte-clésplanification de flux de travail, publication d’API, …

Durant ce stage, vous vous familiariserez avec le Kubernetes et le CNCF écosystème, acquérir une compréhension approfondie des rôles et des responsabilités attendus des Data Scientists et devenir à l’aise pour répondre à leurs besoins. Vous intégrerez une équipe agile dirigée par un Experte en science des données.

De plus, vous obtiendrez à la fin du stage une certification d’un Fournisseur de cloudet un Databrick certification.

Présentation de la société

Adaltas est une agence de conseil dirigée par une équipe d’experts open source spécialisés dans la gestion des données. Nous déployons et opérons les infrastructures de stockage et de calcul en collaboration avec nos clients.

Partenaire de Cloudera et Databricks, nous sommes également des contributeurs open source. Nous vous invitons à parcourir notre site et nos nombreuses publications techniques pour en savoir plus sur l’entreprise.

Responsabilités

Comprendre et répondre au besoin de science des données
apprendre les différentes pièces mobiles d’un Datalab
Déployer le Datalab dans un cluster Kubernetes
Déployer des flux de travail d’apprentissage automatique

Qualifications attendues

Ecole d’ingénieur, stage de fin d’études
Analytique et structuré
Autonome et curieux
Vous êtes une personne ouverte d’esprit qui aime partager, communiquer et apprendre des autres
Bonne connaissance des systèmes Python, Spark et Linux

Vous serez en charge de comprendre l’architecture et de l’intégrer à une infrastructure existante. Vous travaillerez avec InfraOps et des data scientists. Nous recherchons une personne qui développera des compétences sur les outils et solutions suivants :

Toutes les expériences complémentaires sont précieuses.

Informations Complémentaires

Emplacement: Boulogne-Billancourt, France
Langues : français ou anglais
Début : Février 2022
Durée : 6 mois
Télétravail : possibilité de travailler 2 jours par semaine à distance

Matériel disponible

Un ordinateur portable avec les caractéristiques suivantes :

32 Go de RAM
SSD 1 To
Processeur 8c/16t

Un cluster composé de :

3x 28c/56t Intel Xeon Scalable Gold 6132
3x 192 To de RAM DDR4 ECC 2666 MHz
3x 14 SSD 480GB SATA Intel S4500 6Gbps

Un cluster Kubernetes.

Rémunération

Salaire 1200€/mois
Tickets restaurants
Laissez-passer de transport
Participation à une conférence internationale

Dans le passé, les conférences auxquelles nous avons assisté comprenaient la KubeCon organisé par la fondation CNCF, le Sommet Open Source de la Linux Foundation et de la Fosdem.

Pour toute demande d’informations complémentaires et pour déposer votre candidature, merci de contacter David Worms :

M	T	W	T	F	S	S
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

Stage printemps 2022 – création d’un Data Lab

Description de l’emploi

Présentation de la société

Responsabilités

Qualifications attendues

Informations Complémentaires

Matériel disponible

Rémunération

Test des écouteurs Jabra Elite 5 ANC : superbe design, bon son

La filiale londonienne du CWU dit aux ingénieurs de BT de rejeter l’offre de rémunération

Revue du générateur solaire Jackery Explorer 1500 : la protection contre les pannes de courant à son meilleur

Leave a Reply Cancel reply

Scaling Your Startup with a Revops Agency

Seamless Zurich Travel Solutions: Minivan Rentals with Professional Chauffeurs

Why Choosing a CMS for Media Companies is Crucial for Digital Success

Inside the White House Strategy on China Trade

Biden’s Tariff Policy on China: What You Need to Know

Description de l’emploi

Présentation de la société

Responsabilités

Qualifications attendues

Informations Complémentaires

Matériel disponible

Rémunération

More Stories

Leave a Reply Cancel reply

You may have missed