SYAGE, Cabinet de Recrutement IT, recherche pour une embauche chez l'un de ses clients basé à Marseille un
Data engineer cloud (H/F).
Le poste en bref
Un
ingénieur data cloud ayant au moins 3 ans d'expérience dans le métier et une bonne connaissance d'AWS.
Contexte
Aider la société à accompagner ses clients pour leur permettre de tirer profit du machine Learning d'un point de vue opérationnel.
Les + du poste
- Intégrer une start up dynamique portée par un grand groupe et intervenant sur un secteur challengeant
- Intégrer une équipe super motivée et ayant de belles perspectives pour 2023
- Rejoindre une entreprise Advanced Consulting Partners
- Temps plein à distance possible
Mission
Intégrer en tant que data engineer une équipe qui assure une mise en production du Machine learning garantissant sur le long terme le bon fonctionnement des modèles, des performances, de la détection des erreurs ou de la dérive tout en assurant la maîtrise des coûts
Les Principaux Enjeux Sur Ce Poste Sont
- Développeur de modèles de Machine learning
- Mettre en production ces algorithmes
- Adaptation aux architectures Data / ML pour les déploiements en production
- Développement en collaboration avec l’équipe client
- Formation et transfert de compétences sur les services AWS utilisés
Compétences Techniques Attendues
- Data Engineering :
- connaissance des concepts de datalake / data warehouse / lake
house - niveau utilisateur sur Apache Spark (PySpark), Pandas, Apache Airflow ou outil équivalent de workflow
- Cloud Computing sur AWS : A minima une certification de niveau Professional parmi « Solutions Architect - Professional » ou « DevOps Professional »
- Développement logiciel
- au moins un langage majeur maîtrisé parfaitement parmi C, C++, ou Python
- Environnement de travail :
- Linux ou MacOs – être de niveau admin sur son poste de travail ; scripts bash, scripts shell ;
- maîtrise d'un éditeur de texte pour le développement
- Conteneurs : notions et compréhension générale + différences avec les VM (Docker, Kubernetes …)
- DevOps : compréhension des principes CI/CD, tests unitaires, d'intégration, déploiements … + utilisation d'outils tels que GitHub actions, Jenkins …
- Bases de données : niveau utilisation SQL – création et utilisation de requêtes ; conception de niveaux NoSQL (DynamoDB). Compréhension des différences entre les 2 notions.
- Fondamentaux du réseautage : notions IP, sous-réseaux, routage, passerelle, VPN,
- Systèmes de contrôle de version : utilisation régulière de Git - Des connaissances en datascience sont un plus :
- Connaissances sur les algorithmes de ML / deep learning : tensorflow, pytorch, keras, algos de régression / clustering …
- Utilisation d'outils de dataviz
- Connaissance et utilisation des environnements AWS Sagemaker, Quicksight …
Qualités Humaines Requises
- Curiosité
- Envie d'apprendre et d'humilité
- Travail en autonomie
- Habilité à travailler en mode collaboratif via les outils numériques (Slack, visio, …)