Description Du Poste
Apprenez un métier d’avenir en alternance avec OpenClassrooms.
Un partenaire de l’école OpenClassrooms recherche un Data Scientist en contrat d’apprentissage, pour préparer une de ses formations diplômantes reconnues par l’État.
Attention : cette offre ne s’adresse qu’aux candidats à l’alternance qui effectuent leur formation avec OpenClassrooms. Seules les candidatures répondant à ces critères seront étudiées.
Avec OpenClassrooms, vous apprendrez un métier avec une pédagogie mêlant 20% de théorie et 80% de pratique. Résultat : à l’issue de votre formation, vous êtes 100% prêt à l’emploi.
Une fois votre diplôme en poche, nos équipes épaulent chaque profil dans la recherche d’un employeur, nous permettant d’afficher un taux d’insertion de nos étudiants en entreprise de plus de 80%.
Si votre candidature est retenue, votre scolarité sera entièrement financée par votre employeur.
Vos missions en tant que Data Scientist en alternance :
- Lors de la validation de nos logiciels, l'analyse statique du code source est une étape essentielle pour détecter les erreurs de programmation et de conception, facilitant ainsi la maintenance du code. Dans cette optique, cet apprentissage consiste à exploiter les données résultant de l'analyse statistique du code source, telles que les patterns d'erreurs et de corrections, afin de développer des algorithmes de Deep Learning fiables pouvant aider les développeurs à corriger ces erreurs.
- La correction des erreurs de code est une tâche indispensable pour garantir une bonne qualité de code et de minimiser les erreurs qui peuvent causer des problèmes majeurs dans les logiciels. Cependant, la correction des erreurs de code est une tâche fastidieuse et chronophage pour les développeurs, surtout lorsqu'il s'agit de corriger des erreurs complexes. Les modèles génératifs ont récemment été proposés comme une solution potentielle pour automatiser cette tâche en proposant des corrections de code précises et efficaces. Cependant, ces modèles sont souvent confrontés à des défis spécifiques liés à la complexité syntaxique et sémantique du code, à la variabilité des styles de codage, ainsi qu'à la nécessité de prendre en compte le contexte du code pour proposer une correction précise et complète.
- Dans ce contexte, le/la candidat(e) aura pour mission la réalisation des objectifs suivants :
- Comprendre les défis spécifiques associés à la tâche de correction des erreurs de code.
- Proposer de nouvelles approches d'optimisation pour améliorer l'efficacité des modèles génératifs dans la correction des erreurs de code, en utilisant des techniques d'apprentissage automatique avancées.
- Implémenter et expérimenter les nouvelles approches proposées en utilisant des données de code existantes et des outils de modélisation générative tels que les modèles Llama-3, Mistral, etc.
- Evaluer les nouvelles approches proposées en termes d'efficacité et de performance, en utilisant des métriques adaptées.
- Intégrer les modèles dans nos chaînes de DevOps de production.
- Communiquer et présenter les résultats de façon innovante pour les autres équipes.
Poste basé à Vélizy-Villacoublay (Île-de-France). Travail en hybride.
Rythme d’alternance et présence en entreprise
Du lundi au vendredi
Périodes de travail de 8 heures
Repos le week-end
Travail en journée
En entreprise : 4 jours par semaine (jours au choix) avec présence réduite à 3 jours 1 à 2 fois par mois
En formation: 1 jour par semaine + 1 jour supplémentaire 1 à 2 fois par mois
Attention ! Cette offre ne s’adresse qu’aux candidats à l’alternance qui effectuent leur formation avec OpenClassrooms. Seules les candidatures répondant à ces critères seront étudiées.
Profil recherché
Profil Recherché
- Etudiant(e) en cursus universitaire ou Ecole d’ingénieurs, en recherche d'un contrat d’apprentissage de 12 mois.
- Spécialité(s) / Option(s) souhaitée(s) : Data Science, Machine/Deep Learning, Big Data, Statistiques
- Compétences techniques attendues :
- Compréhension des modèles basés sur les transformers
- Maîtrise de la programmation OO : Python
- Maîtrise des librairies dédiées au développement d’algorithmes de Machine Learning et de Deep Learning (scikit-learn, tensorflow, pytorch, transformers…)
- Maîtrise d’outils Git et Gitlab
- Bon niveau d’anglais à l’écrit et à l’oral
- Profil :
- Capacité d’analyse, de synthèse et de formalisation
- Volonté d’implication et d’initiative, autonomie
- Aptitude au travail en équipe et à communiquer
Merci de votre attention.