Le Groupe Servier mène une transformation digitale ambitieuse avec un objectif clair de devenir « best in class Digital Performer ». La Data Factory joue un rôle central dans cette ambition et a un impact fort à chaque étape de la chaine de valeur. Depuis la recherche de nouvelles molécules, la prédiction de leur comportement, l’analyse d’efficacité des traitements en passant par l’optimisation des processus de production des médicaments, la gestion des stocks et la prévision des ruptures jusqu’à l’approche omnicanale et personnalisée auprès des professionnels de santé, le suivi des patients… : tous ces enjeux s’appuient sur la Data et sa puissance transformante.
Rattaché(e) à la Direction Digital, Data & IS, la Data Factory œuvre pour rendre les données accessibles, les valoriser à travers des produits data métiers à base d’IA et d’Advanced Analytics, et transformer Servier en un groupe orientée data (« Data-driven ») où tous les collaborateurs connaissent les enjeux de la data.
La création des produits Data s’appuie sur une « plateforme Data» centrale, cloud-native, sécurisée et performante avec les technologies les plus avancées. Servier a établi un partenariat stratégique de cinq années avec Google Cloud, lui donnant accès à des technologies innovantes et des liens privilégiés avec Google Cloud, et permettant de disposer d’une puissance de calcul augmentée, d’accélérer l’analyse et de développer l’innovation sur de nombreux défis business et technologiques.
Au sein de la Data Factory, le pôle Data Science a pour mission d’accélérer la conception et déploiement des solutions de machine learning et intelligence artificielle. Cela se fait à travers le développement et partage des expertises en différents sujets IA (graphe, NLP, image, etc) et au développement des briques techniques transverses (« services ») dans la « plateforme data » .
Ce poste sera centré sur les projets de Recherche et Développement (R&D) qui ont pour objectif de pour identifier les gènes clés d'une maladie, optimiser le design d'une molécule, repérer les biomarqueurs de résistance ou de réponse à un médicament à partir de données variées telles que les données textuelles, les images médicales et les données génomiques.
Pour déployer ces solutions, nous développons des algorithmes de machine learning et deep learning autour des technologies de graphe sur des réseaux de gènes, de protéines et de médicaments pour mieux comprendre les relations complexes entre ces éléments et les maladies associées ; des modèles de NLP (Natural Language Processing) pour extraire des informations à partir de textes biomédicaux, tels que les publications scientifiques et les rapports cliniques; de l’analyse d’image médicales comme le IRM, les biopsies, entre autres.
Vos missions :
vous êtes impliqué(e) dans l’engagement de l’équipe au quotidien et faites tout pour l’aider pour délivrer des fonctionnalités en continue
vous travaillez en étroite relation avec les autres membres de la feature team pour aider à la création des algorithmes nécessaires pour les cas d’usages développés pour les équipes métier
vous échangerez de manière continue avec les métiers car nous pensons que la proximité avec le métier est la clef pour toucher le bon besoin business
vous mettez en place les nouveaux flux d’entrée et de sortie au sein de la plateforme data, et irez jusqu’au modeling et à l’activation de la donnée
vous assurez le delivery, et êtes constamment en veille sur les nouvelles technos.
Votre formation : De formation supérieure en école d’ingénieur/université niveau Bac+5 (PhD est un plus), vous possédez au minimum 4 ans d’expérience professionnelle en tant que Data Scientist.
Vos compétences :
Techniques
• vous maitrisez le développement en Python, et SQL ainsi que les méthodes et librairies de machine learning
• vous avez la capacité à lire et comprendre des articles scientifiques sur le machine learning et de les appliquer aux données biologiques
• vous avez des excellentes compétences en communication et en collaboration pour participer à la validation des résultats des modèles et des analyses avec l'équipe R&D
• vous pensez que le notebook Jupyter n’est pas une fin en soi et la scalabilité de votre algorithme est un prérequis pour son activation,
• vous avez la capacité à maintenir la chaîne Big Data, de la récupération de la donnée jusqu’à son exploitation finale, dans une approche CI/CD, avec des technos tel que docker,
• une connaissance des données biologiques (génomique, imagerie médicale, données moléculaires) et une connaissance de l’environnement Google Cloud Platform et la suite Vertex AI sont un plus
Anglais professionnel nécessaire.
Personnelles