Poste à pourvoir : Data scientist, Traitement du Langage (H/F)
Emploi - repère : Chef de service
Catégorie d’emploi : Catégorie 1
Type de contrat : Contrat à durée déterminée - 36 mois
Motif : CDD de mission
Localisation : Saint-Denis (93), au pied du RER B La Plaine-Stade de France
Rémunération : Selon expérience et niveau de diplôme, par référence aux grilles indiciaires des agences sanitaires en application du décret n°2003-224 du 07 mars 2003 ou selon statut particulier si fonctionnaire (détachement)
Direction et service d'affectation :
Direction Générale (DG)
Équipe Data
La collecte massive de données entraîne actuellement des transformations majeures dans tous les secteurs d’activités. Les systèmes de santé commencent à être traversés par cette (r)évolution, qui touche en particulier la production de connaissances et leur usage quotidien. Pour prendre pleinement ce virage, la HAS se dote d’une stratégie pluriannuelle dédiée.
Vous travaillerez dans l'équipe data, rattachée au Directeur Général, dont le rôle est de mettre en œuvre cette stratégie, par la réalisation de projets techniques concrets au service des métiers et missions de l’institution.
L'équipe data est à la fois un laboratoire d’innovation, un centre d’expertise, et un catalyseur de transformations dans l’usage des données par la HAS. Elle promeut les dynamiques de connaissance ouverte (open source, open data, open knowledge), conformément aux valeurs de transparence, d’expertise et d’indépendance de l’institution.
Missions générales du poste à pourvoir
Au sein de l’équipe data, vous serez en charge des projets de traitement automatique du langage (TAL / NLP). Vos principales missions consisteront à prototyper et mettre en place des outils pour valoriser les données textuelles de la HAS.
Au fil des projets vous serez amené(e) à :
Véritable force de proposition et de mise en œuvre d’outils de traitement du langage, vous aurez à cœur de déployer ces technologies pour mieux exploiter et valoriser les données textuelles à la HAS. Vous saurez créer une dynamique autour de vos projets, et participer au renforcement progressif de l’équipe par de futurs recrutements.
Formation
Titulaire d’un Master, diplôme d’ingénieur ou diplôme équivalent ; spécialité en statistiques, informatique, big data, intelligence artificielle ou traitement du langage.
Un doctorat serait également apprécié.
Expérience
Vous justifiez d’une expérience professionnelle significative dans le domaine (3 ans minimum, davantage appréciés) avec la réalisation de projets techniques concrets et en équipe. Expériences dans les secteurs sanitaires et sociaux appréciées.
Compétences requises
De nature autonome, vous savez faire preuve d’initiative et avez un réel sens de l’organisation.
Capacité à formaliser des problématiques métiers, et de concevoir des analyses de données ou des outils appropriés pour y répondre.
Expert en traitement automatique du langage (TAL / NLP) : recherche et extraction d’information, reconnaissances d’entités, représentations de textes (ex. TF-IDF, embeddings). Vous connaissez les méthodes les plus récentes (ex. BERT) et effectuez une veille scientifique sur le TAL.
Excellente maîtrise de Python, et des librairies de traitement du langage (ex. NLTK, Spacy) et de machine learning (ex Scikit-Learn, Pytorch, TensorFlow). Connaissances d’autres langages et framework de programmation appréciées (ex. R, JavaScript, C++)
Maîtrise des systèmes de gestion de base de données, en particulier ceux adaptés au traitement du langage (ElasticSearch ou SolR)
Maîtrise d’outil de visualisation de données.
Maîtrise de git, de l’environnement UNIX, des notebooks Jupyter, et d’un environnement de développement (IDE)
Enfin, vous êtes tournés vers l’action, pragmatique, aimez travailler en équipe et faire progresser le collectif en partageant vos compétences.
Date limite des candidatures : 11/03/2021
Candidature (CV, lettre de motivation) à adresser à l'attention de l'équipe recrutement, à l’adresse suivante :