Data scientist, Traitement du Langage (H/F) - Dire...

Company:
Location: 93218 Saint-Denis

*** Mention DataYoshi when applying ***

Poste à pourvoir : Data scientist, Traitement du Langage (H/F)
Emploi - repère : Chef de service
Catégorie d’emploi : Catégorie 1

Type de contrat : Contrat à durée déterminée - 36 mois
Motif : CDD de mission
Localisation : Saint-Denis (93), au pied du RER B La Plaine-Stade de France
Rémunération : Selon expérience et niveau de diplôme, par référence aux grilles indiciaires des agences sanitaires en application du décret n°2003-224 du 07 mars 2003 ou selon statut particulier si fonctionnaire (détachement)


Description du poste à pourvoir

Direction et service d'affectation :

Direction Générale (DG)

Équipe Data

La collecte massive de données entraîne actuellement des transformations majeures dans tous les secteurs d’activités. Les systèmes de santé commencent à être traversés par cette (r)évolution, qui touche en particulier la production de connaissances et leur usage quotidien. Pour prendre pleinement ce virage, la HAS se dote d’une stratégie pluriannuelle dédiée.

Vous travaillerez dans l'équipe data, rattachée au Directeur Général, dont le rôle est de mettre en œuvre cette stratégie, par la réalisation de projets techniques concrets au service des métiers et missions de l’institution.

L'équipe data est à la fois un laboratoire d’innovation, un centre d’expertise, et un catalyseur de transformations dans l’usage des données par la HAS. Elle promeut les dynamiques de connaissance ouverte (open source, open data, open knowledge), conformément aux valeurs de transparence, d’expertise et d’indépendance de l’institution.


Missions générales du poste à pourvoir

Au sein de l’équipe data, vous serez en charge des projets de traitement automatique du langage (TAL / NLP). Vos principales missions consisteront à prototyper et mettre en place des outils pour valoriser les données textuelles de la HAS.

Au fil des projets vous serez amené(e) à :

  • Analyser des données textuelles riches : retours des patients après hospitalisation, événements indésirables graves liés aux soins, dossiers d’industriels, bibliographies, connaissances produites par la HAS ;
  • Concevoir et prototyper des services facilitant le traitement de textes : moteur de recherche, annotation, extraction d’entité, classification, gestion de connaissances ;
  • Participer à mettre en place les briques technologiques sous-jacentes (base de données, traitement automatisé, outil d’analyse, exposition par API), en cherchant le bon équilibre entre achat de solutions et développement en propre ;
  • Piloter des projets d’industrialisation et de déploiement de ces services, en mobilisant des ressources internes et externes ;
  • Effectuer une veille scientifique et technique sur le champ du TAL ;
  • Encadrer des stagiaires ou des profils plus juniors ;
  • Participer à la communauté de traitement de textes biomédicaux et échanger avec les partenaires institutionnels et académiques privilégiés : laboratoire CNRS, LIMSI, HDH, APHP, Etalab.

Véritable force de proposition et de mise en œuvre d’outils de traitement du langage, vous aurez à cœur de déployer ces technologies pour mieux exploiter et valoriser les données textuelles à la HAS. Vous saurez créer une dynamique autour de vos projets, et participer au renforcement progressif de l’équipe par de futurs recrutements.


Profil recherché

Formation

Titulaire d’un Master, diplôme d’ingénieur ou diplôme équivalent ; spécialité en statistiques, informatique, big data, intelligence artificielle ou traitement du langage.

Un doctorat serait également apprécié.


Expérience

Vous justifiez d’une expérience professionnelle significative dans le domaine (3 ans minimum, davantage appréciés) avec la réalisation de projets techniques concrets et en équipe. Expériences dans les secteurs sanitaires et sociaux appréciées.


Compétences requises

De nature autonome, vous savez faire preuve d’initiative et avez un réel sens de l’organisation.

Capacité à formaliser des problématiques métiers, et de concevoir des analyses de données ou des outils appropriés pour y répondre.

Expert en traitement automatique du langage (TAL / NLP) : recherche et extraction d’information, reconnaissances d’entités, représentations de textes (ex. TF-IDF, embeddings). Vous connaissez les méthodes les plus récentes (ex. BERT) et effectuez une veille scientifique sur le TAL.

Excellente maîtrise de Python, et des librairies de traitement du langage (ex. NLTK, Spacy) et de machine learning (ex Scikit-Learn, Pytorch, TensorFlow). Connaissances d’autres langages et framework de programmation appréciées (ex. R, JavaScript, C++)

Maîtrise des systèmes de gestion de base de données, en particulier ceux adaptés au traitement du langage (ElasticSearch ou SolR)

Maîtrise d’outil de visualisation de données.

Maîtrise de git, de l’environnement UNIX, des notebooks Jupyter, et d’un environnement de développement (IDE)

Enfin, vous êtes tournés vers l’action, pragmatique, aimez travailler en équipe et faire progresser le collectif en partageant vos compétences.


Pour postuler

Date limite des candidatures : 11/03/2021

Candidature (CV, lettre de motivation) à adresser à l'attention de l'équipe recrutement, à l’adresse suivante :

has-4108@candidatus.com

*** Mention DataYoshi when applying ***

Offers you may like...

  • Deloitte

    Stagiaire Data Analyst / Data Scientist (H/F)
    92908 Paris
  • Applied Systems, Inc.

    Data Scientist
    Austin, TX 78701
  • ServiceNow

    Data Scientist (Security Research)
    Remote
  • Alteryx, Inc.

    Staff Data Scientist
    Boston, MA
  • Elligo Health Research

    Data Scientist (Remote)
    Remote