Data scientist, Traitement du Langage (H/F)

Company:
Location: 93210 Saint-Denis

*** Mention DataYoshi when applying ***

Date : 11/02/2020
Poste à pourvoir
Data scientist, Traitement du Langage (H/F)

Emploi-repère
Chef de projet

Catégorie d’emploi
Catégorie 1

Type de contrat
Contrat à durée déterminée / 36 mois
Temps complet

Motif
CDD de mission

Localisation
Saint-Denis (93), au pied de la station RER La Plaine Stade de France

Rémunération
Selon expérience et niveau de diplôme, par référence aux grilles indiciaires des agences sanitaires en application du décret n°2003-224 du 07 mars 2003



LA HAUTE AUTORITÉ DE SANTÉ
Autorité publique indépendante à caractère scientifique, la Haute Autorité de Santé a pour but de contribuer à la régulation du système de santé par la qualité. Ses missions dans les champs de l'évaluation des produits de santé, des pratiques professionnelles, de l’organisation des soins et de la santé publique, visent à assurer à tous les patients et usagers un accès pérenne et équitable à des soins aussi efficaces, sûrs et efficients que possible.
La HAS évalue d’un point de vue scientifique et économique les produits, actes, prestations et technologies de santé, en vue de leur admission au remboursement. Elle élabore des recommandations sur les stratégies de prise en charge ainsi que des recommandations de bonne pratique à destination des professionnels de santé et des professionnels intervenant dans les champs social ou médico-social.
Elle certifie les établissements de santé et accrédite les praticiens de certaines disciplines afin d’évaluer et d’améliorer la qualité des soins et la sécurité des patients dans les établissements de santé et en médecine de ville.
Elle est également chargée d’établir des référentiels en vue de l’évaluation interne et externe des activités et de la qualité des prestations délivrées par les établissements et services sociaux et médico-sociaux, ainsi que d’habiliter les organismes d’évaluation externe.

DESCRIPTION DU POSTE A POURVOIR
Direction et service d’affectation
Direction Générale (DG)


Présentation du contexte du service
La collecte massive de données entraîne actuellement des transformations majeures dans tous les secteurs d’activités. Les systèmes de santé commencent à être traversés par cette (r)évolution, qui touche en particulier la production de connaissances et leur usage quotidien. Pour prendre pleinement ce virage, la HAS se dote d’une stratégie pluriannuelle dédiée.
Vous travaillerez dans l'équipe data, rattachée au Directeur Général, dont le rôle est de mettre en œuvre cette stratégie, par la réalisation de projets techniques concrets au service des métiers et missions de l’institution.
L'équipe data est à la fois un laboratoire d’innovation, un centre d’expertise, et un catalyseur de transformations dans l’usage des données par la HAS. Elle promeut les dynamiques de connaissance ouverte (open source, open data, open knowledge), conformément aux valeurs de transparence, d’expertise et d’indépendance de l’institution.




Missions générales du poste à pourvoir

Au sein de l’équipe data, vous serez en charge des projets de traitement automatique du langage (TAL / NLP). Vos principales missions consisteront à prototyper et mettre en place des outils pour valoriser les données textuelles de la HAS.
Au fil des projets vous serez amené(e) à :
  • Analyser des données textuelles riches : retours des patients après hospitalisation, événements indésirables graves liés aux soins, dossiers d’industriels, bibliographies, connaissances produites par la HAS ;
  • Concevoir et prototyper des services facilitant le traitement de textes : moteur de recherche, annotation, extraction d’entité, classification, gestion de connaissances ;
  • Participer à mettre en place les briques technologiques sous-jacentes (base de données, traitement automatisé, outil d’analyse, exposition par API), en cherchant le bon équilibre entre achat de solutions et développement en propre ;
  • Piloter des projets d’industrialisation et de déploiement de ces services, en mobilisant des ressources internes et externes ;
  • Effectuer une veille scientifique et technique sur le champ du TAL ;
  • Encadrer des stagiaires ou des profils plus juniors ;
  • Participer à la communauté de traitement de textes biomédicaux et échanger avec les partenaires institutionnels et académiques privilégiés : laboratoire CNRS, LIMSI, HDH, APHP, Etalab.

Véritable force de proposition et de mise en œuvre d’outils de traitement du langage, vous aurez à cœur de déployer ces technologies pour mieux exploiter et valoriser les données textuelles à la HAS. Vous saurez créer une dynamique autour de vos projets, et participer au renforcement progressif de l’équipe par de futurs recrutements.

PROFIL RECHERCHÉ :
Formation


Expérience


Compétences
Titulaire d’un Master, diplôme d’ingénieur ou diplôme équivalent ; spécialité en statistiques, informatique, big data, intelligence artificielle ou traitement du langage.
Un doctorat serait également apprécié.

Vous justifiez d’une expérience professionnelle significative dans le domaine (3 ans minimum, davantage appréciés) avec la réalisation de projets techniques concrets et en équipe. Expériences dans les secteurs sanitaires et sociaux appréciées.

De nature autonome, vous savez faire preuve d’initiative et avez un réel sens de l’organisation.
Capacité à formaliser des problématiques métiers, et de concevoir des analyses de données ou des outils appropriés pour y répondre.
Expert en traitement automatique du langage (TAL / NLP) : recherche et extraction d’information, reconnaissances d’entités, représentations de textes (ex. TF-IDF, embeddings). Vous connaissez les méthodes les plus récentes (ex. BERT) et effectuez une veille scientifique sur le TAL.
Excellente maîtrise de Python, et des librairies de traitement du langage (ex. NLTK, Spacy) et de machine learning (ex Scikit-Learn, Pytorch, TensorFlow). Connaissances d’autres langages et framework de programmation appréciées (ex. R, JavaScript, C++)
Maîtrise des systèmes de gestion de base de données, en particulier ceux adaptés au traitement du langage (ElasticSearch ou SolR)
Maîtrise d’outil de visualisation de données.
Maîtrise de git, de l’environnement UNIX, des notebooks Jupyter, et d’un environnement de développement (IDE)
Enfin, vous êtes tournés vers l’action, pragmatique, aimez travailler en équipe et faire progresser le collectif en partageant vos compétences.



Pour postuler
Date limite de réponse : 11/03/2021

*** Mention DataYoshi when applying ***

Offers you may like...

  • adidas

    Senior Data Scientist
    Amsterdam
  • Philips

    Data Scientist
    Amsterdam
  • IKEA

    Data Scientist – Marketing Analytics
    Amsterdam
  • Red Commerce

    Data Scientist
    Amsterdam
  • Cloudflight

    Full Stack Data Scientist
    Amsterdam