Les projets sur lesquels elle/il pourrait être amené à travailler sont par exemple :
La classification de contenus audio, la conception d'un algorithme chapitrage automatique de podcast basé sur le transcript
L'optimisation d'un moteur de recherche sémantique fait maison, la détection de moments clés dans un contenu audio pour aider à la découpe d'extraits.
Aspect primordial : La personne doit être très autonome et très bon communiquant pour être à l'aise dans une équipe de R&D et sur des travaux très exploratoires.
Un intérêt pour les médias et une capacité à être force de proposition pour de nouvelles idées seront des éléments très appréciés.
La personne doit avoir au moins 2 ans d'expérience en data science, avec une partie importante en NLP.
Profil candidat:
- Forte expertise sur le domaine du NLP/ Expérience en NLP Obligatoire
- Maîtrise des techniques d'apprentissage automatique (Machine learning)
- Excellente connaissance des bibliothèques open source clés telles que TensorFlow, PyTorch, scikit-learn, Numpy, et Pandas
- Une expérience en traitement automatique du signal audio sera appréciée
- Une appétence pour la veille technologique
Software/data engineering :
- Parfaite maîtrise de Python
- Appétence pour les travaux de préparation de données
- Bonnes dispositions pour la mise en oeuvre de la CI/CD, comme Gitlab-CI
- Connaissance de Kubernetes / Postgres appréciée
Soft skills :
- Une parfaite autonomie est un critère essentiel pour cette mission.
- Une réelle aptitude à communiquer des concepts techniques à des non-experts, notamment pour expliquer les résultats des projets R&D aux autres membres de l'équipe et aux parties prenantes.
- Une capacité à travailler efficacement en équipe, avec parfois des échanges interdisciplinaire (journalistes, documentalistes, etc.).