Job description

Notre client , acteur dans l’onboarding digital pour les services financiers recrute son futur Data Engineer.
Il s’agit d’une plateforme Saas proposant des services KYC ( Know Your Customer), de gestion automatique de documents basée sur l’IA, de signature électronique , et de Business Intelligence
Des dizaines de milliers de comptes sont ouverts via la plateforme chaque jour. Le Data Engineer travaillera au sein de l’équipe Data, dont le but principal est de valoriser ce grand volume de données entrantes (dossiers, pièces justificatives, logs...).
Composition de l’équipe : 4 Data Scientists , 3 Data Engineers , 2 développeurs Python , 1 architecte Data

L’ équipe couvre les thématiques suivantes :
Vision artificielle : lecture et reconnaissance automatique de documents structurés ou non structurés (OCR), classification, analyse sémantique (NLP), approches hybride texte + image, évaluation de la qualité d’un document
Business Intelligence (BI) : ETLs permettant de produire des métriques métier à destination des autres équipes en interne, ou de nos clients
Facturation : calculs de facturation pour l’ensemble des produits
L’entreprise s’engage dans un travail de refonte technologique de sa plateforme. Dans ce contexte, l’équipe Data va être amenée à prendre un rôle plus central dans la génération de données anonymisées utilisées dans le cadre d’analyses de BI. La mission principale du poste sera de participer pleinement à cet effort, tant dans la définition des solutions retenues par l’architecte que dans leur implémentation, et ensuite dans leur évolution.
Technologies de Big Data : Hadoop/Spark pressenti, développements associés, création des transformations des données, des API permettant de requêter ces données.
Création et orchestration des ETL

C’est un match si :
  • Vous avez une première expérience de Data Engineer en Python ( au moins 3 ans)
  • Compétences requises en Python 3 / Docker / Git
Compétences appréciées :
  • Technologies de big data : Hadoop, Spark
  • Gestionnaire de workflow : AirFlow, Prefect
  • Minio, Vault
  • Kafka
  • Outil de versionning général d’environnement (ex: poetry)
  • Outil de monitoring (sentry, Kibana )
  • Ansible
Stack technique :
  • Pyhton 3/Docker / Gitlab/ Ansible
  • Pandas / Bonobo / Prefect
  • MangoDB

Please let the company know that you found this position on this Job Board as a way to support us, so we can keep posting cool jobs.

Similar jobs

Browse All Jobs
FocusKPI Inc.
December 9, 2021

Data Engineer

NTT Data
December 9, 2021
Ascensus
December 9, 2021