Nous recherchons pour le compte de notre client dans le domaine bancaire, un Data engineer. Besoin : consultant avec un profil Hadoop pySpark qui sera en charge, en lien avec l'équipe de production applicative / devops, de mettre en oeuvre techniquement le datalake CIO Office. Cela couvrira les tâches suivantes : - Adresser à l'équipe devops les demandes relatives à la mise en place de la plateforme (configuration des edge nodes, gestion des droits, etc.) - Automatiser les envois / réceptions de fichiers des applications sources vers le datalake (Control-M et flux CFT) - Mettre en place et automatiser l'alimentation de tables Hive - Eventuellement si le besoin apparaît : o ajouter une couche Indexima o mettre en place une offre d'APIs basée sur SolR Objectifs : Les compétences requises sont les suivantes : - Maîtrise de la plateforme Hadoop, du développement Python/PySpark, et de Hive - Anglais courant - Capacité de rédaction de spécifications techniques - Dynamisme et excellent relationnel - Force de proposition - Connaissance et pratique des méthodes agiles (SCRUM en particulier) - La connaissance d'Indexima et SolR est un plus