Ce site utilise des cookies afin que nous puissions vous fournir la meilleure expérience utilisateur possible. Les informations sur les cookies sont stockées dans votre navigateur et remplissent des fonctions telles que vous reconnaître lorsque vous revenez sur notre site Web et aider notre équipe à comprendre les sections du site que vous trouvez les plus intéressantes et utiles.
Data Engineer
Notre définition : Le Data Engineer est un développeur informatique spécialisé dans la gestion et l’exploitation des données au sein d’une entreprise. Sa principale mission consiste à assurer la collecte, le traitement et la mise à disposition des données pour les différents services de l’organisation. En collaboration avec les équipes métier et les équipes d’analyse de données, le Data Engineer contribue à la création d’outils et de solutions permettant de tirer le meilleur parti des données disponibles.
Activités principales :
-
- Acheminement de la donnée
- Recueillir et comprendre les besoins métier en matière de collecte et de stockage de données.
- Développer des solutions techniques de collecte de données via des interfaces de programmation (API).
- Mettre en place des solutions de stockage de données, notamment en utilisant des technologies telles que Hadoop.
- Effectuer des tests unitaires et d’intégration pour assurer la qualité des solutions développées.
- Automatiser les processus de traitement des données en mettant en place des batchs pour les traitements récurrents.
- Acheminement de la donnée
-
- Mise à disposition des données aux utilisateurs
- Industrialiser et automatiser le nettoyage des données conformément aux spécifications définies.
- Gérer et maintenir plusieurs bases de données, en important des données externes ou internes.
- Assurer la conformité avec les réglementations telles que le RGPD en ce qui concerne la gestion du cycle de vie des données.
- Assurer le suivi de la production et la maintenance des solutions de traitement des données.
- Mise à disposition des données aux utilisateurs
-
- Mise en production de modèles statistiques
- Développer l’industrialisation de modèles statistiques ou de machine learning pour les intégrer dans les applications.
- Implémenter des mécanismes de suivi de la validité des modèles statistiques.
- Assurer le suivi de la production et la maintenance des modèles statistiques déployés.
- Mise en production de modèles statistiques
-
- Suivi des projets de développement
- Participer à l’analyse des besoins métier pour établir les spécifications techniques.
- Reporter régulièrement l’avancement des activités au chef de projet.
- Suivi des projets de développement
Activités annexes :
-
- Automatiser la création de tableaux de bord pour les équipes métier.
- Effectuer une veille technologique sur les outils et les tendances en matière de big data.
- Rédiger la documentation technique relative aux bases de données et aux processus de traitement des données.
Compétences techniques requises :
-
- Maîtrise des environnements Hadoop/Hive/Spark, tant en local que dans le cloud.
- Connaissance approfondie des bases de données SQL et NoSQL, ainsi que de leur gestion.
- Maîtrise d’au moins un langage de programmation tel que C++, Scala, Java, Python, etc.
- Familiarité avec les outils de gestion de flux tels que Kafka, Flink, etc.
- Compétences en développement agile.
- Connaissance des réglementations sur la protection des données personnelles et de la cybersécurité.
- Maîtrise des systèmes d’exploitation Unix et Windows.
- Connaissance des solutions de manipulation des données ETL/ELT.
- Notions de base en machine learning et intelligence artificielle.
- Maîtrise en statistique ou en mathématiques.