logo fullscreen logo
  • Dossier
    • IA quantique
    • Réseaux de neurones enzymatiques
    • Le méta-apprentissage fait ses premiers pas…
    • Les avancées prometteuses de l’apprentissage auto-supervisé
    • Que peut l’intelligence artificielle contre les fake news ?
    • Quand l’IA nous regarde…
    • Les réseaux de neurones impulsionnels
    • Quantification de la fragilité
    • Covid-19 et data
    • Ville algorithmique
    • Perception des véhicules autonomes
    • Formation continue
    • Data gouvernance
    • À la recherche des sens perdus
    • Deepfake
    • Agriculture numérique
    • Legal Tech
    • Données de santé
    • Start-up IA
    • Learning Analytics
    • Métiers de la data
    • Recherche IA : public/privé
    • Cybersécurité
    • Emplois dans la Data
    • Innovation et Data
    • Open source
    • Green IA
    • Sciences humaines et sociales et data
    • Voiture autonome
    • IA et création artistique
    • Des algos de confiance
    • Data cities
    • L’homme sur mesure
    • Débats autour des datas
    • Data science & robots
    • Usine 4.0
    • Données personnelles
    • Valorisations des données
    • Formation
  • Innovation
  • Expertise
  • Portrait
  • Point de vue
  • Lexique
  • + loin
    • Timeline
    • Repository
  • Emploi
    • Fiches métiers
  • S’abonner
    • NEWSLETTERS DÉJÀ PARUES
logo fullscreen logo
  • Dossier
    • IA quantique
    • Réseaux de neurones enzymatiques
    • Le méta-apprentissage fait ses premiers pas…
    • Les avancées prometteuses de l’apprentissage auto-supervisé
    • Que peut l’intelligence artificielle contre les fake news ?
    • Quand l’IA nous regarde…
    • Les réseaux de neurones impulsionnels
    • Quantification de la fragilité
    • Covid-19 et data
    • Ville algorithmique
    • Perception des véhicules autonomes
    • Formation continue
    • Data gouvernance
    • À la recherche des sens perdus
    • Deepfake
    • Agriculture numérique
    • Legal Tech
    • Données de santé
    • Start-up IA
    • Learning Analytics
    • Métiers de la data
    • Recherche IA : public/privé
    • Cybersécurité
    • Emplois dans la Data
    • Innovation et Data
    • Open source
    • Green IA
    • Sciences humaines et sociales et data
    • Voiture autonome
    • IA et création artistique
    • Des algos de confiance
    • Data cities
    • L’homme sur mesure
    • Débats autour des datas
    • Data science & robots
    • Usine 4.0
    • Données personnelles
    • Valorisations des données
    • Formation
  • Innovation
  • Expertise
  • Portrait
  • Point de vue
  • Lexique
  • + loin
    • Timeline
    • Repository
  • Emploi
    • Fiches métiers
  • S’abonner
    • NEWSLETTERS DÉJÀ PARUES
Menu
mobile logo
  • Dossier
    • IA quantique
    • Réseaux de neurones enzymatiques
    • Le méta-apprentissage fait ses premiers pas…
    • Les avancées prometteuses de l’apprentissage auto-supervisé
    • Que peut l’intelligence artificielle contre les fake news ?
    • Quand l’IA nous regarde…
    • Les réseaux de neurones impulsionnels
    • Quantification de la fragilité
    • Covid-19 et data
    • Ville algorithmique
    • Perception des véhicules autonomes
    • Formation continue
    • Data gouvernance
    • À la recherche des sens perdus
    • Deepfake
    • Agriculture numérique
    • Legal Tech
    • Données de santé
    • Start-up IA
    • Learning Analytics
    • Métiers de la data
    • Recherche IA : public/privé
    • Cybersécurité
    • Emplois dans la Data
    • Innovation et Data
    • Open source
    • Green IA
    • Sciences humaines et sociales et data
    • Voiture autonome
    • IA et création artistique
    • Des algos de confiance
    • Data cities
    • L’homme sur mesure
    • Débats autour des datas
    • Data science & robots
    • Usine 4.0
    • Données personnelles
    • Valorisations des données
    • Formation
  • Innovation
  • Expertise
  • Portrait
  • Point de vue
  • Lexique
  • + loin
    • Timeline
    • Repository
  • Emploi
    • Fiches métiers
  • S’abonner
    • NEWSLETTERS DÉJÀ PARUES
Retours aux métiers

Data Ingénieur : l’accompagnateur technique de A à Z

Ce métier d’expert de la gestion des données –de leur ingénierie au sens propre –, apparu très récemment, est vite devenu indispensable.  Polyvalent, le data ingénieur un acteur clé des projets.

Ce profil technique est désormais parmi les plus recherchés, dès qu’une entreprise est assez mature pour industrialiser le traitement de ses données. Le data ingénieur rend la donnée exploitable en amont et en aval des projets. En amont, il est capable de comprendre l’environnement numérique du client, de collecter, préparer, nettoyer, normaliser, contextualiser, stocker ses données en s’assurant que les « tuyauteries » nécessaires (au sens des infrastructures) sont adaptées. C’est lui qui met en place l’ETL (Extraction, Transformation, Loading), le système de chargement de données depuis les différentes sources d’information de l’entreprise jusqu’à son entrepôt de données. En aval des projets, le data ingénieur accompagne les data scientists dans l’industrialisation de leurs modèles, relit leur code, l’optimise, assure l’exploitabilité des solutions, leur mise à l’échelle en suggérant des tests automatisés, en déployant et en ordonnant les traitements.

Formation :

Il n’en existe pas encore de spécifique. Les plus adaptées sont des écoles d’informatique (comme Epita, Epitech, Enseeiht) ou d’ingénieurs généralistes (comme UTC, UTT, Polytech). Quant aux data ingénieurs les plus expérimentés, ce sont en général d’anciens développeurs, des profils issus de l’informatique décisionnelle, voire d’autres sciences comme la physique théorique.

Télécharger cette fiche
MOTS CLÈS
  • Ingénierie de la donnée
  • Industrialisation des modèles
AU QUOTIDIEN
  • Collecter des données en explorant le système d’information d’un client et ses différentes sources de données, en alimentant une plateforme d’acquisition de données, etc.
  • Nettoyer ces données en ajustant leur format, en normalisant les bases de données, en gérant les données manquantes
  • Les stocker dans un format homogène
COMPÉTENCES
  • Développeur compétent sur le stockage et le traitement de données volumineuses (Hadoop, Scala, Spark, Kafka…)
  • Esprit d’équipe, curiosité, débrouillardise, communication
diagramme de compétences
du data ingénieur
DAP, la newsletter du Data Analytics Post Recevez chaque semaine un éclairage sur les data science

Peut-on laisser un algorithme apprendre tout seul ?

A la différence de l’apprentissage supervisé, le contexte non supervisé est celui où l’algorithme doit opérer à partir d’exemples non annotés.

En savoir plus

ARTICLES RÉCENTS
  • En attendant l’ordinateur quantique universel…
  • L’IA teste ses premiers algorithmes quantiques
  • Les promesses de l’IA quantique
  • La recherche à l’assaut des deepfakes vocaux
  • Recyclage : nos déchets sous l’œil de l’IA

Tout savoir sur…

Le DAP

Comité Éditorial

Partenaires

Équipe


Copyright © Data Analytics Post. Tous droits réservés.

Mentions légales & CGU