Le data mining couvre l’ensemble des outils et méthodes qui permettent d’extraire des connaissances à partir de grandes bases de données. On parle aussi de fouille, forage ou prospection de données, d’extraction de connaissances à partir de données.
C’est une analyse préliminaire où l’on explore, on cherche à confirmer des intuitions, à faire émerger des concepts (insights). C’est une façon de produire de la connaissance mais cette étape ne s’automatise pas. Certains y intègrent aussi la transformation des données en informations utiles, en établissant des relations entre les données, des corrélations (on parle aussi de patterns, de motifs, de critères) pour les catégoriser. Le data mining est une extension de l’analyse de données et des statistiques exploratoires pratiquées depuis plus de 30 ans. Il intègre (ou il est le prélude à) des techniques d’analyse issues de l’apprentissage automatique (comme le machine learning), de la reconnaissance de formes et des bases de données de diverses natures dont celles issues d’entrepôts de données (ou Data Warehouse).
Le Data Mining, également surnommé Knowledge Discovery in Data (découverte de savoir dans les données), repose sur des algorithmes complexes et sophistiqués permettant de segmenter les données et d’évaluer les probabilités futures, comme les tendances d’un marché.
+ Retour à l'index