Définition de Data mining

Vous êtes chef d’entreprise ou travailleur indépendant ? Découvrez l'étendue de nos services :

Sous-traitez votre téléprospection
acheter des rendez-vous
Devenez téléprospecteur indépendant
devenir téléprospecteur
Dotez-vous d'un logiciel de téléprospection pro
logiciel de téléprospection
Achetez des fichiers de prospection BtoB
acheter fichiers d'entreprises

Le data mining, également appelé découverte de connaissances dans les bases de données, correspond au processus de découverte de modèles et de relations intéressants et utiles dans de grands volumes de données. Ce domaine combine des outils issus des statistiques et de l’intelligence artificielle (tels que les réseaux neuronaux et le machine learning) avec la gestion de bases de données pour analyser de grandes collections numériques, appelées ensembles de données. L’exploration de données est largement utilisée dans les entreprises (assurances, banques, commerce de détail), la recherche scientifique (astronomie, médecine) et la sécurité gouvernementale (détection des criminels et des terroristes).

Un processus directement en lien avec les bases de données

La prolifération de nombreuses grandes bases de données gouvernementales et privées, parfois reliées entre elles, a conduit à l’adoption de réglementations visant à garantir l’exactitude des dossiers individuels et à les protéger contre toute consultation ou altération non autorisée. La plupart des types d’exploration de données visent à vérifier la connaissance générale d’un groupe plutôt que la connaissance d’individus spécifiques, bien que l’analyse des modèles puisse également être utilisée pour discerner des comportements individuels anormaux tels que la fraude ou d’autres activités criminelles.

Origines et premières applications

Avec l’augmentation des capacités de stockage des ordinateurs dans les années 1980, de nombreuses entreprises ont commencé à stocker davantage de données transactionnelles. Les collections d’enregistrements qui en résultaient, souvent appelées entrepôts de données, étaient trop importantes pour être analysées avec les approches statistiques traditionnelles.

Plusieurs conférences et ateliers informatiques ont été organisés pour examiner comment les récentes avancées dans le domaine de l’intelligence artificielle (IA), telles que les découvertes des systèmes experts, les algorithmes génétiques, l’apprentissage machine et les réseaux neuronaux, pouvaient être adaptées à la découverte de connaissances (terme préféré de la communauté informatique). Ce processus a conduit en 1995 à la première conférence internationale sur la découverte de connaissances et le data mining, qui s’est tenue à Montréal, et au lancement en 1997 de la revue Data Mining and Knowledge Discovery. C’est également à cette époque que de nombreuses sociétés d’extraction de données ont été créées et que des produits ont été introduits.