L’extraction de
connaissances est le processus de faire usage de diverses sources d'information
pour créer une banque de connaissances cohérent. Dans le cadre de cette
approche, l'extraction sera souvent s'appuyer sur un large éventail de sources
d'informations structurées et non structurées. En cas de succès, les résultats
de l'extraction de connaissances dans les données solide qui peut facilement
être lus et interprétés par un programme donné, permettant à l'utilisateur
final d'utiliser cette connaissance formelle à toutes fins qu'il ou elle
désire.
Plusieurs
sources différentes peuvent être utilisées dans le processus d'extraction de
connaissances. Dans le cadre de sources structurées, les données peuvent être
extraites à partir de divers types de bases de données relationnelles ou un
certain type de langage de balisage extensible XML ou d'une source. Sources non
structurées, telles que des images, différentes formes de documents de
traitement de texte, feuilles de calcul et même texte capturé sur les
programmes de style de bloc-notes peuvent être utilisés dans le cadre du
processus d'extraction. Tant que les sources sont lisibles dans le programme
utilisé pour gérer le processus d'extraction de connaissances, ils peuvent être
utilisés comme sources qui augmentent le potentiel pour le projet qui est
avancée au moyen de l'extraction et permettant à la connaissance finale
produite soit utilisable.
Il existe
plusieurs applications courantes qui se produisent avec l'extraction de
connaissances. Un exemple fréquent est la capacité de capturer des données
depuis une source non structurées et incorporer un certain type de source de
connaissances structuré. Extraction de données trouvés dans les bases de
données relationnelles et l'utiliser pour créer de nouveaux documents, ou de
faire usage de documents électroniques pour importer des données dans les bases
de données relationnelles, est un autre exemple de la façon dont ce type
d'extraction peut accélérer le partage des connaissances formelles sans avoir
besoin de saisir manuellement les données qui est déjà disponible à partir d'une
autre source. Cette réutilisation des connaissances existantes dans un nouveau
format est souvent très utile dans un certain nombre de scénarios, ce qui rend
possible d'utiliser cette connaissance d'une manière qui n'auraient pas été
possible avec la source existante. De cette manière, l'utilisateur peut créer
des sources qui sont idéales pour un certain nombre de différentes applications
plutôt que celles qui concernent le foyer d'origine de la connaissance
formelle.
Avec
l'utilisation de l'extraction de données, il est possible de faire usage d'une
vaste données entrepôt , facilement importer et exporter des données comme un
moyen de créer une nouvelle source qui est utilisable dans un but précis. Ces
sources nouvellement créées à leur tour trouver aussi une place dans l'entrepôt
de données et peuvent éventuellement être utilisés dans la création de
nouvelles extractions qui sont utilisés pour répondre aux besoins d'utilisation
les plus récents. Dans cet esprit, l'extraction de connaissances peut être considéré
comme un outil très utile qui aide à tirer le meilleur parti de toutes les
ressources actuellement sur la main, ce qui simplifie de nombreuses tâches
impliquées dans le partage de cette connaissance formelle.