definition_text_mining

Qu’est ce que le Text Mining ?

Informatique

Aujourd’hui, l’explosion du web, la capacité de stockage illimitée, les réseaux sociaux… renferment des tonnes de données et de documents non structurés, c’est-à-dire en texte brut, et par conséquent, ils sont inexploitables.
Cela fait de l’analyse et de l’exploration des données textuelles des enjeux cruciaux.
En effet, le text Mining ("fouille de textes") est l’ensemble des techniques et algorithmes d'analyse linguistique visant à transformer des textes bruts non- structurés (mails, documents word, présentations PowerPoint, publications sur les réseaux sociaux,…) en des données exploitables, comme un tableau par exemple.

L'exploitation des données offre beaucoup d’avantages, comme l’évolutivité (le traitement de gros volumes de données en quelques secondes), l’analyse en temps réel et la cohérence.

Parmi les méthodes les plus fréquentes dans le text mining nous citons :

- La fréquence des mots pour identifier les termes les plus récurrents.
- L’identification des collocations, c’est-à-dire une séquence de deux ou trois mots consécutifs.
- La concordance pour reconnaître le contexte d’un mot.

Les applications du Text Mining


L'une des applications les plus courantes de cette technologie est la catégorisation des textes qui permet, par exemple, la détection des spams et la classification des mails.

La recherche d’information est aussi une application de l'analyse des textes et l’exemple le plus connu est celui des moteurs de recherche.

Le résumé automatique est très utile dans l’analyse des données, il s’appuie principalement sur la recherche des phrases les plus représentatives dans un document.

Comme vous l’avez constaté, cette technologie est accessible à tous les clients de toutes les industries et pas seulement à ceux qui ont des compétences en programmation, mais aussi à ceux qui travaillent dans le marketing, la vente, le service client et la production.