Tuesday, October 25, 2016

Note critique Voyant Tools




Voyant est un logiciel de lexicométrie qui permet d'obtenir plusieurs informations sur un texte, grâce à une étude des mots qui y sont contenus. Le procédé est le suivant : à partir d’une ou plusieurs  url, d’un fichier téléchargé depuis son pc, ou en copiant/collant le texte, le logiciel va analyser tous les mots, les recouper, et établir plusieurs données statistiques. Le logiciel accepte plusieurs formats, du fichier Word jusqu’au PDF. Ainsi, on obtient après coup la liste par occurrence des mots, soit le nombre de fois où ces mots apparaissent, et nous pouvons « décortiquer » les champs lexicaux du texte.
Cet outil est efficace afin de savoir si le texte choisi est intéressant et/ou valable pour nos recherches, mais également pour créer des tags qui référenceront le texte dans d’autres logiciels comme Zotero ou Evernote. En effet, les mots sont exposés en différents aspect : Le mode Cirrus présente une lexicométrie visuelle, en affichant les mots les plus utilisés par couleur et par taille de police, les mots les plus gros étant les plus utilisés. Ces mots se déclinent également sous forme de tableau avec leur nombre d’apparitions dans le texte (Termes), où en résumé de mots-clés. Viennent ensuite les graphiques qui insistent sur la fréquence des mots dans chaque partie du texte, un lecteur qui permet d’avoir le texte brut (sans l’infographie du site) et de l’exporter dans un fichier.

Voyant a l'avantage d'inclure donc plusieurs analyses, ce que ne fait pas son concurrent TagCrowd, que j'ai trouvé pour ma part très pauvre en fonctionnalités, et dont l'analyse lexicométrique laisse à désirer, beaucoup de mots détectés n'ayant pas vraiment de sens. De plus, Voyant semble détecter bien plus de langues que TagCrowd, comme le montre les exemples ci-dessous : 



 


Concernant les langues non romanes comme par exemple le japonais, il faut noter que la retranscription des  mots peut être faussée. Certains caractères ne vont forcément pas être analysés dans leur ensemble mais de manière individuelle, ce qui va donner des mots différents. Du côté de TagCrowd, le résultat est identique. Cela est probablement dû au fait que les logiciels ont été basé avant tout sur notre alphabet.



Quoiqu’il en soit, lorsqu’il s’agit d’une langue reconnue, Voyant est très efficace, et se révèle incontournable pour  avoir un rapide aperçu des thèmes abordés. C’est un gain de temps non négligeable, et un moyen de mettre en relation plusieurs textes via la création d’un corpus, puisqu’il est possible d’analyser plusieurs documents à la fois.

No comments:

Post a Comment