Voyant est un logiciel de lexicométrie qui permet d'obtenir
plusieurs informations sur un texte, grâce à une étude des mots qui y sont
contenus. Le procédé est le suivant : à partir d’une ou plusieurs url, d’un fichier téléchargé depuis son pc, ou en
copiant/collant le texte, le logiciel va analyser tous les mots, les recouper,
et établir plusieurs données statistiques. Le logiciel accepte plusieurs
formats, du fichier Word jusqu’au PDF. Ainsi, on obtient après coup la liste
par occurrence des mots, soit le nombre de fois où ces mots apparaissent, et
nous pouvons « décortiquer » les champs lexicaux du texte.
Cet outil est efficace afin de savoir si le texte choisi
est intéressant et/ou valable pour nos recherches, mais également pour créer
des tags qui référenceront le
texte dans d’autres logiciels comme Zotero ou Evernote. En effet, les mots sont
exposés en différents aspect : Le mode Cirrus présente une lexicométrie
visuelle, en affichant les mots les plus utilisés par couleur et par taille de
police, les mots les plus gros étant les plus utilisés. Ces mots se déclinent
également sous forme de tableau avec leur nombre d’apparitions dans le texte
(Termes), où en résumé de mots-clés. Viennent ensuite les graphiques qui
insistent sur la fréquence des mots dans chaque partie du texte, un lecteur qui
permet d’avoir le texte brut (sans l’infographie du site) et de l’exporter dans
un fichier.
Voyant a l'avantage d'inclure donc plusieurs analyses, ce
que ne fait pas son concurrent TagCrowd, que j'ai trouvé pour ma part très
pauvre en fonctionnalités, et dont l'analyse lexicométrique laisse à désirer,
beaucoup de mots détectés n'ayant pas vraiment de sens. De plus, Voyant semble
détecter bien plus de langues que TagCrowd, comme le montre les exemples
ci-dessous :
Concernant les langues non romanes comme par exemple le
japonais, il faut noter que la retranscription des mots peut être faussée. Certains caractères ne
vont forcément pas être analysés dans leur ensemble mais de manière
individuelle, ce qui va donner des mots différents. Du côté de TagCrowd, le résultat
est identique. Cela est probablement dû au fait que les logiciels ont été basé
avant tout sur notre alphabet.
Quoiqu’il en soit, lorsqu’il s’agit d’une langue reconnue,
Voyant est très efficace, et se révèle incontournable pour avoir un rapide aperçu des thèmes abordés. C’est
un gain de temps non négligeable, et un moyen de mettre en relation plusieurs
textes via la création d’un corpus, puisqu’il est possible d’analyser plusieurs
documents à la fois.
No comments:
Post a Comment