L’outil
en ligne « Voyant » est un
logiciel gratuit de lexicométrie d’accès facile et immédiat qui analyse les
données textuelles. Pour approcher cet outil j’ai utilisé les vingt premières
pages des mémoires écrites par Hu Shixin, le sujet de recherche sur lequel je
travaille. Pour ce faire j’ai simplement fait un copié-collé du texte sur la
page d’accueil de « Voyant »,
une première fois avec le texte en caractères chinois et une deuxième fois avec
la traduction française pour pouvoir comparer.
L’analyse
produite par le logiciel donne différentes informations, tout d’abord en haut à
gauche, dans le cadre « Cirrus » les caractères les plus fréquents
sont représentés de façon graphique et colorée, dans une police plus ou moins
grande en fonction de leur récurrence dans le texte (« le nuage de
mots »). Ainsi ce sont les caractères « 的 »
« 我 » et « 日本 » dont
les occurrences sont les plus nombreuses dans mon texte, ce qui n’apporte pas
grand-chose, « 的 » étant le caractère le plus
fréquent en chinois, « 我 » étant un sujet évident
dans toute écriture autobiographique et « 日本 » étant le thème principal
de cette partie du texte dans laquelle l’auteur raconte ses études au Japon. En
français ce sont aussi les mots « Japon » et « japonais »
qui, logiquement, sont en tête.
Ce
qui est certainement plus intéressant c’est la fonction « liens » qui
permet de voir à quels autres mots sont généralement associés les termes les
plus fréquents et cela sous une forme ludique de « toile » malléable.
Cependant, le manque de moyens pour affiner l’analyse oblige à un résultat très
global et rend impossible une approche plus fine et détaillée qui soit simple à
utiliser, mais il est vrai qu’on peut toutefois ajouter des mots à la toile
pour entrevoir leurs relations ou bien varier le nombre de mots à relier (30 au
maximum).
En
sélectionnant un mot dans ce cadre, les informations correspondantes s’affichent
aussi sur les autres outils présents sur la page. Ainsi, toutes les occurrences
du mot sont par exemple surlignées en jaune dans le « lecteur », ce
qui permet de les localiser facilement dans leur contexte. L’outil
« tendances » permet quant à lui de visualiser graphiquement la
fréquence d’un mot à travers une segmentation du document, on peut ainsi voir
si un terme est plus présent au début qu’à la fin du texte : ainsi le
terme « père » est très présent dans le premier segment (Hu Shixin
parle alors des entreprises de son père), alors que le terme
« Japon » domine par la suite.
Daphné Sterk, M1 Histoire
No comments:
Post a Comment