Voyant
Tools est un environnement en ligne de lecture et d'analyse de textes
numériques de différents formats comme le format HTML, XML, PDF,
RTF, MS WORD mais aussi en texte brut. Il permet également des
exportations des données vers les formats CSV, TXT, XML. Cet environnement
dispose de nombreux outils qui permettent d'analyser de plusieurs
manières les textes. Il
est accessible en plusieurs langues et dans une
version totalement gratuite.
1) La
prise en main de l'environnement Voyant Tools
Lorsque
nous voulons analyser un corpus, trois manières de faire s'offrent à
nous : la première étant de saisir ou de copier-coller un
texte ou un ensemble d'URL, la deuxième d'ouvrir un corpus déjà
créé, et enfin charger un ou plusieurs fichiers locals. Plusieurs
des outils de l'environnement possèdent une barre de recherche qui
permettent une recherche avancée à la manière des opérateurs
booléens.
2) Les
outils et leurs options
Il met à
disposition une vingtaine d'outils pour l'analyse des textes. Les
outils interagissent entre eux, si l'on change une caractéristique
sur un des outils alors cette manipulation aura un impact sur les
autres outils. L'environnement nous impose des outils par défaut que
nous pouvons bien évidemment modifier en cliquant sur l’icône en
forme de fenêtre. Sur plusieurs des outils nous pouvons ajouter une
Stoplist, en français une liste
de mots vide comme les
prénoms personnels, les prépositions à
exclure ou bien des termes
qui ne
nous intéressent pas ce qui est une très bonne chose. Par exemple, exclure les abréviations
récurrentes dans les notes de bas de pages Cf. Cit., changer
certains paramètres, ajouter nous même des termes, rechercher
des mots en particulier et
ainsi de suite. Il y a les outils de visualisation comme
cirrus, liens, arbre de mots,
les outils de tableaux comme contexte,
syntagmes, termes. Ces outils
ont tous une particularité
selon ce que nous voulons analyser
précisément.
3) Analyse
d'un texte de mon choix
J'ai choisis dans mon analyse avec l'environnement Voyant tools
la nouvelle Le journal d'un fou de Luxun trouvé en ligne. Au
départ (Cf. première image les mots les plus fréquents sont des
mots vides, j'ai donc du ajouter la Stoplist chinois dans les options
ce qui donne déjà de meilleurs résultats. Ensuite j'ai voulu me
concentrer sur un caractère bien particulier qui est le caractère 吃
puisque la nouvelle à pour thème principal le
cannibalisme et donc le fait de manger. J'ai donc choisi des outils
en fonction de ma recherche. 吃
est le caractère le plus fréquent dans la
nouvelle puisqu'on le rencontre 30 fois.
Analyse par défaut proposé par l'environnement |
Résultat obtenu après approfondissement de l'analyse |
4) Analyse
dans une perspective de recherche
Il permet
l'importation de plusieurs formats en ligne ou local, il reconnais
les autres langues. Simple d'utilisation avec une interface
ergonomique. Il permet une première analyse du corpus avant de
pouvoir approfondir et de faire ressortir du corpus les éléments
qui nous intéressent.
Pour
d'autres formats comme par exemple le format Opendocument il ne peut
être importé ce qui nous engage à copier coller le document ou
tout simplement le convertir dans un format exploitable par
l'environnement Voyant Tools ce qui est un peu décevant.
Dans
l'ensemble il est très simple d'utilisation, il s'adresse donc
autant aux chercheurs qu'aux étudiants pour faire de l'analyse de
texte. Plus précisément dans une perspective de recherche cet
environnement est utile dans les études comparatives ou encore dans
la création de fiche de lectures des textes numériques.
No comments:
Post a Comment