Tuesday, October 25, 2016

Note critique sur l'usage de TagCrowd

Aspect général du logiciel avant l'étude:
On note une présentation agréable, car épurée : réduite au "Paste Text" et à quelques boutons simples en-dessous qui posent les critères de sélection des mots. Absence de couleur : celle-ci se résume au noir, au blanc et au bleu et permet de se concentrer sur le texte.

Maintenant, passons à l'étude du texte

ÉTUDE TAGCROWD DE CE TEXTE CI-CONTRE :
http://nationalinterest.org/feature/chinas-huge-one-belt-one-road-initiative-sweeping-central-17150


« China's Huge 'One Belt, One Road' Initiative Is Sweeping Central Asia »

« Having overbuilt in many domestic industries—such as coal, cement and even solar panels—the Chinese government is redirecting its capital abroad. The aim is to reduce excessive industrial capacity at home while increasing financial returns. U.S. policymakers ought to be watching this very closely.

One of Beijing’s most ambitious foreign economic development initiatives aims to recreate the legendary Silk Road. Nicknamed One Belt One Road (OBOR), the project wields plenty of financial muscle. It launched in February 2014 with $40 billion—mostly drawn from Beijing’s bountiful foreign exchange reserves. »

1ère expérimentation :
Dans « Choose your text source »
-J'ai copié/collé dans le logiciel un texte de 87 mots sur « China's Huge 'One Belt, One Road' Initiative Is Sweeping Central Asia » (un texte sur la politique de la Nouvelle Route de la Soie tiré du bimensuel américain The National Interest)
-J’ai choisi l’Anglais comme langue de travail , ce qui va de soi !
-Dans « Maximum number of words to show », j'ai demandé à étudier 87 mots (soit le nombre de mots total de mon texte).
Résultat : « showing top 47 of 47 possible words » (j'en conclus que sur ces 87 mots du texte, ils nont sélectionné les 47 premiers mots les plus importants et en ont fait d'ailleurs un top 47 des mots importants)
-Dans « Minimum frequency », j'ai demandé une fréquence d’apparition de chaque mot présenté.
-J'ai demandé de montrer le nombre de mots fréquents apparus dans le texte ( par exemple, les mots « aim », « foreign », « road », « financial » et « Beijing » sont apparus plus d’une fois sur ce texte, soit deux fois plus que la moyenne des mots cités dans ce corpus)
Contre toute attente, les mots tels que « silk », « One Belt One Road » ou « economic » ne sont apparus qu'une seule fois en terme de fréquence alors qu’a la première lecture ils semblaient determinant.
-J'ai actionné aussi la recherche des mots similaires a travers le bouton  «  group similar words (puisque le texte est lui-même en anglais),
-Dans « Convert to lowercase » j'ai converti au format « original »car je n’ai as vu l’intérêt de sortir les mots de leurs contexte dans un document aussi court.

2ème expérimentation :
-Il y a toujours le texte avec 87 mots (toujours dans « Maximum number of words to show »
-Une fréquence minimum de 2 mots (et tout d'un coup, il ne reste plus que les quatres mots importants ayant une fréquence de 2 sur les autres mots du texte, à savoir «foreign », « road », « financial » et « beijing ») Par-contre, on ne retrouve pas le mot « aim » pourtant considéré comme un mot important. Pourquoi ?
- « Group similar words » en mode « non ». Je n'ai plus regroupé les groupes de mots similaire en anglais (résultats : au lieu de soutirer 47 mots sur un top 47, on en retrouve 48 sur le top 48, ce qui est tout de même incroyable)
-Dans « Convert to lowercase », je l'ai mis en « lowercase » (ce qui explique pourquoi « beijing » ne prend pas une majuscule avec B puisque ce que c'est en format dit « par défaut »

3ème expérimentation :
-Il y a toujours le texte avec 87 mots dans « Maximum number of words to show »
- Dans « Minimum frequency » : Une fréquence minimum de 2
-« Group similar words » en mode « oui ». J'ai regroupé les groupes de mots similaires en anglais => tout à coup, le mot « aim »est de retour parmi les mots importants du texte, à savoir « beijing » (toujours avec un b minuscule on se demande pourquoi), « foreign », « road », « financial ».
Donc 5 mots importants dans le texte en tout. Retour aussi du top 47.
- « Convert to lowercase » en mode « lowercase » (d'ailleurs, LOWERCASE ne veut-il pas dire « par défaut », allons voir la prochaine expérimentation de ce texte en format « original »)

4ème expérimentation :
- « Convert to lowercase » en mode « original ». J'ai juste mis le texte en version « original »
Resultat : « Beijing » avec un B majuscule, « Road » avec un R majuscule, « financial », « foreign » et « aim » sont sélectionnés.
On l’aura compris, le mode « original » ne fait qu’extraire les mots du texte dans leur forme originale(et le contexte de leur utilisation est respecté).

5ème expérimentation :
-j’utilise « Maximum number of words to show »,et là je limite à 25 le nombte de mots à éffectuer..
Résultat : on me montre bel et bien 25 mots sur les 47 du top 47 du texte.

6ème expérimentation 
-Cette fois-ci, j'ai collé dans le logiciel l’URL. http://nationalinterest.org/feature/chinas-huge-one-belt-one-road-initiative-sweeping-central-17150 »
Et j'ai demandé 100 mots principaux dans « Maximun number of words to show »
Parmi les mots les plus importants (du plus fréquent au moins fréquent), nous avons :
-« China » (21 fois)
-« billion » (14 fois)
-« Chinese » (11 fois)
-« Asia » (9 fois)
-« economic », « projects », « roads », « Subscribe », « trade », « buil » (7 fois)
-« Beijing », « America », « central », « global » (6 fois)
-« HSR », « funds », « plans » (5 fois)
-« Bank », « construction », « Fear », « financial », « Kazakhstan », « initial », « OBOR » (« One Belt One Road » policy), « route », « year », « Turkmenistan », « infrastructure », « Topics », « construction » (4 fois)

J'en conclus que TagCrowd m'a fait l'analyse de la page web complète, mais pas forcément l'étude du texte que j'étudiais, à savoir «  China's Huge 'One Belt, One Road' Initiative Is Sweeping Central Asia ».

7ème expérimentation :
J'ai téléchargé le texte «  China's Huge 'One Belt, One Road' Initiative Is Sweeping Central Asia » en format HTML (format web) afin d'en faire un fichier à part.
Puis j'ai placé ce texte dans « Upload file » (différent de « download » qui veut dire « téléchargé du site Internet vers son propre ordi » en anglais ; ici « Upload » veut dire « télécharger son fichier depuis son ordi pour l'exporter sur le site »)
Résultat : il m'a sorti cet ensemble de mots divers et varié (mais ici, intéressant, je retrouve le nom du site « nationalinterest » (cité 22), sinon tout le reste sont des citations de mots relevant du champ lexical du web, tels que « org » (24 fois), « http » (31 fois) ou « span » (22 fois)



CONCLUSION : TagCrowd est un outil de lexicométrie. Que ce soit pour étudier un artcile en ligne, un blog ou bien un simple site web, cet outils permet d'analyser la fréquence du nombre de mots utilisés dans les documents que l'on cherche.
Le documents que l'on étudie devient une bases de données informatique et quitte la prison de papier sur lequel il était fixé. :
les informations telles que l'usage et la fréquence des mots employés influencent considérablement l'orientation du chercheur.
Pour le chercheur en Master en quête d’informations sur des sujets peu médiatisé, comme « La politique de la nouvelle route de la Soie » TagCrowd, pourra apparaitre arbitraire et hors de propos dans le choix des mots sélectionnés.
Certains mots utilisés (comme « China », « Road ») représentent les « mots-clés »employés sur le Web. Si ces « mots-clés » ne représentent pas les mots de référence à notre recherche, ils sont pourtant sélectionné avec la justification de TagCrowd en tant que mots utilisés.
Par exemple, nous employons moins les mots tels que « developpment » , « gas », « foreign policy », ou « Challenges » car ils sont moins pertinents que « Asia », « Beijing », « Road » ou « billion ».
TagCrowd nous permet de nous échapper du texte étudié pour prendre un peu de hauteur sur le sujet. (le point de vue du web ! Mais il doit être paramétré avec soins afin que sa sélection de mots ne vous fasse pas basculer dans le hors sujet !


Florie HERAUD


Note Critique - Voyant - Camille Arnoux

VOYANT

Un logiciel de lexicométrie est un outil nous permettant de faire une analyse de données textuelles de textes ou autres nous intéressant. Grâce à ce type d'outil, nous pouvons directement savoir si le texte choisit peut concerner notre sujet ou non.
Le logiciel Voyant est un outil à utiliser directement sur internet et qui est gratuit.
En entrant l'URL ou en copiant-collant un texte, on peut grâce à l'outil décortiquer le texte choisit.




En entrant un texte (ou autre) de notre choix, celui-ci grâce à l'outil est décortiqué et nous permets de connaître plusieurs informations tel que les mots clés, le nombre de mots, etc.
Étant en spécialité coréenne, j'ai essayé de voir si la langue coréenne marchait avec ce type d'outil. Pour mon essai, j'ai utilisé un article de presse informatique tout en langue coréenne. J'ai donc pu constaté que l'utilisation marche parfaitement mais qu'il va prendre toutes et vraiment toutes les informations contenues sur l'url. Il est donc important de ne rentrer que le texte choisit et de faire attention à ce type d'erreur. Sur la photo ci-dessus, on peut s’apercevoir (en lisant le coréen) que les informations par exemple de type météorologique ont aussi été intégrés, ce qui a eu pour défaut de fausser ma recherche. J'ai donc du recommencer et ne rentrer que le texte de l'article seulement.

Une fois la bonne sélection de l'article effectuée, j'ai pu constaté plusieurs 'outils' me permettant de mieux comprendre mon texte. Sur la partie gauche, on peut retrouver le 'cirrus' qui me montre tous les mots clés de l'article. Au milieu, nous avons le texte en entier. Et si on porte une attention sur poussée, on peut se rendre compte qu'en passent sur les mots, la fréquence de celui-ci est noté. Quand le mot est présent plusieurs fois dans le texte, nous pouvons retrouver les autres en cliquant seulement sur celui-ci. En bas à gauche, nous avons un 'Summary ' nous présentant le nombre de mots et les plus fréquents.



Cet outil d'analyse est particulièrement important quand on fait de la recherche car il nous permet de passer de texte en texte sans perdre du temps sur certains qui pourrait ne pas rentrer dans notre sujet. L'utilisation de l'outil est rendu très simple et agréable.
Malheureusement, il semblerait que ce type de logiciel soit plutôt adapté pour les textes en langue française ou anglaise. Car même si j'ai pu comprendre la plus grosse partie de mon article en coréen, le logiciel a tendance à couper les phrases en plein milieu gênant donc la compréhension global. Il n'en reste pas moins un logiciel pratique et intéressant.

Camille Arnoux (M1 LCSA coréen) 


Note critique de Voyant Tools



Note critique de Voyant Tools

 

Vue globale de Voyant Tools (ici analyse d'un article scientifique d'un chercheur taïwanais)

Voyant Tools est une interface en ligne de lecture et d’analyses de textes permettant de mener des analyses lexicométriques se basant sur l’aspect visuel. Cet outil est hébergé sur une plateforme dédié, Huma-Num qui est en fait une infrastructure de recherche  en humanité numérique, proposant des outils gratuits d’analyses textuelles.

L’interface se veut la plus simple et intuitive possible, ressemblant à s’y méprendre à n’importe quel moteur de recherche. Il suffit d’entrer un hyperlien ou de télécharger un document pour pouvoir l’exploiter.  

Voyant Tools possède de nombreux outils pour l’analyse de textes, permettant à l’enseignant ou au jeune chercheur d’étudier des textes sous plusieurs angles d’attaques. La page d’analyse se divise selon cinq éléments :

Outil Cirrus
·         Cirrus, ou nuage de mots permettant de faire ressortir les termes les plus utilisés dans le ou les documents, en passant notre souris sur un mot, il est possible de voir le nombre d’occurrence.

Outil Term Frequencies Chart
·         Term Frequencies Chart, permet de comprendre comment sont répartis les termes par texte dans un document ou corpus via un graphique. C’est là une courbe de fréquence des mots clés les plus présents dans le/les document(s).

Outil Contexts
·         Contexts, illustrant sous forme de tableau les occurrences dans leurs contextes, pratique pour trouver une citation ou partie importante.

Associé à l’outil Bubblelines, cela permet d’afficher sous un format visuel la répartition occurrences les plus fortes dans le texte ou corpus.

Outil Reader
·         Reader, espace où l’on retrouve le texte ou corpus à l’état brut, les occurrences étant surlignées en jaune, nous indiquant ainsi à l’utilisateur où se trouvent les mots-clés. Il est également possible via la barre dédiée, de rechercher une occurrence spécifique dans le texte et d’ensuite l’analyser via les autres outils.


Cependant, ces outils peuvent être remplacés par d’autres outils via une icône dédiée, permettant d’aller encore plus loin dans une analyse textuelle.

Dans l’optique d’une recherche universitaire, Voyant Tools est un précieux allié puisqu’il reconnait de nombreuses langues, notamment le chinois et permet via les outils présents d’isoler les termes et donc les thèmes les plus récurrents dans les écrits de tel ou tel auteur, d’en dégager des tendances etc. et d’avoir une vue d’ensemble sur un corpus de textes via des outils textuels ou visuels permettant de mieux appréhender notre recherche. En tant qu’étudiant en recherche et sinologie (littérature chinoise et traduction), cet outil me sera d’une grande aide et permettra de travailler plus efficacement. Les données d’analyses sont exportables sous plusieurs formats, ce qui est appréciable.



Petit bémol, il y a un fort temps de latence lorsqu’on décide de sélectionner une nouvelle occurrence pour qu’un nouveau terme ou mot-clé puisse être analysé. De plus il semblerait que Voyant Tools ne soit pas en mesure d’analyser tous les caractères des langues sino-tibétaines, créant ainsi d’autres mots. Certains résultats peuvent être faussés, il faut rester vigilant.

Damien GAUTIER
Master I Aire Culturelle Asiatique (ACA) : Recherche en Sinologie (RES) - Aix-Marseille Université
Haghebaert Ch
CQPweb
CQPweb : C'est un système d'analyse de corpus de texte. Analyse et mesure le vocabulaire, le contexte d'un texte. L'inscription se fait avec un pseudo, sa véritable identité et une adresse universitaire, car seules les personnes dépendant d'une université ont accès à ce site.
Je me suis dirigée directement vers le corpus chinois mandarin car je suis directement concernée. Mais il y a un grand choix de langues, tel que italien, anglais, chinois, arabe, persan, hindi, latin... J'ai fait un essai en copiant un texte en chinois. En cliquant sur un caractère, on peut obtenir sa fréquence dans le texte, dans quelles phrases le caractère apparaît, il est d'ailleurs alors en surbrillance. Des stastistiques sur sa fréquence mondiale sont disponibles ; on peut également savoir quels caractères se trouvent le plus souvent accolés, de 1 à 5 caractères à droite comme à gauche par rapport au caractère sélectionné. Différentes vues sont proposées. On peut créer plusieurs listes et faire des analyses comparatives.
On peut ajouter des notes aux résultats obtenus, obtenir les mots clés, rechercher les termes selon leur sens négatif ou par sens positif.
On peut utiliser les expressions régulières pour la recherche, avec ? qui remplace un caractère, * pour aucun ou plusieurs caractères, + pour au moins un caractère. C'est ainsi que *寿 donnera aussi 延年益寿.
Une autre application est disponible, la "distribution", elle permet de visionner pour le caractère sélectionné sa classification par genre, c'est-à-dire fiction, prose, académique, presse, revues, théâtre, religion... la liste est très complète. On peut également faire une restriction sur cette liste. Dans ce même onglet on peut cliquer pour télécharger les documents ainsi générés.
C'est un outil intéressant, quand on s'intéresse par exemple à l'étymologie et à l'usage du vocabulaire à différentes périodes de l'Histoire.
Une vidéo tutorielle en anglais sur Youtube est disponible pour une bonne prise en main. Enfin je l'ai trouvée fastidieuse, le présentateur répète 10 fois CQP toutes les 20 secondes ! C'est épuisant à suivre.
TagCrowd :
On colle le texte à analyser, et les mots les plus fréquents sont alors affichés, avec une taille proportionnelle à la fréquence. On peut aussi faire analyser un lien Internet, ou un document entier.
Les choix de langue sont importants, 15 langues ainsi que Google search mais pas de chinois.
Les options sont à peu près les mêmes que CQPweb, c'est-à-dire nombre maximum de mots à montrer, montrer ou non la fréquence, grouper ou non des mots similaires (anglais), convertir ou non en minuscules, mots à ne pas montrer.
Avec le français, les accents sont ignorés ; avec le chinois, c'est le pinyin sans ton qui sort au lieu de caractères.
Le résultat peut être enregistré au format html ou pdf sur le site, à télécharger ensuite.





Note critique Voyant Tools - DIANA Aurélie Master 1 LCSA

    Voyant Tools est un logiciel (application) qui permet d'utiliser la lexicometrie pour étudier un textes au fur et à mesure de nos recherches. La léxicometrie qui est donc la science qui étudie statistiquement les mots, est clairement très difficile voir impossible pendant des recherches poussées qui regrouperaient d’innombrable ouvrage numérique. Voyant Tools est facile d'accès (le fait de ne pas devoir l'installer et aussi un petit plus), et simple à demarrer. Le concept est de poster un texte (déja présent sur votre outil ou d'une URL) et il en fait l'analyse. C'est-à-dire que : il va nous déterminer, bien évidemment la fréquence des mots, (de manière esthétique à mon goût, mais aussi sous forme de graphique), tout en nous affichant le texte en milieu de page, si le texte est long, le logiciel va nous le découper en partie que l'on peut choisir. Sur le plan pratique, quand on découvre un texte et qu'on le place sur Voyant Tools on peut savoir immédiatement si les thèmes abordés nous intéressent ou si on passe au suivant.
    Contrairement à TagCrowd (qui en passant ressemble plus à un site de conversion de video Youtube) Voyant Tools sera détecter le japonais (qui dans mon cas est dans mon intérêt). Même si l'analyse du japonais n'est pas parfaite a mon goût cela est déjà une bonne chose de bien le détecter.

   Tout d'abord j'ai donc commencé à charger un de mes propres essais en japonais pour évaluer si ce que Voyant Tools allait me démontrer était bien dans mon idée. Ce fut concluant. Ensuite pour le cas de l'anglais pas de problème non plus, avec une recherche plus poussée bien sur concluante aussi.
 
   Voyant Tools est munie d'aide compréhensive et efficace de toutes ses fonctionnalitées avec des petits point d'interrogation.
   En outre, si le texte est un peu gros et que l'on veut rechercher un passage précis du texte, l'outil sera un peu long voir sans réponse.

   Pour conclure, Voyant Tools est agréable à utiliser (Point important pour moi puisque faire des recherches nous apporte pas forcement de l'agréable). Bien que ça ne s'impose qu'aux données numériques, c'est déjà un gain de temps monumentale, Même si je n'ai pas pu faire de recherche poussées et donc pas pu voir non plus l'authenticité des informations données. La récurrence ne fait pas tout mais c'est un début. Voyant Tools est donc un bon logiciel de commencement de curiosité pour un texte.

 

Note critique Voyant - Mercier Emilie Master 1 RES

Voyant Tools est un environnement en ligne de lecture et d'analyse de textes numériques de différents formats comme le format HTML, XML, PDF, RTF, MS WORD mais aussi en texte brut. Il permet également des exportations des données vers les formats CSV, TXT, XML. Cet environnement dispose de nombreux outils qui permettent d'analyser de plusieurs manières les textes. Il est accessible en plusieurs langues et dans une version totalement gratuite.

1) La prise en main de l'environnement Voyant Tools
Lorsque nous voulons analyser un corpus, trois manières de faire s'offrent à nous : la première étant de saisir ou de copier-coller un texte ou un ensemble d'URL, la deuxième d'ouvrir un corpus déjà créé, et enfin charger un ou plusieurs fichiers locals. Plusieurs des outils de l'environnement possèdent une barre de recherche qui permettent une recherche avancée à la manière des opérateurs booléens.

2) Les outils et leurs options
Il met à disposition une vingtaine d'outils pour l'analyse des textes. Les outils interagissent entre eux, si l'on change une caractéristique sur un des outils alors cette manipulation aura un impact sur les autres outils. L'environnement nous impose des outils par défaut que nous pouvons bien évidemment modifier en cliquant sur l’icône en forme de fenêtre. Sur plusieurs des outils nous pouvons ajouter une Stoplist, en français une liste de mots vide comme les prénoms personnels,  les prépositions à exclure ou bien des termes qui ne nous intéressent pas  ce qui est une très bonne chose. Par exemple, exclure les abréviations récurrentes dans les notes de bas de pages Cf. Cit., changer certains paramètres, ajouter nous même des termes, rechercher des mots en particulier et ainsi de suite. Il y a les outils de visualisation comme cirrus, liens, arbre de mots, les outils de tableaux comme contexte, syntagmes, termes. Ces outils ont tous une particularité selon ce que nous voulons analyser précisément.

3) Analyse d'un texte de mon choix
J'ai choisis dans mon analyse avec l'environnement Voyant tools la nouvelle Le journal d'un fou de Luxun trouvé en ligne. Au départ (Cf. première image les mots les plus fréquents sont des mots vides, j'ai donc du ajouter la Stoplist chinois dans les options ce qui donne déjà de meilleurs résultats. Ensuite j'ai voulu me concentrer sur un caractère bien particulier qui est le caractère puisque la nouvelle à pour thème principal le cannibalisme et donc le fait de manger. J'ai donc choisi des outils en fonction de ma recherche. est le caractère le plus fréquent dans la nouvelle puisqu'on le rencontre 30 fois.
Analyse par défaut proposé par l'environnement

Résultat obtenu après approfondissement de l'analyse


4) Analyse dans une perspective de recherche
Il permet l'importation de plusieurs formats en ligne ou local, il reconnais les autres langues. Simple d'utilisation avec une interface ergonomique. Il permet une première analyse du corpus avant de pouvoir approfondir et de faire ressortir du corpus les éléments qui nous intéressent.
Pour d'autres formats comme par exemple le format Opendocument il ne peut être importé ce qui nous engage à copier coller le document ou tout simplement le convertir dans un format exploitable par l'environnement Voyant Tools ce qui est un peu décevant.

Dans l'ensemble il est très simple d'utilisation, il s'adresse donc autant aux chercheurs qu'aux étudiants pour faire de l'analyse de texte. Plus précisément dans une perspective de recherche cet environnement est utile dans les études comparatives ou encore dans la création de fiche de lectures des textes numériques.

Note critique Voyant Tools




Voyant est un logiciel de lexicométrie qui permet d'obtenir plusieurs informations sur un texte, grâce à une étude des mots qui y sont contenus. Le procédé est le suivant : à partir d’une ou plusieurs  url, d’un fichier téléchargé depuis son pc, ou en copiant/collant le texte, le logiciel va analyser tous les mots, les recouper, et établir plusieurs données statistiques. Le logiciel accepte plusieurs formats, du fichier Word jusqu’au PDF. Ainsi, on obtient après coup la liste par occurrence des mots, soit le nombre de fois où ces mots apparaissent, et nous pouvons « décortiquer » les champs lexicaux du texte.
Cet outil est efficace afin de savoir si le texte choisi est intéressant et/ou valable pour nos recherches, mais également pour créer des tags qui référenceront le texte dans d’autres logiciels comme Zotero ou Evernote. En effet, les mots sont exposés en différents aspect : Le mode Cirrus présente une lexicométrie visuelle, en affichant les mots les plus utilisés par couleur et par taille de police, les mots les plus gros étant les plus utilisés. Ces mots se déclinent également sous forme de tableau avec leur nombre d’apparitions dans le texte (Termes), où en résumé de mots-clés. Viennent ensuite les graphiques qui insistent sur la fréquence des mots dans chaque partie du texte, un lecteur qui permet d’avoir le texte brut (sans l’infographie du site) et de l’exporter dans un fichier.

Voyant a l'avantage d'inclure donc plusieurs analyses, ce que ne fait pas son concurrent TagCrowd, que j'ai trouvé pour ma part très pauvre en fonctionnalités, et dont l'analyse lexicométrique laisse à désirer, beaucoup de mots détectés n'ayant pas vraiment de sens. De plus, Voyant semble détecter bien plus de langues que TagCrowd, comme le montre les exemples ci-dessous : 



 


Concernant les langues non romanes comme par exemple le japonais, il faut noter que la retranscription des  mots peut être faussée. Certains caractères ne vont forcément pas être analysés dans leur ensemble mais de manière individuelle, ce qui va donner des mots différents. Du côté de TagCrowd, le résultat est identique. Cela est probablement dû au fait que les logiciels ont été basé avant tout sur notre alphabet.



Quoiqu’il en soit, lorsqu’il s’agit d’une langue reconnue, Voyant est très efficace, et se révèle incontournable pour  avoir un rapide aperçu des thèmes abordés. C’est un gain de temps non négligeable, et un moyen de mettre en relation plusieurs textes via la création d’un corpus, puisqu’il est possible d’analyser plusieurs documents à la fois.