Quand on laisse trainer un bot conversationnel assez longtemps sur un chan, ou qu'on le nourris avec suffisamment de textes, on se retrouve rapidement avec un dictionnaire conséquent, dépassant les 3000 mots. Ça devient difficile de s'y retrouver. Et encore moins de visualiser.
Parce que dans le dictionnaire d'AMIBE, il n'y a pas que les mots connus. Il y aussi un certain nombre des mots qui suivent directement ce mot. Ce qui fait qu'en moyenne, pour un mot connu, il y a environ 12 entrée dans le dictionnaire d'AMIBE. Pour mon dictionnaire de 3000 mots, on se retrouve avec presque 42000 entrée. Ça fait beaucoup.
Alors je me suis demandé comment visualiser tout ça ? Étant donné que mon dictionnaire est en réalité un réseau de mots, pourquoi ne pas représenter ce réseau ? Un réseau à 3000 noeuds et avec en moyenne 12 liens par noeuds. C'est pas aisé à représenter. Ça fait une jolie bouillie.
Du coup, j'ai représenté les choses sous forme circulaire. Par exemple, avec cet extrait de conversation :
Whiteshoulders [11:04] > Salut Amibe ! Comment ça va ? Whiteshoulders [11:04] > Moi c'est Whiteshoulders. Je suis ton ami. Whiteshoulders [11:05] > Je suis enchanté de faire ta connaissance, Amibe
On voit assez bien les liens entre les mots, et c'est lisible. C'est diablement cool. Maintenant, l'épreuve du feu : que donne-ce avec mon dictionnaire de 3000 mots ?
Déja, ça donne une image trop grosse pour être dans le corps de l'article (16 Mpx). Si vous voulez la voir, c'est ici (attention, elle pèse 19 Mo). Ensuite, je trouve ça beau. On voit la richesse et la complexité d'une conversation.
Même si tout ça ne sert pas à grande chose, je trouve ça beau.
Photo : cype_applejuice
Écrire un commentaire