Actualités du Wiktionnaire
Wiktionnaire:Actualités est un journal mensuel sur le Wiktionnaire, les dictionnaires et les mots. Il est publié en ligne depuis avril 2015. Son écriture est ouverte à toutes les bonnes volontés. Vous pouvez recevoir un avis lors de la publication des prochains numéros, consulter les anciens numéros et participer au brouillon de la prochaine édition. Vous pouvez lire aussi les Regards sur l’actualité de la Wikimedia. Pour les commentaires, critiques ou suggestions, voir la page de discussion.
+ 15 909 entrées et 96 langues modifiées pour atteindre 4 467 308 entrées et 1 251 langues avec au moins cinq entrées.
+ 2 510 entrées en français pour atteindre 397 678 lemmes et 610 978 définitions.
Les cinq langues qui ont le plus avancé, outre le français, sont le same du Nord (+ 7 520 entrées), le gallo (+ 1 239 entrées), l’allemand (+ 1 118 entrées), le breton (+ 565 entrées) et le polonais (+ 560 entrées).
Les nouvelles langues sont : le kaang (+1) et le mro (+1).
+ 2 975 citations ou exemples en français pour atteindre 503 293.
+ 969 médias d’illustrations (images et vidéos) dans les articles du Wiktionnaire, pour atteindre 57 441.
+ 3 414 sections de langue contenant au moins une prononciation audio (dont 619 pour le français) pour atteindre 307 691 sections de langue contenant au moins une prononciation audio pour 138 langues (dont 133 038 pour le français).
Aucun nouveau thésaurus ce mois-ci, le total reste de 1 098 thésaurus dans 67 langues dont 801 thésaurus en langue française.
Wikiscan et Wikistats donnent chaque mois accès à beaucoup de mesures, dont la liste des pages les plus consultées et des pages modifiées par le plus de personnes.
+ 28 mots créés sur les 38 proposés dans les Mots du jour !
Quelques émissions audio ou vidéo sur la lexicographie, la linguistique et la langue française sorties ou découvertes ce mois-ci.
Depuis quelques années, de nombreux médias proposent des mots de l’année, qui sont à la mode ou caractérisent un événement ou une discussion typique d’une année. Ils peuvent être choisis par une rédaction de dictionnaire, par le lectorat d’un journal ou par un sondage en ligne.
Le Multidictionnaire est un ouvrage usuel au Canada, mais moins connu ailleurs, alors qu’il existe depuis 33 ans. Sa septième édition est parue cette année, ce que le numéro d’août des Actualités n’avait pas manqué de faire savoir. C’est à nouveau un fort épais volume proposant des définitions sur plus de 1 800 pages.
Ce qui le distingue d’un dictionnaire de définition centré sur les sens et usages comme le Robert ou d’un dictionnaire encyclopédique tel que le Larousse, c’est qu’il apporte de très nombreuses notes d’explications pédagogiques détaillées. Des indications sur la prononciation plutôt que l’API systématiquement (par exemple : « notamment : les deux m se prononcent comme un seul : ») ou des indication sur la graphie selon le contexte (nu-tête mais tête nue), des indications de la conjugaison des verbes ou sur la structure qu’ils ont dans des phrases et même des indications typographiques avec les règles les plus communes, répétées aussi souvent que nécessaires. Des notes sémantiques et techniques viennent enrichir de très nombreuses entrées afin de faciliter la compréhension, d’expliquer les différences avec des mots proches ou des règles de la langue.
En ceci, il réunit plusieurs ouvrages lexicographiques et pédagogiques, dépassant sur certains aspects de sa couverture les intentions du Wiktionnaire, en accompagnement son lectorat vers la bonne utilisation des termes décrits. Il en vient à être normatif, pointant négativement les anglicismes sans les décrire et manquant parfois de nuance, notamment dans la description de la diversité de la langue. Pourtant, s’agissant d’un ouvrage québécois et canadien, il rend compte des usages spécifiques à cette aire, en indiquant d’une fleur de lys les entrées concernées. Les autres usages régionaux ne sont pas indiqués, et la courte introduction ne s’attarde pas sur les diversités géographiques de la langue. Une centaine de planches et tableaux de conjugaison viennent compléter l’ouvrage, apportant de nombreuses informations supplémentaires au fil de la lecture. La découverte des planches est hasardeuse, ce qui sert également le but pédagogique de l’ouvrage en rappelant régulièrement le fonctionnement de la langue.
La mise en page est claire et assez peu dense, avec de nombreux retours à la ligne pour les notes, qui rend l’exploration assez agréable, et pousse à s’y référer, même pour une personne non-québécoise ! Il existe également une version numérique, que je n’ai pas pu consulter, ainsi qu’un Multi des jeunes qui a l’air plus coloré. Si vous connaissez ces ouvrages, ou d’autres dictionnaires, n’hésitez pas à proposer des compléments à cette chronique !Dans la lignée du logiciel DALL-E, les chercheurs en intelligence artificielle d’OpenAI ont réalisé GLIDE qui permet lui aussi de générer spontanément une image à partir d’un texte en langage naturel. L'aspect intéressant est que l'image est créée à la volée, en s'inspirant de bouts d'images déjà vus dans des catalogues d'images, mais sans les recopier intégralement ; toute image générée devrait donc être une nouvelle image. La technologie utilisée est à base de réseaux de neurones artificiels et plus précisément d'un modèle de type génératif appelé « modèle de diffusion ». Pour l’instant, si le démonstrateur ne fonctionne qu’en anglais, il impressionne quand même fortement. Par exemple, si vous soumettez le texte « a group of rhinoceros walking in muddy water », le logiciel vous affichera environ vingt secondes plus tard une image représentant « un groupe de rhinocéros marchant dans de l’eau boueuse ». Le logiciel devrait aussi permettre d’éditer seulement une partie d’une image existante à partir d’une instruction textuelle. Par exemple, la Figure 3 de la pré-publication GLIDE montre que le logiciel serait en mesure d’ajouter « une peinture d’un corgi sur le mur au-dessus d’un canapé » dans une image existante représentant un salon.
Certes, les images générées sont un peu floues, voire carrément incompréhensibles (essayez par exemple de générer une image en soumettant « a sad person »). Néanmoins, étant donné les progrès dans les réseaux de neurones au cours des dix dernières années, nul doute que ce type de logiciel va s’améliorer.
Dès lors, on s'imagine que les dictionnaires en ligne pourraient l’utiliser pour générer automatiquement une image illustrant chaque mot. Voire ils pourraient l'utiliser pour générer une nouvelle image à chaque téléchargement de page. Cependant, il est probable que les images de certains types de mots du dictionnaire, même avec leur définition (ex : un mot abstrait comme « empathie ») seront extrêmement difficiles à générer. Par conséquent, pour ces mots, peut-être faudra-t-il plutôt utiliser des exemples d'utilisation du mot qui utilisent un contexte « visuel » afin de disposer d'un texte qui guidera efficacement GLIDE à générer une image intéressante pour le lecteur. Bref, amis contributeurs, n'hésitez pas à continuer à alimenter le Wiktionnaire en exemples, ils serviront peut-être à générer de futures images.Ces propositions, affichées sur la page d’accueil, ont été proposées par Noé et Lyokoï. Merci de leurs contributions aux personnes qui ont créé ces nouvelles entrées !
– Une idée de thème de la semaine ? Je sèche !
– Seiche ? Seiche encrier , seiche hameçon, seiche petites mains, seiche pharaon , seiche élégante , seiche flamboyante ?
– C’est charmant !