Actualités du Wiktionnaire
Wiktionnaire:Actualités est un journal mensuel sur le Wiktionnaire, les dictionnaires et les mots. Il est publié en ligne depuis avril 2015. Son écriture est ouverte à toutes les bonnes volontés. Vous pouvez recevoir un avis lors de la publication des prochains numéros, consulter les anciens numéros et participer au brouillon de la prochaine édition. Vous pouvez lire aussi les Regards sur l’actualité de la Wikimedia. Pour les commentaires, critiques ou suggestions, voir la page de discussion.
Quelques émissions audio ou vidéo sur la lexicographie, la linguistique et la langue française sorties ou découvertes ce mois-ci.
Le 1er novembre ouvre la Cité internationale de la langue française, au château de Villers-Cotterêts dans les Hauts-de-France. Dans ce lieu, le roi François ier a signé l’ordonnance d’août 1539 sur le fait de la justice, le plus ancien texte normatif encore en vigueur en France : elle impose de remplacer le latin par le français ou des langues régionales dans les domaines du droit.
Cette nouvelle cité est inaugurée ce 30 octobre par le président de la République qui l’avait promise en 2017 lors de sa campagne électorale. Constituée d’un parcours interactif sur la langue française, elle accueillera aussi des associations, des résidences d’auteurs, des rappeurs, des slameurs ou encore des stand-uppeurs. Ce projet construit autour d’un monument, d’un parc et d’une place historique a aussi été pensé comme un projet territorial pour rattacher la Picardie désindustrialisée à la capitale, comme un outil politique voulant entretenir des relations de plus en plus tendues avec le monde francophone, comme un « instrument de lutte contre la décivilisation » selon l’entourage d’Emmanuel Macron. Le parcours cosigné par Barbara Cassin est donc hautement politique et à visée internationale.
Le site entièrement rénové avec un budget de 211 millions d’euros attend 200 000 visiteurs par an.+ 49 822 entrées et 111 langues dont le nombre d’entrées a été modifié, pour atteindre 5 012 539 entrées et 1 378 langues avec au moins cinq entrées.
+ 11 720 entrées en français pour atteindre 420 804 lemmes et 659 987 définitions.
Les cinq langues qui ont le plus avancé, outre le français, sont l’italien (+ 17 297 entrées), l’allemand (+ 11 354 entrées), le same du Nord (+ 2 583 entrées), le portugais (+ 1 699 entrées) et le sicilien (+ 650 entrées).
Grâce à la collaboration mensuelle initiée par CKali, 3 langues ont passé la barre des 100 entrées : l’holikachuk (101, + 22), l’ahtna (100, + 23), l’inupiaq (100, + 27).
Une nouvelle langue : le moyen écossais (+2).
+ 5 609 citations ou exemples en français pour atteindre 607 678 pour les entrées en français, et 321 031 pour les entrées d’autres langues (+17 020).
+ 430 médias d’illustrations (images et vidéos) dans les pages principales du Wiktionnaire, pour atteindre 75 660.
+ 24 734 sections de langue contenant au moins une prononciation audio (dont 5 202 pour le français) pour atteindre 522 460 sections de langue contenant au moins une prononciation audio pour 165 langues (dont 170 326 pour le français).
+ 4 nouveaux thésaurus ce mois-ci, le total est de 1 181 thésaurus dans 74 langues dont 861 thésaurus en langue française. Les nouveaux thésaurus sont pour la sérigraphie par Noé, le dinosaure par Lyokoï, l’encyclopédie par DarkVador79-UA et l’informatique en chinois par Popolon. NicoScribe a fait aussi un peu de rangement, en créant deux pages de redirection dans le cas de thésaurus homographes (cinéma : l’art et le lieu ; vol aérien et en droit).
Wikiscan et Wikistats donnent chaque mois accès à beaucoup de mesures, dont la liste des pages les plus consultées et des pages modifiées par le plus de personnes.
+ 22 mots créés sur les 34 proposés dans les Mots du jour ! Merci à Basnormand, Bercours, Bpierreb, Pamputt.
En 1882, paraît une Grammaire et vocabulaire de la langue Taensa, avec textes traduits et commentés, par Jean-Dominique Haumonté, Jean Parisot et Lucien Adam. Elle a été depuis numérisée et rendue disponible sur Internet Archive. L’auteur principal, Jean Parisot, est un jeune séminariste, qui deviendra abbé par la suite. Il indique dans la préface avoir trouvé dans les affaires de son grand-père, feu Jean-Dominique Haumonté, du village de Plombières, un manuscrit en espagnol d’une grammaire d’une langue parlée en Amérique du Nord, le taensa. Langue des Taensa qui vivaient dans l’actuelle Louisiane, éteints depuis les années 1740. Grâce à l’aide du linguiste reconnu Lucien Adam, il fait publier la grammaire et les textes de cette langue, inédite.
En 1883, le linguiste américain Daniel G. Brinton publie un article sous le titre A Deception Exposed dans lequel il analyse la publication et exprime de grands doutes sur l’histoire, considérant qu’il puisse ne s’agir que d’une fumisterie. Pourquoi le texte serait-il en espagnol alors que le territoire où vivaient les Taensas n’a été colonisé que par les Français ? Comment a-t-il été traduit ? Personne n’a pu voir ce manuscrit original et il aurait été perdu depuis. De plus, les traits grammaticaux décrits paraissent bien peu communs pour la région et étranges, notamment la présence d’un genre grammatical (comme en français). Au niveau culturel surtout, les faits rapportés paraissent saugrenus pour qui connait l’histoire et la géographie, notamment une saison de la neige et la présence de canne à sucre, introduite par les Jésuites en 1761 seulement, après la disparition des Taensas.
En 1885, l’éditeur scientifique de la Grammaire, Lucien Adam, publie une réponse défendant son engagement, Le taensa a-t-il été forgé de toutes pièces ? Réponse à M. Daniel G. Brinton, à laquelle ce dernier répond à son tour, en anglais. En 1886, point d’orgue et conclusion de cette histoire avec un article en français, « La langue taensa », publié par Julien Vinson dans la Revue de linguistique et de philologie comparée. Il est réédité ce mois-ci dans Wikisource, en complément à cette chronique.
Julien Vinson s’implique car il avait pu échanger avec Jean Parisot avant la publication du livre et dispose d’informations nouvelles. Durant les premiers échanges, Jean Parisot indiquait ne posséder que quelques chants et admettait avoir complété le manuscrit de compositions qui lui semblaient pertinentes. Le contenu nouveau, apparu dans le livre publié, paraît sortir de nulle part et ne coïncide pas avec la première version, par l’apparition de nouveaux chiffres notamment. Le doute est plus qu’important, et Julien Vinson conclut à une invention pure et simple du manuscrit original et de la langue elle-même par un jeune homme féru de linguistique.
L’article se conclut en faisant référence à Psalmanazar qui inventa une fausse langue, le formosan, amenant l’auteur a publier un autre article à ce sujet, « Psalmanaazaar et la langue formosane », également disponible sur Wikisource.
La langue taensa telle que décrite dans cette Grammaire n’a donc sans doute jamais existé et les Taensa ont parlé une langue proche de celle des Natchez, vivant dans la même région. Le canular fut cependant bien réalisé et soutenu par un éditeur qui n’a su accepter de reconnaître son erreur pendant un temps. Il n’a cependant duré guère plus que quelques années, et le taensa rejoignit la liste des langues qui n’ont jamais existé, aux côtés de celles qui relèvent d’erreurs de documentation honnêtes, telles que présentées dans le numéro précédent des Actualités.Comme ce que l’on conçoit bien s’énonce aisément, et que vous êtes pénétré par votre sujet, votre plume est alerte, votre texte se construit, les mots pour le dire vous viennent… mais subitement vous butez. Un mot vous échappe, vous l’avez pourtant sur le bout de la langue. Votre plume est arrêtée en plein élan ; vous cherchez, ne trouvez point. Une périphrase pourrait faire l’affaire, mais vous la trouvez fade. Votre travail devient laborieux. Mais vous ouvrez le dictionnaire analogique, et les entrées qui touchent à votre sujet l’éclairent d’un jour nouveau, les mots qui y sont liés créent des associations nouvelles, auxquelles nous n’auriez peut-être pas pensé — votre plume retrouve son agilité, votre texte sa vivacité, et sans peine vous lui mettrez d’ici quelques minutes un point final. Qu’il s'agisse d’une plaidoirie, d’un chapitre de roman ou d’un rapport, la magie du dictionnaire analogique opère, tant ce couteau suisse des écrivains est un instrument d’aide à la pensée.
Et peut-être vous réjouissez-vous de découvrir dans cette rubrique un nouveau dictionnaire analogique : les éditeurs n’en proposant que quelques références, une nouveauté serait bienvenue. Mais voilà : le Dictionnaire analogique de la langue française de Guiseppe Cappiello n’est pas un dictionnaire. Publié dans l’excellente collection « Vertige de la langue » chez Hermann, cet ouvrage universitaire traite du concept de dictionnaire analogique de la langue française — d’où son titre.
L’auteur examine les différents dictionnaires analogiques existant en français, du premier, de Prudence Boissière, en 1862, jusqu’à la révolution analogique des dictionnaires portée par Paul Robert. La prose est parfaitement documentée, comme il sied à un ouvrage universitaire ; elle est également fluide, et d’un commerce très agréable. Cette plongée historique dans l’analogie lexicographique en langue française suffirait à contenter le lecteur et justifierait à elle seule la chronique de cet ouvrage dans la présente rubrique. Mais ces pages contiennent bien plus : le livre s’ouvre sur une fort utile introduction aux dictionnaires, tout à la fois théorique, pratique et historique. L’auteur s’intéresse ensuite à la notion d’ordre et à sa valeur dans les dictionnaires — les pages consacrées à l’ordre alphabétique sont un délice de lecture. Plus loin, l’auteur explique les notions de sémasiologie et d’onomasiologie, qui sont fort éclairants. Ceci posé, et en toute logique, l’auteur en vient au concept d’analogie, qu’il éclaire avec maestria. Puis il en vient aux parties historiques citées plus haut : le lecteur est comblé.
Mais ce n’est pas tout ! L’auteur passe à la pratique, dans un ultime chapitre consacré à l’usage du dictionnaire analogique en littérature, illustré par l’exemple du poète Saint-John Perse dont les manuscrits témoignent de son utilisation de celui de Charles Maquet, publié en 1936. Enfin, la bibliographie de l’ouvrage suffit à composer la bibliothèque idéale du wiktionnariste.
L’ensemble de l’ouvrage tient en 208 pages seulement, ce qui m’a surpris : j’avais le sentiment d’en avoir lu bien plus, tant le savoir partagé par M. Cappiello est vaste. J’espère que le lectorat des Actualités aura compris le grand intérêt de ce livre, et qu’il me pardonnera d’avoir choisi comme dictionnaire de ce mois cet ouvrage qui n’en est pas un.
Enfin, je tiens à dire que j’ai découvert cet ouvrage tout à fait par hasard, dans une librairie nîmoise. Sans le libraire qui l’a choisi, je ne l’aurais sans doute jamais découvert : que M. Teissier soit ici remercié. Vivent les libraires !Ces suggestions, affichées sur la page d’accueil, ont été proposées par Noé. Merci de leurs contributions aux personnes qui ont créé de nouvelles entrées : Bercours, Bpierreb, DarkVador79-UA, Harmonide, Noé et Willylexomil !
Connaissez-vous le métier d’art de l’émaillage sur lave ? Il est pratiqué par des émailleurs sur lave et des émailleuses sur lave, à partir de différentes roches volcaniques, telle que la pierre de Volvic pour produire de la lave émaillée.
Et si on s’intéressait aux ouvrages hydrauliques ? Ascenseur à bateaux, ascenseur à caisson, bassin à portes marinières (aussi appelé paléo-écluse et archéo-écluse), fontaine de Héron, pente d’eau.
Alors que le 10 octobre est la Journée mondiale de la santé mentale, voici des expressions qui utilisent la folie pour désigner tout autre chose : folle farine, plastique fou, fou varié, bon fou et mauvais fou (aux échecs), folle sagesse, Fou-nan.
Et s’il n’existait pas qu’une seule réponse à la grande question sur la vie, l’univers et tout le reste ? Nous sommes la quarante-deuxième semaine de l’année alors on cherche s’il s’agit de réponse à l’intervention, réponse combat-fuite, réponse humanitaire, réponse impulsionnelle, réponse linéaire, réponse ministérielle ou réponse sexuelle humaine ?
Quelques insectes aux noms étonnants : abeille à culottes , chevrette bleue , déesse précieuse , éristale gluante , magicienne dentelée , pantale globe-trotteur
Le 5 novembre est la journée mondiale de sensibilisation aux tsunamis. Créons le vocabulaire manquant pour mieux les décrire et mieux s’en protéger : tsunamisation, échelle Sieberg-Ambraseys, après-tsunami, paléo-tsunami, séisme côtier, séisme sous-marin.
Dans un article publié le 21 octobre dans la revue linguistique Linx, Franck Sajous étudie la qualité des définitions pour le français du Wiktionnaire. Il s’intéresse notamment à savoir si la qualité des définitions est corrélée au nombre de révisions qui ont eu lieu sur ces définitions.
L’auteur s’interroge d’abord sur la notion de qualité des définitions. Il a d’abord essayé de s’appuyer sur les bonnes et très bonnes entrées en français mais relève que le nombre de pages concernées est trop faible pour pouvoir en tirer des conclusions statistiquement valables. Par ailleurs, il relève que les critères de qualité donnés sur Wiktionnaire:Évaluation/Critères de qualité sont parfois flous et pas toujours respectés. Cette lecture critique devrait nous permettre de clarifier ces critères et améliorer nos entrées labellisées dont les défauts sont relevés dans l’article.
L’auteur a étudié le dump du 1er septembre 2021 et en a tiré plusieurs statistiques. L’étude met en avant des chiffres intéressants. Parmi toutes les révisions effectuées, un tiers sont réalisées par seulement 11 personnes, la moitié par 27 personnes et les deux tiers par 65 personnes. Si on regarde spécifiquement les révisions de définition, deux personnes sont à l’origine de plus de 20 % de ces révisions, 5 personnes d’un tiers de celles-ci, 15 pour la moitié et 42 pour les deux tiers. On apprend ensuite que parmi les entrées de lemmes en français, chaque entrée est en moyenne modifiée 7 fois par des humains (avec une médiane à 3). Concernant les modifications « profondes » de définition, la moyenne est à seulement 0,42 modification par définition.
On apprend également que les robots sont responsables de la création de 37 % des pages et de 30 % des sens. Comme ces créations sont faites à partir de dictionnaire dans le domaine public (Littré, 8e édition du Dictionnaire de l’Académie française), Franck Sajous s’interroge pour savoir si ces entrées importées sont davantage retouchées par le contributorat que les entrées créées par des humains. La différence n’est pas marquée étant donné que seules 28 % des créations réalisées par un bot ont été retouchées par un humain, à comparer à 26 % de retouches pour les entrées créées par des humains. Il est également à noter qu’il faut attendre en moyenne 2,7 années avant qu’une définition ne soit retouchée dans le cas où la définition a été écrite par un humain et 4,2 années quand c’est un robot qui a créé l’entrée.
Dans la fin de l’article, Franck Sajous s’intéresse à différents problèmes de qualité repérés dans 3 entrées différentes.
En conclusion, Franck Sajous décrit le Wiktionnaire plus comme un dictionnaire contributif (et aussi un agrégat lexicographique) que comme un dictionnaire collaboratif. Afin d’inciter les contributeurs et contributrices à réviser les définitions, l’auteur imagine un système de votes centré sur les définitions comme ce qui est mis en place dans le projet Kamusi. En votant, le contributorat gagnerait des points et pourrait recevoir des badges (après l’obtention d’un certain nombre de points) à mettre sur sa page personnelle, un peu comme ce que propose le modèle {{Contributions}}
. Enfin, l’auteur indique qu’une relecture systématique n’est pas gage de qualité (en prenant l’exemple de wagonnet) mais qu’elle permettrait probablement de relever des erreurs évidentes (comme des problèmes d’indication du genre grammatical).