Actualités du Wiktionnaire
Wiktionnaire:Actualités est un journal mensuel sur le Wiktionnaire, les dictionnaires et les mots. Il est publié en ligne depuis avril 2015. Son écriture est ouverte à toutes les bonnes volontés. Vous pouvez recevoir un avis lors de la publication des prochains numéros, consulter les anciens numéros et participer au brouillon de la prochaine édition. Vous pouvez lire aussi les Regards sur l’actualité de la Wikimedia. Pour les commentaires, critiques ou suggestions, voir la page de discussion.
Statistiques portant sur plus d’un mois.
+ 46 109 entrées et 158 langues modifiées pour atteindre 3 949 554 entrées et 1 160 langues avec au moins cinq entrées.
+ 23 567 entrées en français pour atteindre 382 322 lemmes et 576 874 définitions.
Les trois langues qui ont le plus avancé outre le français sont le same du Nord (+ 14 697 entrées), le kotava (+ 1 885 entrées) et l’italien (+ 1 143 entrées).
+ 6 nouvelles langues pour un total de 4 831 langues : le normand insulaire (+28), le bunan (+2), le solrésol (+1), le créole haïtien (+1), le taïno (+1), le guarani paraguayen (+1).
+ 8 434 citations ou exemples en français pour atteindre 422 991.
Plus de 49 135 illustrations. Notons au passage la création d’une nouvelle documentation pour les illustrations : conventions et aide.
+ 4 235 prononciations (dont 698 pour le français) pour atteindre 192 639 prononciations audios pour 119 langues (dont 84 696 pour le français).
+ 180 nouveaux thésaurus pour atteindre 813 thésaurus dans 63 langues (+9) dont 583 thésaurus en langue française ! Les nouveaux thésaurus sont détaillés sur la page du défi du mois, et plus bas dans ce numéro.
Wikiscan et Wikistats donnent chaque mois accès à beaucoup de mesures, dont la liste des pages les plus consultées et des pages modifiées par le plus de personnes.
+ 29 mots créés sur les 31 proposés dans les Mots du jour.
+ 3 domaines sémantiques pour les mots de français, et naissance d’un Projet:Lexiques pour lister ceux peu utilisés ou qui pourraient être créés. Ce mois-ci : l’entreprise, la géomorphologie et la Bible.
La rubrique Wiktionnaire:Questions sur les mots (WT:QM) a enregistré 46 questions en mars contre 35 questions en février et 49 en janvier.
Plusieurs entrées sont proposées comme bonnes entrées : autrice, Canadien français, jumelle, quenelle, radis.
Darmo117 sollicite et obtient les outils d’administrateur, notamment dans l’objectif d’un projet pour clarifier les modules. Projet dont on reparlera dans un prochain numéro !
Après les efforts de M0tty l’an dernier avec les pictogrammes pour les sections des pages, puis la persévérance de Thomas Linard sur l’utilisation d’images vectorielles plutôt que matricielles pour qu’elles s’affichent mieux sur tous les écrans, voici maintenant Koreller qui a rénové les pages d’aide et de conventions grâce à des boîtes colorées et un menu par onglet qui fonctionne mieux sur téléphone mobile. Le changement est nettement visible sur les pages Aide:Sommaire et Convention:Sommaire ainsi que sur les pages qui y sont liées.
Dans le même temps, petit changement des pictogrammes associés aux thésaurus , catégories et annexes suite à un vote proposé par Noé.
Ces améliorations ont également entrainé une rénovation des Actualités qui sont maintenant responsive, c’est-à-dire qu’elles s’affichent mieux sur mobile, grâce à des boîtes flex. Ceci grâce à Koreller, Darmo117 et Noé. L’avis de publication a également profité de ce soin.
Ces changements ont été mis en place autour du 22 mars, afin de célébrer les 16 ans du Wiktionnaire francophone !
La chaleur est insoutenable et pour cause : les soufflets attisent en permanence des flammes ardentes et voraces. Dans cet enfer quotidien, le forgeron achève résolument de frapper un outil au fer encore blanc, qu’il trempe avec vivacité dans un baquet d’eau. Une vapeur âcre et un bruit strident jaillissent du métal torturé. Mais les temps ont changé. L’antre d’un forgeron moderne n’est plus une forge et les outils sont partagés, dispersés aux quatre coins du monde en une fraction de seconde. Le forgeron lui-même n’est plus seul à tenir la boutique.
L’intégralité de notre vie repose sur des outils. Nous mangeons, cuisinons avec des outils. Nous travaillons avec des outils. Nous contribuons avec des outils. Cet outillage est le fruit d’un travail et d’une réflexion très souvent invisibles. D’aucuns considèrent cela comme normal, et ils ont raison : imaginez-vous devoir maîtriser sur le bout des doigts les principes de la thermodynamique si intrinsèquement liés au fonctionnement de votre réfrigérateur ou de votre véhicule, pour pouvoir les utiliser. Mais cette considération ne doit pas interdire une curiosité bienvenue.
Les outils que nous employons au quotidien nous sont utiles : ils ont été conçus pour l’être. Ils répondent à un besoin qui a été formulé, formalisé, étudié, disséqué dans ses moindres détails. Un ordinateur, un système d’exploitation, un éditeur de texte, un navigateur internet ; MediaWiki, un modèle, un gadget, un bot. La comparaison avec les wikis semble forcée : elle ne l’est point. Si le Wiktionnaire n’a pas une équipe dédiée à l’analyse des besoins des contributeurs, cette dernière a pourtant été réalisée au travers des discussions, des prises de décisions, des expérimentations successives. Et si l’outillage, à ce jour, n’est pas parfait, il tendra nécessairement, au fil des expériences et des années, vers la perfection.
C’est pour répondre à un besoin que l’on crée des outils. Ainsi, c’est pour accélérer une tâche bien précise que je me suis consacré à la création d’un prototype. En effet, je contribue principalement dans le domaine, plutôt restreint, des prononciations phonétiques des enregistrements en français listés sur nos pages. C’est une tâche chronophage et fastidieuse que d’écouter et retranscrire le contenu de chaque enregistrement en alphabet phonétique international. Mais il est possible, à l’instar de Lingua Libre, d’accélérer le processus en déléguant une partie des tâches à l’ordinateur.
Ainsi, avec l’aide de Darmo, je suis parvenu à réaliser une première version de mon prototype en une journée. Il s’agit d’un logiciel développé en langage Python avec l’aide des nombreux outils créés par des développeurs de la Fondation pour ce langage. PhiLL (pour Phonetica in Lingua Libre) est ainsi officiellement né sur les registres du Wiktionnaire le 28 mars 2020, avec ce diff. Son code source est disponible sur GitHub sous licence GPLv3. Ses fonctionnalités sont pour l’instant limitées, et son interface, austère. Cet outil n’en est qu’à ses balbutiements, comme bien d’autres l’ont été ou le sont toujours. Mais il est intéressant de suivre l’évolution de ces outils, car ils peuvent être amenés à simplifier la manière de laquelle chacun contribue. Et ce, principalement parce qu’il s’agit d’expérimentations. Ce qui en fait la plus inestimable des ressources.Deux autres développements ont bien avancé ce mois-ci :
Marxav a créé un outil pour évaluer la plausibilité des prononciations indiquées dans les mots français du Wiktionnaire. Il s’est appuyé sur le troisième tableau présenté sur la page d’annexe sur la prononciation du français qui indique les différentes façons possibles d’écrire un son dans un mot français. Les premiers résultats indiquent qu’environ 99 % des prononciations actuelles sont plausibles sur les environ 1,5 million de couples mot-prononciation évalués. Il reste à analyser les environ 15 000 cas estimés comme non plausibles pour estimer si la table de correspondance est à enrichir, et elle le sera sans doute notamment pour les mots contenant des chiffres arabes et romains, ou s’il y a effectivement des prononciations à corriger. Le code et les résultats sont sur ce dépôt de code Github.
Romainbehar quant à lui a écrit un gadget pour aider à créer les pages de flexions de l’italien, CreerFlexionIt, dont le code est adapté d’un gadget existant déjà pour le français depuis 2012, CreerFlexionFr, que l’on doit à ArséniureDeGallium. Et aussi refondu les modèles de flexions pour l’italien, écrits avec les fonctions d’analyse de MediaWiki, en un unique module écrit en Lua. Ces adaptations ont été conçues en concertation avec Otourly qui contribue principalement sur des entrées dans cette langue. La conversation ayant permis d’affiner l’outil est intéressante sur les problèmes qui se sont posés et qui ont pu être résolus.
Ces propositions sont affichées sur la page d’accueil. Ce mois-ci, elles ont été rédigées par Lepticed7 et Noé. Merci de leurs contributions aux personnes qui ont créé les mots ! Félicitations à elles et eux : Dbult, François GOGLINS, Hildepont, Lepticed7, Lyokoï, Noé, Otourly, Pamputt, Poslovitch, Sebleouf
La Collaboration du mois vise à la création d’un projet thématique facilitant la rédaction d’un type de contenu. Pour le mois de mars le projet proposé était un défi de création collective de thésaurus. Un thésaurus lexicographique est un ensemble de termes pour parler d’un concept, c’est cadré et expliqué dans une page d’aide.
L’objectif initial était de créer 100 thésaurus de plus de dix mots. Une trentaine de thésaurus existant n’atteignaient pas ce critère et ils ont été pris en compte dans le défi. 31 jours pour créer 100 thésaurus, ce qui impliquait une moyenne d’au moins 3,23 thésaurus par jour. Début mars, il existait déjà 633 thésaurus dans le Wiktionnaire. La première semaine a été plutôt incertaine, le nombre de thésaurus créés oscillant entre 2 et 6. La majorité des thésaurus créés lors de la première semaine l’ont été en français. Un thésaurus en espéranto a été fait. Le dimanche 8 mars a établi le premier record de 7 thésaurus en jour, dont les thésaurus de Lyon et Toulouse.
Puis le monde a été touché par une pandémie dirigée par un roi microscopique. La création de thésaurus a alors pris une autre tournure. Alors qu’il a fallu attendre deux semaines pour atteindre 50 thésaurus, la centaine a été faite le 19, établissant le record du nombre de thésaurus créés en un jour à 20. Les 150 thésaurus sont arrivés le 24 et quatre jours plus tard, les 200 étaient là, avec 26 thésaurus créés en un jour ! À noter que le 29 a également été jour de record, avec le nombre minimal de thésaurus créés, au nombre de 1. Le solitaire du jour est le thésaurus de la quantité. Il faut croire que faire des thésaurus, ça épuise les gens.
Sur les 176 thésaurus créés, 124 sont en français. De nombreuses langues ont été explorées, comme l’italien, le gaélique irlandais ou l’espéranto, mais également le moyen français ou le babar du Sud-Est. Toutes les lettres de l’alphabet ont eu droit à au moins un thésaurus, même les moins fréquentes.
De nombreux domaines ont été explorés, de l’amour aux Wisigoths, en passant par le badminton, le plogging et même le virus ! Ce dernier a été créé lors du Live du Virus ! #1 organisé par Lyokoï. À noter que les contributeurs et contributrices ont décliné le thésaurus en espéranto, en russe et en chinois ! D’autres ont exploré les différents sens de virus, avec des thésaurus sur le virus informatique.
De nombreux contributeurs et contributrices ont participé : Arcuz94, Assassas77, Automatik, Basbu, Basnormand, Braaark, ChoumX, Darkdadaah, Darmo117, Jpgibert, Laurent Jerry, Lepticed7, Lmaltier, Lyokoï, Noé, Otourly, Pamputt, Pom445, Poslovitch, Pyxido, Romainbehar, Sebleouf, Stephane8888, Treehill, Vaulque, VIGNERON, et deux personnes non-inscrites ou non-connectées.
Des personnes se sont même essayé pour la première fois aux thésaurus. Félicitations à Acer11, Briqueloup, Fralambert, Hsarrazin, Justinetto, Kaioken100x, La Kontribuanto, Koreller, Onbec, PikaTaz !Quelques émissions audio ou vidéos sur la lexicographie, la linguistique et la langue française sorties ou découvertes ce mois-ci.
Wikipédia est une encyclopédie, un dictionnaire encyclopédique, et même parfois un peu un dictionnaire. Pourtant une recommandation dit que Wikipédia n’est pas un dictionnaire. Alors, dictionnaire ou non ?
Cet article achève la trilogie des œuvres-hybrides-inachevées-qui-sont-plus-ou-moins-des-dictionnaires, après le Wiktionnaire et le dictionnaire de l’Académie française.
De nombreuses ébauches invitent à douter, telles que câble série, favoris, millésime, solent. La définition serait-elle seulement la fondation de la connaissance encyclopédique ? La cible autour de laquelle rassembler les informations au fil du temps, pour dépasser la description du réel et évoluer vers l’encyclopédisme, ou vers le dictionnaire ?
En 2018, Lyokoï avait proposé une discussion sur les aspects les plus dictionnairiques de Wikipédia, sous le titre impertinent Wikipédia devrait-elle être encore moins un dictionnaire ? et les diapositives sont en ligne. Il s’intéressait notamment aux rapports compliqué de Wikipédia vis-à-vis des langues. Dans la façon de les décrire, d’abord, où il n’y a pas de convention sur les différences entre les langues, les dialectes, les parlers et les idiomes, ce qui induit à mélanger tout ça dans les modèles de palette par exemple la palette Langues d’oïl. Certaines pages de description d’un idiome ne sont qu’une liste de mots et d’expressions, comme celle du Parler lyonnais dont la forme rappelle tout à fait celle du dictionnaire.
En outre, Lyokoï relevait la présence quasi-systématique d’une section étymologie dans beaucoup de pages, principalement pour les prénoms, noms de famille, lieux. La maîtrise des sources étymologiques est très variable, sans documentation dédiée. L’étymologie est le propre d’un dictionnaire, et l’information se trouve souvent doublée entre les deux projets sans que cela ne pose de problème à Wikipédia, qui tire ainsi du côté du dictionnaire.
Par ailleurs, une cinquantaine de pages de Wikipédia sont appelées glossaires et la même quantité sont des lexiques qui sont des listes de termes, normalement des listes de notions et pas du vocabulaire, mais la limite est floue. D’après l’essai de convention sur les glossaires, les termes ne doivent pas être définis comme dans un dictionnaire mais en relation avec le thème. C’est toujours ce qui est fait dans un dictionnaire de spécialité, et de nombreuses définitions techniques sont rédigées ainsi dans le Wiktionnaire également. Sur Wikipédia, ces listes sont des compléments aux catégories, comme le sont les thésaurus et les annexes dans le Wiktionnaire. Certaines ressemblent d’ailleurs beaucoup aux annexes du Wiktionnaire, tel que le glossaire de la couture Elles favorisent la navigation au sein de l’encyclopédie et forment un contenu de nature différent des articles. Un contenu lexical.
Mais peut-être que certaines de ces listes seraient mieux à leur place sur le Wiktionnaire, telle que le lexique du français québécois. Le 10 décembre dernier, Lepticed7 suscitait une discussion animée dans le bistro de Wikipédia à propos de ces listes, revenant sur les frontières entre Wikipédia et le Wiktionnaire et questionnant la tendance à vouloir tout mettre dans Wikipédia plutôt que de répartir les connaissances selon les objectifs des projets. Un débat qui n’a abouti à aucune décision, la limite aux contenus admissibles dans Wikipédia n’étant pas claire.
Finalement, Wikipédia, un dictionnaire ? Des pages demeurent très proches de ce qui forme la base du dictionnaire, mais la plupart s’en éloignent et ce n’est que dans les marges, les bas-côtés de l’encyclopédie que l’on retrouve du vocabulaire et des informations typiques des dictionnaires. La frontière demeurera-t-elle floue ou va-t-elle se clarifier à l’avenir ? Difficile à prévoir.