Actualités du Wiktionnaire
Wiktionnaire:Actualités est un journal mensuel sur le Wiktionnaire, les dictionnaires et les mots. Il est publié en ligne depuis avril 2015. Son écriture est ouverte à toutes les bonnes volontés. Vous pouvez recevoir un avis lors de la publication des prochains numéros, consulter les anciens numéros et participer au brouillon de la prochaine édition. Vous pouvez lire aussi les Regards sur l’actualité de la Wikimedia. Pour les commentaires, critiques ou suggestions, voir la page de discussion.
+ 18 640 entrées et 116 langues modifiées pour atteindre 4 881 834 entrées et 1 346 langues avec au moins cinq entrées.
+ 2 450 entrées en français pour atteindre 412 175 lemmes et 645 004 définitions.
Les cinq langues qui ont le plus avancé, outre le français, sont l’allemand (+ 6 852 entrées), le same du Nord (+ 3 749 entrées), le portugais (+ 1 092 entrées), l’occitan (+ 872 entrées) et l’italien (+ 765 entrées).
Les nouvelles langues sont : le yoron (+8), le khazar (+4), le yonaguni (+2), le kunigami (+2), le khmer du Nord (+2), le gua (+1), le manobo de Dibabawon (+1), le nawuri (+1), le vieux slave (+1), le vieux môn (+1), le malieng (+1), le danau (+1), l’amami du Nord (+1), le yaeyama (+1), le tai loi (+1), l’indo-européen commun (+1), le boro (+1).
+ 3 638 citations ou exemples en français pour atteindre 586 213.
+ 439 médias d’illustrations (images et vidéos) dans les pages principales du Wiktionnaire, pour atteindre 73 930.
+ 10 337 sections de langue contenant au moins une prononciation audio (dont 1 101 pour le français) pour atteindre 452 668 sections de langue contenant au moins une prononciation audio pour 161 langues (dont 145 007 pour le français).
+3 nouveaux thésaurus ce mois-ci, le total est de 1 167 thésaurus dans 74 langues dont 850 thésaurus en langue française. Les nouveaux thésaurus sont pour le bol, la nuisance et le saké par Noé.
Pas de nouveaux domaines sémantiques en français ce mois-ci mais de nombreuses catégories ont été crées pour organiser les localités de Suisse en français par CKali et Dbult.
Wikiscan et Wikistats donnent chaque mois accès à beaucoup de mesures, dont la liste des pages les plus consultées et des pages modifiées par le plus de personnes.
+ 12 mots créés sur les 30 proposés dans les Mots du jour ! Merci à Bercours, Bpierreb, Cdang et Pamputt !
Quelques émissions audio ou vidéo sur la lexicographie, la linguistique et la langue française sorties ou découvertes ce mois-ci.
Ces suggestions, affichées sur la page d’accueil, ont été proposées par Noé, Lyokoï et Scriptance. Merci de leurs contributions aux personnes qui ont créé ces nouvelles entrées : Bpierreb, Noé, Pamputt et Rectrice Argentée !
Cette semaine, on va allier fer et carbone ! Connaissez-vous les différentes phases de l’acier plus ou moins graphitisante ? La bainite ou la lédéburite (ou fonte blanche) ? Saviez-vous que l’austénite s’obtient par austénitisation ? Que la martensite permet la fabrication d’acier maraging ?
Beaucoup de termes qui appartiennent au lexique de la métallurgie !
Ajoutez des termes liés aux identités de genre bispirituelles (two-spirit) dans différentes langues et pour différentes cultures nord-américaines : a'yai-kik-ahsi, ááwowáakii, ninauh-oskitsi-pahpyaki (Pieds-noirs ou Niitsitapii) ; tayagigux‘ (Aléoutes) ; títqattek (Kootenays ou Ktunaxa) ; aranaruaq/angutnguaq (Yupiks du centre de l’Alaska), et d’autres !
Anticonstitutionnellement a été pendant longtemps le mot le plus long des dictionnaires, mais ce temps est révolu et beaucoup sont plus longs, dont certains restent à documenter : sterno-cléido-occipito-mastoïdien, extraconstitutionnellement, Saint-Vincentaise-et-Grenadine, psychopharmacothérapeutique, anti-bidépartementalisation…
Intéressons-nous à la musique assistée par ordinateur et aux techniques des beatmakers (concepteur rythmique et conceptrice rythmique) : calage tempo, compression en sidechain, échantillonnage sonore, kick, type beat.
Connaissez-vous le latte art et toutes ces nouvelles boissons aux noms étranges ? Chaï latte, dirty chaï latte, golden latte, goth latte, matcha latte.
Au début des définitions de dictionnaire et à côté des liens vers des mots liés, il n’est pas rare de trouver une indication de la rareté, entre parenthèse, en italique. Ces indications de fréquence présentent plusieurs degrés : peu usité, rare, très rare, extrêmement rare, hapax.
Ces indications ne sont pas claires, puisqu’elles pourraient informer de la rareté de la forme rencontrée ou du sens décrit. Certains mots s’écrivent de plusieurs manières différentes, dont certaines sont plus communes que d’autres. Et certains mots peuvent avoir un sens bien moins couramment rencontré que les autres. Pour le lectorat, l’indication est donc trop synthétique et devrait, dans de nombreux cas être complétée par un texte rédigé précisant de quelle rareté il est question.
De plus, ces indications de rareté peuvent être établies selon deux méthodes distinctes : étude statistique sur un ensemble de production écrite ou appréciation subjective. La première méthode implique la délimitation d’un corpus à étudier qui soit uniforme sur l’ensemble du dictionnaire et des outils techniques permettant d’observer le nombre de fois où apparaissent les termes et leurs sens à chaque apparition. Cet outillage est utilisé dans des dictionnaires décrivant un ensemble fini d’entrées, et qui peuvent établir un corpus fini. Ce n’est donc pas du tout le cas pour le Wiktionnaire, qui n’a ni corpus fixe ni outillage statistique solide. L’outil Books Ngram Viewer de Google n’offre qu’une information partielle, n’étant pas très rigoureux sur la forme écrite (notamment au niveau des tirets et accents), ne prenant pas en compte le sens des mots et ne s’appuyant que sur un corpus littéraire non clairement défini.
Les indications de rareté dans le Wiktionnaire sont donc subjectives, et peuvent être des connaissances inédites. Elles découlent de la perception que peuvent avoir les personnes qui contribuent de la rareté des termes rencontrés, et cela dépend de leurs expériences de vie, et des milieux dans lesquels ils évoluent. Et cela n’est pas sans problème. Par exemple, une personne qui ne serait jamais en contact avec de l’analyse littéraire trouverait que tout le vocabulaire utilisé dans ce domaine est rare (on ne croise pas de mésozeugme à tous les coins de rue). Il en est de même pour tous les termes spécialisés, pour les mots d’usage régional ou pour les termes innovants utilisés par des milieux sociaux spécifiques (nouveaux mots des jeunes, nom de produits commerciaux, argots).
La force du Wiktionnaire, c’est le consensus qui peut émerger des modifications successives, en différé, dans la durée. Pourtant, rares sont les personnes qui s’impliquent dans l’ajout, la modification ou la suppression de l’indication de rareté. C’est une information difficile à jauger, et sur laquelle il est difficile de débattre, faute de publications extérieures qui puissent servir de sources. Un aspect du Wiktionnaire à améliorer à l’avenir ?
La lexicologie est une discipline des sciences du langage qui s’intéresse au lexique, à la nature des mots et à la lexicogenèse, la formation des mots. C’est une composante de la lexicographie, qui est l’art du dictionnaire, avec la dictionnairique, qui est la partie éditoriale, de transmission des connaissances et de mise en forme de l’information. La lexicologie est une discipline qui n’est que rarement enseignée à l’université, car la formation en linguistique distingue plutôt les disciplines en séparant la morphologie (étude de la structure des mots), la linguistique historique (étude dans le temps de l’évolution de la langue) et la stylistique (étude de la phrase et du texte). Pourtant, c’est une méthode et un ensemble de concepts forts utiles pour décrire la langue et précieux pour mieux rédiger un dictionnaire.
Le petit ouvrage de poche qu’est ce Dictionnaire de lexicologie française est très précieux pour appréhender les quelques 675 termes qui y sont décrits. Après une première édition en 2009, une édition en format souple et léger est sortie en 2017. Le quatrième de couverture indique la méthode de rédaction, qui a impliqué l’analyse de 60 000 mots et locutions pour en retenir les concepts les plus saillants, et tenter de rendre compte des différents usages selon les écoles théoriques. Un souci de pédagogie certain rend l’ouvrage accessible à des personnes étrangères à la discipline, même si de nombreuses définitions incluent d’autres termes techniques, forçant à tirer le fil jusqu’à comprendre les concepts principaux.
La plupart des termes spécifiques ne sont pas utilisés dans les discussions qui se tiennent au sein du Wiktionnaire, et les quelques personnes qui possèdent ce dictionnaire n’y font que rarement référence. D’une part car ce sont des termes rares et très pointus, mais surtout afin que les discussions demeurent accessibles au plus grand nombre. C’est cependant un outil utile pour toute personne qui souhaiterait réfléchir à sa pratique de contribution au Wiktionnaire.Bonjour, je m’appelle Boujem3a, je suis un ami de l’utilisateur Àncilu. Je suis un lecteur du Wiktionnaire et je le trouve très utile car j’apprends le français et cela me donne accès à des définitions et des traductions qui sont presque toujours à jour.
Lors de mes lectures en français, je trouve des termes qui, bien que je sois arabophone marocain, ne sont pas des arabisations de mots en français, ni proches de l’espagnol, autre langue que je parle. Je ne peux donc pas faire de liens avec mes propres connaissances et j’ai franchement du mal à trouver des dictionnaires de l’arabe marocain vers le français (et vice-versa). Certes, il en existe pour l’espagnol, mais ils manquent de détails qui sont présents dans le Wiktionnaire. Et comme je lis des livres électroniques, je peux aussi noter sur mon ordinateur les traductions et les définitions des nouveaux termes.
Oui, sous IPV6. Je ne pense pas créer un compte car je corrige sporadiquement l’orthographe (ou les définitions), surtout en espagnol. Je n’en ressens pas le besoin. Par contre, j’aide indirectement en disant à Àncilu de temps en temps des mots aléatoires en arabe marocain. Àncilu les crée alors, par exemple le mot m9alla9, un adjectif qui signifie « en colère ».
Ce que j’apprécie, c’est simple ! Le fait que vous ne soyez pas des puristes de la langue. Les néologismes sont les bienvenus, le langage SMS aussi (comme les mots en mu3arrab, c’est-à-dire l’arabe utilisé dans les chats, que beaucoup de sites et d’auteurs détestent). Un autre aspect que j’aimerais aborder est le nombre considérable de langues. C’est incroyable ! 5 000 langues, je ne sais pas comment vous avez fait !
Un autre point que j’apprécie est que vous définissez tout sans censure, contrairement à la plupart des dictionnaires qui censurent les mots vulgaires. C’est aussi de la langue, il faut la documenter !
Malheureusement, oui, mais il s’agit d’une critique constructive. Les langues mineures sont vraiment non standard, y compris sur le plan graphique, et donnent honnêtement une image plutôt négative, puisqu’elles donnent l’impression d’être un blog.