Actualités du Wiktionnaire
Wiktionnaire:Actualités est un journal mensuel sur le Wiktionnaire, les dictionnaires et les mots. Il est publié en ligne depuis avril 2015. Son écriture est ouverte à toutes les bonnes volontés. Vous pouvez recevoir un avis lors de la publication des prochains numéros, consulter les anciens numéros et participer au brouillon de la prochaine édition. Vous pouvez lire aussi les Regards sur l’actualité de la Wikimedia. Pour les commentaires, critiques ou suggestions, voir la page de discussion.
+ 26 741 entrées et 109 langues modifiées pour atteindre 4 642 859 entrées et 1 303 langues avec au moins cinq entrées.
+ 1 977 entrées en français pour atteindre 401 703 lemmes et 620 858 définitions.
Les cinq langues qui ont le plus avancé, outre le français, sont le portugais (+ 8 963 entrées), l’allemand (+ 5 231 entrées), l’ukrainien (+ 4 045 entrées), le same du Nord (+ 3 975 entrées) et l’occitan (+ 384 entrées).
Une nouvelle langue : le yemba (4 nouvelles entrées).
+ 4 334 citations ou exemples en français pour atteindre 529 189.
+ 337 médias d’illustrations (images et vidéos) dans les pages principales du Wiktionnaire, pour atteindre 61 620.
+ 4 773 sections de langue contenant au moins une prononciation audio (dont 20 pour le français) pour atteindre 366 541 sections de langue contenant au moins une prononciation audio pour 142 langues (dont 136 146 pour le français).
+ 1 nouveau thésaurus ce mois-ci, pour un total de 1 109 thésaurus dans 69 langues dont 811 thésaurus en langue française. Le nouveau thésaurus est autour de Mithra, créé par Don-vip.
Wikiscan et Wikistats donnent chaque mois accès à beaucoup de mesures, dont la liste des pages les plus consultées et des pages modifiées par le plus de personnes.
Deux nouveaux contenus de bonne qualité : caméléon, marron
+ 9 mots créés sur les 36 proposés dans les Mots du jour ! Merci à Bpierreb, Destraak, Muertomega et Pamputt.
Quelques émissions audio ou vidéo sur la lexicographie, la linguistique et la langue française sorties ou découvertes ce mois-ci.
Ces suggestions, affichées sur la page d’accueil, ont été proposées par Noé. Merci de leurs contributions aux personnes qui ont créé ces nouvelles entrées : Ainoa Luß, Basnormand, Bpierreb, Daradaradara, Muertomega, Pamputt
Salut ! Intéressons-nous aux ports ! Selon leurs usages, on peut distinguer : port de pêche, port de commerce, port militaire, port à sec, port de marée, port refuge.
Pour recouvrir vos jambes, êtes-vous plutôt bootcut, capri, palazzo, pantalon cargo ou pantalon cigarette ? En peau de velours ou en croûte de cuir ?
En requêtant les 4 mots comment se prononce bagagiste, le moteur de recherche de Google retourne non seulement un fichier contenant le mot audio, mais aussi une représentation textuelle ba·ga·jist. Cette représentation textuelle utilise des lettres alphabétiques usuelles (ainsi que le · pour séparer les différentes syllabes). Ainsi, la description phonémique est compréhensible par tous, et non pas seulement par ceux qui maitrisent l’alphabet phonétique international.
Cette idée avait également été discutée en détails par plusieurs Wiktionnaristes (ex: discussion 2020). Il est intéressant de constater que la solution envisagée était similaire, exceptée sur deux aspects : concernant les e caducs (i.e. le son ), Google les affiche systématiquement (ex : événement) ; concernant les voyelles nasales (c’est-à-dire les 4 sons , , , ), Google retourne le même résultat pour latin et latine tandis que le Wiktionnaire prévoyait un affichage différencié pour supprimer toute ambiguïté (ex : ici).
Une limitation d’envergure du service de Google est qu’il n'offre pas de résultat pour les noms propres, ni pour les mots peu utilisés ou très récents (ex : Ploubezre, ischio ou légiolecte), ce qui est probablement dû à l’absence du mot (ou de sa prononciation) dans leur dictionnaire partenaire (principalement les Éditions Le Robert pour les mots en français — il a été question de ce sujet dans les Actualités d’octobre 2018).
Mais cette limitation est compensée par le fait que le service existe aussi pour quelques autres langues, telles que l’anglais (ex : how to pronounce clever), depuis fin 2018, et l’espagnol (ex : como se pronuncia mesa), ce qui est pratique si vous apprenez une de ces langues. Cerise sur le gâteau, pour l’anglais et l’espagnol, Google tire parti de la multimodalité du Web en ajoutant aussi une animation visuelle du mouvement des lèvres, pour une encore meilleure description de la prononciation.Dans l’étude des formes de parler, plusieurs mots en -lecte peuvent être rencontrés, qui correspondent à des manières de caractériser des usages : idiolecte, sociolecte, technolecte, géolecte, dialecte, cryptolecte
Le premier mot, idiolecte, correspond au lexique d’une personne, à l’ensemble des termes et structures de paroles qu’elle pourra mobiliser pour communiquer. Fluctuant au cours de la vie, l’idiolecte est bien difficile à étudier, car des termes peuvent être connus mais peu utilisés, ou même compris mais jamais repris.
Ce vocabulaire varie ensuite selon les moments d’échange, le cadre de communication, les personnes impliquées. On parlera de sociolecte pour les usages propres à un groupe, qui peut être une bande d’amis, une famille ou tout autre collectif. C’est ce qu’on appelle aussi les argots. S’il se trouve lié à une activité professionnelle, il s’agira d’un technolecte, s’il se trouve lié à un espace géographique spécifique, on parlera de géolecte. Dans un dictionnaire, l’indication du trait technolectal d’un usage (aussi appelé jargon ou vocabulaire de spécialité) se fait par la mention d’un domaine sémantique, tandis que les marques géolectales sont celles des régionalismes, ou aires d’usage. Tout cela apparaît dans les indications en début de définition.
Lorsqu’une partie d’une communauté langagière partage de nombreux traits de langue, tant au niveau du lexique que de la prononciation, prosodie et grammaire, il pourra être considéré que cela forme un dialecte spécifique. Un état de la langue qui n’est pas pleinement intercompréhensible avec les autres usages. Le terme de dialecte ne désigne pas des langues sans documentation ou sans reconnaissance, mais une forme d’une langue, précisée par une analyse. Bien souvent, les études linguistiques décrivent un continuum dialectal, une progression dans les changements qui font que d’un extrême à l’autre, il n’y a pas intercompréhension, mais que de villages à villages, il y a une forme de continuité qui permet la compréhension. Cette analyse dialectale est difficile à indiquer dans un dictionnaire, car elle peut être controversée. Par exemple, on admet sans mal que la langue portugaise dispose de dialectes, a minima entre le portugais du Portugal et le portugais du Brésil, ou que la langue occitane ait des dialectes, mais c’est bien moins admis pour la langue française.
Enfin, le concept de cryptolecte est celui qui me semble le plus délicat pour le travail lexicographique. Un cryptolecte est un usage qui est partagé au sein d’un groupe afin de ne pas être compris des personnes extérieures au groupe. C’est une partie de l’argot qui n’est pas expliquée aux béotiens, qui permet de s’en moquer ou de lui cacher des informations. Un des plus connus est peut-être le louchébem, langue des bouchers parisiens, qui disposaient d’un technolecte propre à leur activité, ainsi que de termes permettant d’escroquer les clients en s’indiquant d’en mettre plus ou moins, selon la tête du client. Certains usages des jeunes fonctionnent également selon ce principe, pour n’être point compris des adultes. Dans un dictionnaire, faut-il décrire ces termes, lorsqu’ils ont pu être saisis au vol ? Dévoiler ce qui devait rester caché ? Leur présence pourraient se révéler une trahison du ou de la lexicographe, qui gâche ainsi leur emploi secret. Est-ce ainsi forcer une évolution plus rapide de la langue, qui cherchera à se renouveler pour demeurer efficace ?
Faut-il documenter ces termes ou sont-ils privés ? C’est un questionnement éthique qui me semble intéressant à avoir à chaque rencontre, plutôt que de manière générale, car les limites à la diffusion des termes ne sont jamais les mêmes. Par exemple, un terme du parler des jeunes qui apparaîtrait dans un morceau de rap à large diffusion perdrait de son mystère sans que ce soit du fait des lexicographes. S’intéressant aux traces, ils et elles peuvent ainsi documenter bien des usages, sans s’immiscer dans les usages locaux et confidentiels.
La chronique sur les lectes m'a beaucoup intéressé, pour deux raisons. J'ignorais les cryptolectes en tant que phénomène répandu. J'ai beaucoup de difficultés à croire que la langue française ne comporte aucun dialecte, alors que la francophonie n'est pas limitée à un seul territoire. Cantons-de-l'Est (discussion) 1 août 2022 à 23:25 (UTC)