Bonjour, vous êtes venu ici pour chercher la signification du mot Wiktionnaire:Wikidémie/août 2023. Dans DICTIOUS, vous trouverez non seulement toutes les significations du dictionnaire pour le mot Wiktionnaire:Wikidémie/août 2023, mais vous apprendrez également son étymologie, ses caractéristiques et comment dire Wiktionnaire:Wikidémie/août 2023 au singulier et au pluriel. Tout ce que vous devez savoir sur le mot Wiktionnaire:Wikidémie/août 2023 est ici. La définition du mot Wiktionnaire:Wikidémie/août 2023 vous aidera à être plus précis et correct lorsque vous parlerez ou écrirez vos textes. Connaître la définition deWiktionnaire:Wikidémie/août 2023, ainsi que celles d'autres mots, enrichit votre vocabulaire et vous fournit des ressources linguistiques plus nombreuses et de meilleure qualité.
Actualités du Wiktionnaire, numéro 100, juillet 2023
Un nouveau numéro des Actualités du Wiktionnaire vient de paraître !
C’est le centième numéro ! Comme toujours, de belles brèves et illustrations sélectionnées par Noé. Et un record de sept articles : des confusions sémantiques présentées par Cantons-de-l'Est, un retour du wikicamp 2023 par Pamputt, une exploration multilingue par Pamputt, une anecdote sur le loup par Unsui, une présentation de dictionnaire par Trace, et une présentation de jeux par Scriptance et Cantons-de-l'Est.
Oui félicitations à tout le monde pour avoir tenu dans la durée et surtout un grand merci à Noé pour son implication sans faille tout au long de ces 100 numéros. En espérant que ça dure encore longtemps. Pamputt5 août 2023 à 16:18 (UTC)
travail au noir
Bonjour à toutes et tous,
Nous avons ces deux articles : travail au noir et travailler au noir qui déclarent une étymologie simpliste pour l’un, quelque peu fantaisiste pour l’autre.
En effet, cette expression est un héritage du moyen-âge qui interdisait de travailler la nuit, au noir étant entendu pour obscurité.
Est-ce que quelqu’un(e) ayant accès à des sources sérieuses (je ne doute pas de France Info mais on doit pouvoir faire mieux) pourrait corriger ces étymologies ?
RAW est une newsletter francophone d'actualité sur le mouvement Wikimédia. N'hésitez pas à donner des nouvelles du Wiktionnaire dans le prochain numéro.
@Basnormand : Pour clarifier : il existe des mots qui existent officiellement (recommandations officielles) sans qu’on puisse trouver d’attestations, et on doit pouvoir inclure ces mots. Par ailleurs, on ne peut jamais affirmer qu’un mot n’est pas attesté alors que quelqu’un prétend qu’il est attesté, on ne peut que dire qu’on n’a pas trouvé d’attestation : un mot peut très bien être attesté seulement oralement, ou dans des écrits introuvables sur Internet. Dans ce dernier cas, on est seulement amené à faire comme s’ils n’étaient pas attestés. Lmaltier (discussion) 4 août 2023 à 07:54 (UTC)
Je viens d’aller voir la discussion. Cela concerne seulement les suppressions immédiates sans discussion. Une raison déterminante est qu'il y avait trop de suppressions immédiates avec ce motif, alors qu’on pouvait souvent trouver des attestations assez facilement et que ça aurait mérité une discussion. Lmaltier (discussion) 4 août 2023 à 08:02 (UTC)
Attention, un mot est attesté s’il est réellement utilisé. Par exemple, si on voit chevql sur un site sur les chevaux, ça ne veut pas dire que le mot chevql est attesté, c’est juste une faute de frappe… Je rappelle que nous accueillons tous les mots, mais encore faut-il qu'on soit sûr que le mot existe, quelle que soit la façon dont on s’y prend pour en être sûr. Lmaltier (discussion) 5 août 2023 à 15:17 (UTC)
Définition remplie automatiquement par un modèle
Bonjour, en travaillant sur cette liste, je suis tombé sur Laborantinnen (cliquer sur « modifier » pour voir le code). Que pense la communauté de la génération automatique de définitions ? À noter que cette façon de faire est aussi utilisée en arabe. Pamputt5 août 2023 à 09:38 (UTC)
Non, car c’est impossible à comprendre quand on veut modifier la page. Si on veut simplifier la création, la bonne solution est celle des robots qui génèrent du texte clair. Je me rends bien compte que certains semblent vouloir que tout texte soit dans un modèle, mais ça va contre le principe des wikis : on clique sur Modifier, on voit le texte en mode modifiable, on modifie, on sauvegarde, et on voit le texte modifié. Lmaltier (discussion) 5 août 2023 à 12:58 (UTC)
En plus de solution avancée par Lmaltier (l'utilisation de robot), on peut aussi le faire en manuel à partir d'un modèle qu'on substitue. J'avais fait ça il y a quelques années ; ça s'utilisait avec {{subst:Utilisateur:Pamputt/modl|paramètre}} (où le paramètre était ici le code de langue). Pamputt5 août 2023 à 13:08 (UTC)
Effectivement, utiliser le modèle avec subst: ne présente pas les inconvénients dont je parlais, et peut donc être une méthode valable : chacun ses goûts, pourvu que ça ne soit pas gênant pour les autres contributeurs. Mais la solution du robot est aussi intéressante à étudier pour gagner du temps, dans certains cas. Lmaltier (discussion) 5 août 2023 à 15:09 (UTC)
Favorable également à une transformation en texte normal, afin que des exemples puissent être ajoutés Noé8 août 2023 à 12:07 (UTC)
Arpyia est ce que ça te conviendrait qu’on modifie {{de-nom-pluriel-f-in}} de sorte qu’on puisse le substituer pour obtenir du texte « en clair » ? Si ce n’est pas possible de le substituer directement, alors peut-on envisager un remplacement par robot. Si le robot est la seule solution, comment envisages-tu l’utilisation de ce modèle à l’avenir ? Pamputt8 août 2023 à 09:31 (UTC)
Bonjour Pamputt, ce modèle m'a servi à créer des pages pour les pluriels de nombreux mots de façon répétitive. Je n'envisage pas d'autre utilisation à court terme. Cordialement, Arpyia (discussion) 8 août 2023 à 19:00 (UTC)
Wikifunctions
Bonjour, je tiens juste à signaler que j’ai rajouté le nouveau projet de la Fondation, aka Wikifunctions, dans la liste des projets en page d’accueil. Voilà, Lepticed7 (À l’immortalité !) 5 août 2023 à 14:54 (UTC)
@Lepticed7 : d'après toi le Wiktionnaire pourrait-il avoir des liens (de près ou de loin) avec ce nouveau projet ? À mon avis non, mais je n'ai peut-être pas encore bien saisi le but de ce nouveau projet. Pamputt5 août 2023 à 19:11 (UTC)
Salut @Pamputt. Pour l’instant, aucune liaison n’est faisable avec le projet. Il va falloir attendre encore. Par contre, à terme, on pourrait envisager d’y transférer le code de certains de nos modèles, afin de mutualiser avec d’autres petits wiktionnaires. Mais pour l’instant, ça reste flou. Lepticed7 (À l’immortalité !) 5 août 2023 à 19:15 (UTC)
Hmmm, du coup ton explication me laisse perplexe car la mutualisation de modèle et de module n'est-il pas déjà possible au travers de ça ? J'en ai pas encore parlé ici donc je ne sais pas si beaucoup de monde est au courant mais ça ouvre déjà la porte au partage de code entre Wiktionnaire (récupération de module chez le projet anglophone entre autre). Pamputt5 août 2023 à 19:21 (UTC)
Salut @Pamputt. Je n’étais pas du tout au courant de ça. Pour l’instant, je ne peux pas t’en dire plus à propos de Wikifunctions. Le futur du projet reste assez flou pour moi. Pour l’instant, c’est un dépôt de code. Mais quand il sera possible d’en faire quelque chose sur les autres projets, je reviendrai sur la Wikidémie pour en parler. À+, Lepticed7 (À l’immortalité !) 6 août 2023 à 06:34 (UTC)
en simple : la Connaissance située sur l’encyclopédie Wikipédia doit être précisée pour respecter la neutralité de pdv.
En effet savoir d'où vient le pdv, les compétences et biais qui y sont rattachés, permettent depuis le wiktionnaire de se faire un avis très rapidement.
Exemple: linguistes descriptivistes VS random people prescriptivistes
Si on cite deux sources contradictoires, une en en disant qu’elle souffre de certains biais, et une autre en en faisant des compliments, ce n’est pas vraiment neutre… Si on a de bonnes raisons de considérer qu’une source n’est pas fiable, le mieux est ne ne pas la citer du tout. Je trouve donc le changement justifié. Cela n’empêche pas de situer les sources, par exemple en indiquant leur date ou ce genre de chose (car, par exemple, la science étymologique s’améliore avec le temps), mais pas en en disant du mal. Lmaltier (discussion) 5 août 2023 à 15:41 (UTC)
c'est pas ce que j'ai dit. Déforme pas mes propos merci c'est pas sain pour le débat. Dire "Machin est linguiste et dit ça" et "truc est pas linguiste et dit ça" c'est factuel, c'est pas "dire du mal". Et si on veut être un peu lexicographiquement fiable, alors oui faut pas utiliser une source pas fiable (par ex l'aca fr) Scriptance (pronom : al, accord : neutre) 5 août 2023 à 15:49 (UTC)
C’est partisan de ne présenter l’Académie française que sous cet angle. On ne va trouver beaucoup de partisans de l’Académie française ici, mais qu’on le veuille ou non, l’Académie française est une institution officielle et on doit donc donner son point de vue sans commentaire aucun. Si je me fais l’avocat du diable, je peux facilement trouver des articles du Figaro, source journalistique reconnue en France, qui vont vanter les mérites de l’Académie française. Pour éviter de tomber dans une guerre de formulation et/ou d’explications à rallonge, il vaut mieux indiquer simplement « L’Académie française dit … ». Pamputt5 août 2023 à 16:14 (UTC)
C'est pas partisan, c'est le consensus et c'est un fait. Certes c'est une institution, mais la présenter comme telle comme si elle n'était pas biaisée et lacunaire est aussi partisan mais est nuisible. Alors que si tu la situe entièrement (et pas juste "institution française") tu as plus d'infos pertinentes pour appréhender l'entrée. Et si t'appliques le principe de neutralité à ton diabolo avocado, tu vois que ça tient pas debout puisque le figaro est comme l'af conservateur et collabore étroitement avec, tandis que les critiques sur les compétences de l'af sont internationales et scientifique.
Bref, ici l'af n'est qu'un exemple, et les précisions nécessaires peuvent être ajouté en note et/ou un lien wikipédia.
Ce qui est important pour la neutralité c'est de situer les pdv, donc de garder cette phrase ("tout en précisant les compétences et biais de X et Y") quitte à la reformuler en "tout en situant X et Y". Scriptance (pronom : al, accord : neutre) 5 août 2023 à 16:32 (UTC)
Les travaux de Donna Haraway sur la connaissance située sont très utiles, mais ça a peu à voir avec le fait de démolir telle autorité en deux bouts de phrase bien sentis, pendant qu'on encenserait telle autre. C'est une mauvaise façon d'entrer dans un débat intellectuel par un argument d'autorité : quand on a énoncé qu'une opinion est soutenue par telle autorité, on peut élever des statues à cette autorité et la couvrir de lauriers, mais on n'a rien prouvé en réalité.
Ce qui serait intéressant dans Convention:Neutralité de point de vue, ce serait, plutôt que d'inciter simplement à dire "X pense ceci et que Y pense cela", d'inciter à exposer les raisonnements et les arguments (enfin, en ce qui concerne l'Académie, si on en trouve…). Par exemple, pour l'emploi, condamné par l'Académie, de "malgré que" au sens de "bien que", au lieu de simplement dire "le Grevisse dit qu'on peut l'employer", on peut exposer les arguments du Grevisse (chacun et chacune se fera son opinion sur la valeur des recommandations de l'Académie après cela). Keymap9 (discussion) 5 août 2023 à 17:10 (UTC)
Entièrement d'accord, il faut inciter à présenter les arguments des diverses parties si il y a désaccord. Pamputt5 août 2023 à 17:28 (UTC)
on n'a rien prouvé parce que c'est "l'autorité" (compétente) qui l'a fait. C'est pas notre taf de prouver des trucs (hors débats).
Entre "dit ceci" et "exposer les arguments" je vois pas une grande diff ("ceci" pouvant être les arguments), mais ça a le mérite d'être plus précis. Donc ok pour garder les arguments.
Toutefois je maintiens le point sur la connaissance située, ça doit être mentionné dans la neutralité de pdv, sans ça : pas de neutralité. Pas besoin de débunker l'af puisque ce n'est pas une source fiable donc on ne doit pas l'utiliser. Scriptance (pronom : al, accord : neutre) 5 août 2023 à 17:58 (UTC)
L’Académie française, pas une source fiable ????? Pas une source neutre, ça, c’est sûr, mais c’est justement là l’intérêt de la citer. Pas une source infaillible non plus, ça, c’est sûr aussi : tout le monde peut se tromper, à plus forte raison des gens qui ne sont généralement pas des linguistes. Mais il faut bien entendu pouvoir la citer, et on ne s’en prive pas, sans pour autant prendre ses opinions à notre compte. Lmaltier (discussion) 5 août 2023 à 20:27 (UTC)
Tu vois avec le consensus scientifique international pour la fiabilité de l'af. Tu m'expliques comment tu la cite "sans pour autant prendre ses opinions à notre compte"? J'ai vraiment du mal à saisir, si t'as un exemple ? Genre ce serait "selon l'af patitatipatata puisque selon elle patitatita " ? avec une petite note situant l'af bien sûr (et pourquoi pas développer ça en modèle pour économiser du temps ?). Question neutralité, en lexicographie, l'af devrait avoir, au mieux, juste un renvoi vers son site depuis les entrées du wiktionnaire.
Ceci dit, je rappelle que la section aborde le simple point d'ajouter "en situant X & Y" à la page sur la neutralité de pdv et n'a pas vocation à parler de l'af Scriptance (pronom : al, accord : neutre) 5 août 2023 à 21:05 (UTC)
Sur le sujet « en situant X & Y », l'exemple de l'Académie française est un bon exemple. Ça montre qu'essayer de « situer » l'AF pose plus de soucis de neutralité qu'elle ne règle de questions. Des gens accordent une certaine légitimité à l'Académie française, à tort ou à raison, et le Wiktionnaire n'a pas à prendre partie ouvertement pour un camp ou un autre. On décrit l'usage et on se contente de mentionner les avis des différentes institutions si elles en ont exprimés un à propos d'un mot. Pamputt5 août 2023 à 21:10 (UTC)
Oui mais comme dit plus haut, je peux probablement trouver un article du Figaro qui va « situer » l'Académie française à sa manière. Et au niveau fiabilité, France Culture est aussi reconnu que Le Figaro. Donc encore une fois, je pense qu'ajouter une telle règle créerait plus de problème qu'elle n'en résoudrait. D'ailleurs y a-t-il un problème avec la façon de faire actuelle ? Pamputt5 août 2023 à 21:19 (UTC)
Bonjour. « Entre "dit ceci" et "exposer les arguments" je vois pas une grande diff » Je pense que ça vient d’une mauvaise interprétation couramment faite de « Neutralité de points de vue ». À mon avis, il y a (au moins) deux interprétations possibles : soit présenter les points de vue des entités, en mettant l’accent sur lesdites entités (« A pense blabla ; B pense blibli ; C pense blabla »), soit présenter les arguments, en regroupant par argument, et non plus par entité (« L’hypothèse blabla est soutenue par A et C, tandis que la thèse plus minoritaire blibli est soutenue par B »). Pour donner quelques exemples avec des articles encyclopédiques, voir pour le premier cas w:Culture du viol, où le sectionnement de l’article a été fait selon les entités qui ont émis les critiques, et pour le second cas w:Micro-agression, où le sectionnement a cette fois été fait par argument. Il faut, à mon avis, tendre vers un regroupement par argument.
Ensuite, concernant le sujet spécifique de l’AF, je ne pense pas qu’elle soit fiable (dans le sens où ses travaux ne reposent que rarement sur le consensus scientifique), par contre, elle possède une autorité en France, et beaucoup de monde s’y réfère (à tort ou à raison). In fine, ça reste un choix de notre part. Sur Wikipédia, il y a des sources qui ne sont pas utilisées car elles ne sont pas considérées comme fiables. À+, Lepticed7 (À l’immortalité !) 6 août 2023 à 06:55 (UTC)
Je préfère aussi le regroupement par argument, et comme le résume Lepticed7, on peut juste mettre "source non fiable bien qu'ayant une autorité morale en France" pour l'af.
Comme dit plus haut Pamputt, le figaro n'est pas fiable sur l'af, contrairement à FC. Le problème c'est d'utiliser une source pas fiable avec des étymologies non-scientifiques et un point de vue prescriptiviste bourgeois, raciste et sexiste. Donc situer cet avis permet au lectorat de mieux le recevoir, que ce soit en y adhérant ou non. Scriptance (pronom : al, accord : neutre) 6 août 2023 à 08:21 (UTC)
+ (ex malgré que) des prescriptions qui précisent pas que selon l'af 1) c'est mal vu dans le langage soutenu 2) recommande de pas l'utiliser sur la base de rien du tout. Résultat : des auteurs cannoniques (Proust, Apollinaire) sont cités en exemple. C'est perturbant pour le lectorat. => af " Proust c'est le bien c'est le bô style ohlala" - Proust *utilise malgré que sans avoir* - l'af *visibily confused* . C'est pas cohérent
pour les adjectifs comme glénoïdal·e, le problème c'est que c'est androcentré. Pourquoi choisir la forme masculine comme entrée de référence ? Sachant que les deux termes sont dérivés de glénoïde, avec les suffixes -al et -ale ? Mais ça ferait trop de taf de tout changer. Scriptance (pronom : al, accord : neutre) 6 août 2023 à 09:19 (UTC)
Pourquoi choisir la forme masculine comme entrée de référence ? : en réalité, on choisit la forme masculin singulier des adjectifs (quand cette forme existe). Pourquoi ? D’abord, parce que c’est la façon standard de faire dans tous les dictionnaires. Et si tout le monde le fait, c’est parce que c’est logique : en général, on rajoute -e à la forme de base de l’adjectif pour faire le féminin et on ajoute -s pour faire le pluriel. Le masculin singulier est donc bien la forme de base. Pour les adjectifs en -al, le masculin pluriel est généralement -aux, par exception, sinon ces règles s’appliquent. Considérer qu’il y a un suffixe -ale des adjectifs pour donner la forme féminine de l’adjectif en -al, c’est aberrant. Et pourquoi dire que c’est androcentré ? C’est la langue française qui est comme ça, tout simplement… Et je rappelle que, quand on parle en grammaire de genre masculin et féminin, on parle du genre grammatical, et qu’on peut souvent utiliser le féminin pour les hommes (une vraie crapule) ou le masculin pour les femmes (c’est un ange)… Lmaltier (discussion) 7 août 2023 à 11:55 (UTC)
Reste que la majorité (totalité ?) des dictionnaires présentent l'information dans ce sens. Donc dans le but de ne pas perdre les lecteurs et lectrices, ça a du sens de présenter l'information de la même manière. Pamputt7 août 2023 à 16:00 (UTC)
Je suis globalement d’accord avec ce qu’expliquait Keymap9 : ce que j’explique est le schéma habituel (je pense que personne ne peut le contester), mais il y a plein de cas particuliers, comme il l’explique. Cela ne change rien au fait qu’il est complètement logique, en français tout au moins, de prendre le masculin singulier comme forme de référence. Lmaltier (discussion) 7 août 2023 à 16:15 (UTC)
Sauf que notif|Keymap9}} conclut en disant que c'est le féminin qui devrait être la forme de référence...
Il ne conclut absolument pas ça… Mais j’ai relu, et je ne suis pas d’accord avec tout (par exemple sur l’orthographe commandant, qui s’explique très facilement autrement). Lmaltier (discussion) 7 août 2023 à 20:27 (UTC)
Je recentre le débat. S'agit pas de savoir si on doit refaire tout le wiktionnaire pour qu'il soit pas androcentré comme les autres, mais d'ajouter à la règle sur la neutralité de pdv la nécessité de situer les argumentaires. Scriptance (pronom : al, accord : neutre) 7 août 2023 à 19:49 (UTC)
J'ai expliqué pour quoi je ne pense pas que ça soit une bonne idée : situer les argumentaires est la porte ouverte à la subjectivité et aux débats sans fin associés. Je laisse les autres donner leur avis. Pamputt7 août 2023 à 20:44 (UTC)
Je soutiens cet avis. Situer les argumentaires de manières systématiques est trop souvent utilisé pour retirer la parole à l’autre, éliminer l’argumentaire pour une question de forme et non de fond… Je suis plutôt contre, d’autant que je pense que situer un argumentaire est bien plus complexe qu’on ne le croit. L’académie ne fait pas que des choix prescriptifs, et tout n’y est pas à jeter même encore aujourd’hui. Aussi pour situer un argumentaire, il faut bien que quelqu’un ou quelqu’une l’ai situé, cette personne elle-même est situable, etc. et ça devient une sorte de boucle infinie qui permet facilement d’éliminer ce qu’on veut en fait… Bref, mieux vaut se baser sur des critères plus objectifs. Lyokoï(blablater)7 août 2023 à 21:32 (UTC)
Je le redis : on peut situer en donnant des renseignements objectifs pertinents, par exemple la date de la source, mais situer ne doit pas signifier essayer de discréditer. Lmaltier (discussion) 8 août 2023 à 06:32 (UTC)
C'est assez simple pourtant, tu prends les sources fiables qui ont établies un consensus scientifique et voilà. Or dans le cas de l'af, le consensus c'est : "aucune compétence linguistique ne justifie son autorité/aura morale en prescription". Donc y a pas de discrédit quand l'institution en question a pas de crédit en sciences du langage. Un peu d'objectivité ;) . Une non-mixité d'hommes blancs de + 50 ans (chiffre très bas , certes) de la haute/bourgeoisie qui rédige des dicos et "conseils" sans formation dans le domaine c'est des faits objectifs.
Et à parler de "subjectif" vs "objectif", vous avez pas l'air d'avoir capté le principe de la connaissance situé (y a pas d'objectivité en simple).
Vos arguments sont intéressants, mais en l'absence d'exemples - tirés de l'expérience - ils font seulement figure d'épouvantail.
Et y pas besoin de tout situer tout le temps, juste les points où y a débat. Scriptance (pronom : al, accord : neutre) 8 août 2023 à 08:13 (UTC)
En fait, la plupart des dictionnaires n’ont aucun crédit en sciences du langage, car ce sont des travaux de lexicographes et non de linguistes. La plupart des lexicographes n’ont pas de formation avancée en linguistique. Et la formation en science du langage n’inclue en général pas de cours de lexicographie, ce qui fait que les linguistes ne sont pas forcément de bons lexicographes. J’ai expliqué ça par le passé dans une formation à destination de Master en description de langues en danger (ma formation initiale par ailleurs). Mes notes sur les disciplines et compétences des linguistes et lexicographes vont bien plus loin que la discussion actuelle, mais éclairent le problème d’indiquer une crédibilité en sciences du langage pour les dictionnaires. Nous pourrions par contre réfléchir à des critères de validité des travaux lexicographiques permettant de considérer les différents travaux publiés, que ce soit des dictionnaires, des lexiques spécialisés, des travaux de terrain sur des langues en danger, des articles académiques ou des articles de presse. Mais c’est un gros chantier Noé8 août 2023 à 08:26 (UTC)
@Scriptance Sur ce que tu dis sur l’académie, ça ne me convient pas. Leurs travaux du 18e et 19e siècles sont valables et seraient de facto éliminés ce qu’il ne faudrait pas. De même, les critères de non-mixité et de positions sociales, je ne vois pas ce que ça a faire pour juger de la pertinence d’un travail lexicographique. Les dictionnaires sont jusqu’au 20e siècle massivement dirigés et/ou écrit par des hommes. Les femmes ont surtout été cantonnées aux rôles de petites mains. Va-t-on refuser une grosse partie des travaux réalisés par des hommes uniquement ? L’écrit, avant l’école obligatoire, était surtout maitrisé par les hautes classes sociales, va-t-on jeter toutes les travaux de nos anciens sous ce prétexte ? Et si un homme issu de la bourgeoisie fait un bon dictionnaire aujourd’hui, on le jette ?
Je pense qu’il faut uniquement se baser sur les retours scientifiques et ne pas sur des bases sociales, WP le fait, pourquoi nous ne le ferons pas ? Quand aux points qui font débats, on les traite déjà ici dans la Wikidémie, je ne vois pas en quoi il faudrait changer quelque chose…
Néanmoins, à l’instar de Noé je suis favorable à un observatoire des sources pour résumer les discours sur certaines sources. Mais à l’heure actuelle, on doit avoir débattu sur 3-4 sources à tout casser… Lyokoï(blablater)8 août 2023 à 13:43 (UTC)
Allons-y pour l'observatoire.
alors franchement peu m'importe que ça te conviennes pas. Non leurs travaux sont pas valables, ils ont éliminés plein de mots et ce en raison des critères sociologiques mentionnés précédemment (car oui la sociologie est une science...) par exemple les noms de métiers féminins notamment des hautes fonctions. Mais si tu vois pas le problème, c'est qu'en t'en fais partie, et tu loupes l'intérêt de la connaissance située - qui est le point de cette section - car justement les savoirs produits le sont en fonction des caras sociales des gens. C'est vraiment une base Scriptance (pronom : al, accord : neutre) 8 août 2023 à 16:47 (UTC)
L’Académie ne prétend bien sûr pas que son dictionnaire inclut tous les mots du français (heureusement !). Oui, ils peuvent prendre des positions discutables, mais ils expriment là seulement une opinion, qu’on a le droit de ne pas partager, et qui évolue souvent avec le temps, il faut le noter. Les cas où ils prennent position en interprétant des faits à leur façon (sur des étymologies, par exemple) sont assez rares, je pense, et on peut ne pas partager leur position. Mais, dans tous les cas, les personnes qui nous lisent peuvent être intéressées par leurs prises de position, et il est donc souvent normal de les citer (sans prendre position nous-mêmes). Lmaltier (discussion) 9 août 2023 à 13:39 (UTC)
les citer sans les situer c'est prendre position, une position moins éthique précise et exacte que de les situer. Et c'est pas juste une opinion, c'est un choix politique de leur part.Scriptance (pronom : al, accord : neutre) 9 août 2023 à 21:36 (UTC)
Un choix politique, c’est une opinion… Et si on veut situer en critiquant, c’est ça qui serait une prise de position de notre part. On ne peut situer qu’avec des faits objectifs, comme par exemple la date de la prise de position en question, et éventuellement l’historique des changements d’avis de l’Académie, s’il y a lieu. C’est comme Wikipédia, qui donne des renseignements sourcés, entre autres sur les idéologies politiques, mais sans prendre position, et dont les articles ne doivent pas encourir de reproches, que ce soit de la part des partisans de cette idéologie ou de la part de ses adversaires. Lmaltier (discussion) 10 août 2023 à 07:12 (UTC)
non un choix politique c'est pas juste une opinion, c'est des prises de décisions, ça à une dimension matérialiste. Deuxième phrase : rebelote, tu mets de côté la connaissance située : ne pas situer est une prise de position (comme dit plus haut...), et encore une fois tu limite "les faits objectifs" dans une vision androcentré du savoir : le genre la race la classe & l'âge sont des faits objectifs, de même que y a ni linguistes ni lexicographes à l'af. Et ça les sources le disent. Pourquoi autant d'acharnement à t'opposer à des critiques qui font consensus dans la commu scientifique ? Scriptance (pronom : al, accord : neutre) 10 août 2023 à 09:40 (UTC)
Ah, c’est plus clair maintenant : alors, écrire L’Académie française (composée en grande majorité d’hommes blancs âgés appartenant à une classe bourgeoise et incompétents du point de vue linguistique) pense que… serait meilleur ? Je pense que tout le monde sera d’accord pour dire que ce ne serait pas neutre, c’est le moins qu’on puisse dire. Lmaltier (discussion) 10 août 2023 à 10:17 (UTC)
Bha ou ce serait meilleur et c'est factuel. Et je pense plutôt qu'une telle formulation n'embêterait que ceux qui profitent en partie ou en totalité ces privilèges. Et c'est plus exact et "neutre" (voir sur la "neutralité" l'essai de Lila Braunschweig Neutriser, en simple: prôner la neutralité = reproduire les oppressions = pas neutre) que passer ces faits objectifs sous silence. Ou je dois te rappeler le rôle de l'af dans la suppression des noms de métiers féminins - en particulier prestigieux - ainsi que leur refus de la simplification de l'orthographe de 1990 pour garantir la distinction de classe ? Scriptance (pronom : al, accord : neutre) 10 août 2023 à 11:28 (UTC)
L’Académie française a voté en faveur de cette réforme orthographique, il ne faut pas dire n’importe quoi. Et sa position sur les noms de métiers féminins a maintenant évolué… Lmaltier (discussion) 10 août 2023 à 15:22 (UTC)
Non, elle l'a seulement "toléré" . Pareil pour la féminisation, en 2017 elle avait reçu un rappel à l'ordre de la part de la cour de cassation, et sa position était ridiculement intenable (30 ans de prescriptions contre l'usage), et là encore elle se mouille pas, puisqu'elle se refuse à faire la liste des féminins et renvoie à "l'usage". Et de toute façon ça ne change rien à sa composition et aux biais précédemment mentionnés. Scriptance (pronom : al, accord : neutre) 10 août 2023 à 17:33 (UTC)
c'est bien ce que je dis, elle se mouille pas. Et ça répond pas au reste, j'en conclu tu ne peux rien y opposer (car y a rien à y opposer en fait), donc acte et ajout de la mention. Scriptance (pronom : al, accord : neutre) 10 août 2023 à 22:46 (UTC)
Recommander et tolérer, ça ne veut pas dire tout à fait la même chose… Pour ce qui est de renvoyer à l’usage, c’est un grand progrès par rapport aux positions prescriptivistes, et ici aussi, sur le Wiktionnaire, c’est avant tout de l’usage dont nous tenons compte. Lmaltier (discussion) 11 août 2023 à 06:27 (UTC)
Modèle lexicographique du wiktionnaire
Re,
Des gens savent lequel est utilisé ?
@Keymap9 a pointé (je sais plus où) que celui employé permettait pas de décrire au mieux le genre neutre en français.
Avis constructifs bienvenus.
voir message de Keymap9 plus bas. Je ne parle pas de modèle en wikicode mais de grille d'analyse des lexèmes en morphèmes.
"l'argumentaire" en suppression dit que l'analyse en racine de lect- n'est pas utilisé, j'ai montré après la suppression que c'était pourtant le cas. Cet argumentaire a pour prémisse qu'une autre grille d'analyse (modèle lexicographique) est en usage pour le français standard sur le wix, or, toi qui a supprimé la page, dit ne pas la connaître. C'est marcher sur la tête. Y a bien la base/racine d'un mot qui doit être utilisé ici non ? Vous n'avez jamais fait de test de commutation/substitution ? Scriptance (pronom : al, accord : neutre) 5 août 2023 à 17:53 (UTC)
Pamputt (d · c · b) Il s'agit du ou des modèles expliquant la dérivation lexicale et la flexion. Le modèle dominant est celui de la côte tirée d'Adam pour faire Ève : on prend un mot masculin, et on en fait un mot féminin. Quand on accorde du crédit aux avis et opinions de l'Académie, on dira même que le genre masculin est le genre non marqué, et donc que pour faire un féminin il faut ajouter une marque (un suffixe) au mot masculin. Bien entendu, cela ne tient pas la route trois secondes, il y a tellement d'exemples contraires. On constate en réalité bien d'autres phénomènes :
Du fait de l'amuïssement en français (ou plus largement du déplacement de l'accent tonique, qui provoque d'autres métaplasmes : bref et brève, veuf et veuve par exemple) depuis plusieurs siècles de la consonne finale pour les mots masculins (malgré quelques tentatives pour la rétablir, parfois avec succès comme dans le cas des mots en -eur), pour de nombreux noms communs la forme masculine est la forme incomplète et la forme féminine est la forme complète : on ne comprend l'orthographe de vétéran\ve.te.ʁɑ̃\ (et non pas "vétérant") qu'en connaissant son féminin vétérane\ve.te.ʁan\. L'orthographe commandant\kɔ.mɑ̃.dɑ̃\ ne s'explique pas seulement par l'étymologie (pas vraiment besoin de garder le t final), mais par la forme complète commandante : \kɔ.mɑ̃.dɑ̃t\.
Dans d'autres cas (dont Scriptance parle plus spécialement, mais je voulais élargir la question), on voit une racine de base, par exemple "aut-" ou "lect-", à laquelle on va ajouter un suffixe masculin (auteur, lecteur) ou féminin (autrice, lectrice).
Dans d'autres encore, le modèle de la base masculine + suffixe féminin fonctionne : comte, comtesse ; prince, princesse, etc.
Et enfin, dans certains cas, la forme féminine est purement graphique : civil, civile (\si.vil\ dans les deux cas) — alors que fragile garde la même orthographe pour les deux genres… bref.
Ce qui nous fait défaut, ce sont des sources pour tout cela (il y en a, mais très peu) : les modèles sont largement, très majoritairement, ceux de la "côte tirée d'Adam pour faire Ève". Et le Wiktionnaire reflète cela. Keymap9 (discussion) 5 août 2023 à 17:58 (UTC)
Merci pour cet état des lieux Keymap9. En somme on garde racine/lect (ou autre) pour les cas où c'est pertinent, puis, considérant la section au dessus, on pourrait ajouter une autre étymologie si besoin est, en situant les deux positions (une antisexiste, l'autre sexiste). Scriptance (pronom : al, accord : neutre) 5 août 2023 à 18:52 (UTC)
Bonjour, avant que ça ne dégénère (je préshot avant d’avoir à passer 6 heures à démêler des conversations), il serait bon, quand on poste un message de clairement expliquer ce qu’on pense. Parce qu’une section qui s’appelle "Modèle lexicographique du Wiktionnaire" et qui demande "Des gens savent lequel est utilisé ?" sans plus d’informations, ça ne me semble pas clair du tout. D’autant plus quand le Wiktionnaire possède un autre sens, beaucoup plus courant sur les projets wikis, du mot "Modèle". Par conséquent, je désapprouve totalement ta réponse, Scriptance (d · c · b) : « Si tu ne comprends pas, alors pourquoi avoir supprimé racine/lect ? » à la question de Pamputt (d · c · b) : « Je ne comprends pas. De quel modèle lexicographique est ce que tu parles ? ». Sans être une attaque personnelle, ça ne correspond pas à ce qui est attendu au regard de l’esprit de non-violence. Ton message initial n’est absolument pas clair et porte à confusion. Pamputt cherche à savoir, et tu l’envoies juste promener sans plus d’explications. Merci à Keymap9 (d · c · b) d’avoir apporté plus de contexte. Bonne soirée, Lepticed7 (À l’immortalité !) 5 août 2023 à 19:25 (UTC)
Il y a aussi des cas moins simples que ceux cités, par exemple assistante sociale, qui a très probablement été créé avant assistant social. Keymap9 montre bien que les cas sont très variés, on n’a donc pas à utiliser un modèle à ce sujet, on doit juste essayer de donner la bonne information, ce qui n’est pas toujours le cas actuellement, malheureusement (je pense à des étymologies qui font remonter des mots en -trice au latin correspondant en -trix, sans source, bien sûr, alors qu’il semble assez évident, dans beaucoup de cas, qu’ils dérivent du mot français en -teur en raison du couple -teur/-trice, qui correspond au couple -tor/-trix en latin). Lmaltier (discussion) 5 août 2023 à 20:43 (UTC)
@Lmaltier : voir mon édit. S'agit pas d'un modèle en wikicode, mais de mettre dans la section étymologie, quand y a besoin, le lien interne vers Racine/lect (par exemple) qui a récemment été supprimée. => lect- eur/rice/aire. Donc ça viendrait pas dans l'exemple que tu mentionnes. Pour la seconde partie du message, autrice mais un coup dur à ta théorie étayée par 0 sources pour l'instant. "-atrice a pour orig. la finale lat. -trix, fém. de mots en -tor." https://www.cnrtl.fr/definition/-trice (en biblio de -trice) Scriptance (pronom : al, accord : neutre) 5 août 2023 à 20:52 (UTC)
J’avais bien compris, je ne parlais pas de ça. Mais, pour ce qui concerne les modèles wiki, de toute façon, il faudrait faire des étymologies en clair, sans modèles, c’est la meilleure façon de faire quelque chose de correct, sans se laisser enfermer par les contraintes inévitables d’un modèle. Lmaltier (discussion) 5 août 2023 à 20:57 (UTC)
OK. Il faudrait éviter de m'en vouloir car j'ai supprimé Racine:français/lect suite à cette discussion. Je n'ai fait qu'appliquer la décision prise collectivement. Je n'ai donc pas supprimé cette page parce que tu l'avais créé.
Je ne t'en veux pas, des wiktionnairistes se sont prononcéz pour la suppression et tu as fait ton taf d'admin en supprimant les pages, aucun souci & aucun reproche à te faire.
Oui c'est l'idée, comme tu l'avais suggéré. Est-ce que les bases/radicaux ont leurs entrées, sachant que y en a besoin nécessairement pour décrire le genre neutre en français. Scriptance (pronom : al, accord : neutre) 6 août 2023 à 08:04 (UTC)
Dans un monde idéal, les étymologies doivent être sourcées, donc si une source dit que lecteur vient de lect- + -eur alors on le mentionne. En gardant toutefois en tête la notoriété des sources étymologiques. Si la très majorité des sources mentionnent une autre étymologie alors on ne mentionne que cette étymologie ultra-majoritaire. Pour les étymologies, j'aurais tendance à dire qu'on aura les même biais que Wikipédia, i.e. on ne présente pas la « vérité » mais on présente le consensus scientifique actuel. Pamputt5 août 2023 à 21:06 (UTC)
Pour ta réponse Pamputt, c'est à l'encontre de neutralité des pdvs qui doit les présenter justement. Or l'entrée racine/lect est utilisée uniquement (sauf erreur) pour le genre neutre en français car c'est comme ça que ça a été construit, théorisé et analysé par les linguistes qui travaillent dessus. DOnc sur ce topic la très grande majorité des sources utilisent cette étymologie. Scriptance (pronom : al, accord : neutre) 5 août 2023 à 21:10 (UTC)
en tout cas le Gaffiot (sourçant le cnrtl) donne bien lect -or/oris : https://www.lexilogos.com/latin/gaffiot.php?q=lector alors en 1934 certes Scriptance (pronom : al, accord : neutre) 5 août 2023 à 21:14 (UTC)
Lepticed7 (d · c · b) ça me semblait logique que Pamputt comprenne, puisque c'est lui qui a proposé de lancer cette discussion, d'où ma propre incompréhension à sa réponse. Merci d'avoir souligné la confusion sémantique présente dans mon message et la réponse de Pamputt, je ne l'avais pas en tête. J'édite de ce pas le message initial. Scriptance (pronom : al, accord : neutre) 5 août 2023 à 20:45 (UTC)
Par ailleurs, je pense qu'il faut éviter de personnifier la discussion. On s'en fiche que Pamputt ait supprimé la page. La page a été proposé à la suppression, et au moment où ça a été traité, il y avait deux avis pour la suppression et un neutre. La discussion n'est pas de savoir si Pamputt a bien fait : une page supprimée peut être restaurée. La question est de savoir si on présente également ce modèle lexicographique. Je pense qu'il n'est pas question d'en choisir un, comme pourrait le laisser croire le titre et le message initial, mais de savoir si le modèle (développé par Alpheratz si j'ai tout compris) est suffisamment reconnu pour être présenté comme un modèle d'analyse concurrent au modèle standard. La neutralité de point de vue nous fait poser cette question, mais n'impose en rien de présenter tous les systèmes imaginés. Par ailleurs, j'en appelle à la prudence lorsque vous invoquez l'évidence et le bon sens. Il y a beaucoup de choses qui peuvent paraitre évidentes, mais se révéler fausses. Ne tombons pas dans l'étymologie populaire. Bonne journée, Lepticed7 (À l’immortalité !) 6 août 2023 à 06:19 (UTC)
Pamputt a fait son taff d'admin, ce n'est pas un problème. C'est même lui qui a proposé d'ouvrir cette discussion. Techniquement, si on prend l'exemple de lect-, le gaffiot utilise ce modèle (ou un similaire qui ne l'exclut pas), le TLFI aussi (idem pour bouch -er,ère), donc c'est pas juste Alpheratz (qui d'ailleurs s'appuie sur les travaux de Lucy Michel), et comme dit plus haut, l'analyse en racine est faite depuis un bail, donc les entrées sont admissibles. Scriptance (pronom : al, accord : neutre) 6 août 2023 à 08:16 (UTC)
Je sais que la discussion est partie du cas d'un modèle (au sens de modèle en wikicode) supprimé, et ce modèle wiki servait à l'étymologie, mais à mon sens, comme je l'ai dit plus haut, la grille d'analyse grammaticale est première, le reste vient ensuite. Et le reste inclut bien plus que l'étymologie. Par exemple, nous disons que matelot est un adjectif (entre autres), et matelote une forme d'adjectif (entre autres) . Même chose pour hussard et hussarde. En fait, cela n'explique pas comment nous passons de \ma.tlo\ à \ma.tlɔt\ ou de \y.saʁ\ à \y.saʁd\ : c'est juste le modèle d'analyse grammatical dominant, et notre wikicode et notre structure de page reflètent cela. Mais en réalité, il serait beaucoup plus pertinent de faire du masculin la forme dérivée.
Mais comme la dit Pamputt, et je souscris totalement à sa formule, comme sur Wikipédia, on ne présente pas la « vérité » mais on présente le consensus scientifique actuel (et il est pourtant clair que consensus scientifique et « vérité » sont deux choses différentes). Keymap9 (discussion) 6 août 2023 à 09:12 (UTC)
En termes de wikicode c'est pas un modèle, c'est une entrée, on utilise les crochets pour faire le lien, pas les parenthèses cheloues utilisées pour les modèles: Racine:français/cop. Le consensus actuel sur le genre neutre c'est d'utiliser ces racines. Concrètement tu proposes quoi ? Je suis d'accord que c'est plus pertinent de faire du m la forme dérivée, mais techniquement c'est énorme comme tâche non ? Autre point, y a pas mal d'étymologie qui présente le masculin comme dérivé d'un verbe, mais on retrouve pas cette info dans les sources, quand y en a Scriptance (pronom : al, accord : neutre) 6 août 2023 à 09:36 (UTC)
Oui, je me suis mal exprimé : pas un modèle, mais un espace de nom "Racine:français/". Racine:français/aut et Racine:français/lect ont été supprimés, mais comme l'a relevé Pamputt, bien plus ont été créés depuis. En relisant les échanges sur Wiktionnaire:Pages proposées à la suppression/juin 2021, j'ai l'impression que ce qui a fait peur c'est son usage pour le français en général, alors qu'il n'y a pas de consensus scientifique pour analyser le français ainsi. C'est un peu (toute proportion gardée, et sans égard pour l'anachronisme) comme si Einstein avait voulu publier son E = mc² sur Wikipédia en premier : théorie révolutionnaire, donc "travail inédit", donc refusé.
Par contre, pour le "français neutre" d'Alpheratz, il y a pas de difficulté pour trouver des sources expliquant cette analyse, donc on pourrait garder ces espaces de nom pour les noms construits suivant le modèle d'Alpheratz. Ce qui sera bien sûr paradoxal, car l'analyse en racine n'a pas de raison déterminante de se cantonner à ces seuls mots : si "Racine:français/aut" explique autaire, pourquoi pas auteur et autrice ? Mais bon, pas de consensus scientifique là-dessus, ce sera donc l’éléphant dans la pièce. Keymap9 (discussion) 6 août 2023 à 11:57 (UTC)
Ce n'est pas moi qui décide mais la « communauté ».
De ce que je comprends de la fin de l'intervention de Keymap9, c'est qu'il n'y a pas de consensus scientifique sur cette analyse par racine donc de ce que j'en comprends, c'est que si on décide collectivement d'utiliser ce type d'analyse alors il faudrait au minimum passer par une prise de décision car ça remettrait radicalement en cause la façon de traiter les entrées en français qui est utilisée jusqu'à maintenant. Pamputt6 août 2023 à 14:35 (UTC)
Bien sûr c'est pas toi qui décides, c'est pourquoi je demande aux autres personnes ayant participé à cette discussion (="la communauté"). De ce j'ai compris de son intervention, c'est que le consensus scientifique pour cette analyse vaut seulement pour le genre neutre en français inclusif. On n'envisage pas pour l'instant de le déployer pour les entrées "standard". Scriptance (pronom : al, accord : neutre) 6 août 2023 à 15:36 (UTC)
Salut. @Scriptance J’ai corrigé la notification. Tu avais utilisé le modèle {{u}} qui permet juste de faire un lien vers un·e utilisataire. Il faut utiliser {{ping}} dans ce genre de cas. En soit, si l’analyse du français inclusif est avancée par certain·es dans la communauté scientifique, je n’ai pas de problème à faire figurer ça dans l’étymologie des mots standards. J’imagine qu’on peut dire que selon une vision synchronique de la chose, « auteur » peut être découpé en « aut/ » + « -eur », même si, diachroniquement, il est analysé comme venant de l’ancien français « auctur ». Et rien n’empêche de faire figurer une autre analyse synchronique, plus traditionnelle, si elle existe. À+, Lepticed7 (À l’immortalité !) 6 août 2023 à 17:28 (UTC)
@Scriptance Bonjour Scriptance, j’interviens ici parce que je contribue de manière importante aux étymologies du français et que je connais bien la plupart des sources (sans prétendre tout savoir, loin de là…). La méthode d’analyse que tu proposes ne correspond vraiment pas à ce qu’on lit en étymologie, et c’est surtout parce que cela ressemble à un analyse synchronique et non diachronique. Or, l’analyse synchronique est très peu utilisée en étymologie. La présence de racines dans le français est prouvée, notamment en étymologie, par Pierre Guiraud. Mais elles ne correspondent pas à celle que tu donnes, les racines que nous acceptons doivent apparaître dans des travaux d’un minimum de qualité. Ta déclaration « le TLFI aussi (idem pour bouch -er,ère) » ne trouve pas mon adhésion. Le seul endroit où cette forme est posée c’est en entrée, sans le tiret et accolé (boucher, ère), il n’y aucune volonté de présenter une quelconque racine. Et le Gaffiot est un dictionnaire de latin, il ne peu justifier aucune racine française sauf s’il la mentionne explicitement. Lyokoï(blablater)6 août 2023 à 19:29 (UTC)
@Lepticed7 : merci, on peut aussi utiliser le modèle notif non ?
Oui c'est plutôt synchronique, ce qui est adapté au genre neutre en français puisque c'est quand même assez récent, c'est donc un outil d'analyse qui correspond au spécificité de l'objet décrit. Je n'ai pas accès aux travaux de Pierre Guiraud, ça m'intéresse, tu peux m'en envoyer par mail stp, ou me faire un résumer/des exemples ? Scriptance (pronom : al, accord : neutre) 6 août 2023 à 20:02 (UTC)
Malheureusement, ce sont deux livres : Dictionnaire des étymologies obscures et Structures étymologiques du Français. Lyokoï(blablater)6 août 2023 à 20:55 (UTC)
T'as pas des exemples sous la main stp ?
Sinon, bien que ce soit intéressant, ça ne tient pas compte des spécificités du genre neutre en français inclusif, contrairement aux travaux plus récents dédiés au sujet. Scriptance (pronom : al, accord : neutre) 7 août 2023 à 09:43 (UTC)
Rien dans le wix, mais une racine bar/ber présente dans baragouiner, débarouler et d’autres. Parce contre, je ne vois pas en quoi l’ajout du genre neutre demande de changer de méthode d’étymologie… Ça élargi peut-être les travaux en synchronie mais la diachronie ne risque pas de changer de grille d’analyse. L’étymologie n’est pas concernée par le « ressenti » des personnes, au contraire, même, il faut s’en séparer le plus possible parce que ça a souvent été la porte ouverte au n’importe quoi. Lyokoï(blablater)7 août 2023 à 19:34 (UTC)
Parce que le genre neutre est synchronique tout simplement, pour l'instant peu importe la diachronie (sauf pour les réactivations type -z, al et ol), et que le genre neutre est construit sur une base agenre du mot. Scriptance (pronom : al, accord : neutre) 7 août 2023 à 19:46 (UTC)
Je rattrape la conversation et souhaite apporter une petite précision terminologique. Il y a ici une confusion entre lexicologie et lexicographie. Il y a plusieurs méthodes d’analyse de la langue, qui peuvent s’appuyer sur les logiques morphophonologiques de la langue et dynamiques (que vous appelez synchroniques et diachroniques) et celles-ci sont l’objet de la lexicologie et de plusieurs autres sciences du langage. Tout cela sert de base à la lexicographique, qui est l’art de concevoir un dictionnaire et qui est une présentation des connaissances vers un lectorat extérieur à ces réflexions là. Dans le Wiktionnaire, nous ne présentons pas l’état de l’art de l’ensemble des recherches en linguistique, nous présentons une synthèse claire et accessible des connaissances acquises. Il est important de représenter les grandes controverses, mais pas chaque hypothèse ni chaque école linguistique. Nous n’avons pas à nous positionner sur notre préférence pour le modèle génératif transformationnel ou pour la linguistique typologique fonctionnelle. Nous avons à évaluer quelques termes seront les mieux à même d’être compris par notre lectorat et à nous y adapter. Le Wiktionnaire ne va pas plus vite que les systèmes pédagogiques des pays francophones car c’est un lieu de présentation des connaissances concerté, rédigé collectivement par une masse de francophones aux cultures diverses.
Pour revenir spécifiquement sur l’analyse de la langue avec des racines et des affixes, elle est très classique en lexicologie, et n’est propre à aucun modèle lexicologique en particulier. Elle est en revanche très rare dans les travaux lexicographiques, en particulier dans ceux décrivant la langue française. D’une part car elle présente beaucoup de difficultés et d’irrégularité (comme bien résumé par Keymap9) et d’autre part car elle n’apporte pas forcément d’information supplémentaire claire. Indiquer les liens entre mots partageant une racine commune ou un cognate commun, oui, c’est intéressant. Décrire cette racine ou cette protoforme et lui fixer une forme, c’est bien plus compliqué, abstrait et dans un cadre lexicographique, pas forcément utile Noé7 août 2023 à 22:11 (UTC)
Tout le débat est intéressant (et je plaide coupable pour l'avoir entretenu), mais le sujet est moins large à la base : la suppression de Racine:français/aut et Racine:français/lect en 2021 (alors que bien d'autres "Racine:français/*" ont été créés depuis). Comme je le disais "en relisant les échanges sur Wiktionnaire:Pages proposées à la suppression/juin 2021, j'ai l'impression que ce qui a fait peur c'est son usage pour le français en général, alors qu'il n'y a pas de consensus scientifique pour analyser le français ainsi". Et j'ai une nouvelle impression : nous refaisons le même scénario, avec les mêmes travers.
Or, il s'agit d'analyser des néologismes, créés sur le modèle proposé par Alpheratz. Difficile d'analyser les créations d'Alpheratz sans se référer à Alpheratz, non ? Et Alpheratz dit (https://www.shs-conferences.org/articles/shsconf/pdf/2018/07/shsconf_cmlf2018_13003.pdf) : "Nous ne reprenons pas la thèse de la « marque zéro » qui serait propre au genre masculin, et nous nous appuyons sur une conception agenre du mot, laquelle construit toutes les flexions en genre à partir d’une base délivrée de toute marque de genre. Ici, les bases ne sont plus meilleur- (à laquelle s’ajoute l’affixe flexionnel e au féminin) ni auteur (où le suffixe dérivationnel eur peut varier en rice au féminin), mais meill- (à laquelle s’ajoute le suffixe déjà fléchi au genre masculin eur) et aut- (à laquelle s’ajoute le suffixe déjà fléchi au genre masculin eur, ce qui ouvrirait peut-être la perspective d’analyser ce suffixe dérivationnel eur comme un affixe flexionnel de genre masculin)."
Tout pareil. Merci. Si d'autres pas d'accord, merci d'indiquer techniquement comment vous présenteriez la formation des mots de genre neutre Scriptance (pronom : al, accord : neutre) 8 août 2023 à 08:01 (UTC)
Ça dépend des mots de genre neutre. Acteurice, c’est un ajout de suffixe sur un mot existant. Actaire, c’est un ajout de flexion -aire sur le couple acteur/actrice. Le fonctionnement en racine-suffixe n’est pas automatique et provient d’une analyse lexicologique, du fait notamment qu’Alpheratz est dans le milieu (ce qui ne retire rien, mais influence). Iel propose cette grille de lecture, qu’on peut mentionner dans les exemples qu’iel donne.
Néanmoins, la réinterprétation des fins de mot en un groupe suffixale est une pratique ultra-courante en français (-iciel, -thèque, etc.) et on n’a pas besoin d’une fonctionnement en racine pour le faire. D’autant plus qu’une racine est par définition non autonome dans la langue. Or act- = acte / action. C’est différent pour bar/ber d’après Guiraud qui n’existe pas seul (sémantisme différent de barre ou bar). Attention donc à ne pas tout confondre, oui, on peux mettre et changer des suffixes à peu près partout en français, mais cela ne fait pas pour autant que le reste du mot en devient une racine (quel qu’en soit son genre d’ailleurs). Il faut que cela a été précisément analysé comme tel par des sources pour la racine en question pour que ce soit valide ici. Lyokoï(blablater)8 août 2023 à 13:57 (UTC)
C'est marrant, chaque fois que ce sujet revient sur le tapis, la seule source indiquée est Alpheratz. Y a donc personne d'autre qui s'intéresse à ce sujet ? Et une seule source, ça me semble plus que léger. Le Wiktionnaire n'est pas sensé être une entité d'enregistrement des théories d'une personne quelle que soit son aura mais le reflet du consensus scientifique (qui évolue au fil du temps, bien sûr).
Tout le monde semble d'accord pour dire qu'il n'y a pas consensus sur cette approche mais on propose de faire quand même. Surprenant.
Pour moi, cette histoire devrait se trouver dans un article de Wikipédia où l'approche en question serait détaillée et critiquée (avec sources secondaires, bien sûr), mais je ne vois pas pourquoi on introduirait dans le Wiktionnaire ces idées comme si elles étaient validées/tamponnées, ce qui est très loin d'être le cas.
Alpheratz est une des rares personnes ayant produit un travail de qualité sur le neutre et son expression en français à l’heure actuelle. Sa thèse et ses articles sont important et doivent être pris en compte. Évidemment, comme iel ouvre un domaine, ses travaux sont minoritaires et très visibles. La méthode a été validée par le milieu donc il n’y a pas de raison de ne pas prendre en compte tout ça, mais en effet, on tourne autour aujourd’hui. Lyokoï(blablater)9 août 2023 à 13:07 (UTC)
Je ne connais pas le sujet, mais j’ai l’impression qu’Alpheratz voudrait faire évoluer la langue française (pour certaines raisons). Pour ses évolutions, ça lui simplifie la vie de considérer les choses un peu comme dans les langues artificielles (espéranto, par exemple), où y a clairement pour chaque mot une racine (jamais seule) et un suffixe. Mais je suppose qu'Alpheratz ne prétend pas que c’est toujours vrai pour la langue française actuelle. Sinon, Alpheratz se tromperait clairement. La réponse à la question quel modèle ? est donc claire, pour moi : il ne faut utiliser aucun modèle particulier, ce qui serait la meilleure façon de se tromper, car les langues naturelles ignorent parfois la logique et la cohérence. Il faut seulement essayer de décrire les choses de la façon la plus exacte possible dans chaque cas particulier, en tenant compte au maximum de l’histoire de chaque mot, ce qui n’est pas toujours facile. Lmaltier (discussion) 9 août 2023 à 13:21 (UTC)
Merci @Lyokoï : de resituer Alpheratz (par contre sont pronom c'est al et surtout il @Lmaltier :, merci de changer ça, ce serait respectueux) dans le champ.
Manifestement Jpgibert et Lmaltier connaissent mal les travaux sur le sujet (comme Lmaltier le reconnaît d'ailleurs), puisque comme dit plus haut Lucy Michel a déjà fait une thèse avec un modèle de racine qu'adapte Alpheratz et Florence Ashley adapte ille-même celui-ci. Et son modèle lexico et le système al sont basés sur une analyse diachronique qui prend en compte l'évolution morphologique et phonétique du français, en utilisant des morphèmes en usage (-aire) ou l'ayant était (al. Ce que Lmaltier propose dans sa dernière phrase est exactement ce que je fais et propose. Scriptance (pronom : al, accord : neutre) 9 août 2023 à 21:34 (UTC)
Bonjour, je n'ai jamais eu la prétention de dire avoir la moindre expertise linguistique.
En tant qu'observateur extérieur, je ne fais que remonter ce que je constate. A chaque fois qu'on parle de ces théories plus ou moins mises en pratique dans certains milieux, c'est le même nom qui revient. C'est tout ce que je dis. Je n'émets pas de jugement.
Comme il a été indiqué plus haut (vis-à-vis d'Einstein et Wikipédia), par Lepticed7, je crois, je me pose la question de la limite entre faire état du consensus scientifique autour de ces sujets et travaux inédits.
Pour moi qui circule en marge du milieu linguistique, ça me semble extrêmement marginal et si j'en crois le nombre de personnes qui indiquent ici même qu'il n'y a pas consensus, je m'étonne de voir qu'on envisage un vote (ou pas d'ailleurs, j'ai pas bien compris vu qu'il semble déjà exister des pages) de créer des namespaces, de mettre en branle tout une mécanique alors que le plâtre me semble très loin d'être sec.
Après vous faites comme bon vous semble. Je ne fais que partager un ressenti.
comme dit plus haut, et comme tu le reconnais toi-même, tu n'es pas au courant de l'importance des travaux d'Alpheratz dans le champ du français inclusif. En connaissance de cause, pourquoi tu donnes ton avis alors que tu reconnais toi-même que tu n'as pas les connaissances pour qu'il soit pertinent ? Scriptance (pronom : al, accord : neutre) 10 août 2023 à 09:42 (UTC)
Le ressenti des lecteurs ordinaires, c’est important. S’il fallait réserver la lecture du Wiktionnaire aux spécialistes des travaux d’Alpheratz, on n’aurait pas beaucoup de lecteurs… Lmaltier (discussion) 10 août 2023 à 10:22 (UTC)
(conflit d’éditions) Je trouve cette question vraiment déplacée. Sur le Wiktionnaire, je pense que chacun·e est libre de donner son avis tant que c’est bienveillant. Le but est de construire un dictionnaire tous·tes ensemble et chacun·e d’entre a des connaissances sur des sujets divers. Exclure de la discussion des personnes parce qu’elles n’ont pas des connaissances sur ce sujet aussi poussées que les tiennes, ça me semble pas être collaboratif du tout. Lepticed7 (À l’immortalité !) 10 août 2023 à 10:43 (UTC)
@Lmaltier : Encore un épouvantail. Personne n'a demandé de "réserver la lecture du Wiktionnaire aux spécialistes des travaux d’Alpheratz". C'est pas constructif de déformer les faits, comme c'est pas constructif de s'opposer à quelque chose en reconnaissant qu'en en fait on n'a pas de quoi justifier cette opposition, et décrétant que y pas de consensus scientifique dans ce champ tout en affirmant ne pas connaître ce champ... Scriptance (pronom : al, accord : neutre) 10 août 2023 à 11:23 (UTC)
Je n’ai rien déformé. Tenir compte du ressenti des lecteurs, c’est important, puisque c'est pour eux qu’on travaille. Refuser le ressenti d’un non-spécialiste, c’est sous-entendre qu’on ne travaille que pour les spécialistes. Lmaltier (discussion) 10 août 2023 à 11:27 (UTC)
Si tu as déformé, cf plus haut. Non, tu mélanges entre mes propos envers un contributeur et le lectorat, sur lequel je ne me suis pas prononcé. (c'est ou une incompréhension involontaire soit une déformation volontaire). Et le lectorat n'étant pas stupide, rien ne l'empêche de lire racine/lect+-aire . Des fois il a bon dos qd même le lectorat. Scriptance (pronom : al, accord : neutre) 10 août 2023 à 11:31 (UTC)
@Scriptance Je ne suis pas d’accord avec ton propos, @Jpgibert a autant le droit de donner son avis que toi. Ta phrase contrevient au principe de respect des contributeurs et contributrices, merci de la retirer et de t’excuser. Lyokoï(blablater)10 août 2023 à 11:53 (UTC)
Certes il a le droit, tout comme il a le droit de s'en abstenir, mais c'est pas pour autant que l'avis est pertinent. Il reconnaît lui-même ne pas connaître suffisamment le sujet pour donner son avis, je le lui rappelle, en quoi est-ce irrespectueux ? Scriptance (pronom : al, accord : neutre) 10 août 2023 à 13:46 (UTC)
Pas la peine de se prendre la tête pour si peu.
Je ne cherche pas à faire preuve d'ultracrépidarianisme. Je pensais juste que le ressenti de quelqu'un qui n'a pas le nez dans le guidon pouvait intéresser, ce n'est pas le cas, je vais donc aller me faire voir ailleurs, pas de soucis, j'ai plein d'autres choses à faire.
Je suis juste un peu chagriné de me voir accuser comme décrétant que y pas de consensus scientifique(sic) alors que cette information a été citée avant même ma première intervention. Comme je n'y connais rien, je ne me suis permis de reprendre les propos d'autres personnes. Et de m'interroger quant à la validité d'une telle démarche ici.
Je reprends donc mon baluchon d'ignare et vous souhaite un bon weekend.
Mouais, le "débat" est assez fatiguant entre les gens qui font des épouvantails, des pentes glissantes, ou à qui on doit répéter 2-3 fois la même chose et qui mégenre Alpheratz même quand on leur demande de rectifier , alors en plus qqun qui se pointe en déclarant ne rien y connaître mais qui veut quand même faire par de son opinion, c'est plus qu'agaçant (mansplainning). D'autant plus lorsque ledit individu ne s'excuse pas, et en plus fait une double attaque personnelle (1. en sous-entendant que les autres auraient "la tête dans le guidon", ce qui est péjoratif 2. en claquant des sic injustifié, d'autant plus qu'on n'attaque pas les gens sur leur façon de causer - tant que ça n'enfreint pas "l'esprit de non-violence'" - ni sur leur orthographe. Quitte à interroger la validité de certaine démarche, autant commencer par balayer devant sa porte. Scriptance (pronom : al, accord : neutre) 10 août 2023 à 17:47 (UTC)
Bonjour. Le truc, c’est que tu veux changer le fonctionnement actuel du projet. Donc si tu ne peux pas expliquer aux membres l’intérêt d’un tel changement, et que les questions des membres qui peuvent ne rien y connaitre ne reçoivent qu’un message désagréable qui les envoie promener, c’est problématique. Le Wiktionnaire reste une petite communauté et tes messages ne prennent pas ça en compte. Je regrette que des membres comme @Jpgibert choisissent de ne plus discuter et de s’intéresser à ce que font les autres. Bonne soirée, Lepticed7 (À l’immortalité !) 10 août 2023 à 18:39 (UTC)
Merci de relire la conversation avant de m'attribuer des dires. Je le répète une énième foi: s'agit juste d'utiliser le modèle d'Alpheratz pour les mots dont la construction en relève = genre neutre. Ces personnes ont déjà eu à lire les messages élucidant leurs "questionnements", et ce plusieurs fois. Scriptance (pronom : al, accord : neutre) 10 août 2023 à 18:57 (UTC)
La question de base était de connaitre le "modèle lexicographique" du Wiktionnaire, sans plus de contexte qu’une vague mention à une discussion sur le genre neutre. Tu n’exposes pas le sujet qui t’intéresses, tu t’attends à ce que les gens comprennent et tu passes à l’attaque si ce n’est pas le cas. Je commence sérieusement à me lasser de tes réactions dans lesquelles tu ne sembles pas prendre en compte les messages que @Lyokoï et moi t’avons écrit sur le fait que dans les discussions du Wiktionnaire, tout le monde est bienvenue. Par ailleurs, l’utilisation des racines pour autre chose que le français neutre a été mentionnée, il est normal d’en discuter. Enfin, non, "avoir la tête dans le guidon" n’a rien de péjoratif.
Tu es sur un petit projet collaboratif où on a l’habitude de discuter de tout sur la Wikidémie, et ce avec toutes les personnes intéressées. Donc soit tu prends le temps d’expliquer le sujet qui t’intéresse, en donnant des exemples, des liens vers des discussions et d’autres éléments qui permettent de prendre connaissance du sujet, soit tu t’attends à ce que ça parte dans tous les sens, sans avoir rien à y redire.
Je me permets également de modifier le message de @Lmaltier afin de prendre en compte le mégenrage d’Alpheratz. Je ne le ferai pas pour le message de @Lyokoï, iel et al étant synonymes.
Merci pour la modification, même s'il aurait du le faire lui-même. La discussion s'est affinée et plusieurs fois, avec @Keymap9 : on a précisé de limiter l'emploi de racines à ça. Certes tout le monde est bienvenu, sauf pour ramener ses gros sabots en ne tenant pas compte des messages précédant (manifestement) et en admettant de toute façon ne rien y connaître. Imagine la même chose si je me pointais après de mo de discussion sur la transcription du cyrillique pour dire "j'y connais rien mais faut pas faire ça. Allez salut :) ". Les propositions sont assez limpides. Ensuite si les gens peuvent pas comprendre "on utilise racine/lect pour les mots en genre neutre" quand j'y arrive, ainsi que Lyokoï et Keymap9, soit on a un QI extrêmement supérieur à la moyenne du wix ou des autres intervenants, soit on parle pas la même langue, ou je ais pas. Mais à un moment les trucs sont écrits, faut les lire, dans ma signature y a le lien vers le genre neutre avec la mention "accords neutres", je suis pas leur mère non plus aux autres. Scriptance (pronom : al, accord : neutre) 10 août 2023 à 22:42 (UTC)
Pour résumer tout ce qui est dit ici d’après ma lecture. Je n’ai pas l’impression que c’est le « modèle lexicographique » du Wiktionnaire qui est mis en question, mais surtout, si on présente la morphologie des mots selon une analyse systématique par racines. Comme je l’ai dit, ça pose plusieurs soucis car la racine linguistiquement parlant n’est que très peut présente en français et la vision systématique de l’analyse du nom de cette manière est une suggestion d’Alpheratz pour décrire les usages du genre neutre. Du point de vue du respect des sources, on ne peut donc présenter de cette manière que les mots qui sont concernés par cette analyse. L’appliquer ailleurs alors que nos autres sources ne présentent pas les mots ainsi va apporter deux soucis : D’abord de la confusion au sein de notre lectorat et de notre contributorat ; et enfin un décalage entre nos sources et nous, ce qui est dommageable quand on se repose sur elles…
Donc, il est tout à fait possible de se reposer sur les travaux d’Alpheratz sur l’objet de ses travaux, mais on ne peut étendre ses propositions pour la totalité des lemmes car ce serait prendre un parti. Je vous laisse me dire si vous êtes d’accord avec ce propos. -- Lyokoï(blablater)10 août 2023 à 12:05 (UTC)
Il est d'une grande naïveté et d'une grande simplesse de penser que "la science" et "l'histoire" sont des choses distinctes de "l'idéologie". Keymap9 (discussion) 11 août 2023 à 09:04 (UTC)
Dans certains cas, l’idéologie peut avoir des conséquences sur la formation des mots, je ne dis pas le contraire, et ça peut être expliqué dans l’étymologie de ces mots. Ce que je voulais seulement dire, c’est que, quand on rédige une étymologie, il faut impérativement écarter toute idéologie personnelle, il faut s’en tenir aux faits historiques et scientifiques. Lmaltier (discussion) 11 août 2023 à 13:49 (UTC)
@Scriptance : Excuse-moi, mais ce n’est pas ton premier message de la discussion (qui est celui-là : ). Je trouve que ta réponse est insultante et de mauvaise foi. Merci d’arrêter maintenant. Lyokoï(blablater)11 août 2023 à 20:20 (UTC)
Nouveau départ
@Scriptance :. Salut. Je crois que tout le monde est un peu perdu avec la section au dessus. Donc, dans une tentative de débloquer la discussion et de faire avancer le tout, pourrais-tu, stp, expliquer le problème et ce que tu aimerai/souhaiterai faire ? Je pense qu’il vaut mieux rester dans le factuel, sans faire de renvoi à la section ci-dessus, qui est difficile à lire. Merci d’avance, Lepticed7 (À l’immortalité !) 11 août 2023 à 16:19 (UTC)
Je dirais que plutôt qu'une bonne partie des participants a multiplié les hommes de paille et pentes glissantes quand bien même on a été plusieurs a recentrer le sujet plusieurs fois.
Bref, voir la section étymologie de lectaire. On utilise cette formulation pour les formes construites et analysées comme un genre neutre d'une variation diaéthique du français par les linguistes et communautés étudiant et/ou utilisant/développant ces formes, voir genre neutre en français et en ajoutant ladite catégorie auxdites entrées.Et c'est tout. Ce qui induit de restaurer les racines supprimées.
À la lecture du message qui précède, je n’ai aucune envie de soutenir la moindre demande émanant de Scriptance, la forme étant bien éloignée des habitudes collaboratives auxquelles j’aspire et que je rencontre ailleurs dans les conversations au sein du Wiktionnaire. Dommage. Noé11 août 2023 à 18:47 (UTC)
Je trouve dommage que tu ne veuilles pas saisir l’occasion. D’autant que je sais ce que c’est, j’ai défendu et fait voter la description du français à point médian. Mais là, ça suffit. Je prends l’initiative en tant qu’administrateur du Wiktionnaire et étant donné que mes précédents messages n’ont pas eu l’effet escompté. Ceci est un rappel à l’ordre qui t’es adressé, Scriptance. En tant qu’admin, le sujet de fond ne me concerne pas. Ce qui me concerne, c’est que tu souhaites faire restaurer deux pages supprimées par décision communautaire, et plus particulièrement le processus mis en place pour arriver, ou pas, auxdites restaurations. Les arguments relatifs aux suppressions et restaurations sont de l’ordre de l’éditorial, et donc en dehors de mon champ d’action. Je vais donc me concentrer sur la forme. Je ne ferai de tone policing, tu es libre d’utiliser les mots et les formulations que tu souhaites. Toutefois, il faut avoir conscience de leurs potentiels effets. Ainsi, accuser « une bonne partie des participants » de faire des « hommes de paille et pentes glissantes » est, au minimum, une atteinte à l’esprit de non-violence, voire une série d’attaques personnelles que tu assènes sans jamais les avoir étayer. Par ailleurs, l’utilisation de certaines tournures, comme « Claro ? » ou « soit on a un QI extrêmement supérieur à la moyenne du wix ou des autres intervenants, soit on parle pas la même langue, ou je ais pas. Mais à un moment les trucs sont écrits, faut les lire, dans ma signature y a le lien vers le genre neutre avec la mention "accords neutres", je suis pas leur mère non plus aux autres. » me donnent juste une impression de condescendance et d’être pris pour un con. Tout ceci constitue une atteinte aux règles de savoir-vivre et à l’esprit collaboratif que nous recherchons ici. Ceci est donc le premier et dernier avertissement formel de ma part. La prochaine fois, ça se passera sur le BA.
Maintenant, en tant que contributeur, si la proposition est (parce que je suis toujours pas sûr d’avoir clairement compris) de restaurer lesdites pages afin de les utiliser uniquement dans les pages en français neutre, je ne m’y oppose pas. Par contre, le contenu de l’étymologie sur les noms et le contenu dans les pages décrivant les racines ne me convint pas. Pour les racines (en prenant un exemple accessible à tous·tes : Racine:français/cherch). L’étymologie ne me va pas. Ça n’indique pas comment on arrive à la suite de lettres « cherch ». En l’occurrence, je pense qu’il faudrait que ça mentionne le couple « chercheur »/« chercheuse ». De plus, la définition me semble un peu légère, si ç’en est réellement une. Ça ressemble plus à une nature grammaticale. Enfin, bien que tu parles de n’utiliser la racine que pour le neutre « cherchaire », tu as listé dans les noms masculin et féminin « chercheur » et « chercheuse », ainsi que les verbes « chercher » et « rechercher ». En cela, tu te permets plus de liberté que la simple chose que tu décrivais dans ton message. De plus, je me permets de faire remarquer que de tels usages ont été mentionné, et tu as appeler ces mentions des sophismes de la pente glissante (sous-entendu, ça n’arrivera pas), alors même que tu le fais déjà. C’est en cela que j’estime qu’il est important d’en discuter et d’arrêter avec les accusations de pente glissante. Concernant maintenant l’étymologie de cherchaire, elle ne me convint pas non plus. Elle parle d’une dérivation de « cherch/ » avec le suffixe « -aire », sur le même modèle que des mots comme « secrétaire », quand bien même « secrétaire » semble venir du latin « secretarium ». Il manque ici une étape dans l’explication qui permet de comprendre en quoi c’est le « même modèle ». Il manque également une explication sur -aire. Je note également que tu parles bien sur la page cherchaire d’une décomposition de « chercheur » et « chercheuse » en « cherch-eur» et « cherch-euse ». C’est en cela que la discussion communautaire aurait été un plus. En permettant d’apporter de nouvelles paires d’yeux. Comme l’a expliqué plus tôt Lmaltier, « S’il fallait réserver la lecture du Wiktionnaire aux spécialistes des travaux d’Alpheratz, on n’aurait pas beaucoup de lecteurs… » (propos que tu as qualifié de sophisme de l’homme de paille). Ici, rien n’est clair, et si on n’a pas une compréhension préalable des travaux d’Alpheratz, en tant que lecteur·ice lambda, on comprend rien.
Section Prononciation, localisation de la prononciation : ordre pays/région (ville) et ordre alphabétique
Bonjour,
Dans ces modifications , Lingua Libre Bot (d · c · b) ajoute le modèle {{écouter}} avec pour le premier paramètre (Zone de résidence du (de la) locuteur(trice)) un ordre qui ne correspond pas aux recommandations de la page de documentation dudit modèle : Pays (Région) ("le pays, suivi si besoin est de la région entre parenthèses"). Dans les exemples cités et d'après la documentation, "Cornimont (France)" et "Calvados (France)" devraient être "France (Cornimont)" et "France (Calvados)".
Une modification de l'ordre pays/région (ou ville ou département) est-elle souhaitable ?
Tu voulais plutôt dire "région puis pays" ? :-) Merci pour les liens ! Je vois dans la discussion qu'une proposition de même nature avait été faite par Jpgibert.
Concernant l'argument présenté par Eihel, l'information de la région est effectivement importante, mais la navigation pour parcourir les différentes prononciations n'est-t-elle pas aussi à prendre en compte ? Je pense en particulier à des sections avec de nombreuses prononciations, comme dans pain#Prononciation ou eau#Prononciation.
Est-ce qu'une présentation différente, par exemple avec une virgule, ou le signe ">" suggérant une classification allant du général au particulier, à la manière d'un fil d’Ariane, pourrait convenir ?
Pour faire suite à la proposition de Pols12 en décembre 2021, j’ai enrichi la page Convention:Notes et l’ai intégrée pleinement dans l’ensemble des pages de documentation du projet. Il me semble qu’elle devrait être enrichie d’une page Aide:Notes destinée à accompagner à la contribution sur cette partie-là du contenu du Wiktionnaire, mais je n’ai pas le temps de m’y consacrer ces prochains jours. Si le sujet vous intéresse, je vous y invite à nouveau (oui, à nouveau, j’avais déjà évoqué ce sujet sans susciter le moindre intérêt en mars 2020 !) Noé9 août 2023 à 21:09 (UTC)
Salut. Avant de proposer à la suppression, je voulais connaitre l’avis général de la communauté sur ce genre de page. Ici, il s’agit d’une commande Unix. Je ne sais pas trop que penser d’une telle entrée. Des avis ? Lepticed7 (À l’immortalité !) 9 août 2023 à 21:43 (UTC)
Bonsoir
Pour l'admissibilité, je ne sais pas trop, c'est plutôt le fait que l'entrée soit indiquée comme étant de l'anglais qui me fait douter. Ne serait-ce pas plutôt « Conventions internationales » qui irait le mieux ? Peut-être avec la catégorie qui montre que celle-ci dérive de l'anglais ?
Je ne connais pas bien le sujet, alors je me trompe sans doute quelque part…
P. S. : je n'avais pas vu que j'étais passé dessus il y a quatre mois…
Plutôt opposé à ce genre d’entrées. Car je vois mal quel genre de critères d’admissibilité ou pourrait définir. Par ailleurs, quelle est la langue d’une commande informatique ? Pamputt10 août 2023 à 05:47 (UTC)
C’est assez facile de définir le langage utilisé, mais c’est un langage informatique. Moi aussi, je pense qu’il faut absolument supprimer : nous ne sommes pas un manuel de système d’exploitation, nous sommes un dictionnaire de langue. Un manuel informatique n’expliquerait pas ça, d’ailleurs, il expliquerait la commande et ses options, et ne pourrait expliquer la commande citée qu’en tant qu’exemple. Par contre, quand on croise des phrases du genre Habitué au sudo de Ubuntu, j'ai fait un su et tapé root puis le mdp.— (forums.fedora-fr.org, 18 mai 2008), il ne me semble pas aberrant de créer des pages pour su et sudo et mdp, en tant que noms communs masculins en français, puisque c’est utilisé dans une phrase en français. Lmaltier (discussion) 10 août 2023 à 07:02 (UTC)
Je vote aussi pour la suppression car ce n'est pas idiomatique en anglais mais en shell Unix. Et de la même manière que le JavaScript peut embarquer de l'HTML, l'anglais peut embarquer n'importe quel langage informatique sans qu'il devienne de l'anglais pour autant. JackPotte ($♠) 10 août 2023 à 07:54 (UTC)
Même avis, supprimer, pour une autre raison. C'est une blague corporate. Même si j'ai été heureuse au passage d'apprendre la signification de "sudo". Que j'aurais trouvée par ailleurs si cela avait eu un réel intérêt. Lekselle (discussion) 23 août 2023 à 18:38 (UTC)
(D’accord pour supprimer, mais…) Une blague… « corporate » ??! C’est une blague de geeks ! Et ce n’est pas un motif de suppression. Même « management » et « méthode agile » ont leur place, en parlant de blagues corporate… Il y a, dans un dictionnaire, c’est fatal, des mots qui n’entrent pas dans les centres d’« intérêt » de tout le monde. Maëlan (discussion) 29 août 2023 à 12:34 (UTC)
Réponse à Maëlan Corporate veut dire qui appartient à une profession. C'est bien les personnes qui pratiquent l'informatique à degré poussé, tels que les professionnels ou les geeks qui rient d'une telle blague, et non les utilisatrices et utilisateurs lambda des commandes sudo. Lekselle (discussion) 29 août 2023 à 19:06 (UTC)
Salut, je me questionne sur les illustrations des entrées du jour qui passent en ce moment. En particulier des illustrations comme les deux premières ci-dessous. Elles me semblent plus relever du contenu encyclopédique en cela qu’elle n’aide en rien à comprendre le sens du mot, contrairement à d’autres, comme les deux dernières photos ci-dessous. Vous en pensez quoi ? À+, Lepticed7 (À l’immortalité !) 10 août 2023 à 08:56 (UTC)
L’orienteuse (sens 1) et patineuse de vitesse Ragne Wiklund
Oui, Lepticed7 voulait mettre en regard les deux premières images comme peu instructives comparativement aux deux dernières. En changeant la disposition des images, j'ai peut-être brouillé son propos. Toutes mes excuses. Jpgibert (discussion) 10 août 2023 à 10:00 (UTC)
Tout à fait d’accord avec Basnormand : les deux premières photos n’aident en rien ceux qui lisent la page en question. C’est pour ça qu’on peut éventuellement illustrer le mot Paris avec une photo générale incluant la tour Eiffel, mais qu’il ne sert à rien d’illustrer le nom d’un village très peu connu avec une photo touristique du village, qui serait plus trompeuse qu’autre chose. Quand une photo n’aide pas, le risque que ce soit trompeur peut exister, et de toute façon ça détourne l’attention des lecteurs de ce qui est important : le texte, et c’est donc nuisible. Mais il est bon d’illustrer (y compris les verbes) à chaque fois qu’on peut trouver une illustration vraiment utile dans un dictionnaire de langue. Bien entendu, la question est complètement différente sur Wikipédia… Lmaltier (discussion) 10 août 2023 à 10:07 (UTC)
D'accord avec l'argumentaire de Lmaltier. Je vois deux autres points surprenants :
Les illustrations ne sont pas forcément dans l'article !! (cf франсыз), ce qui est un comble vu que ces entrées du jour sont là pour donner des exemples d'articles du wiktionnaire.
95 % des mots du jour de ces derniers temps sont des métiers féminins. Qu'on rebondisse ponctuellement sur l'actualité pour le choix du mot du jour, pourquoi pas, mais quels sens et intérêt à cette litanie ? Hector (discussion) 10 août 2023 à 11:17 (UTC)
Bonjour, comme j'ai choisi ces 4 illustrations, je vais m'en expliquer.
Il s'agit de noms d'agente, ce qui pose d'emblée un contexte particulier en français. À la suite des travaux de Marie-Louise Moreau et de Michèle Lenoble-Pinson (voir par exemple Michèle Lenoble-Pinson, Mettre au féminin les noms de métier : résistances culturelles et sociolinguistiques. Le français aujourd'hui, 2008, 163, 73-79, https://doi.org/10.3917/lfa.163.0073), j'identifie ce contexte comme étant particulièrement marqué par une forme d'insécurité linguistique (concept initialement formulé par William Labov, qui s'est trouvé particulièrement utile pour l'analyse de la féminisation des noms de métiers).
Donc j'identifie un besoin particulier d'incarnation. En ce sens, l'illustration n'est pas à considérer en dehors de sa légende, qui renvoie à une fiche Wikipédia sur la personne illustrée. Ainsi, on montre que le mot est incarné : ce n'est pas un pur concept, le mot peut être utilisé pour décrire des personnes réelles. Si une personne vient consulter l'entrée en se demandant « est-ce que ça se dit soudeuse ? il y a vraiment des femmes qui ont ce métier ? » : oui, ça se dit (les exemples), et oui, telle femme est connue pour avoir été soudeuse.
Mais on peut toujours améliorer : l'image des deux orienteuses est très bien, j'ai remplacé l'ancienne par celle-ci, merci. Toutefois, l'exercice a ses limites : comment voulez-vous illustrer marquise ? Par la photo de quelqu'un marquisant ? Non, ça n'aurait pas de sens bien sûr : on illustre par une personne connue pour avoir été marquise (avec lien Wikipédia). C'est ce que je fais le plus souvent.
Pour la fréquence « litanique » reprochée par Hector : comme l'a dit Lepticed7, ce sont de vieilles entrées, et on manque de contributions. Donc au lieu de râler, contribuez ! Pour l'instant, je contribue, et je contribue dans le domaine qui m'intéresse sur le Wiktionnaire : les noms d'agente. Ça permet de mettre un coup de projecteur sur certains mots, ça attire des contributions (enrichissements, corrections, traductions) et donc ça m'aide. Mais il y a de la place pour tout le monde (l'année 2021 est loin d'être finie !), pour peu qu'on s'en donne la peine. Keymap9 (discussion) 10 août 2023 à 12:23 (UTC)
Puisqu’il faut de toute façon lire quelque chose (la légende) pour comprendre, on peut atteindre ce même objectif sans perturber ni distraire ceux qui lisent en donnant comme premier exemple une citation (la plus courte possible) citant une femme qui exerce ce métier. Lmaltier (discussion) 10 août 2023 à 12:54 (UTC)
On ne vous reproche rien Keymap9, on s'interroge sur comment faire mieux. Dans le cas de marquise, reine, ministre ou que sais-je, il est difficile de mettre une image illustrant le terme, on est d'accord. Le choix d'une image d'une personnalité se tient.
Dans le cas de soudeuse ou orienteuse, mais également n'importe quel autre métier (développeuse par exemple), il est possible de trouver (ça dépend de Commons bien sûr) des images représentant non seulement une personne du genre associé, mais qui est train de réaliser l'action décrite.
Parce que, personnellement, une orienteuse, c'est d'abord une personne qui pratique la course d'orientation. Son genre est important bien sûr mais arrive en second.
Bonjour, avec @Lepticed7, en continuité de cette prise de décision et de mon message du 30 janvier 2021 sur le remaniement des modèles Babel, nous allons effectuer les tâches suivantes à partir d’aujourd’hui et sur les prochains jours :
Restructuration des catégories Babel et suppression des anciennes catégories (« Catégorie:User fr-M », etc.)
Suppressions des modèles désuets et en conflit avec le système Babel
Passage sur de nombreuses PU pour remplacer les anciens modèles par le nouveau système
Je viens de voir passer de nouvelles entrées sur des formes de verbes en portugais, et je m'interroge sur plusieurs informations qui me semblent manquantes.
Dans la page correspondida, il est indiqué "Participe passé féminin singulier de corresponder". Dans la page correspondante en anglais, pour le mot en portugais, il est indiqué "feminine singular of correspondido". Dans la page en français, la forme masculine ne devrait-elle pas être précisée ? De même que la forme féminine dans la page correspondido ? Peut-être dans le tableau à droite ?
Dans la page en anglais en:correspondido, différentes formes sont précisées : "feminine correspondida, masculine plural correspondidos, feminine plural correspondidas". On devrait sans doute pouvoir trouver ces informations dans la page en français, et les pages correspondida, correspondido, correspondidas et correspondidos devraient probablement être liées entre elles.
J'observe la même chose pour des formes de verbes en français, par exemple dans la page procurée. La forme procuré devrait sans doute y être précisée, tout comme la forme procurée dans la page procuré. La forme féminine devrait probablement aussi se trouver dans la page de conjugaison. Wz (discussion) 15 août 2023 à 12:55 (UTC)
Singulare tantum, plurale tantum et modèles d’accord
Bonjour ! (Incroyable le temps qu’il m’a fallu pour tomber sur cet endroit…) Parmi les mots « invariables » en nombre, il y a :
ceux qui sont identiques au singulier et au pluriel (garde-boue),
ceux qui n’existent qu’au singulier, « singulare tantum » dans le jargon (acidcore),
et ceux qui n’existent qu’au pluriel, « plurale tantum » dans le jargon (abdos-fessiers).
Ces 4 cas de figure utilisent tous le modèle d’accord {{fr-inv}}. Dans le premier cas le modèle est utilisé tel quel avec l’en-tête « Invariable » (ou, selon la fantaisie de l’auteur, un titre personnalisé comme « Préposition » (lès), « Adverbe » (très)…). Dans le deuxième cas il y a le paramètre sp=oui qui remplace le titre par « Singulier et pluriel ». Mais dans les deux derniers cas ?… Il n’y a pas de paramètre correspondant dans {{fr-inv}}, et j’ai vu de tout : parfois juste le titre par défaut « Invariable » (allemand, acatèque) ce que je ne trouve pas très satisfaisant, parfois un titre personnalisé avec le paramètre inv_titre=XXX tel que « Singulare tantum » (Acadien, acidcore) ou « Pluriel » 12 nuits de Noël, abdos-fessiers), parfois un titre personnalisé qui indique aussi le genre (japonais, fang), parfois même une tentative d’utiliser un paramètre inexistant ms=oui ou mp=oui pour indiquer du masculin singulier ou du masculin pluriel (locus cœruleus, abdalas, albatros et alliés)… Et encore une autre catégorie : « Adjectif invariable » / « Nom invariable » (mieux).
Bref ça manque d’uniformité (et donc en particulier, c’est l’enfer pour extraire automatiquement de l’information de ces modèles, ce qui me préoccupe dans le cadre d’un petit projet dont je reparle bientôt). Est-ce qu’il y a un autre modèle à utiliser ? Une convention établie à suivre ? Serait-il opportun d'ajouter des paramètres au modèle {{fr-inv}} ?
(On peut faire la même distinction concernant le genre.)
Bonjour @Lepticed7 : et merci pour ta réponse claire (pardon, je n’avais rien de bien intéressant à te répondre). Dans mon programme j’ai donc listé toutes les valeurs de inv_titre qu’on trouve dans la nature, et j’en extrais des informations de genre et de nombre quand c’est possible. Pour info voici ci-dessous les valeurs rencontrées (je recopie le bout pertinent de mon code).
Il y a de cela quelques mois, j'ai découvert l'existence et l'utilisation du modèle pron-recons, qui est utilisé sur les prononciations de langues mortes et historiques, en remplacement du modèle pron que l'on connait si bien.
Or, plus tard, j'ai entendu d'une personne (son identité et le fil de discussion où ce sujet a été amené m'échappent malheureusement) que, ayant cité le latin comme exemple de langue utilisant le modèle pron-recons (ce qui me paraissait logique, le latin étant une langue morte), ce dernier n'avait pas sa place sur des articles en latin. Plus tard, en discutant avec une personne ne souhaitant pas être mentionnée, ce débat reprit, et je me suis rapidement rendue compte que l'opinion sur l'utilisation du modèle pron-recons n'est pas unanime. J'y vois soit un manque de clarté dans l'usage demandé du modèle, soit une utilisation mécomprise de la majorité.
Je viens ici donc pour demander votre avis, contributeur.trice.s du Wiktionnaire, quant à l'usage que ce modèle devrait avoir.
Les questions se posent majoritairement pour des langues mortes dont la prononciation a été étudiée et est connue, comme le latin, le grec ancien, l'ancien français et autres.
Je pense que la réponse est plutôt évidente, que le latin soit considéré comme une langue morte ou non. Il est fort peu probable que le latin tel que prononcé aujourd'hui corresponde à la réalité du latin de l'époque. Du moins pas entièrement. Par conséquent, dans une section prononciation, la prononciation moderne peut être accompagnée d'un modèle indiquant que c'est la prononciaton donnée aujourd'hui (sachant qu'il y a il me semble des divergences entre le latin prononcé par le Vatican et d'autres domaines plus scientifiques par exemple) et doit donc utilisé le modèle {{pron}}. Les références à une prononciation classique ou à une éventuelle prononciation en latin vulgaire etc. doit utiliser le modèle {{pron-recons}}. Treehill (discussion) 23 août 2023 à 11:41 (UTC)
demain le 18 août à 14h15 SGT (UTC+08:00) l'équipe Web est au programme de Wikimania 2023 avec une rencontre pour discuter (en anglais) des améliorations à apporter à notre processus collectif de prise de décision pour les versions de logiciels. Vous êtes invité.é.s !
Plus d'information à ce lien.
Pour un projet perso, j’ai bricolé un programme qui extrait, tant bien que mal, une base de données de prononciations (et un peu plus) à partir d’un dump XML du Wiktionnaire francophone.
Je partage le code si jamais la question « comment extraire des trucs du Wiktionnaire » vous intéresse (moi-même n’ayant pas eu d’exemple à suivre, j’ai bricolé de presque zéro). C’est du Python, sous licence faites-en-ce-que-vous-voulez. Si vous voulez l’étendre, n’hésitez pas !
Je partage aussi le résultat (le fichier dont le nom commence par frwikt-) obtenu à partir du dump XML de ce mois d’août. @Pjouv : qui voulait faire un dictionnaire de rimes : il y a encore du boulot de nettoyage mais au moins maintenant c’est un tableur tout à fait gérable d’une petite centaine de mégaoctets (1 870 000 entrées), plutôt qu’un monstre XML de 5 Go.
description
Pour faire court : le programme s’intéresse aux mots français (certaines catégories sont exclues), et extrait des données à partir de la boîte de flexions et de la ligne de forme (il ignore tout ce qui se trouve à partir de la première ligne de définition). Il produit un tableur TSV (un mot par ligne, les champs sont séparés par des tabulations). La prononciation est extraite de {{pron}} et des modèles d’accord (les 5 modèles racines {{fr-accord-mixte}}, {{fr-accord-mf}}, {{fr-rég}}, {{fr-accord-ind}}, {{fr-inv}} et leurs dérivés). Pour cela j’ai dû implémenter le comportement desdits modèles d’accord (code pas très difficile mais très long…). Je l’ai fait pour autant de modèles que possible, malheureusement pas tous car certains sont codés en Lua (cf. Module:fr-flexion), ce qui est très bien, mais je n’ai pas le temps de décrypter le code Lua pour le traduire dans mon propre code. Les modèles d’accord non supportés sont copiés sur la sortie tels quels.
On aurait pu envisager d’extraire plus de prononciations à partir des sections « Prononciations », mais ces sections n’obéissent à aucun format (la cathédrale ou le bazar…) et sont donc franchement impossibles à traiter automatiquement.
Comme ça ne coûte pas plus cher, mon programme essaie aussi d’extraire deux-trois autres données utiles : la catégorie grammaticale (indispensable à cause des homographes), le lemme (déduit du modèle d’accord), les genre et nombre (extraits de la ligne de forme et de la boîte de flexions ; souvent ces deux sources sont contradictoires), et à quelles conjugaisons cette flexion correspond dans le cas d’un verbe (extrait de {{fr-verbe-flexion}}).
Le programme se base uniquement sur les modèles, qui offrent un minimum de structure à laquelle se raccrocher dans cette soupe de wikicode. Il n’essaie absolument pas de comprendre le contenu des définitions en texte libre pour deviner que l’adjectif éclaircie est le féminin singulier de éclairci, par exemple.
erreurs signalées
Un sous-produit de ce travail, c’est de détecter plein d’erreurs dans le Wiktionnaire. J’en ai corrigé une fraction à la main (mes excuses à la Patrouille !), mais il y a encore beaucoup à faire. Si vous voulez vous amuser (moi j’en ai marre :P ), le log du programme sur le dump d’hier se trouve là. Il affiche de nombreux messages : les ANOMALIE sont à coup sûr des erreurs dans le Wiktionnaire. Les ATTENTION et les ERREUR sont possiblement des carences de mon programme mais, à ce stade (après avoir répétitivement crash-testé mon programme sur l’intégralité du Wiktionnaire), ce sont le plus souvent également des erreurs côté Wiktionnaire. Comme il y a beaucoup de messages, je recommande de les filtrer (par exemple avec grep) si vous voulez vous y attaquer…
Mon programme vérifie de façon très parcellaire la Convention:Structure des pages, pour la partie qui l’intéresse (je conjecture qu’il y a déjà des robots qui le font de façon plus exhaustive ?). On détecte notamment des mauvais titres de niveau 3 ; mais, pour certains titres, les erreurs étaient si fréquentes (sections placées au niveau 3 alors qu’elles devraient être au niveau 4) que j’ai désactivé leur signalement ; voir la variable subsecs_ignore dans mon code.
La majorité des messages concernent un mauvais usage des modèles d’accord, souvent bénin (pas d’effet visible sur le rendu de la page), mais qui trahit assez fréquemment une vraie erreur.
Il y a de tout, mais la majorité des erreurs découlent de l’imitation d’un autre modèle d’accord, en supposant à tort qu’il supporterait les mêmes paramètres ; ainsi on a des paramètres m au lieu de ms ou le contraire, des graphies de lemmes en paramètre 1 alors que le paramètre 1 est censé être une prononciation…
On a très souvent 2=fr dans {{fr-rég}}, peut-être par mimétisme avec {{pron}}. Mais les modèles d’accord ne prennent pas de code de langue (ils contiennent "fr" dans leur nom).
Cas plus rigolo : quelques modèles d’accord ont un paramètre num, parce que des gens trop pressés se sont trompés de ligne en insérant ce paramètre, qui normalement va dans le titre de section, la ligne juste au-dessus.
Concernant la valeur des paramètres booléens mf et sp : techniquement, écrire autre chose que oui n’est pas fautif, mais (1) actuellement les docs de modèles donnent oui comme seule possibilité, et (2) j’estime que « le paramètre est considéré vrai si et seulement il est fourni et non vide » est une mauvaise interface de programmation (parce qu’on se retrouve avec des gens qui écrivent mf=non avec l’effet exactement inverse de celui espéré, parce que peut-être un jour on voudrait ajouter des possibilités, et parce qu’on ne sait jamais trop si les caractères blancs comptent ou pas…). Le compromis que j’ai adopté est de tolérer les trois valeurs 1, o et oui, les plus employées, ainsi que la valeur vide. Mon programme pourrait facilement faire la même vérification pour les paramètres de {{fr-verbe-flexion}}, je ne l’ai pas fait par peur du résultat…
inventaire des erreurs de paramètres de modèles d’accord (sur le dump XML du 20 août)
Une autre grande source de messages : des infos contradictoires de genre ou de nombre entre la ligne de forme et le modèle d’accord. Ce sont souvent de vrais problèmes (des féminins indiqués comme masculins sur leur ligne de forme, par exemple).
Cas très fréquent : le problème vient du fait qu’on veuille maintenant(?) séparer les hommes et les femmes pour les noms communs, ce qui conduit à ce cas de figure lorsqu’un nom masculin admet une forme féminine identique et aussi une forme féminine différente : pote, évêque (la ligne de forme dit masculin uniquement, la boîte de flexions dit épicène).
Autre cas fréquent : la ligne de forme contient {{p}} mais dans le cadre d’une remarque d’usage (exemples : future, sornette, fretin) ; je soupçonne que les modèles {{s}} et {{p}} ne sont pas censés être utilisés de cette façon (ce ne sont pas de simples raccourcis d’écriture), et qu’en tout cas il faut déplacer ces remarques dans une section de notes.
Troisième source d’erreurs bruyantes : les prononciations qui contiennent des caractères atypiques. Mon programme est assez strict sur ce point, trop peut-être (enfin il accepte tout mais affiche un message si ça sort du lot). Mais j’ai constaté que c’était efficace pour détecter des erreurs.
Par exemple, regarder les prononciations qui contiennent \é\, \r\ ou \c\ est redoutable pour repérer des dizaines de cas ou un mauvais usage d’un modèle d’accord conduit une orthographe à être affichée à la place d’une prononciation.
Il y a quelques dizaines de ã, ẽ, õ (caractères pré-composés avec un tilde), j’ai présumé qu’à chaque fois, ce qu’on veut réellement, c’est la voyelle ouverte nasalisée : ɑ~, ɛ~, ɔ~ (pour lesquelles le caractère pré-composé n’existe pas).
Il y a des r / ʀ qui devraient être des ʁ.
Il y a aussi des erreurs invisibles, telles que la lettre grecque epsilon ε utilisée au lieu du bon symbole de l’API ɛ, ou ǝ au lieu de ə (pas le même caractère Unicode…). (Pour une raison qui m’échappe, l’écrasante majorité des g sont en fait des ɡ, le caractère Unicode U+0261, visuellement presque identique ; mon programme accepte donc cette variante.)
Pleins d’apostrophes, de slashs ou autres qui sont des coquilles à supprimer.
Des virgules, des slashs, des antislashs utilisés pour séparer des prononciations (méconnaissance des possibilités offertes par les modèles d’accord).
etc.
Ça n’apparaît pas dans ce log, mais indirectement avec ce programme, on peut aussi détecter quelques milliers de pages où les balises de gras/italique sont mal fermées ; mais je suppose qu’on peut détecter ça par ailleurs…
PS : Dans la discussion sus-mentionnée à propos du dictionnaire de rimes, Lmaltier semblait sous-entendre que faire ce genre d’extraction automatique serait facile… Je vous laisse en juger ! En tout cas, mon code fait 1500 lignes de sueur et de sang, et il faudrait encore implémenter une douzaine de modèles d’accord, sans parler de corriger les quelque 5000 erreurs trouvées dans le Wictionnaire… Maëlan (discussion) 21 août 2023 à 16:42 (UTC)
Merci pour le travail réalisé, c’est très précieux. Le Wiktionnaire a pu bénéficier à divers moments de ce genre d’aide qui permettent d’identifier et de résoudre des problèmes dans la mise en forme des informations. J’avais ainsi mené un gros chantier sur les modèles de début de définition, et avec de l’aide, nous avions réussi à nettoyer l’ensemble des indications de domaine de spécialité. Sur les notations de la prononciation, il y a beaucoup à faire, c’est sûr. C’est le prix à payer d’utiliser un wiki plutôt qu’un formulaire qui vérifie chaque cellule à l’enregistrement. Certaines des erreurs pourront être corrigées par des bots, notamment l’utilisation de mf=2 au lieu de mf=1. Peut-être que JackPotte ou Pamputt pourront se pencher sur ce sujet et ajouter ces routines aux nombreuses qui tournent déjà sur le Wiktionnaire ? De mon côté, je vais aider en corrigeant quelques trucs, et faire une liste d’erreurs courantes sur la page Aide:Prononciation écriteNoé22 août 2023 à 12:31 (UTC)
Bonjour. Merci beaucoup pour le travail que tu as mené, tant dans l’élaboration du code, son explication ici que par les corrections manuelles que tu as déjà mené sur le Wiktionnaire. J’ai vu tes corrections (grâce à la patrouille), et cela m’a permis de parfois repasser derrière toi pour soit améliorer les corrections, soit améliorer d’autres choses sur les pages. Corriger ce genre d’anomalies, mettre en forme et harmoniser les contenus est quelque chose que je fais avec plaisir depuis de nombreuses années sur Wikipédia, et plus récemment ici sur le Wiktionnaire. Même s’il apparaît que certaines corrections sont automatisables, j’aime le faire manuellement, car cela me permet de parfaire les pages en même temps sur d’autres aspects. Ton fichier d’erreurs est très intéressant, cela complète d’autres sources d’anomalies que j’utilise, et tes efforts me donnent une motivation supplémentaire pour continuer à faire ce genre de corrections.
Je pense que nous pouvons collectivement corriger ces erreurs ! J’ai déjà vu que certains comme Keymap9 (d · c · b) ou Noé (d · c · b) ont déjà fait des corrections à partir du fichier. J’imagine que @Snawei :, habitué de ce genre de corrections, sera aussi intéressé par cela. Je constate sur ton git que le log du dump du 1er août donne plus de 5 600 erreurs, soit environ 600 de plus que sur celui de dimanche : tout autant de pages déjà améliorées grâce à ce travail ! Pour faciliter la collaboration, je pense qu’il faudrait partager la liste directement sur le Wiktionnaire (avec le bon formatage), que les utilisateurs pourraient supprimer au fur et à mesure des corrections, pour éviter que l'on se marche dessus ? Et pour la remettre à jour après chaque dump ?
Merci beaucoup pour ce travail ! En effet, j'ai déjà commencé à corriger des entrées. Comme Sebleouf, le faire manuellement permet d'améliorer d'autres aspects, mais l'automatisation de certaines corrections ne serait pas de refus. Keymap9 (discussion) 22 août 2023 à 12:50 (UTC)
Hello à vous,
La liste collaborative (sur wiki ou framapad) me semble une bonne idée. Bravo aux braves qui ont déjà plongé dedans !
@Sebleouf : j’ai vu certaines de tes retouches, merci d’ailleurs, ça m’a appris des choses que j’ignorais sur l’usage (ou non-usage) de {{s}} et {{p}} par exemple. Bien d’accord que c’est sympa de prendre le temps d’améliorer chaque page plus globalement (quand une page contient une erreur, il est plus probable qu’elle contienne d’autres points améliorables), je reconnais que dans mes retouches à la chaînes j’ai foncé tête baissée sans trop regarder le reste (j’ai quand même à plusieurs reprises fait d’autres corrections en passant). « Je constate sur ton git que le log du dump du 1er août donne plus de 5 600 erreurs, soit environ 600 de plus que sur celui de dimanche : tout autant de pages déjà améliorées grâce à ce travail » Oui j’ai fait le même calcul : 600, c’est aussi la croissance approximative de mon nombre d’édits ces derniers jours. Comme quoi en se faisant quelques séances de brutes (mais je suis particulièrement efficace avec un clavier, il faut le dire…), sur quelques jours/semaines on peut en voir le bout. En effet, beaucoup de corrections s’automatisent ; ça dépasse mes compétences et le temps que j’ai alloué à ça, mais je sais que certaines personnes ici ont les moyens de le faire à peu de frais (vu que plusieurs robots tournent déjà). c’est aussi pour ça que je vous transmets les infos.
Je me joins également aux remerciements pour le travail effectué. Je vais voir ce que je peux faire au niveau du bot. Mais comme c'est du travail faisable avec AWB (ou pywikibot), peut-être que Darmo117 ou Lepticed7 peuvent également filer un coup de main. Il faudrait d'abord identifier tous les schémas de remplacement. J'essaierai de regarder ça à partir de la semaine prochaine.
A part ça, j'ai une question au sujet des anomalies. Je ne comprends pas quelle est le problème de la ligne 21 qui dit
"évêque": désaccord ligne de forme / modèle d’accord sur le genre: m / +
C’est le même cas de figure que pote dont je parlais dans mon premier message (je viens de l’éditer pour préciser). Vu leur nombre, j’ai hésité à désactiver le signalement de ces conflits m / + (masculin / épicène) mais je l’ai finalement gardé car je pense que la ligne de forme devrait dire {{mf}} et non {{m}}. Maëlan (discussion) 23 août 2023 à 15:55 (UTC)
\g\ (8000 occurrences) : c’est la lettre g usuelle, par opposition à la variation graphique ɡ (Unicode U+0261) qui semble être la forme préférée pour les prononciations (205 000 occurrences) ; .
\ː\ (700 occurrences) : allongement de voyelle, si j’ai bien compris c’est une distinction désuète en français standard mais on la trouve toujours fréquemment dans les dicos.
\ʰ\ (10 occurrences) : utilisé par une poignée de mots pour signaler un h aspiré, initialement je l’acceptais mais en lisant l’article Wikipédia je vois que c’est un usage impropre du symbole (le symbole \ʔ\ est plus adapté) ; donc je corrige mon programme, dorénavant il signalera aussi ce caractère.
En revanche, la catégorie accepte certains symboles que mon programme refuse :
\h\ (700 occurrences) : consonne fricative glottale sourde, une petite expiration, utile dans de rares mots français (ahaner), mais souvent incorrectement utilisé pour indiquer un h aspiré.
\ʔ\ (200 occurrences) : coup de glotte, qu’en français on peut utiliser pour indiquer une coupure / absence de liaison (comme un h aspiré, mais pas forcément en début de mot) : je ne sais pas quoi faire avec ça. La majorité des occurrences récentes sont des graphies inclusives à la militant-es et chat·te dont la prononciation semble discutable, mais il y a aussi des cas plus classiques (par exemple éhontement, contre-hiloire, ha-ha, faire halte, tétrahydrocannabinol, à couper à la hache… et même parfois sans lettre h dans l’orthographe (vitamine K1, soie en matasse, tapisserie à personnages, conseil aulique… et pas qu’entre deux voyelles : anhélation). À la réflexion je vais accepter ce symbole, mais je reste perplexe : dans une écriture phonétique, quel est la pertinence de transcrire l’absence d’un son ? (ok je vois maintenant l’intérêt.) Si au contraire on accepte ce symbole, pourquoi on ne l’utilise pas aussi pour les h aspirés en début de mot (comme fait dans hampé, hérissonné, hélium 7), au lieu de se compliquer la vie avec le modèle {{h aspiré}} et les paramètres préfpron dans les modèles d’accord ? (je comprends en revanche que le modèle {{h muet}} reste nécessaire, sinon en l’absence de précision on ne pourrait pas savoir si le h est muet ou si ça n’a juste pas été renseigné.)
Pour \ɪ\ (100 occurrences) j’hésite : il n’est pas standard en phonétique française, mais il s’entend dans l’accent québécois (cf. avril). D’un autre côté, en signalant ce caractère, on détecte aussi quelques utilisations qui n’ont pas lieu d’être à la place de \i\ (Play, flemmingite aiguë, vitamine B8, en huit…), et même des prononciations qui ont été copiées-collées à la va-vite depuis d’autres langues.
Ah il y a aussi \…\ (refusé par la catégorie mais accepté par mon programme) qui est utilisé par des entrées de la forme à … près, où ça se justifie. Il est aussi utilisé, de façon plus discutable, par des entrées telles que ne pas mâcher ses mots pour s’épargner une répétition dans le cas de prononciations multiples… Décidément, il faudrait une convention, de l’outillage, quelque chose, pour indiquer des variantes de prononciation de façon visuellement compacte, sans avoir à recopier toutes les parties qui restent les mêmes… surtout quand la différence est un seul son (\o\ ou \ɔ\, \a\ ou \ɑ\, \ɛ\ ou \e\). Mais c’est un autre sujet. Maëlan (discussion) 23 août 2023 à 20:49 (UTC)
Bonjour, merci pour cette liste. Une remarque : pour le modèle {{fr-rég}}, le paramètre « p1 » existe et est équivalent à « p », or tu le listes comme un erreur. Concernant les autres, j’ai ajouté au modèle {{fr-rég}} une catégorisation s’il existe un paramètre qui ne devrait pas être utilisé. Pour l’instant, c’est un peu artisanal, mais voyez Catégorie:Appel du modèle fr-rég avec un paramètre inconnu. Je vais sûrement retaper un peu la chose pour l’automatiser, mais c’est un début. Je regarde ce que je peux automatiser et je vous tiens au courant. À+, Lepticed7 (À l’immortalité !) 23 août 2023 à 17:12 (UTC)
@Lepticed7 : bien vu ! Je viens de corriger mon programme. Et hop, 60 messages en moins et 20 lignes améliorées dans mon petit tableur.
J’ai donc modifié mon programme et mis à jour le tableur et le log en conséquent (même URL). Changements :
@Maëlan D’ailleurs, j’y pense maintenant, mais @Marxav a travaillé sur les prononciations du Wiktionnaire. De mémoire, il les a notamment extraites et analysées pour travailler sur l’alignement entre orthographe et prononciation. Mais je me souviens pas où il en a parlé, et je retrouve pas. Si quelqu’un a, ça peut être intéressant. À+, Lepticed7 (À l’immortalité !) 24 août 2023 à 03:42 (UTC)
Alors ça oui ça m’intéresse, vu que c’est précisément l’un de mes buts ! (cf. un autre sous-dossier de mon dépôt git, où j’ai calculé les « alignements » orthographe–prononciation pour la base Lexique3…) Maëlan (discussion) 24 août 2023 à 03:51 (UTC)
C’est encore moi… pour présenter mon bricolage du jour : un modèle {{pron-simple|notation phonétique simplifiée|fr}} qui simplifie considérablement la saisie de prononciations API. Actuellement mon modèle se trouve là : Modèle:Utilisateur:Maëlan/Brouillons/pron-simple. La documentation est rédigée, je vous invite à aller la voir.
En gros il y a une notation phonétique ad-hoc qui est traduite en API tout joli (par exemple pour le français, E devient ɛ, R devient ʁ, _ devient ‿). Le but de cette notation ad-hoc est de pouvoir être saisie facilement sur un clavier d’ordinateur usuel (donc en se limitant aux caractères ASCII ou à la rigueur latin-1), et aussi d’être facile à lire (par opposition avec Unicode, ses caractères composants, ses détails graphiques minuscules et ses glyphes visuellement identiques…). Pour avoir travaillé à la fois sur Lexique3 et sur le Wiktionnaire ces derniers mois, je peux attester à quel point le gain en ergonomie est spectaculaire.
Détail de cette notation pour le français : j’ai étendu la notation employée par la base de données Lexique3 (j’ignore si ladite notation correspond à une norme quelconque). J’ai entre autres ajouté des sons qui me paraissaient utiles pour les prononciations canadiennes (consonnes affriquées , voyelles relâchées , quelques diphtongues), mais je n’y connais presque rien, n’hésitez pas à me reprendre là-dessus. La notation ad-hoc est compatible avec l’API, au sens où les symboles en commun entre les deux systèmes (par exemple a, k) désignent la même chose, tandis que les nouveaux symboles ad-hoc (par exemple A, R) ne correspondent à rien en API. Pas de conflit donc.
La notation est donc spécifique à la langue. Le modèle sélectionne le système de notation en fonction du code de langue. Je n’ai défini de notation que pour le français, mais il est facile d’en ajouter pour n’importe quelle langue : il suffit de décrire l’ensemble des substitutions dans le fichier de données associé au module Lua.
Le but n’est pas de translittérer tout l’API (il y a déjà X-SAMPA) mais d’avoir une notation simple pour travailler au quotidien sur une langue spécifique, adaptée à sa phonologie. En particulier, on peut ainsi éviter d’écrire par erreur des sons atypiques vis-à-vis de la langue (ou d’écrire une graphie là où une prononciation est attendue…). Mon modèle est strict : il n’accepte aucun caractère en-dehors des symboles définis, et affiche un bon gros message d’erreur le cas échéant (voir la doc du modèle).
Mon vaillant petit modèle s’utilise isolément et produit du texte brut, donc il faut le combiner avec les modèles usuels {{pron}} et compagnie ; par exemple :
{{pron|{{pron-simple|bla.bla|fr}}|fr}}
C’est long et répétitif. Je propose donc de l’intégrer au fonctionnement des modèles de prononciation issus du Module:prononciation, ce qui donnerait immédiatement accès aux notations simplifiées partout où on doit saisir des notations phonétiques (donc dans {{pron}}, {{phon}}, {{phono}}, {{écouter}}, mais aussi dans les modèles d’accord, puisqu’ils utilisent les modèles précédents). On peut raisonnablement le faire grâce à la compatibilité de notations mentionnée précédemment. C’est techniquement facile à réaliser car il s’agit d’une fonction Lua à appeler avec le code de langue. Ma fonction a un mode strict, utilisé par le modèle {{pron-simple}} comme décrit plus haut, et un mode non-strict où les symboles inconnus sont acceptés silencieusement ; ce second mode est destiné aux modèles de prononciation {{pron}} et compagnie. J’ai déjà implémenté cette proposition dans ma copie personnelle du Module:prononciation.
Êtes-vous favorables à promouvoir {{pron-simple}} dans l’espace principal ?
Des réflexions sur la notation spécifique au français ? (améliorations, norme existante, etc.)
Quid d’intégrer ça aux modèles de prononciation existants ?
@Marxav : ton bricolage est intéressant à mon avis, n’hésite pas à susciter une discussion là-dessus un de ces jours (j’ai laissé quelques suggestions). Mais c’est le dual de ce que moi je propose (je réalise que mon message initial n’était pas assez clair). Ce que je propose, c’est une aide à la rédaction : on écrit en wikicode {{pron-simple|@.n8i.j@|fr}} et on obtient ɑ̃.nɥi.jɑ̃. Ta proposition fait l’opération inverse, c’est une aide à la consultation du dictionnaire par les non-initiés de l’API : on écrit {{pron-apf|ɑ̃.nɥi.jɑ̃|fr}} et on obtient an.nui.yan.
@Keymap9 : ah non je ne connaissais pas du tout ce modèle ! C’est fascinant, peut-être faudrait-il l’importer chez nous. Mais je ne pense pas que ça constitue une alternative à ce que je propose car le but est différent : ce modèle fr-IPA essaie d’interpréter au mieux l’orthographe française, la vraie, avec ses complexités et ses déconnexions d’avec la prononciation. Donc c’est une grosse usine à gaz, assez imprévisible, indébuggable à part peut-être pour son auteur d’origine (regarder la page de discussion du module…), et si on essaie d’en modifier un bout il y a probablement plein d’utilisations existantes du modèle qui verraient leur résultat changé sans avertissement. Et ça ne s’étend pas à d’autres langues (il faut faire une usine à gaz complètement différente pour chacune). Ce que je propose est beaucoup plus simple, s’intègre dans l’API, et s’instancie pour n’importe quelle langue. Maëlan (discussion) 25 août 2023 à 12:59 (UTC)
À propos des modèles d’accord
(J’avais commencé à rédiger ce qui suit comme un commentaire à propos des erreurs détectées par mon programme d’extraction de prononciations (cf la discussion du dessus), mais vu la taille que mon commentaire a atteinte, je pense qu’il vaut mieux ouvrir une nouvelle discussion.)
La conclusion que je tire de mon expérience avec les modèles d’accord, c’est qu’ils sont trop complexes à utiliser, en particulier parce qu’ils manquent d’uniformité.
Disparités d’utilisation : des modèles conceptuellement analogues n’ont pas tous les mêmes paramètres avec les mêmes noms. Ou alors, ils ont des paramètres nommés pareils mais qui font des choses subtilement différentes (tantôt le paramètre ms est une orthographe, tantôt c’est seulement un préfixe d’orthographe, tantôt il n’existe pas car il s’appelle en fait s ; tantôt le paramètre pinv ajoute un suffixe de prononciation avec une espace, tantôt sans espace, tantôt le paramètre n’existe pas du tout…). Quant aux paramètres numérotés, il n’y a aucune cohérence, 1 est tantôt une orthographe, tantôt un préfixe d’orthographe, tantôt une prononciation, tantôt un préfixe de prononciation. Ce qui est d’ailleurs une véritable plaie quand un modèle est remplacé par un autre (voir plus bas).
Les docs sont lacunaires, certains paramètres ne sont pas mentionnés, ou alors leur valeur par défaut n’est pas indiquée.
Les chaines de valeurs par défaut sont parfois étranges (cf. {{fr-rég}}, il y a un commentaire à ce sujet dans mon code Python).
Disparités de fonctionnalité : par exemple, certains modèles permettent d’ajouter un suffixe identique à toutes les formes. Mais pas tous les modèles, alors que ce serait utile pour tous.
Disparités de fonctionnalité (bis) : une moitié, mais une moitié seulement, des modèles d’accord spécialisés n’est en fait plus implémentée à partir des fameux modèles racines, mais indépendamment en Lua. Sans avoir regardé le code, je crois en la valeur d’utiliser un langage de programmation décent (et en effet ces modèles sont plus intelligents que leurs collègues en Wikicode, par exemple ils trouvent tout seuls le préfixe de la graphie à partir du nom de la page). Mais ça ajoute au manque d’uniformité.
Autre lacune de documentation : le quatuor {{fr-accord-mixte}}, {{fr-accord-mf}}, {{fr-accord-ind}}, {{fr-inv}} est documenté collectivement comme « les 4 modèles racines, dont tous les autres dérivent ». Sauf qu’il y a aussi {{fr-rég}} (ajout plus récent ?) qui n’est mentionné sur aucune des 4 autres pages et qui semble remplir la même fonction, conceptuellement, que {{fr-accord-mf}} (genre unique, deux nombres). La seule différence, semble-t-il, est que {{fr-rég}} fusionne les prononciations quand identiques aux deux nombres, ce que pourrait aussi faire {{fr-accord-mf}}.
J’aurais aussi à redire sur le nommage. Dans "fr-accord-xxx", l’accord en question est il en genre, en nombre ou les deux ? Dans "fr-accord-mixte", qu’est-ce qui est mixte ? (moi je comprends plutôt ça comme "les deux genres mélangés, i.e. identiques", c’est-à-dire exactement le contraire de ce qu’il faut comprendre.) Dans "fr-accord-mf(-xxx)", "mf" indique-t-il qu’il y a deux genres ? (en fait il signifie que les 2 genres existent et sont identiques ; ça ne transparaît pas dans le nom). Et dans "fr-rég(-xxx)", il n’y a donc pas d’accord ? Le nom "fr-rég(-xxx)" ne dit absolument rien de ce que fait le modèle (à savoir afficher un petit tableau avec les flexions et les prononciations). Et pourquoi "fr-accord-mf" et "fr-accord-mf-ail", mais "fr-rég-x" et "fr-rég-al", en quoi ces 2 derniers cas sont-ils plus réguliers que les autres ? Et, décidément, "fr-rég" fait trop penser à du français régional… Un schéma de nommage qui serait plus clair pour moi : "fr-flexions-genre-nombre, fr-flexions-genre, fr-flexions-nombre, fr-flexions-invariable". Dans les paramètres, la lettre "p" est trop surchargée (pluriel, prononciation, et on la trouve aussi dans "préf" ce qui est d’autant plus visuellement difficile à lire qu’il y a aussi des paramètres qui s’appellent "p" et "réf"). "p2s3" est la 3e prononciation associée à "s2" (2e graphie du singulier), et non la 2e prononciation associée à "s3" (3e graphie du singulier) !! Les noms de paramètres " "(p)suff(p) sont confusants, on croit que ça veut dire « le suffixe » tout court alors que c’est « le sufixe du féminin » spécifiquement). Le nom de paramètre "(p)inv" est confusant, ce paramètre n’a rien à voir avec l’invariabilité en genre et/ou nombre mais ajoute un suffixe « invariable » à la graphie ou la prononciation.
Avec toute cette confusion il semble (et c’est bien normal) que pas grand-monde ne connaît par cœur l’utilisation de tous ces paramètres, et qu’ils sont beaucoup utilisés par copier-coller en changeant le nom du modèle… Et comme les modèles ignorent silencieusement les paramètres qu’ils n’utilisent pas, même prévisualiser ne permet pas toujours de voir une erreur.
Par exemple, un grand nombre des erreurs d’utilisation de ces modèles viennent d’un remplacement trop précipité d’un modèle spécialisé par {{fr-rég}}, dans le cadre de la dissociation du masculin et du féminin pour les noms communs :
fonceurs, curieuses, écoliers, gauchères, cureurs, sérasquier, prospectrice d’affaires… à chaque fois, le radical commun aux deux genres, qui était donné en paramètre 1 à l’ancien modèle, a été conservé à cette position alors que {{fr-rég}} attend une prononciation en 1 ! (ce qui montre que la prévisualisation n’est pas toujours employée).
terrien… ici le préfixe de prononciation qui était donné en paramètre 1 à un modèle spécialisé tel que {{fr-accord-en}}, a été gardé tel quel pour {{fr-rég}}, alors que {{fr-rég}} attend une prononciation complète ! pourtant la correction a bien été faite pour le paramètre pron2. C’est un bot qui a fait le coup ( @Dbult :), donc il va falloir repasser sur toutes ses modifs…
Au-delà de l’édition manuelle par des humains, les différences entre modèles rendent hasardeuses les éditions automatisées… Sans même parler d’extraction de données pour usage externe au Wiktionnaire, comme ce qui m’intéresse.
À mon avis (yak à faucon), il est possible de repartir sur une base plus nette avec un modèle racine unique, qui serait donc capable de faire jusqu’à 4 cas (masculin/féminin, singulier/pluriel) (comme l’actuel {{fr-accord-mixte}}), avec évidemment 3 (voire 4 ! pourquoi s’arrêter en si bon chemin ?) variantes possibles pour chaque cas (comme l’actuel {{fr-rég}}), et le modèle fusionnerait les cases de façon idoine en cas d’orthographes ou de prononciations identiques. Dans l’idéal, le modèle serait capable de gérer des mots composés, ce qui est une autre limite des modèles actuels (actuellement, quand il y a deux parties qui varient chacune selon un motif usuel, on ne peut pas réutiliser les modèles spécialisés pour chaque partie). Atroce à implémenter en Wikicode, mais tout à fait abordable avec un langage de programmation comme Lua. Ensuite, les modèles spécialisés seraient implémentés à partir de ce modèle de base, et hériteraient toutes des mêmes options génériques, celles du modèle de base. Pas de paramètres numérotés. Et une grosse erreur en rouge quand un paramètre n’existe pas. Évidemment, la transition serait douloureuse… Mais on peut rêver…
Je suis d'accord que les Catégorie:Modèles d’accord en français sont extrêmement compliqués à utiliser, et ce encore plus parcequ'ils intègrent la prononciation. Pour ma part, j'ai toujours considéré comme un énorme désavantage que le wiktionnaire intègre la prononciation dans le modèle d'accord car cela revient à mettre l'information de prononciation en double pour chaque mot accordé (car la prononciation est déjà présente dans la ligne de forme de chaque mot... sachant que le mot peut-être dans une autre entrée si c'est un mot accordé), voire en triple si la prononciation est également présente dans la section "Prononciation" du mot (ex: cheval). De ce fait, un mot avec 4 accords (ex l'adjectif bancal), pourrait donc en théorie engendrer 3 prononciations sur 4 pages wiktionnaire: ça en fait des doublons dont il faut maintenir la cohérence. Fut un temps, j'ai passé beaucoup de temps à essayer d'aligner ces doublons (ex: à remplir ou corriger la prononciation dans le modèle d'accord si elle était vide ou erronée mais qu'elle était ok dans la ligne de forme, ou l'inverse..., pas mal de boulot à faire quand les mots pluriels avec prononciations vides sont créés par des bots...), mais j'ai ensuite abandonné faute de motivation. Tout serait bien plus simple si la prononciation était supprimée des modèles d'accord (i.e. il faudrait restreindre le modèle d'accord à leur rôle qui est d'indiquer les différents accords sans y intégrer leur prononciation). Il y avait déjà eu une discussion de cette veine mais sans consensus car des contributeurs préféraient au contraire la prononciation dans le modèle d'accord plutôt que dans la ligne de forme ou dans la section prononciation. Marxav (discussion) 26 août 2023 à 03:31 (UTC)
Pour illustrer ce que je disais, voici un exemple d'entrée fastidieux à maintenir et corriger au niveau prononciation : enculé de ta race. Il y aurait 12 longues prononciations à corriger dans le modèle rien que dans cette page (supprimer les caractères 'ˌ' et 'ˈ', ainsi que certains '.') et il faudrait aussi ajouter la prononciation dans la ligne de forme. (désolé du choix du mot qui est très vulgaire, je l'ai choisi car c'est celui en exemple sur le modèle Modèle:fr-accord-personne.) Marxav (discussion) 26 août 2023 à 04:01 (UTC)
Ah sur le sujet des infos redondantes, je veux bien chanter la complainte en duo… C’est vraiment pénible de devoir faire le tour des pages des N flexions et des P variantes orthographiques, à chaque fois qu’on veut faire une correction ou ajouter une info. Et de constater soit qu’il faut faire la modif sur les N×P pages, soit que ces pages ont divergé… À mon avis c’est à la fois une perte de temps collectif considérable, et une source majeure d’erreurs. Mais bon, le Wiktionnaire est comme ça, je n’ai pas la foi de me battre pour que ça change.
Comme tu le dis, il y a les redondances entre pages (les différentes flexions), et aussi les redondances au sein d’une page : ligne de forme versus modèle d’accord. Si le modèle d’accord contient déjà toutes les infos (genre, nombre, prononciation), la ligne de forme devrait peut-être disparaître complètement, ou du moins ne plus être rédigée manuellement mais produite par le modèle d’accord lui-même ? (quitte à laisser la possibilité d’ajouter des notes d’usage supplémentaires). Personnellement j’aime bien avoir les prononciations dans les modèles d’accord parce que ça fournit une vue synthétique de toutes les flexions. À mon avis le problème est surtout d’avoir des pages séparées pour chaque flexion, et d’y mettre des infos autres qu’un pointeur vers le lemme.
Dans la liste d’améliorations possibles de mon programme, j’ai noté de vérifier la cohérence des infos entre ligne de forme et modèle d’accord, et entre les pages de chaque flexion d’un même lemme. Je ne le fais pas car ce n’est plus à quelques milliers d’erreurs que je m’attends, mais plutôt à des centaines de milliers.
Le statut des sections « Prononciation » est un peu différent puisque dedans on peut y mettre les réalisations concrètes et toutes la variété d’accents régionaux, là où les prononciations « usuelles » données en tête d’article sont des formes plus simples / normalisées (c’est la différence entre {{pron}} qui sauf erreur de ma part approxime la notion de phonologie, et {{phon}} qui donne la phonétique). Ce qui me désole avec ces sections (mais là je demande la Lune, en tant que personne qui veut exploiter le Wiktionnaire comme une source de données plutôt que comme un produit final), c’est qu’elles ne se prêtent pas du tout à un traitement automatisé, parce que :
l’info de ce qui est réellement prononcé dans les extraits audio (parfois un article est prononcé avant le mot vedette) est parfois manquante ;
la prononciation des extraits audio est très souvent manquante (mais grâce à des travaux comme le tien on peut s’attaquer au problème !) ;
la région est très souvent manquante (et il n’y a aucun espoir de renseigner cette info après coup) ;
des remarques de prononciation sont écrites en texte libre.
Pour revenir au sujet des modèles d’accord, je note aussi une limitation des modèles actuels : {{fr-accord-mixte}} permet de renseigner à la fois plusieurs orthographes et plusieurs prononciations, mais il ne précise pas quelle graphie correspond à quelle prononciation. Un lecteur humain est peut-être capable de faire la connexion tout seul (encore qu’il y a sûrement des cas mystérieux), mais pas un programme informatique.
Rien ne dit que la 1re graphie est associée à la 1re prononciation et la 2e graphie à la 2e prononciation. Dans d’autres instances, cette même configuration signifie que toutes les prononciations s’appliquent à toutes les graphies. Par conséquent, mon programme d’extraction de prononciations considère erronément que « tonals » admet les deux prononciations \tɔ.nal\ et \tɔ.no\.
Les modèles {{fr-accord-mf}} et {{fr-rég}} sont meilleurs de ce point de vue car dans ceux-ci, chaque prononciation renseignée cible une graphie (par exemple p2s3=xxx est la 3e prononciation de la 2e graphie du singulier). Encore faut-il que ce soit fait correctement, ce qui n’est pas toujours le cas. Par exemple dans djich, avant que je corrige la page, il y avait :
Ici pp2=XXX renseigne la 2e prononciation de la 1re graphie du pluriel (et, par défaut, la 2e graphie hérite des prononciations de la 1re graphie). Ce n’est pas ce qu’on veut, il faut en fait renseigner la (1re) prononciation de la 2e graphie, avec le paramètre p2p=XXX :
On a fait ce chantier avec User:Romainbehar pour l'italien. Il reste deux gros modèles d'accord : {{it-flexion}} et {{it-inv}}; et bien c'est bien plus simple et la maintenance est grandement facilitée. Il reste quand même quelques exceptions, mais la modification a été vraiment très utile. Otourly (discussion) 31 août 2023 à 13:58 (UTC)
Et si on commençait par virer les prononciations des boites à flexions ? Je regarde les autres wiktionnaires, et j’ai l’impression qu’on est les seul·es à faire ça. Lepticed7 (À l’immortalité !) 7 septembre 2023 à 08:47 (UTC)
Moi, j'aime bien les prononciations même si j'avoue que c'est la source de plusieurs problèmes dont on discute ici. L'avantage que j'y vois, c'est que ça permet de savoir comment prononcer une flexion sans avoir à cliquer. C'est particulièrement utiles pour les pluriels irréguliers comme œil/yeux. En gros la boite de flexion contient la même chose que ce qu'on trouve sur la ligne de forme (titre, prononciation et parfois genre).
Un autre avantage que je vois, c'est que ça permet d'identifier plus facilement les erreurs de copier-coller pour les prononciations. En général, la prononciation présente une prononciation correcte car générée automatiquement tandis que celle sur la ligne de forme peut être erronée.
Ma question du jour : pour de nombreux mots, on indique une « prononciation usuelle » ({{pron}}) avec le phonème \ɑ\ (pour les locuteurs qui le connaissent), et une deuxième prononciation qui est exactement la même mais avec \a\ (pour les locuteurs qui ne font pas la différence). Pourquoi ne pas se contenter de la première prononciation qui est plus informative, puisque la deuxième s’en déduit de façon systématique ? Autrement dit, pour un locuteur pour qui ne fait pas la différence, \ɑ\ serait à lire comme \a\. Il me semble que c’est ce que font les dictionnaires, et c’est déjà ce qu’on fait pour la paire \œ̃\, \ɛ̃\ qu’une grande partie des locuteurs ne distingue pas : par exemple, pour brun on se garde bien d’indiquer comme « prononciation usuelle » l’alternative \bʁɛ̃\ qui est pourtant celle de beaucoup de locuteurs.
La situation de \ɑ\, \a\ est-elle plus complexe, ma question est-celle trop naïve ? (Déclaration utile : moi-même je ne distingue pas du tout le son \ɑ\.)
Bonjour,
Dans le traitement de portière nous sommes 2 à avoir une vision différente de diviser (ou non) l'entrée en section. Le sectionnement est simple sur des bases grammaticales (un adjectif n'est pas un nom & réciproquement) Dans le cas présent, l'un de nous propose une seule section, par homogénéité de l'étymologie, l'autre propose de scinder en 2 noms, pour séparer la personne de l'objet ; l'un s'attache au signifiant, l'autre au signifié. Comme je ne suis plus que de loin le projet, beaucoup de débats m'ont échappés. Quelle est notre doctrine sur ce point ? Saluts à tous. François GOGLINS (discussion) 26 août 2023 à 17:00 (UTC)
Bonjour, Si un nom diffère d'étymologie en fonction de son sens, il faut qu'il y ait autant de section de nom que d'étymologie différente. Si portière dans le sens de "qui garde une porte" venait de "portagnagna" (pas très originale mon invention) et portière dans le sens de religieuse venait de "buertiara" (j'invente toujours évidemment), il faudrait deux sections "noms" (num=1 ; num=2. Si c'est la même étymologie pour tous les sens, il faut une section de nom (ou d'adjectif, etc.). Par ailleurs, l'étymologie telle qu'elle est écrite actuellement ne respecte aucunement l'orthotypographie du français. Il faudrait faire une phrase et ne pas utiliser le modèle date, car il force à avoir une parenthè erronèe et qui plus est inesthétique en français (écrire "Attesté en 1160 dans le sens de « celle qui garde une porte », etc." est plus clair et tombe d'ailleurs dans le cadre d'une sous-section de l'étymologie appelée "attestations historiques"). Treehill (discussion) 26 août 2023 à 20:44 (UTC)
Deux points me gênent dans la confusion : D'abord une confusion entre des humains & des choses. Je sais que d'aucuns affirment que les humains sont des animaux comme les autres (et je présume qu'ils ne parlent que pour leur cas) mais je n'ai jamais entendu revendiquer que les humains sont des objets comme les autres (même les esclaves étaient considérés comme du cheptel, donc des animaux & non des objets). Et le pompon c'est qu'aucune féministe ne monte au créneau lorsque nous confondons une femme & son métier et un vulgaire objet (comme quoi il y a plus d'activistes transgenres que féministes sur notre projet). Le second point concerne l'équivalent dans un autre genre : il existe pour les humains, pas pour les objets et ne serait-ce que pour cela, il faut bien les séparer car rapidement l'on ne sait plus de quoi l'on parle (je vous rappelle que nous poursuivons le projet du wiktionnaire pour éclairer ceux qui butent sur un mot ou une expression & son usage) --François GOGLINS (discussion) 30 août 2023 à 06:12 (UTC)
Donc, en gros, il faudrait faire des sections selon des considérations politiques, pour faire passer l'idée qu'il s'agit de mots différents avec la même orthographe, non pas qu'il y aurait une confusion si on ne faisait pas deux sections (les sens sont de toute façon bien distingués, et avant l'intervention de François Goglins sur portière, le modèle {{équiv-pour}} n'était pas appliqué à tous les sens du mot), mais parce qu'il serait offensant de mettre dans la même section une définition de sens s'appliquant à une personne et une définition de sens s'appliquant à un objet. Et donc "que font les féministes ?" comme on dirait "que fait la police ?" (mais en réalité le sujet n'est pas que la dignité offensée des femmes : calculateur, distributeur, lessiveur, ordinateur, par une rapide recherche). Ce serait bien que d'autres personnes s'expriment, que l'on tâte s'il s'agit d'une opinion partagée ou totalement minoritaire. Keymap9 (discussion) 31 août 2023 à 07:29 (UTC)
Pour ma part, je rejoins l'avis exprimé par TreeHill, c'est-à-dire une section différente si l'étymologie est différente. Donc dans le cas de portière, d'accord pour n'avoir qu'une seule section. Pamputt31 août 2023 à 08:08 (UTC)
Nous seulement l’étymologie est la même, mais il y a un rapport de sens net. Nous ne confondons en rien une femme et un objet puisque nous mettons des définitions différentes. La seule question qui importe, c’est de savoir si c’est le même mot avec des sens différents ou deux mots différents. Nous distinguons bien, par exemple, boucher et bouchère comme noms à part entière (dans des pages différentes) car ce sont des noms différents (le premier du genre masculin et le deuxième du genre féminin), bien que leur étymologie soit identique, mais là, il n’y a pas de raison de séparer.
J’en profite pour évoquer le cas des prénoms et des noms de familles, dont la prononciation (en français) peut parfois varier selon la personne qui porte ce prénom ou ce nom. L’étymologie peut parfois être la même ou quasiment, et parfois complètement différente, ou encore inconnue ou incertaine. Comment traiter ces cas ? Ce n’est pas évident de trancher, d’autant plus que la prononciation peut souvent varier selon les compétences linguistiques du locuteur (par exemple, prononciation (en français) à l’anglaise ou à la française pour un prénom anglophone porté par un anglophone, et prononciation (en français) à l’anglaise ou à la française pour un prénom anglophone porté par un francophone). Et, pour une personne donnée, comment savoir quelle était l’intention des parents, qui se moquent bien souvent de l’étymologie ? Le plus simple pour les lecteurs (et pour les contributeurs…) serait sans doute de regrouper dans tous les cas, avec éventuellement des notes explicatives, même s’il y a parfois un risque de regrouper des noms d’étymologie différente. Lmaltier (discussion) 31 août 2023 à 17:30 (UTC)
Sur ce dernier point, j’ajoute que c’est un cas très particulier du fait que ni les prénoms ni les noms de famille n’ont en soi de signification, même s’ils peuvent avoir une étymologie (quand ils ne sont pas complètement arbitraires)… La question est-ce le même mot ? n’a donc pas la même importance que dans les cas ordinaires. Lmaltier (discussion) 1 septembre 2023 à 13:16 (UTC)
Salut. Je rattrape un peu mon retard sur la Wikidémie.
@François GOGLINS : « Et le pompon c'est qu'aucune féministe ne monte au créneau lorsque nous confondons une femme & son métier et un vulgaire objet (comme quoi il y a plus d'activistes transgenres que féministes sur notre projet). » C’est un homme de paille doublé d’une atteinte aux règles de savoir-vivre.
Maintenant que ça c’est clarifié, je rejoins l’avis des autres. À la limite, si il n’y avait qu’une seule définition, du genre "Nom d’un objet et d’une femme", là il me semble qu’il faut séparer. Mais dans la même section, il n’a jamais été question de confondre toutes les définitions. En plus des noms de métiers par @Keymap9, j’en rajoute quelques uns, dans lequel la définition pour un objet ou un animal non-humain (oui, on est des animaux, François) est dans la même section qu’un nom désignant une personne : andouille, asperge, bête, bite, bombe, plaie, planche à pain, pourriture, quiche, saucisse, tapette et beaucoup d’autres qui viennent de Catégorie:Mots féminins en français pouvant désigner des hommes. À la limite, si il était imposé que le modèle {{équiv-pour}} soit sur la ligne de forme plutôt qu’en fin de définition, alors là, je serai pour la scission en deux sections différentes. Si non, je n’en vois pas l’intérêt. Bonne journée, Lepticed7 (À l’immortalité !) 9 septembre 2023 à 06:37 (UTC)
Les directives d'application nécessitent la création d'un comité de construction pour rédiger une charte décrivant les procédures et les détails d'un comité mondial appelé le comité de coordination du code de conduite universel (U4C). Au cours des derniers mois, le comité de construction U4C a travaillé en groupe pour discuter et rédiger cette charte. Le comité de construction U4C accueille les commentaires sur cette version de charte jusqu'au 22 septembre 2023. Après cette date, le comité de construction U4C révisera la charte si nécessaire et un vote communautaire s'ouvrira peu de temps après.
Je vous communique ce numéro car j'ai pu évoquer pour la première fois le Wiktionnaire grâce à un article universitaire intitulé "Wiktionary Popularity from a Citation Analysis Point of View".
Yep, super ! Merci ! Je n’avais pas encore capté cet article malgré ma veille régulière sur les publications se référant au Wiktionnaire. Un article assez court, et sans analyse détaillée, mais qui montre que plein d’articles universitaires citent le projet Wiktionary, et surtout la version anglophone, de manière constante ces dernières années Noé29 août 2023 à 14:00 (UTC)
Merci pour la découverte, et merci, Noé, pour le résumé dans les prochaines Actualités. Je suis quand même surpris que le Wiktionnaire en allemand soit cité autant que le Wiktionnaire en français. Le Wiktionnaire en allemand est moins développé que les Wiktionnaires en anglais et en français. Mais peut-être qu'ils ont une équipe de Wiktionnaristes qui fait de la pub à ce projet de l'autre côté du Rhin. Pamputt29 août 2023 à 14:41 (UTC)
Heures de conversation pour discuter du projet de charte du comité de coordination du code de conduite universel
Vous trouverez le lien des conversations sur Meta-wiki. Pendant que vous y êtes, veuillez ajouter votre nom à la liste des conversations. L'interprétation en français est confirmée pour la conversation du jeudi 7 septembre à 17h UTC.
Les membres du comité de construction U4C et les membres du personnel soutenant ce travail seront disponibles pour discuter des détails du projet de charte avec vous et écouter vos commentaires.