Bonjour, vous êtes venu ici pour chercher la signification du mot Wiktionnaire:Wikidémie/octobre 2009. Dans DICTIOUS, vous trouverez non seulement toutes les significations du dictionnaire pour le mot Wiktionnaire:Wikidémie/octobre 2009, mais vous apprendrez également son étymologie, ses caractéristiques et comment dire Wiktionnaire:Wikidémie/octobre 2009 au singulier et au pluriel. Tout ce que vous devez savoir sur le mot Wiktionnaire:Wikidémie/octobre 2009 est ici. La définition du mot Wiktionnaire:Wikidémie/octobre 2009 vous aidera à être plus précis et correct lorsque vous parlerez ou écrirez vos textes. Connaître la définition deWiktionnaire:Wikidémie/octobre 2009, ainsi que celles d'autres mots, enrichit votre vocabulaire et vous fournit des ressources linguistiques plus nombreuses et de meilleure qualité.
Je suis en train de roder mon bot pour qu'il mette des puces aux exemples et citations, et en même temps mette les sources dans le modèle {{source}}.
Sachant que les conventions n'étaient pas très bien définies auparavant, on tombe sur un certain nombre de mises en forme différentes pour l'écriture des sources ainsi que des notes d'exemples qu'il est assez difficile à différencier pour un bot. Donc je vais d'abord faire une première passe avec le bot, puis je répertorierai les cas ambigus à vérifier à la main.
J’ai pas tout vérifier (à quand des bots pour vérifier les bots ? ) mais cela me semble correct. Je n’ai vu qu’une seule erreur, sur herbe
En effet, le bot ne peut pas faire la différence entre des notes et des sources de citation : la différence ne peut se faire qu'à l'œil (sauf indices évidents). J'ai plusieurs choix possibles :
tout remplacer par des {{source}} et corriger les notes à la main ensuite ;
suspendre les remplacements le temps de réécrire les notes correctement à la main ;
ne pas remplacer les sources ambigües tout de suite (ne changer que les puces et les sources évidentes), et faire les sources dans un second temps ;
tout remplacer de manière semi-automatique, comme je l'ai fait en rodage jusqu'à maintenant (j'en suis à 1425 / 70315) ;
Remarque : pour le résumé de modification on pourrait pas avoir une précision mise en forme des exemples et citations des puces quand il ne modifie que les puces et mise en forme des exemples et citations des puces + {{source}} quand il ajoute aussi le modèle source ? Cdlt, VIGNERON * discut.2 octobre 2009 à 14:20 (UTC)
Sachant que j'ai des problèmes d'Internet en ce moment, je suspend ces remplacements. Quand je reprendrais, j'appliquerais la solution que j'ai décrite, c'est-à-dire que je vais m'occuper des éléments non ambigus d'abord (ajout des puces, et du modèle de source quand c'est évident) puis je ferais une liste des sources ambigües qu'il faudra corriger à la main. Il ne devrait donc pas y avoir de problèmes durant la « transition ». — Dakdada(discuter)6 octobre 2009 à 10:16 (UTC)
Il y a deux modèles proposés à la suppression, {{doute de traduction}} et {{traduction inconnue}}. Ces modèles sont très difficile à comprendre, à mon avis la meilleure solution est de revoir {{ébauche2-exe}} qui me semble plutôt utile. Avoir trois modèles qui fait plus ou moins la même chose, c'est ça qu'il faut éviter parce que plus il y a de modèles, plus le Wiktionnaire est difficile à comprendre. Mglovesfun (disc.) 6 octobre 2009 à 10:55 (UTC)
Je viens de découvrir ce site qui se réfère aux Wiktionnaires en finnois et en anglais. Mais qui a oublié de dire qu'il se référait aussi au Wiktionnaire en français... pourtant bien utile pour atteindre les "2 871 766 words. 2 986 710 translations.". Quelle action entreprendre ? Stephane8888Discuter1 octobre 2009 à 18:55 (UTC)
Personnellement, je n’y comprends rien (c’est quoi du finnois, du suomi ?).
Mais si quelque se débrouille dans cette langue, il peut commencer par leur écrire un mail pour leur signaler (souvent cela suffit pour résoudre le problème).
Oui, ou sinon, remonter au niveau au-dessus, à des gens qui ont l'habitude de ça (je crois qu'il y a une page quelque part pour signaler ce genre de chose, mais je ne sais plus où). Lmaltier2 octobre 2009 à 20:46 (UTC)
Problème technique. Comment faire que noital=1 ne met pas d’italique pour les mots comme λόγος qui ne s'écrivent pas avec alphabet latin. Je vais envoyer un mail à Robert Ullmann parce qu'il doit le savoir (génie d'informatique). Mglovesfun (disc.) 2 octobre 2009 à 04:42 (UTC)
Il y a deux manières de marquer les références, qui sont actuellement en conflit :
utilisation des modèles {{réf}} et {{RÉF}} (c'est cette solution qui avait été discutée et mise en place) ;
utilisation des balises <ref> avec la liste <references> via le modèle {{Références}} (ce qu'il y a sur Wikipédia, mais je ne me souviens pas avoir vu de discussion sur l'introduction de ces balises, mais j'ai peut-être tort) ;
Il y a plusieurs cas où elles sont utilisées :
on veut faire une note, par exemple dans une étymologie pour donner l'origine d'une information, ou pour une certaine définition (rare, polémique, ...) pour en donner des sources la soutenant ;
on veut citer la source d'une citation.
Actuellement tout est mélangé, et c'est mal.
Propositions d'harmonisation, à marquer dans les conventions :
pour les notes, garder les {{réf}} et {{RÉF}} qui sont bien plus intuitifs que les balises <ref> ;
pour les citations, utiliser exclusivement {{source}} (mieux vaut avoir la référence d'une citation au niveau de celle-ci plutôt qu'en bas de page) ;
par conséquent, éliminer (remplacer) l'usage des <ref>, <references> et {{Références}} dans les articles.
Neutre, dans l’idéal il ne faudrait utiliser que les balises ad hoc (ie. <ref> et <references>), mais je comprends que certains préfèrent la solution « bricolée ». Pour les citations, {{source}} est ce que l’on a de mieux pour le moment mais il est loin d’être parfait (mais il y a un problème plus global avec les citations). Cdlt, VIGNERON * discut.2 octobre 2009 à 14:10 (UTC)
Plutôt pour 1°) Arguments pour la balise <ref> ... </ref> : utilisée sur tous les projets Wikipédia, donc très connue, elle permet aussi une numérotation automatique et s'avère très utile sur de longs articles. Arguments contre : le wiktionnaire n'a pas d'articles aussi longs que sur Wikipédia et le texte nuit considérablement à la lecture. 2°) Arguments pour {{réf}} et {{RÉF}} : permettent de renvoyer le texte à la fin, et donc de dégager le texte, conviennent bien pour des articles courts ayant très peu de références (rarement plus de 2). Arguments contre : ne seront utilisées (à ma connaissance) qu'ici et seront donc peu connues de tous les contributeurs qui viennent de Wikipédia pour participer ici, ce qui est courant ; dans les cas rares d'articles multiréférencés, la numérotation devra se faire à la main. — Le second modèle semble donc plus approprié que le premier pour le wiktionnaire, mais je préconise alors de créer deux boutons dans la ligne au-dessus de la fenêtre d'édition pour qu'ils soient facilement accessibles à tous, notamment à cause de l'écriture RÉF. C'est mieux comme ça, Vigneron ? Chrisaix4 octobre 2009 à 09:19 (UTC)
Remarque : ces votes illustrent ce que j’explique en dessous : ils sont commentés par des avis qui sont plus proches de l’opinion que de l’argument (bon c’est pas ce que j’ai vu de pire mais c’est loin d’être parfait).
Par exemple, Stephane8888 tu préfères ces modèles plutôt que les balises, ok, très bien, tant mieux même. Par contre, en quoi cela doit-il intervenir dans la discussion ? Surtout que ta préférence n’interdit en rien la cohabitation des deux donc pourquoi imposer ton point de vue personnels aux autres ? Imagine les wikipédiens qui sont déjà complètement dépassés par la boulimie ambiante de modèle. Leur premier réflexe sera évidemment d’utiliser la méthode qu’ils connaissent et qui est utilisée sur plus de 271 projets ! Cdlt, VIGNERON * discut.3 octobre 2009 à 13:11 (UTC)
Désolé, c'est en effet le genre de "vote" à proscrire. Comme Darkdada le rappelle dans sa proposition, ces modèles avaient déjà fait l'objet de discussions. En voici une qui a rendu les modèles {{réf}} et {{RÉF}} relatifs à chaque section de langue (« remise à zéro » (non automatique) du compteur) C'est encore rarement utilisé mais c'est un inconvénient de moins qu'on aurait pu reprocher à ces modèles. Pour les autres arguments, je ne ferais que répéter (en moins bien) l'analyse de Chrisaix. (Merci à lui). Oui les balises (<ref>) doivent (selon moi) être remplacées mais la possibilité technique de les ajouter ne doit pas être supprimée. La syntaxe serait ainsi homogène et les contributeurs de passage ne seraient pas trop déboussolés. L'idée de boutons est excellente. Stephane8888Discuter4 octobre 2009 à 17:17 (UTC)
Je suis pour placer dans {{source}} les références de citations. Si j'ai (très rarement) utilisé {{réf}} pour cela ce n'était que pour alléger la citation d'une volumineuse référence. Mais une citation sans sa référence (lisible juste à côté) perd beaucoup de son intérêt. Stephane8888Discuter6 octobre 2009 à 21:36 (UTC)
Quelques rappels de déontologie de base
Je sais qu'écrire cela me fera peut être passer pour un donneur de leçons un peu ridicule, mais j'ai l'espoir que le respect de notions simples de déontologie pourrait nous éviter de devoir tout régir par des règles trop précises (ce qui a pas mal de défaut, et fait perdre beaucoup de temps).
On ne clôt pas soi-même un vote qu'on a initié.
On ne clôt pas un vote en allant à l'encontre de l'avis de la communauté, même si on est sûr d'avoir raison (concerne surtout les PàS). Si le vote s'est "mal" passé (résultat illogique, ou contradictoire avec un autre, etc.), on argumente, et on argumente encore. On peut toujours relancer la discussion (après une cloture qui parait mauvaise) sur de nouvelles bases. Si il n'y a pas assez de votes exprimés pour pouvoir décider, on laisse durer. Même si c'est ennuyeux ou peu pratique.
Les actions d'administrateur devraient toujours répondre à une demande de la communauté, sauf si on n'imagine pas de contestation possible (par exemple : les vandalismes, purges d'historique, etc.).
On ne bloque jamais quelqu'un avec qui on est en conflit. On peut demander à quelqu'un de le faire, en exposant le problème, et c'est lui qui engagera sa responsabilité en agissant.
Les attaques personnelles et les lynchages en place publique sont à éviter comme la peste (ils sont parfaitement contre-productifs, puisque l'effet de la méthode employée noiera les arguments avancés).
Je dois en oublier d'autres aussi évidentes et capitales, mais je crois que si celles-ci déjà étaient respectées ça irait peut être un peu mieux. Plus généralement et à titre personnel je dirais qu'on ne devrait pas oublier que les articles concernés par nos querelles ne représentent qu'une partie infime de nos 1 500 000 articles, alors restons calmes. Markadet∇∆∇∆2 octobre 2009 à 15:46 (UTC)
Bof, ça change quoi ? Si on fait preuve de neutralité, cela ne pose aucun problème (j’ai bien dit si et pas quand).
Cela dépend. En PàS par exemple, il ne s’agit pas de vote à la majorité mais de consultations d’avis. Ainsi, si une personne à un bon argument et que cinq autres personnes se ramènent sans arguments, je vais plus tenir compte de l’avis argumenté. Évidemment, on évite de se mettre tout le monde à dos .
En respectant cela ("On ne clôt pas soi-même un vote qu'on a initié"), on évite beaucoup de problèmes potentiels, et cela évite, entre autres choses, de pouvoir clore un débat au moment où ça nous arrange le plus.
Alors qui pourra décider de ce qui est le "bon" argument ? Si 5 personnes ne sont pas d'accord (contre une seule), je ne vois pas ce qui me permet de les ignorer. En clôturant sans en tenir compte je les prend pour des imbéciles (la seule exception : si l'argument est arrivé après les 5 votes, mais alors il suffit juste de les prévenir. C'est pourquoi je parlais de "reprendre la discussion sur de nouvelles bases", on peut relancer un vote déjà clôt à partir des nouveaux arguments). Et comment savoir si je ne suis pas leur imbécile ? Ils sont peut être aussi certains que moi d'avoir raison. Cette idée de "PàS comme consultation" doit donc être combattue à toute force, sans quoi celui qui clôt prend un avantage de fait sur les autres. Ou alors il nous faut une classe de super-utilisateurs, plus intelligents et plus sûrs (qui ne se trompent jamais) que les autres pour clore les PàS... Mais ces super-utilisateurs ne sont pas les admins (qui ne sont pas spécialement plus malins que les autres), et cela serait aller à l'encontre de tout ce qui a cours sur les projets Wikimedia. Markadet∇∆∇∆2 octobre 2009 à 16:35 (UTC)
Tout à fait mais dans le cas ou personne ne veut/peut le faire, je pense que l’on peut le faire soi-même si on reste neutre (ce qui est difficile donc plutôt à éviter, effectivement)
Je ne parle pas de bon ou de mauvais arguments, je parle d’absence d’arguments ou d’opinions. Il faut tenir compte de tout le monde (y compris des imbéciles) mais pas forcément de tout les votes/avis. Si quelqu’un vote supprimer X parce que je l’aime pas, ce n’est pas un argument mais une opinion. Donc je le prendrais peu voire pas en compte (le plus probablement, je vais contacter le votant pour avoir des précisions). Par contre, supprimer X parce qu’il contient des éléments A et B qui présentent tels ou tels défauts (d’ailleurs que ces défauts soit importants ou pas, réels ou pas) est beaucoup plus constructif donc plus à prendre en compte. Le concept « PàS comme consultation » (donc comme une discussion, une collaboration, donc un wiki) existe depuis le début des projets (2001 tout de même) et est appliqué (à ma connaissance) dans les 271 langues. Il est logique dans le mesure ou on ne peut pas répondre à une opinion, il faut donc absolument des arguments pour bien discuter. Cdlt, VIGNERON * discut.3 octobre 2009 à 12:58 (UTC)
Je suis d'accord avec Vigneron sur le fait qu'un vote non expliqué ne sert à rien. Pour le on ne bloque pas quelqu'un avec qui on est en conflit : je suis globalement d'accord sur le principe, mais il faut voir quelque chose : je bloque extrêmement rarement, mais j'ai déjà fini par bloquer quelqu'un qui persistait à enlever du contenu pour ne laisser que son propre point de vue sur un sujet très polémique, malgré toutes les explications, répétées, sur la neutralité à respecter. Eh bien, il a protesté énergiquement parce que je l'avais bloqué en étant en conflit avec lui (alors que je n'avait fait que révoquer ses suppressions et expliquer pourquoi). Je pense que ses protestations étaient injustifiées. Par exemple, quelqu'un qui blanchirait à répétition une page doit pouvoir être bloqué même par celui qui a révoqué ses blanchiments.
Mais, de toutes façons, il faut toujours éviter de bloquer, le Wiktionary anglophone se porterait beaucoup mieux s'il ne faisait pas des blocages sans arrêt. Lmaltier2 octobre 2009 à 20:42 (UTC)
Le fait que le vandale se plaigne qu'on l'a bloqué ne fait pas un conflit... Je fais ici référence à un conflit préexistant à l'affaire qui entraine le blocage. A part ça je suis d'accord pour dire que les blocages doivent rester extrêmement rares. Markadet∇∆∇∆3 octobre 2009 à 10:35 (UTC)
Markadet tu ferais mieux de clore "mon" vote quasi-périmé (que je me suis sentis obligé de proposer par omission des confrères wikidémistes, car je le trouve fondamental et le relance d'ailleurs toutes les semaines). Par contre, ce deuxième nécessitera peut-être une tierce personne pour trancher. JackPotte3 octobre 2009 à 09:33 (UTC)
Pour le premier je vois plus une discussion qui a pris la forme d'un vote, je crois qu'on pourrait dire "Si il n'y a pas d'opposant, je fais le changement dans 3 jours", ou quelque chose comme ça, en le signalant sur la Wikidémie du mois en cours ; ça serait suffisant. Pour le second je n'ai pas compris ce que tu voulais changer exactement. Markadet∇∆∇∆3 octobre 2009 à 10:40 (UTC)
J'ai commencé, au début de cette page, une liste de résultats de requêtes Google qui ont pour but de mesurer comment évolue le nombre de références au Wiktionnaire sur Internet. Ce serait bien si ceux qui y pensent rajoutaient une ligne à cette liste à chaque début de mois, après avoir effectué les 3 requêtes Google indiquées. Lmaltier2 octobre 2009 à 20:49 (UTC)
Pourquoi par un javascript, qui calculerait aussi automatiquement les nombres de résultats Google de chaque vocable du site dans chacunes de leurs PDD. JackPotte3 octobre 2009 à 09:37 (UTC)
Pour Je pense que ces références sont une excellente idée. Le tout est d'arriver à y penser, mais ça vaut vraiment le coup. Chrisaix5 octobre 2009 à 00:26 (UTC)
Problèmes des transcriptions (encore) mais dans les traductions
Bonjour à tous. Je souhaiterais que vous regardiez cette modification. Elle pose un gros problème, celui des écritures multiples dans les langues. En effet, il ne s'agit pas d'une transcription, mais d'un deuxième alphabet utilisé. Il y a le serbe, l'ouïghour, le serbo-croate... Est-ce qu'il serait possible de modifier le modèle {{trad}} de façon à ce qu'il puisse prendre en compte ces écritures multiples ? Par exemple, et dans le cas cité, quelque chose comme :
{{trad|sr|острво|éc2=ostrvo}} qui serait l'équivalent de {{trad|sr|острво}} / {{trad|sr|ostrvo}}
Je vais être un peu critique, désolé. Concernant la romanisation, il s'agit d'un problème d'écriture dans les articles, et je ne suis pas sûr qu'il soit applicable aux traductions. Mais ça peut être une piste. Par contre, ce n'est pas un variante orthographique (comme pourraient l'être Marseille et Marseilles) et encore moins des synonymes (il ne s'agit pas de mots différents). Concernant le japonais, l'alphabet romaji n'est utilisé que pour les étrangers ; il n'est jamais utilisé au Japon. C'est donc uniquement une translittération. Par contre, l'écriture en kana est une transcription des kanji, et elle est utilisée pour faciliter la lecture des caractères chinois. Donc, à nouveau, rien à voir avec le problème évoqué. Merci quand même de ton intervention, elle permet d'éliminer un certain nombre de possibilités qui ne pourront pas être utilisées pour les traductions. Chrisaix3 octobre 2009 à 10:05 (UTC)
Oui, il n'aurait pas fallu supprimer la traduction. C'est un mot utilisé en serbe avec l'alphabet latin. C'est pénible, ceux qui suppriment le travail des autres... Mais il suffit de mettre les diverses écritures possibles, il n'y a pas à changer le modèle trad pour ça (il est déjà bien assez compliqué...). Et il est aussi à définir comme un mot normal, ce qu'il est. Les lecteurs ne sont pas idiots. Lmaltier3 octobre 2009 à 09:52 (UTC)
Il n'a pas cherché à "supprimer" le travail des autres. C'est seulement par méconnaissance qu'il a fait ça. Il n'y a rien à redire à ça. C'est uniquement une petite erreur. Par contre, pour en revenir à ce qui m'intéresse ici, ce ne serait pas "compliquer" le modèle, mais le compléter pour répondre à un besoin particulier des langues à plusieurs alphabets. Et je préfèrerais avoir des réponses constructives en rapport direct avec le problème (si cela peut être possible...). Chrisaix3 octobre 2009 à 10:05 (UTC)
C'est ce que je fais : je répète que je préfère deux modèles trad qui se suivent, plutôt que le compliquer pour des cas particuliers comme ça, il est déjà assez compliqué. Lmaltier3 octobre 2009 à 11:24 (UTC)
Ce que je voudrais, c'est pouvoir indiquer qu'il s'agit seulement d'une autre écriture, et pas d'un synonyme, comme cela se comprend généralement quand il y a plusieurs traductions. Chrisaix3 octobre 2009 à 12:04 (UTC)
J'aurais préféré passer par le modèle {{trad}} pour éviter que chacun le marque à sa façon. C'est seulement pour assurer l'homogénéité des présentations. Ça servira pour beaucoup de langues différentes. Chrisaix3 octobre 2009 à 12:11 (UTC)
Même si ça arrive que certains les mettent, on n'a jamais dit qu'il fallait mettre les genres dans les traductions (on peut toujours cliquer sur le mot si on est intéressé). En tout cas, il vaut mieux ne pas compliquer. Lmaltier3 octobre 2009 à 21:14 (UTC)
Tout à l'heure j'avais vu |f}} dans un modèle trad. Il faudrait ajouter le paramètre à trad+ et trad- aussi, mais oui c'est déjà utilisé sur des pages, même si la syntaxe n'existe pas encore. Mglovesfun (disc.) 3 octobre 2009 à 21:15 (UTC)
Le genre n'est utile dans les traductions que dans un seul cas : celui de mots en français qui ont, en espagnol par exemple, des traductions différentes selon le genre : Exemple bon pour lequel bueno et buena sont les 2 traductions selon le genre. Certains en ont déduit (on ne peut pas leur jeter la pierre) qu'il fallait préciser le genre pour toute traduction... Stephane8888Discuter4 octobre 2009 à 16:14 (UTC)
Bon. LMaltier, lui, refuse de changer le modèle. Mais qu'en pensent les autres ? Verriez-vous comme utile de pouvoir faire la différence dans les traductions entre 1°) les écritures différentes d'une même langue et 2°) les synonymes possibles ? Personnellement, je pense qu'il est nécessaire, voire indispensable, de pouvoir faire la différence entre les deux. Quelles sont vos idées ? Chrisaix3 octobre 2009 à 21:53 (UTC)
Donc, avec une syntaxe comme {{trad-|sr|острво|éc2=ostrvo}}. Mais il faudrait avoir une différence à l'affichage, par rapport à l'utilisation de 2 modèles. Sans quoi je ne vois pas bien l'intérêt de cette modif (en dehors, certes, de rendre plus précise la saisie). Stephane8888Discuter4 octobre 2009 à 16:14 (UTC)
Ça pourrait donner par exemple : острвоouostrvo, le "ou" n'apparaissant jamais en cas de synonymes. Ce serait donc équivalent à {{trad|sr|острво}} ''ou'' {{trad|sr|ostrvo}}, mais en beaucoup plus court ! Chrisaix4 octobre 2009 à 23:38 (UTC)
Je ne vois pas d'inconvénient majeur. Le modèle se complique mais seulement pour ceux qui veulent utiliser cette possibilité. Donc je suis pour (et je n'impose pas mon avis mais simplement je le donne ) Stephane8888Discuter5 octobre 2009 à 19:56 (UTC)
Dans la charte j'ai eu la fausse impression nous étions partis du principe que tous les mots à macron étaient des transcriptions et translittérations. Cependant, j'ai rencontré 2 sérieux obstacles à cette thèse aujourd'hui :
Attention, les macrons sur le Wikipédia sont un troll récurent. Si il existe des articles comme w:Bouddhisme mahāyāna ou w:Tōkyō c’est plus par abandon suite à de longs combats qui n’ont menés à pas grand’chose que par un vrai esprit encyclopédique.
Ensuite, les titres des articles de la Wikipédia francophone ne sont pas obligatoirement en français (cf w:Large Hadron Collider, ou w:Fear, uncertainty and doubt, ou toutes les tires d’albums de musique xénophone). Donc se référer à la Wikipédia est une fausse bonne idée.
D’abord cernons le champs d’utilisation :
À ma connaissance, les macrons sont utilisés sur les voyelles
en Asie, en japonais (Hepburn), chinois (pinyin et Yale), hindisanskrit (w:IAST),
autres : latin et grec ancien, API, et très très marginalement en français (nommés accent plat en remplacement des accents grave, aigus, et circonfexe ; cf w:Macron#Français).
En fait, partout où il y a des voyelles longues.
le macron est utilisé en numération romaine (mais le wiktionnaire doit-il avoir une entrée pour des chiffres comme ̄V̄ ? d’ailleurs je suis même pas sur de la façon de la composer en Unicode !)
Personnellement, je ne comprends pas qu'il y ait des problèmes sur Wikipédia à cause de ça, il suffit de prendre l'orthographe la plus courante en français pour régler le problème. Mais ici, comme nous avons toutes les orthographes utilisées, je ne vois pas ce qui interdirait de créer mahāyāna ou Tōkyō si ce sont réellement des orthographes utilisées en français par les spécialistes, et pas seulement des transcriptions non utilisées comme mots en français. Lmaltier4 octobre 2009 à 16:39 (UTC)
Créer Tōkyō ne pose pas de problèmes (pas à moi en tout cas), par contre quel contenu mettre ? dans quel langue le classer ? français ou japonais transcrit ? (dans l’idéal, il faudrait peut-être les deux). Je ne vais pas faire un cours d’archéowikilogie mais en gros la graphie Tōkyō est plus correcte que Tokyo même si cette dernière est plus courante. Sinon, heureusement que les articles de la Wikipédia n’utilisent pas le terme le plus courant, la majorité est loin d’avoir toujours raison (et dans des cas comme pomelo/pamplemousse, difficile de démêler le nœud, du coup, on a w:Pamplemousse et pomélo les espèces vivantes posent souvent problèmes d’ailleurs et se retrouve sous leur nom binomial). Cdlt, VIGNERON * discut.4 octobre 2009 à 17:06 (UTC)
Si c'est utilisé en français, on le met en français, si la transcription est aussi utilisée dans des livres japonais, on le met en japonais, si c'est utilisé en anglais, on le met en anglais, etc. Lmaltier 4 octobre 2009 à 17:10 (UTC) Et pour Wikipédia, je ne parlais que des orthographes, le choix du titre est un problème différent (là aussi, c'est souvent la fréquence qui devrait guider, mais il y a d'autres contraintes). Lmaltier4 octobre 2009 à 18:24 (UTC)
Je n’arrive toujours pas à me faire à cette définition. Les seules attestations de macrons en français sont 1. parfois des dictionnaires de noms propres (Larousse, Robert, etc.) 2. surtout des livres hyper-spécialisées. Enfin, elles sont très rares (Tōkyō ça va encore, mais pour un village perdu de Hokkaidō ça devient sport). Par contre, au Japon, les macrons sont présents dans certaines stations de train/métro (exemple ici ou le macron est présent dans Myōgadani et absent dans Tokyko !). Cdlt, VIGNERON * discut.4 octobre 2009 à 17:36 (UTC)
Ça ne m'étonne pas que ce soit dans des textes de spécialistes (+ Wikipédia...). Mais l'important est que ce soit utilisé. Et il se peut que ce soit utilisé par les spécialistes en français et en anglais, mais pas du tout en allemand ni en italien (j'en sais rien), c'est donc vraiment l'utilisation dans chaque langue qui compte, c'est le seul critère possible. Lmaltier4 octobre 2009 à 18:28 (UTC)
Ah, désolé, autant pour moi (et en plus j’avais voté !).
Du coup, on fait quoi pour le gaulois ? On a 60 articles : Spécial:Pages_liées/Modèle:=gaul= mais il n’a ni code ISO, ni code WM. En regardant les autres critères : c’est une langue morte, qui n’est apprise nulle part, sans littérature (presque sans attestation même !), la connaissance de cette langue est limitée à quelques universitaires. Le seul critère qui est respecté est « langue faisant l'objet d'un article dans au moins deux des dix plus grosses Wikipédias, sans que l'existence de ces articles y soit contestée » (w:Gaulois (langue) et une trentaine d’autres langues importantes). Ceci ces articles ne sont pas des modèles d’encyclopédicité.
J’exagère un peu, mais à peine. Pour être honnête, apparemment il existe (au moins) deux codes langues : xcg et xtg respectivement pou le « gaulish cisapine » et le « gaulish transalpine » mais je ne sais pasbien à quoi cela se réfère. Niveau attestations, on en a bien quelques unes mais rien de très probant.
On fait ce qu'on peut, on n'est pas obligés de faire l'impossible. On ne va pas inventer des mots gaulois pour être plus complets. Même si on n'a que quelques mots, c'est mieux que rien. Je pense que l'existence d'une (ou plusieurs) langue gauloise n'est contestée par personne. Moi non plus, je ne sais pas à quoi correspondent les codes xcg et xtg. Lmaltier4 octobre 2009 à 11:42 (UTC)
Bien sur, mais si on veut être réglo, les critères disent « Les langues n'ayant encore ni code ISO ni code Wikimédia doivent impérativement faire l'objet d'une discussion et d'une décision préalable à leur introduction ». Je ne suis pas bureaucratiste-jusqu’au-boutiste mais j’aimerais bien en discuter tout de même. Ne serait que pour créer une Convention:gaulois (comme pour les autres langues).
Qu’il existe un truc que l’on appelle aujourd’hui gaulois à cette époque, je ne le conteste pas du tout. Par contre, que ce « truc » soit acceptable sur le Wiktionnaire, là je demande des précisions (sans pour autant vraiment le contester). Ce que je conteste par contre, c’est la code =gaul= sorti de nulle part. Je me demande aussi si les formes reconstruites sont acceptables, dans quelle mesure, de quelle façon ? (avec l’astérisque habituel ou non ?) Cdlt, VIGNERON * discut.4 octobre 2009 à 12:03 (UTC)
Ah, je n'avais pas du tout compris, je croyais que tu pensais uniquement à l'avenir. Il y a en fait deux problèmes différents : le code utilisé (et son lien avec les codes ISO), et l'existence des mots qui utilisent ce code (d'où est-ce qu'ils viennent ?). Effectivement, il faut en discuter, mais je suis personnellement tout à fait incompétent sur ce sujet. Lmaltier4 octobre 2009 à 16:19 (UTC)
Voilà (j’ai bien fait de reformuler ). Ce n’est pas vraiment ma spécialité, je peux juste voir qu’il y a un « problème ». Ce « problème » devrait pouvoir être rapidement résolu par un spécialiste (ou même juste un amateur plus éclairé que moi). Cdlt, VIGNERON * discut.4 octobre 2009 à 16:43 (UTC)
Toutes les langues reconnues internationalement comme des langues ont droit à être traitées comme telles par le Wiktionnaire. Le critère est l'existence
d'un code ISO-639 (sauf les codes de "macrolangues")(Voir Wiktionnaire:ISO 639-1, Wiktionnaire:ISO 639-2 et Wiktionnaire:ISO 639-3). Toutefois, les mots hypothétiques n’étant pas acceptés, cela n’a pas de sens pour les langues dont aucun mot n’est connu. Ces langues constituent donc une exception.
ou d'un code langue de la fondation Wikimédia (codes utilisés pour les liens interwikis).
J'en reviens donc au mari. Le code chm est un code de langue (ISO 639-2) ou un code de macrolangue (ISO 639-3), et le code utilisé par la fondation Wikimédia est mhr. Si on suit cette règle, on ne doit donc plus utiliser le premier et ne garder que le deuxième. Je suis même sûr qu'en cherchant un peu, on devrait bien trouver une bonne dizaine de langues — voire plus — et une bonne centaine de dialectes ou patois divers, sans compter les langues multi-alphabétiques qui poseront des problèmes qu'il faudra régler par un bidouillage quelconque en enfreignant les sacro-saintes règles énoncées ci-dessus (slovio, gaulois, phénicien, indo-européen, klingon, tsolyani, berrichon, poitevin...). Je crois sincèrement que la classification 639-3 nous dépasse totalement, personne ici n'étant capable de faire des distinctions aussi fines dans la majorité des langues. On se fixe donc des règles qu'on ne pourra en réalité jamais respecter (même entre fra, frm et fro, on ne sait pas toujours où il faut placer les mots...). Il suffit de voir le bordel qu'a causé la réorganisation du nahuatl et la guerre que ça a provoqué... Je pense qu'il faut rester réaliste et ne pas vouloir chercher au-delà de ce qu'on est capable de faire ici, sinon il y aura BEAUCOUP de problèmes. Sans oublier un autre point important : les codes utilisés ici sont un mélange des trois ISO 639, alors qu'il serait plus logique de s'en tenir à un seul. Même Wikipédia est dépassé par ces distinctions. Restons simples et pragmatiques, c'est le seul conseil que je peux donner à tous. Chrisaix4 octobre 2009 à 22:34 (UTC)
Quand un code est utilisé à plusieurs niveaux, on prend le plus haut, donc selon moi, le mari est bien chm, selon mhr est le Eastern Mari. De même que le français est fr et pas fra. Entre fr, frm, et fro, il y a parfois un doute mais il est souvent léger (et se résume souvent à « fro seul ou bien fro et frm ? »).
Jusqu’à preuve du contraire, le poitevin ou le berrichon ne sont pas des langues à part entière donc pas de code (ou fr par approximation grossière). Le klingon est une langue construite qui ne pose pas de problème, son code est tlh. En fait, il n’y a qu’une petite vingtaine de projet donc le code ne respecte pas l’ISO (als, bh, ksh, ms, no, simple, sq, tokipona, et les codes composés qui pourraient bientôt disparaitre comme be-x-old, zh-classical, zh-min-nan, etc.). Donc la mention à la fondation est au pire inutile mais en tout cas pas gênante.
Le problème de l’écriture est complètement indépendant de la langue. Qu’il soit écrit en latin ou en arabe, l’azéri sera toujours codé az (il n’y a d’ailleurs qu’une seule wikipédia), par contre ISO 15924 s’occupe des écritures, si on veut faire le distinguo, on pourra dire az-Latn ou az-Arab. En chinois, on utilisera par exemple zh-Hani, zh-Hans, ou zh-Hant.
Se tenir à une seule des six parties de la norme ISO 639 serait dommage et dommageable (quel partie ? alpha 2 : on se limiterait drastiquement : 676 langues ! alpha 3 : ce serait mieux mais ce ne serait pas encore parfait comme tu le démontres toi-même).
ISO 639 est en évolution (639-4 à 639-6 sont en cours de finalisation) et je pense que l’essentiel est de faire au mieux avec ce que l’on peut et de de suivre les évolutions de l’ISO.
De toute façon, la règle a été acceptée, autant faire avec maintenant (ou alors on remodifie la règle). Hors le gaulois pose problème, au minimum, il faudra renommer le code mais peut-être le gaulois n’est pas acceptable en lui-même. Cdlt, VIGNERON * discut.5 octobre 2009 à 09:30 (UTC)
Tu as mis exactement le doigt sur ce que je voulais dire : 1°) Quand un code est utilisé à plusieurs niveaux, on prend le plus haut ; 2°) Donc la mention à la fondation est au pire inutile mais en tout cas pas gênante ; 3°) je pense que l’essentiel est de faire au mieux avec ce que l’on peut et de de suivre les évolutions de l’ISO ; 4°) mais peut-être le gaulois n’est pas acceptable en lui-même. C'est très noble de vouloir fixer des règles, mais tu as dans ce seul texte abordé quatre points "sujets à interprétation". Personnellement, je suis POUR conserver le gaulois. C'est une langue morte et peu connue, mais une langue tout de même. Chrisaix5 octobre 2009 à 09:55 (UTC)
Pour le point 1, ce n’est pas sujet à interprétation, mais une règle défini dans le norme ISO 639 (quoique, à vérifier, je n’ai pas le texte sur moi ). 2. simple point de vue et constatation objective de ma part. 3. idem mais moins objectif effectivement. 4. le peut-être est justement là pour l’interprétation et c’est même le but initial de cette discussion. Je ne suis pas pour supprimer le gaulois, mais je voudrais des sources, des références. C'est très noble de dire « C'est une langue morte et peu connue, mais une langue tout de même. » mais encore faut-il que ce soit vrai. Les attestations soit presque inexistantes et pour le moment, il me semble que seul quelques universitaires français (Pierre-Yves Lambert, Xavier Delamarre, et Jean-Paul Savignac) dans leurs coins ont rassemblés des données (et encore très parcellaires). C’est très peu et je me demande si cela n’est pas trop peu. Mais n’étant pas spécialiste, je peu me tromper et je suis au contraire preneur de toute les sources existantes. Cdlt, VIGNERON * discut.5 octobre 2009 à 10:52 (UTC)
C’est effectivement un bon début (je vais pouvoir importer les deux derniers livres sur la Wikisource, pendant la pagination j’en profiterais pour améliorer le wiktionnaire). Devant l’absence de spécialistes, on va rester sur gaul (on pourra toujours passer -ou pas- à xtg -ou à un autre code- plus tard), ces livres me semblent suffisant pour attester la langue. Cdlt, VIGNERON * discut.6 octobre 2009 à 16:21 (UTC)
Je ne peux pas parler à la place des autres administrateurs, mais quand on met {{supp}} sur la page je préfère que vous ne blanchissiez pas le contenu, pour voir ce qu'on va supprimer ! Souvent je dois regarder l'historique de l'article pour voir si l'article est vraiment inutile. Pour humanus par exemple, sa définion était plus ou moins correcte, alors je l'ai simplement wikifié. Mglovesfun (disc.) 3 octobre 2009 à 21:37 (UTC)
Idéalement, il faudrait toujours regarder l'historique des articles qu'on supprime. Car il peut s'agir d'un article correct vandalisé, marqué ensuite avec {{supp}}. Je me souviens avoir restauré un article supprimé de cette façon. Stephane8888Discuter4 octobre 2009 à 16:32 (UTC)
Volunteers Still Needed
Please forgive the posting in English. Would someone please translate?
Hi all, Although we will soon remove the centralnotice that is up, the
Wikimedia Strategic Planning project is still looking for volunteers
to serve as
subject area advisors or to sit on task
forces that will
study particular topics and make recommend short- and long-term
strategies for the Wikimedia projects and Foundation, and the wiki movement.
The Wikimedia Strategic Planning project is a year-long collaborative process
being hosted at http://strategy.wikimedia.org. Your input is welcome there, and
will drive the process. When the task forces begin to meet, they will
do their work transparently and on that wiki, and anyone may join
fully in their work. We hope to
include as many community members as possible in the process.
Any questions can be addressed to me either on
on the strategy wiki or by email to philippe
at wikimedia.org.
Veuillez pardonner ce message en anglais. Quelqu'un voudrait-il bien traduire ?
Bonjour à tous,
Bien que nous allons bientôt retirer l'annonce, le projet de plan stratégique de Wikimedia recherche encore des volontaires pour pour devenir conseiller ou pour devenir membre d'un des groupes de travail qui étudieront des sujets particulier et feront des recommandations de stratégie à court ou long terme pour les projets de Wikimedia et la Fondation, ainsi que pour le mouvement wiki.
Pour demander à faire parti d'un groupe de travail ou pour devenir conseiller dans une zone spécifique, rendez-vous sur le site http://volunteer.wikimedia.org.
Le projet de plan stratégique de Wikimedia est un long processus collaboratif hébergé par http://strategy.wikimedia.org. Vos commentaires sont les bienvenus là-bas, et feront avancer le processus. Quand les groupes de travail commenceront à se rencontrer, il travailleront de manière transparente sur ce wiki, et quiconque pourra pleinement participer à leur travaux. Nous espérons inclure le plus de membre de la communauté possible au processus.
Toutes les questions peuvent m'être adressée sur le wiki stratégique ou par couriel à philippe at wikimedia.org.
Je propose de modifier l'explication de l'introduction des critères d'inclusion, pour la rendre beaucoup plus claire. Mon idée n'est pas de proposer des changements de fond, mais seulement de rendre notre objectif beaucoup plus facile à comprendre, en utilisant la notion de "composant" (ou de "constituant", ou de "brique") du langage comme notion unificatrice. Par exemple, pour expliciter ce que je veux dire :
Le Wiktionnaire décrit tous les mots et, plus généralement, tous les "constituants" de la langue qui servent quand on s'exprime dans une langue ou qu'on écrit un texte dans la langue. Ces constituants sont à plusieurs niveaux :
niveau 1 : signes qui servent à constituer les caractères (quand c'est à la fois possible techniquement et utile d'un point de vue linguistique), par exemple les accents, les cédilles...
niveau 2 : caractères (lettres, idéogrammes, signes de ponctuation, etc.)
niveau 3 : groupes de caractères servant de bases pour la constitution des mots, à traiter selon la tradition propre à chaque langue (par exemple, en français, seuls les préfixes et suffixes sont traités dans les dictionnaires).
niveau 5 : mots au sens linguistique du terme, c'est-à-dire y compris les locutions figées qui sont des composants de la langue : par exemple pomme de terre, hôtel de ville, New York sont des mots au sens linguistique, mais le pull-over rouge, Hôtel Beau-Rivage ou Winston Churchill ne sont normalement pas considérés comme des mots.
niveau 6 : phrases toutes faites et proverbes, quand ce sont vraiment des constituants de la langue, utilisés au même titre que les autres. Cela ne comprend pas certaines phrases, même célèbres, qu'on ne peut pas considérer comme des constituants de la langue, par exemple les slogans et les devises : leur intérêt est purement encyclopédique, pas du tout linguistique (mais on peut faire des exceptions si leur usage international rend leur présence ici réellement utile aux traducteurs).
C'est seulement le principe général, il faut conserver les explications plus détaillées. Qu'est-ce que vous en pensez ? Est-ce que ça ne rend pas les choses plus claires ? En tout cas, ça m'a permis personnellement de voir les choses nettement plus clairement. Lmaltier4 octobre 2009 à 08:03 (UTC)
Le niveau 1 (les signes diacritiques, tu comptes les panses aussi ?) et le niveau 2 me semble très proches, ils pourraient peut-être être fusionnés, non ? Sinon, cela clarifie pas mal la structure, merci beaucoup.
Vous le savez déjà mais je ne suis pas trop d’accord sur les exclusions (aux niveaux 5 et 6) de mots comme « Winston Churchill » (alors que l’on a Homère ou Molière) ou des « phrases » hyper-célèbre (Hôtel Beau-Rivage ou hôtel des voyageurs etc. me semble presque aussi acceptable que par exemple café du commerce, arabe du coin). Ceci dit, cela n’a aucun rapport direct avec ton propos (j’avais juste envie de râler un peu, désolé).
PS : merci d’utiliser une vrai ponctuation (« » et pas " !). Sur un dictionnaire, ça fait un peu négligé. De mon côté, je vais essayer de soigner mon orthographe Cdlt, VIGNERON * discut.4 octobre 2009 à 11:51 (UTC)
Pour les guillemets : c'est juste une page de discussion... Pour Winston Churchill ou les devises, c'est une question de logique, un dictionnaire de langue ne peut rien dire d'intéressant dessus (parce que ce ne sont que des réunions de mots), une encyclopédie, si. Je mets en petit parce que ce que je dis là n'est effectivement pas en rapport avec ma proposition. Lmaltier4 octobre 2009 à 15:04 (UTC)
Pour les diacritiques, j'ai rajouté ce niveau au dernier moment, mais peu importe, on peut le supprimer, c'est juste un détail. Lmaltier4 octobre 2009 à 15:06 (UTC)
Il y a (en gros) 200 diacritiques, alors qu’il y a des centaines de milliers de caractères (rien qu’avec les chinois, ça fait quelque chose comme plus de 100 000 en comptant les variantes). Donc soit on mets les deux ensembles, et les diacritiques sont « noyés » dans la masse (mais il seront à part avec des catégories, actuellement ^ est dans symboles, c’est un peu léger comme catégorisation), soit on fait un niveau à part mais il sera très déséquilibré par rapport aux autres (ce qui n’est pas forcément gênant). Cdlt, VIGNERON * discut.4 octobre 2009 à 16:27 (UTC)
Je ne propose pas du tout de graver ces niveaux dans le marbre, ni qu'ils aient une quelconque conséquence sur le contenu du Wiktionnaire tel qu'il est actuellement, c'est juste une présentation de ce qui est un composant de la langue, aux différents niveaux hiérarchiques envisageables : des lettres servent à former des mots ou des préfixes, qui servent à former des mots... etc. Lmaltier4 octobre 2009 à 16:44 (UTC)
J’aime bien, mais je mettrais bien des illustrations pour rendre ça encore plus clair, mettre en valeur… Par contre, un jamo coréen (ah, mince, pas sur WT… Bon, fr:jamo), c’est un caractère ou un diacritique ? Pour moi, clairement un caractère, mais pour unicode, c’est juste un constituant de caractère . --Eiku (d)
Les jamos ne sont pas des signes diacritiques (contrairement à ゜ ou ゛ en japonais par exemple, et encore) par contre, ils servent à constituer les caractères (donc niveau 1 ou 2 ?). Unicode indique que ce sont des « hangûl tch'ôsong/djôngson » ou des « lettres hangûl » (cf. le terme est pas idéal, il vaut mieux directement utiliser jamo mais l’approximation ne me semble pas si mauvaise). Ceci dit, la distinction est pas toujours aisée (ッ/っ, niveau 1 ou 2 ?
Entièrement d’accord : ce sont bien des caractères et même des lettres (dans la logique du système et par définition, et même pas approximativement), mais comme Unicode fonctionne d’une manière différente (j’irai jusqu’à dire imparfaite, même si mille fois mieux que ce qu’il y avait avant), mieux vaudrait fusionner 1 et 2. --Eiku (d) 4 octobre 2009 à 17:40 (UTC)
C'est super génial ! LMaltier vient de réinventer ce qui est appris à l'école primaire entre le CP et le CE2 depuis plus de cent ans : lettres → syllabes → mots (→ locutions) (+ ponctuation) → phrases, avec mot = préfixe + radical + suffixe. Et en plus, ça marche pour n'importe quelle langue (même le coréen, le japonais ou le chinois) ! Le tout limité par un Unicode en pleine évolution. Quand vous aurez fini de faire joujou, on pourra peut-être aborder avec sérieux les problèmes de fond du Wiktionnaire ? Chrisaix4 octobre 2009 à 22:50 (UTC)
La pratique montre que ce n'est pas évident pour tout le monde qu'on peut accepter des pages comme zist, adonner, ou certaines locutions figées. Si on y pense en tant que briques de la langue, et si on dit que toutes ces briques de la langue sont acceptées, ça serait sans doute beaucoup plus évident pour tout le monde. Lmaltier5 octobre 2009 à 05:38 (UTC)
Si ce genre d'intervention pouvait régler la crise actuelle, je dirais bravo sans hésiter. Mais s'il faut revenir à des bases aussi primaires pour redéfinir une direction, c'est que la crise qui attaque aujourd'hui la communauté du wiktionnaire est beaucoup plus grave que je ne l'imaginais. Mais cela a néanmoins une conséquence très positive, c'est que ton idée (tout à fait juste et correcte, rien à redire) montre bien à quel point il est indispensable aujourd'hui de revenir à des bases saines et solides, bases qui ont souvent échappé à tout le monde depuis longtemps... Chrisaix5 octobre 2009 à 11:35 (UTC)
Si malaise il y a c'est car le Wiktionnaire est déroutant pour le lecteur : Le Wiktionnaire n'est pas normatif, pas terminé, parfois vandalisé. Il décrit les patois, les jargons, le langage des jeunes et celui des trépassés, en apportant souvent davantage d'information que vient en chercher le lecteur. Si ces bases saines et solides que proposent Lmaltier permettent de dissiper ce possible malaise : Tant mieux. Stephane8888Discuter5 octobre 2009 à 20:19 (UTC)
Je ne pense pas du tout qu'il y ait un malaise chez les lecteurs, au contraire (même si certains ne voudraient voir qu'une courte définition, parce que c'est ça qu'ils recherchent, et même si certains sont surpris qu'on ait plus de mots que le dictionnaire qu'ils possèdent). Le plus déroutant pour un lecteur qui vient pour la première fois, de très loin, c'est qu'on traite toutes les langues. Ce que je propose ne vise pas les lecteurs, mais vise à rendre les choses plus faciles à comprendre pour les contributeurs. Lmaltier5 octobre 2009 à 20:26 (UTC)
Cela fait la deuxième fois que tu parles de malaise des lecteurs. Ce n'est pas du tout de ça que je veux parler, mais d'une absence totale de cohésion entre contributeurs et concernant les règles à respecter sur les articles. Oh ! il y a des grandes pages avec beaucoup de grandes et belles phrases (ici, c'est tous les mots de toutes les langues) bien théoriques. Mais quand on regarde les articles au hasard, aucune homogénéité. Quand on regarde la Wikidémie, il y a sans cesse des disputes. Ce passage est logique et normal, mais tant qu'on refusera de le regarder en face, il y aura problème sur problème (près de 3 nouvelles sections par jour en septembre dont pratiquement aucune ne s'est terminée, c'est un signe). La section en cours ici en est une preuve flagrante : devoir revenir à des bases plus que primaires est vraiment un symptôme très grave quand on pense au nombre de problèmes de fond qui sont à régler maintenant que c'est fini pour le TLFi ou le Littré. Chrisaix5 octobre 2009 à 20:40 (UTC)
Si je parle d'un éventuel malaise chez les lecteurs, c'est qu'il peut exister : il n'y a qu'à relire les discussions sur bravitude ou dégingandé pour constater qu'il y a malentendu. Qu'il y a parfois, sur certains articles, un décalage entre ce que les gens attendent de nous et ce qu'on propose. Mais attention : Notre démarche est la bonne, c'est à ces lecteurs de comprendre que le Wiktionnaire est différent (et à nous de les y aider...). Si Chrisaix parle de certains articles qui sont la honte du Wiktionnaire, c'est qu'il se préoccupe de leur impact sur le lecteur. Qu'à travers ces articles il est soucieux de l'image qu'on donne du Wiktionnaire, de la déception, de la perte d'illusion que peuvent provoquer ces articles chez le lecteur. D'où l'intérêt de cette analyse de Lmaltier qui clarifie et rend moins théoriques nos principes fondamentaux. De telles clarifications aident les nouveaux contributeurs à s'accorder avec la communauté, à vaincre d'éventuelles réticences. Stephane8888Discuter6 octobre 2009 à 21:18 (UTC)
Ce que tu dis à mon sujet est exact. Je suis incapable de créer un article sans me poser en premier la question de "comment il sera lu par quelqu’un qui débarque ?". C'est peut-être par déformation professionnelle, mais c'est comme ça. Pour moi, voir un article qui n'explique rien ou qui ne fait que renvoyer à un autre article, c'est comme une tromperie, un mensonge. Pour moi, chaque article doit être complet en lui-même, sinon, on reproduit un des grands problèmes des dictionnaires, où tu dois parfois faire trois ou quatre articles avant de comprendre (et encore, quand tu y arrives) le mot que tu avais au départ. Je ne parle pas évidemment des mots dans des langues étrangères, mais uniquement des mots en français, bien que je m'efforce aussi de faire des articles étrangers complets, ce qu'on m'a parfois reproché (→ voir kommen et dog !!!). Je reconnais que, lorsque je vois "reprinciser = princiser à nouveau", alors que ce deuxième verbe ne doit sûrement même pas être connu d'un millième de la population, ça me met en colère, parce que je me dis que celui qui a fait l'article n'a pas une seule seconde réfléchi à celui qui pourrait le lire. Quand je vois ça, j'ai vraiment l'impression qu'on se fout de la gueule du lecteur. C'est sûr, recopier une définition dans un dictionnaire, c'est très facile. En créer une, créer des exemples qui permettent de vraiment comprendre un mot, ça, c'est une autre histoire. Ça demande d'autres qualités. Chrisaix7 octobre 2009 à 12:52 (UTC)
Créer des articles uniquement pour leurs traductions
Suite au débat sur être assis, on parle de s'il faut créer des pages uniquement pour leurs traductions. C'est vrai que les langues germaniques ont tendance à utiliser un seul mot où en français on en utilise deux ou trois. Évidemment je suis contre la création de ce genre d'article. Déjà on s'est accordé d'utiliser le modèle {{-trad-}} pour les mots étrangers difficiles à exprimer en français. Je vois un conflit. Soit on utilise trad, soit on crée des articles qui ne sont pas des locutions figées, juste pour ajouter les traductions. Mglovesfun (disc.) 5 octobre 2009 à 07:44 (UTC)
Pour moi il est hors de question de créer des articles pour des locutions traduites. Il est plus pertinent de développer la section Traductions que de créer des articles pour des locutions qui n'en sont pas. Par exemple, dans le cas de être assis, il suffirait d'avoir des choses du genre (dans assis) :
J'ai fait ça à la va-vite, mais j'imagine qu'on peut améliorer les traductions et sortir du « 1 traduction = 1 ligne » qu'on a généralement, en développant un peu plus, ce qui permettrait d'éviter d'avoir à créer des pages inutiles comme être assis. — Dakdada(discuter)5 octobre 2009 à 09:44 (UTC)
Étant donné l'importance des verbes de mouvements dans de nombreuses langues, je pense qu'il faut leur accorder une place particulière. Sinon, ce n'est pas la peine de se dire "dictionnaire multilingue". C'est comme si on refusait de prendre en compte la différence "perfectif / imperfectif" parce qu'elle n'existe pas dans nos langues proches (français, espagnol, anglais, portugais, italien...). Par ailleurs, je te rappelle que le verbe asseoir est un verbe qui se construit avec l'auxiliaire avoir (j’ai assis), que s'asseoir est un verbe pronominal, et donc que être assis est un troisième verbe à part entière qui n'est ni un passif, ni l'emploi d'un simple adjectif avec le verbe être. Il en est de même pour être debout, être couché ou être accroché. Encore une fois, le fait de vouloir construire un dictionnaire multilingue en ne se référant qu'au français mène obligatoirement à des problèmes dès qu'on rencontre des règles très importantes dans d'autres langues qui n'ont aucune existence en français. Ce n'est pas la première fois, et il y en aura encore... Chrisaix5 octobre 2009 à 10:06 (UTC)
Euh, depuis quand l’anglais n’est plus une langue germanique ? Enfin, pour le problème actuel, je n’ai qu’un très très légère préférence pour la non-inclusion, mais très franchement, avoir être assis et être debout n’est pas une menace sérieuse pour le Wiktionnaire. Moins sérieuse que les disputes. Enfin, pour le moment, ce n’est pas encore une dispute mais j’anticipe. --Eiku (d) 5 octobre 2009 à 10:15 (UTC)
C'est vrai que l'anglais est aussi une langue germanique, désolé. Je trouve quand même que ces couples de verbes allemands setzen / sitzen, stehen / stellen, legen / liegen, hangen / hängen qu'on retrouve aussi en russe (et d'autres langues) doivent trouver leur place ici en tant que particularités de ces langues. Qu'il y ait une dispute pour ça me semble absurde, mais c'est malheureusement la réalité du moment. Si ça doit s'envenimer, je laisserai tomber cette idée, en attendant que la conscience fasse son travail. Regarde : j'avais proposé de catégoriser les étymologies il y a trois ans (au début, Catégories de base). Personne n'a écouté. Aujourd'hui, c'est devenu réalité. Il suffit d'être patient ! Chrisaix5 octobre 2009 à 10:38 (UTC)
Eh oh, je ne cherche pas la dispute, alors merci d'éviter de dériver. Argumente : pourquoi vouloir refléter en français des concepts qui n'en font pas partie ? On peut aussi utiliser « seoir », ou « siéger », tant qu'à faire : ce ne sera jamais qu'une traduction. Nul dictionnaire multilingue ne fait d'articles pour ça, et nous n'avons pas de raison d'en faire non plus. Je le répète : tout cela est du domaine de la traduction, et celle-ci doit être détaillée dans chaque article en langue étrangère, pas dans un pseudo-article en français. — Dakdada(discuter)5 octobre 2009 à 11:56 (UTC)
Je sais très bien que tu ne cherches pas la dispute, je ne faisais que répondre à Eiku. En réfléchissant un peu sur ces verbes, je me rends compte qu'on fait aussi la différence en français. Cette notion de "avec mouvement" ou "sans mouvement" est aussi présente dans notre langue, mais pas de façon aussi marquée qu'en allemand ou en russe. Je comparerais ça aux déclinaisons des pronoms personnels dont plus personne n'a conscience aujourd'hui. Il n'existe pas beaucoup de couples de verbes comme ceux que j'ai cités, mais plus je regarde le verbe être assis, plus je trouve qu'à lui seul, il exprime un concept unique. Même seoir ou siéger n'ont pas exactement le même sens (bien qu'ils puissent, en allemand, se traduire tous les deux parfois par sitzen). De même que être debout est une locution verbale figée qui fait le pendant à se lever, être couché est le pendant de se coucher, et être accroché est le pendant de accrocher. Tu remarqueras que ces couples ont tous la même construction (se ...er / être + participe passé) et qu'ils se conjuguent tous avec l'auxiliaire avoir au départ. Il n'y a que "être debout" et "être levé" qui n'ont pas le même sens, le premier indiquant un état, le deuxième la fin d'une action, ce qui explique que le deuxième n'ait pas été gardé en français comme "verbe sans mouvement". J'ai beau chercher d'autres verbes se présentant de la même manière en français, je n'en trouve pas. Or, ce sont ceux qui possèdent justement une traduction dans beaucoup de langues. Je suis donc obligé de te contredire : ce concept existe bel et bien en français aussi, et il semble n'y avoir que ces quatre verbes-là. Chrisaix5 octobre 2009 à 12:55 (UTC)
C'est "меня зовут" (je m'appelle), du verbe звать (appeler), il s'agit d'une forme impersonnelle qui n'a aucune raison d'avoir un article. Rentrer зовут suffira. Le sujet ici concerne quatre verbes très particuliers qui possèdent deux formes : verbes de position et verbes de mouvement. Chrisaix5 octobre 2009 à 21:09 (UTC)
(corrigez-moi si je dis une ânerie) Peut-on dire que couché est le participe du verbe pronominal se coucher ? Et qu'il est aussi le participe du verbe coucher ? Car si oui : 2 verbes différents, donc 2 sections {{-flex-verb-}} dans l'article couché et donc 2 sections Traductions : legen et liegen, etc. Stephane8888Discuter5 octobre 2009 à 22:29 (UTC)
Ce n'est pas du tout une ânerie, au contraire. Mais je dirais plutôt que couché est le participe passé du verbe coucher — et de se coucher par voie de conséquence, mais sans que ça mérite une section à part. Quant à legen ou liegen, ça n'a jamais voulu dire couché (legen = se coucher / liegen = être couché). À la rigueur leurs participes passés (gelegt et gelegen), et encore... Pour traduire l’adjectif couché, on dit plutôt liegend. Ces deux verbes ne pourraient en aucun cas se trouver dans cet article.
Grâce à Stéphane, j'ai découvert un autre verbe : situer. Il existe le verbe simple, qui se conjugue avec le verbe avoir, se situer et "être situé" (qui n'est pas un passif et qui a un peu le même sens que "se situer"). Pourtant, ce verbe ne rentre pas du tout dans le cas des quatre verbes en question. La raison est très simple : il n'y a aucune opposition entre "se situer" et "être situé", à l'inverse des autres. Je souhaiterais en conclusion créer ces trois verbes (puisque être debout existe déjà) et qu'ils ne soient pas supprimés. Chrisaix5 octobre 2009 à 22:59 (UTC)
Eh oh, pourquoi pas un ultimatum tant que tu y es ? Tu crois que je vais supprimer tes articles parce que je suis pas d'accord avec toi ? Tu me prends pour qui ? D'abord.
Sérieusement, le Wiktionnaire est à destination d'abord de lecteurs humains, et pas de traducteurs automatiques. Dans le cadre de ce dernier, c'est logique de créer des équivalents de partout. Mais ça, c'est Omegawiki qui s'en charge ça.
On ne va pas créer tous les syntagmes possibles juste parce qu'ils correspondent à des mots étrangers n'ayant pas d'équivalent en français.
Maintenant si on parle de être couché, etc. c'est un peu la même chose. Ce qu'il faut retenir c'est que couché peut s'utiliser avec un verbe d'état (être, paraitre, sembler), ou bien tout seul. C'est le cas de plein de mots : être fort, être rouge, être d'accord (on peut trouver des verbes qui leur correspondent d'ailleurs : forcir/se fortifier, rougir, s'accorder/s'entendre, etc.). Tout ça pour dire qu'en français, on n'a pas besoin d'avoir un article pour chaque forme être + truc, et je ne pense pas que le fait d'avoir des traductions dans d'autres langues suffise à justifier la création de ces articles. — Dakdada(discuter)6 octobre 2009 à 08:57 (UTC)
Du calme ! Ne deviens pas agressif ! Lorsque je parlais de supprimer, c'est à Mglovesfun que je m'adressais parce qu'il a "la gâchette facile", pas à toi. Je sais très bien que tu ne le ferais pas. Pour répondre à tes arguments, il ne s'agit pas de créer tous les syntagmes possibles, mais uniquement certains présentant des particularités importantes dans d'autres langues. La locution "sembler couché" (je ne vois pas trop ce que ça pourrait vouloir dire, mais ce n'est pas grave) n'est rien de plus que "sembler" + "couché". Pour "être couché", non, c'est vraiment une expression à part qui est le contraire de "se coucher". Les autres expressions que tu as données (être rouge, être fort) ne sont rien de plus qu'un assemblage de mots n'ayant pas plus de sens que les mots séparés. Par contre, être d'accord existe déjà, parce que c'est une expression figée. Je le répète, ces verbes-là sont au nombre de quatre, c'est tout, il n'y en a pas d'autres. Cela ne concerne que trois articles : être assis, être couché et être accroché, je ne pense pas que ça vaille le coup de s'enfoncer dans des argumentations sans fin pour ça. Si tu regardes les expressions commençant par "être", il y en a environ 150 qui sont créées, dont être coincé, être culotté, être debout, être dedans, être d'accord, être fait, être fini, être messé, être mindé, être noir, être sûr, être vert... Ce ne sont pas trois expressions de plus qui vont changer grand-chose, surtout qu'elles me semblent quand même importantes au niveau linguistique. Chrisaix6 octobre 2009 à 09:53 (UTC)
Moi c'est justement le « certains présentant des particularités importantes dans d'autres langues » qui m'embête. Si c'est dans d'autres langues qu'il y a des particularités, alors c'est dans les articles de ces autres langues qu'il faut les décrire. — Dakdada(discuter)6 octobre 2009 à 10:10 (UTC)
Ce que tu dis fonctionne dans le sens "langue étrangère" → français, mais pas dans l'autre sens. D'où l'intérêt d'élargir les critères d'acceptation des articles aux particularités que l'on trouve parfois dans d'autres langues que le français. C'est seulement une question d'ouverture. Cela va peut-être te choquer que je dise ça, mais je ressens ce rejet pour ces verbes comme une forme de xénophobie. Chrisaix6 octobre 2009 à 22:17 (UTC)
Dans le sens où certains syntagmes présents dans des langues étrangères ne correspondent pas en français à des locutions figées. Seulement les syntagmes en question sont suffisamment importants dans ces langues-là pour se permettre de déroger à la règle et pour accepter de créer en français des articles qui, sans traduction, n'auraient jamais eu leur place ici. Accepter ces articles en français, c'est offrir aux lecteurs la possibilité de faire l'équivalence complète langue étrangère ⇔ français. Regarde le nombre de locutions avec les verbes avoir, prendre, faire... On a besoin de créer ces locutions en français car, souvent, elles sont faites de plusieurs mots en français et d'un seul dans une autre langue (avoir faim, avoir soif...). Pour "être assis", c'est pareil. Si on a sitzen, il faut avoir aussi être assis. Chrisaix7 octobre 2009 à 09:54 (UTC)
Ok, c'est bien là que je ne suis pas d'accord (on avance). Si le terme n'est pas figé en français (bref, si ça ne correspond à rien de particulier), il n'y a pas de raison de créer un article en français, et vice versa. Exemple :
Admettons qu'en français, on a oisillon, mais il n'y a pas d'équivalent en anglais ; par contre cela se traduit par little bird. Dans ce cas, on notera dans la section traductions de oisillon : littlebird.
Maintenant, disons qu'on a un mot anglais qui n'a pas d'équivalent particulier en français, mettons lie. Cela se traduit par êtrecouché en français, alors il suffit de mettre ça sur la ligne de définition (avec d'autres formulations, ça peut aider pour les traductions).
Si on peut faire ça dans les deux sens, pourquoi créer un article sur une forme qui n'a rien de particulier du point de vue du français ? Si tu peux me convaincre que êtrecouché est plus que être + couché en français, alors d'accord, mais sinon non. — Dakdada(discuter)7 octobre 2009 à 10:16 (UTC)
C'est justement ce que je disais. En français, "être couché" n'est rien de plus que "être" + "couché" (encore que...). Mais dans d'autres langues, ce n'est pas du tout le cas. Dans le cas de oisillon, tu renvoies un nom sur un autre nom. Le fait qu'il n'existe pas en anglais n'est pas un problème. De la même façon, si tu renvoies un nom français sur un autre nom dans une langue étrangère, ça ne gêne pas. Mais si tu renvoies lie ou liegen à couché, tu renvoies un verbe à un adjectif, ce qui est illogique. Dans ton raisonnement, tu insistes sur le fait que "être assis" ou "être couché" n'a rien de spécial en français. Je suis d'accord avec toi, c'est vrai. Mon argument à moi, c'est de dire que, puisqu'ils correspondent à des verbes uniques dans d'autres langues (pas qu'une seule), je pense qu'on devrait leur accorder la place d'article. Ainsi, tu ferais une équivalence verbe ↔ verbe d'une langue à l'autre. Si on ne suit que ton raisonnement, cette création ne sert à rien parce que "être couché" n'est pas une locution particulière en français. Si on suit le mien, cette création est nécessaire, parce que ça permettrait de faire le lien de lie ou liegen vers un verbe qui aurait exactement le même sens. On fait quoi ? Chrisaix7 octobre 2009 à 12:42 (UTC)
Fusionner : qui a besoin de la traduction d'un terme sans pouvoir la trouver dans le wiktionary de la langue de celui-ci ? JackPotte5 octobre 2009 à 21:15 (UTC)
Pardon ? Il n'est pas proposé de supprimer les sections Traductions (et non, on ne peut pas toujours trouver l'information ailleurs).
Pour ce qui est de la catégorie, je ne pense pas qu'elle serve vraiment, de toutes façons... Quelqu'un ici s'en est-il déjà servi ? Lmaltier5 octobre 2009 à 21:23 (UTC)
Suite au débat sur comment allez-vous, je propose de créer un guide de conversation qui ressemblerait à ça. Les locutions ne figurent pas dans la catégorie:français (ou <langue>) parce que ce ne sont pas des « mots » ni des « expressions ». Autre possibilités, créer des redirections vers des annexes, ou tout enregistrer comme locution-phrase comme on le fait maintenant. Hmm Mglovesfun (disc.) 7 octobre 2009 à 01:09 (UTC)
Je pense que cette proposition ne concerne que les phrases du genre comment allez-vous, qui sont vraiment des locutions figées (sinon, on ne ressentirait pas le besoin de les inclure). Ce sont donc ce qu'on appelle actuellement locutions-phrases, effectivement. Je suis favorable à cette inclusion. Mais les guides de conversation en livres comportent souvent aussi des phrases du genre Pouvez-vous m'indiquer la direction de l'île de la Cité ? ou Je voudrais réserver une chambre pour deux personnes avec vue sur la mer. Ce genre de phrases peut bien sûr être utile mais, si on veut les inclure, je pense que ce ne peut être que dans une annexe "Guide de conversation", pas en tant que pages séparées. Cela paraît évident, mais je préfère l'expliciter. Lmaltier7 octobre 2009 à 05:36 (UTC)
Mettre ça dans une annexe c'est encore débuter la rédaction d'une oeuvre annexe (comme on a le dico des rimes et le thesaurus) L'idée d'une catégorisation séparée et très bonne pour ce genre de locution-phrase. Stephane8888Discuter7 octobre 2009 à 08:32 (UTC)
Comme je disais, un guide de conversation minimal peut aller (via les catégories ou indépendamment, mais un guide de conversation élaboré est du ressort de Wikibooks. Je rejoins donc Stephane8888. --Eiku (d) 7 octobre 2009 à 11:25 (UTC)
Je ne suis pas contre l'idée de nous lancer dans la rédaction de plusieurs guides de conversation de type "Annexe:" car c'est parfois présent dans des dictionnaires classiques. Un tel guide peut être utile aux lecteurs. En attendant on pourrait y déplacer certaines phrases rejetées lors de leur passage dans "Pages à supprimer". On pourrait aussi faire figurer dans les portails de langue la catégorie "Locutions phrases". Il ne s'agira pas vraiment d'un guide de conversation, donc mieux vaut ne pas changer l'intitulé de la catégorie. Wikibooks est aussi une bonne idée. Stephane8888Discuter7 octobre 2009 à 13:17 (UTC)
Je m'explique à nouveau (peut-être mieux) : il est à mon avis hors de question de créer des pages du genre Je voudrais réserver une chambre pour deux personnes avec vue sur la mer.. Le seul choix pour ce genre de phrase est donc de ne pas les inclure du tout, ou d'avoir une annexe Guide de conversation. Par contre, des phrases comme comment allez-vous peuvent tout à fait se justifier en tant que pages normales, parce qu'on peut vraiment dire que ce sont des locutions figées. Je le redis, parce que je ne suis pas sûr de comprendre auquel des deux cas Stephane8888 et Eiku font allusion. Lmaltier7 octobre 2009 à 16:12 (UTC)
Je suis d'accord avec les 2 cas : Si la phrase ne mérite pas un article elle peut seulement prétendre alimenter une Annexe:Guide de conversation. Si l'article de cette phrase est acceptée, c'est qu'il s'agit d'une locution-phrase figée. Stephane8888Discuter7 octobre 2009 à 22:00 (UTC)
Salut, je me dis qu'entre familier et informel il y a trop peu de différence. {{inf}} est beaucoup moins utilisé, donc catégoriser dans la ] me semble une bonne option. Je le fais, sauf si personne n'est d'accord avec moi. Mglovesfun (disc.) 7 octobre 2009 à 12:05 (UTC)
Ce modèle est surtout utilisé pour l'indonésien. J'ignore si en indonésien il y a une nuance. Il est probable que tu aies raison, mais peut être en discuter avec Serpicozaure. Attention il y a un noinclude de trop. Stephane8888Discuter7 octobre 2009 à 13:31 (UTC)
À mon avis ce n'est pas la même chose. En français on n'a que du familier, mais dans d'autres langues il y a, il me semble, une distinction forte entre langue formelle et informelle pour laquelle le terme familier n'est pas adapté. À vérifier pour ces langues (le japonais n'a-t-il pas aussi cette notion ?). — Dakdada(discuter)7 octobre 2009 à 13:36 (UTC)
Effectivement je ne dis pas qu'il y a aucune différence. Simplement pour moi, que 95% des mots dans la catégorie <langue> familier pourrait figurer dans une catégorie <langue> informel. C'est un peu comme français de Belgique / français de Wallonie. Mglovesfun (disc.) 7 octobre 2009 à 23:13 (UTC)
Pour le cas de l’indonesien et AMHA il y a clairement une difference entre informel et familier, donc la fusion des categories est une erreur, exemple coblos et nyoblos qui se retrouvent tous les deux dans la categorie familier, j’ai demande a un contributeur de Wikipedia de bien vouloir donne quelques eclaircissements ici, au minimum laisser les pages comportant {{informel}} sans categorisation mais ne pas faire de fusion ca va tout embrouiller, et pour le japonais et d’autres langues ??? Serpicozaure(discuter)9 octobre 2009 à 03:25 (UTC)
Bonjour tout le monde, rien de tel qu'une illustration concrète. Il existe dans les entreprises une mode, importée des Etats-Unis, de venir habillé casual, c'est-à-dire informel, le vendredi au bureau. Ce n'est pas pour autant qu'on sera familier avec le patron de la boîte... Informel et familier sont donc deux notions distinctes. Sur le plan linguistique, mes quelques connaissances du coréen et du japonais me disent qu'il y a bien une forme formelle et une forme informelle des verbes. Ce n'est pas le cas de l'indonésien, mais en revanche, dans cette langue, les formes verbales familières abondent. C'est donc bien que ces deux notions sont différentes, Humboldt9 octobre 2009 à 13:53 (UTC)
Je rejoins l'avis des autres contributeurs et ne pense pas que ce soit une bonne idée de fusionner ces catégories -- Quentinv57✍9 octobre 2009 à 14:09 (UTC)
Sans élision ni liaison
Maintenant que les modèles d’accord acceptent tous un paramètre préfpron, on pourrait créer un modèle semblable à {{h muet}} et {{h aspiré}} pour signaler l’absence d’élision et de liaison en préfixe de prononciation. Qu’en pensez-vous ? Il ne s’agit plus que de trouver une formule compacte (« sans liaison » ?) et une page cible. Urhixidur7 octobre 2009 à 15:59 (UTC)
En français je pense que tous les verbes commençant par des voyelles font la liaison (ex: Erreur sur la langue !). Pour les conjugaisons étrangères, aurais-tu des exemples d'exceptions à des règles de liaison stp ? JackPotte9 octobre 2009 à 17:40 (UTC)
J'en pense que c'est une bonne idée, car les modèles {{h muet}} et {{h aspiré}} n'ont pas satisfait tous les contributeurs (dont Szyx), et que c'est une information linguistique importante. « sans liaison » me parait clair et concis. Stephane8888Discuter9 octobre 2009 à 20:04 (UTC)
JackPotte, il y a quelque part une discussion à ce sujet où on note, entre autres, la tendance à ne pas faire la liaison dans des locutions du genre machines à laver. Faudrait que je retrouve l’endroit. Urhixidur13 octobre 2009 à 11:25 (UTC)
Salut. CaBot (d · c · b) est en train de remplacer {{fam}} par {{familier}}. fam est un code langue (Fam) en anglais, pour le français ça reste à voir. Voyez Wiktionnaire:BCP 47/language-3-f. Je pense qu'il est très important de créer ces modèles même avant que la langue soit utilisé (→ voir Modèle:moy) sinon quelqu'un qui veut ajouter cette langue ne peut pas, et peut-être que quelqu'un créera une redirection. Un autre qui reste à faire c'est {{mpl}}. Sinon on fait pas mal de progrès. Mglovesfun (disc.) 8 octobre 2009 à 10:18 (UTC)
Il reste {{mpl}} à faire aussi. Le problème, c'est qu'on a tellement l'habitude d'utiliser fam et mpl que il me semble déconseillé de les créer avec les codes ISO 639 tout de suite. Voyez ce que j'ai fait avec {{fam}} pour le moment. Sinon les codes alpha, c'est quoi ? Mglovesfun (disc.) 9 octobre 2009 à 14:56 (UTC)
Selon l’ISO, un code alpha X est un code qui contient X caractères. L’ISO 639-1 utilise des codes alpha 2 (en, fr, de, etc.), les ISO 639-2 et 639-3 utilisent des codes alpha 3 (fro, frm, ang, etc.). L’ISO 15924 utilise des codes alpha 4 (Arab, Latn, etc.). Cdlt, VIGNERON * discut.13 octobre 2009 à 13:30 (UTC)
En passant, il y en a encore d'autres. Il faudrait que je finisse de remettre en forme les pages des codes langues alpha 3 (j'en suis à la lettre l) de Wiktionnaire:BCP 47, qui permet non seulement de voir tous les codes existants déjà normalisés, mais aussi ceux qui ont été employés pour autre chose... L’étape suivante, ce sera incorporer les modifs publiées depuis le 29-07-2009 (date où ces listes ont été importées). Mais les sites d'info de l’ISO 639, et surtout de BCP 47 (le registre IANA où ces modifs sont assez vite importées et toutes datées) ont des listes de mises à jour triées par date, ce qui facilitera ce travail. verdy_p (d) 25 octobre 2009 à 10:25 (UTC)
Structure de la base de données
Bonjour,
J'ai installé le wiktionnaire à la maison avec une vague intention de faire de l'analyse automatique de textes.
Malheureusement, la base de données n'a pas la structure à laquelle je m'attendais.
En particulier, je suis surpris de trouver le contenu de toutes les pages dans une seule table et tout le texte d'une page dans un seul champ.
J'aurais plutôt imaginé le contenu d'une page éclaté dans plusieurs tables, dont la structure suivrait la logique de la langue.
Si j'avais voulu par exemple extraire la liste des verbes transitifs (http://fr.wiktionary.orghttps://dictious.com/fr/Cat%C3%A9gorie:Verbes_transitifs_en_fran%C3%A7ais), une très simple requête aurait suffi. Au lieu de cela je suis obligé de faire du bricolage et je n'ai aucune garantie que le résultat sera cohérent et exhaustif. La recherche du tag transitif me renvoie 341 résultats alors qu'il y en a théoriquement 152.
Je me doute bien qu'il y a d'excellentes raisons qui justifient cette organisation des données (taille de la DB, performances, etc.), mais je suppose également que je ne suis pas le seul a avoir ce genre de besoins, et avant de réinventer l'eau tiède je voudrais savoir si des solutions existent déjà.
Je suis convaincu que beaucoup de projets adjacents, comme par exemple wikitranslate, pourraient s'appuyer sur un wiktionnaire dont les données seraient fortement structurées.
Est-ce que quelqu'un pourrait m'aiguiller sur une piste ?
Merci d'avance !
Bonjour, le Wiktionnaire n'est disponible que sous la forme d'un fichier xml dans lequel les pages sont effectivement représentées par un champ de texte unique, sans plus de structure. Ce fichier brut ne peut être utilisé directement pour des recherches avancées, car il ne contient pas la structure plus précise des articles, qui est faite « à la main ». En d'autres termes, il faut parser les articles et en extraire la structure (sections de langues, étymologies, etc.).
Le problème est que la structure de la base de données de Mediawiki (le logiciel qui gère le projet) n'est pas adapté à celle d'un dictionnaire. La meilleure solution serait d'avoir un parseur qui transforme le dump xml brut en un format plus structuré adapté pour un dictionnaire, qui serait alors plus facilement utilisable.
Autre solution : installer Mediawiki et y importer le dump du Wiktionnaire. Cela permet notamment de faire des requètes comme sur le site (liste de catégories par exemple), mais ça reste limité et lourd. — Dakdada(discuter)9 octobre 2009 à 11:59 (UTC)
Ce dont tu parles (transformer un dump en une structure adaptée) vient d'être fait pat quelqu'un sur la version anglophone, tout récemment, d'après ce que je comprends. Lmaltier9 octobre 2009 à 15:52 (UTC)
Sur le fond, il faut voir que la structure a été conçue pour Wikipédia, et que cette structure est parfaite pour un wiki : on affiche un champ de formulaire pour la page quand une page doit être modifiée, et c'est très flexible. Il ne faut pas regretter que Wikimédia n'ait pas essayé de définir un nouveau logiciel spécial dictionnaires. S'il l'avait fait, il est clair qu'il aurait manqué plein de choses, qu'on aurait râlé parce que c'était mal adapté (et sans pouvoir faire quoi que ce soit pour y remédier), que les différents projets auraient eu des demandes parfois contradictoires, enfin, ça n'aurait pas marché, à mon avis. Alors qu'actuellement, on a le maximum de flexibilité pour faire ce qu'on veut.
La seule évolution que je verrais comme vraiment utile, ce serait de pouvoir mettre quelque chose dans les catégories pour indiquer la langue des titres de pages de cette catégorie, et que le logiciel en tienne compte pour le classement, sans qu'on ait à se préoccuper des clés de tri. Lmaltier9 octobre 2009 à 15:52 (UTC)
Par curiosité, pourquoi vouloir la liste des verbes transitifs ? Je ne vois pas de cas où cela pourrait être utile, l'immense majorité des verbes pouvant être utilisés transitivement (et la catégorie devrait être supprimée). Lmaltier9 octobre 2009 à 15:55 (UTC)
Ceci dit, rien ne nous interdit de développer une extension MediaWiki afin de pouvoir éclater les pages dans des champs séparés et modifiables séparément. Déjà pouvoir séparer les langues (ou assimilées comme les section internationales pour les caractères et symboles), et les sous-sections (qui seraient indexées par type de terme et numéro, à l'intérieur d'une langue) serait un bonus.
Ensuite on peut aller beaucoup plus loin dans ce genre d'extension, et prévoir alors un éclatement logique complet de la structure : l'extension serait alors installée dans l'espace de nom par défaut, et les différents champs seraient sauvegardés dans des pages d'un espace de nommage spécifiques.
On peut aussi refondre le tout dans une véritable base de donnée relationnelle (il faudrait disposer d'une extension MediaWiki permettant de stocker des tables multicolonnes qu'on peut parcourir en ligne et éditer cellule par cellule, ou ligne par ligne.) Ces tables pourraient être vues en totalité dans un espace de nommage "Table:" dans lequel il serait possible d'éditer en code Wiki directement toute la table, ou une rangée précise, l'extension se chargeant de générer automatiquement une syntaxe wiki éditable, et la réanalysant pour la rééclater dans la table en arrière plan.
Malheureusement, on n'a toujours pas d'extension "Table" pour créer un schéma relationnel, ni de la possibilité de faire des requêtes simples de sélection dedans avec une syntaxe wiki simple mentionnant la table et des identifiants de recherche sur une colonne (MEdiawiki retournant alors la liste des éléments trouvés, et les mettant en forme avec un séparateur spécifié en paramètre également...
Et cela rendrait des services immenses à un tel projet (comme à d'autres) : au lieu de mettre à jour sans arrêt des tas de pages liées, ou de recourir à des modèles complexes, on éditerait uniquement des éléments simples ou on ajouterait des lignes à une table, les autres pages pouvant se remettre à jour toutes seules si la table a été modifiée.
Les tables en syntaxe wiki devraient être simples, et éventuellement hiérarchisées : ce serait, vu en syntaxe Wiki, des listes à puce, avec la liste des colonnes séparées par des "|".
Cela remplacerait bon nombre de modèles complexes par des modèles bien plus génériques et plus facile à concevoir.
et on pourrait alors avoir plusieurs présentations différentes des articles, en permettant de les parcourir selon plusieurs axes de classification, ou dans une seule langue.
Exemple de choses qui seraient possible : la mise à jour des listes de synonymes (relations 1:N), hyponymes (relation hiérarchisée 1:N), hyperonymes (la même relation hierarchisée mais inversée N:1).
On pourrait aussi gérer plus facilement les traductions (relations hiérarchisées aussi 1:N, mais non automatiquement inversibles)...
Au lieu de mettre les prononciation des articles vedette dans l'article, on lierait l'article à sa prononciation présente dans une autre table, laquelle aurait une indexation automatique pour permettre l'intégration du robot externe de recherche de rimes...
Aussi les homonymes (hiérarchisée aussi 1:N) d'un groupe de prononciation vers ses mots qui les réalisent : pour avoir les homonymes d'un mot, on recherche d'abord le groupe de prononciation auquel il appartient, et on obtient dans le sens inverse la liste 1:(N-1) des autres termes...
Mais là je crois que je rêve encore, Wikimedia n'est pas prête à intégrer des schémas de données utilisateurs dans sa base de données (c'est à dire des tables virtuelles regroupées dans une table SQL unique, ou même dans la table générale des textes d'article), pour permettre aux utilisateurs de faire du pseudo-SQL (même limité) en syntaxe wiki.
Mais d'autres Wikis, ailleurs, et qui utilisent aussi MediaWiki, l'ont fait et même ont permis de manipuler directement une partie du schéma SQL de la base de données (via des options de nommage pour ces tables "utilisateurs" devenues des tables physiques, ou via une demande faite à un des administrateurs approuvés du wiki, qui peut créer de nouvelles tables en fonction des besoins du projet, et permettre sélectivement l'édition de la table entière, ou ligne par ligne, ou seulement certaines lignes ou certains champs, ou permettent d'ajouter des lignes ou supprimer des lignes à une table déjà existante, selon certaines conditions telles que l'absence de référence à cette ligne dans une autre table ou page existante).
Moi qui ait travaillé sur des bases de données pour les guides touristiques, annuaires, dictionnaires, et gestion de chemins de fer de parution pour la presse quotidienne ou magazine (avec des éditeurs ou régisseurs publicitaires multiples et concurrents) je m'étonne que le Wiktionnaire arrive à avancer aussi vite sans support d'un schéma relationnel : que d'efforts gaspillés (même avec des robots) à remettre à jour sans arrêt les pages à cause d'un seul changement, alors que chez les éditeurs de guide ou d'annuaire, une seule personne peut appliquer la modif demandée en une poignée de secondes en quelques clics et une petite saisie, et obtenir un nouveau chemin de fer mis à jour et consultable immédiatement, et déjà toujours prêt à imprimer pour la parution finale ! Heureusement que Wikimedia a des reins solides et de la puissance de calcul sur ses serveurs. verdy_p (d) 9 octobre 2009 à 23:59 (UTC)
C'est bien le dump XML que j'ai importé dans mysql, avec la structure que j'ai décrite plus haut.
Je serais très intéressé de savoir ce qui a déjà été fait ailleurs, est-ce que vous avez des liens?
A nouveau, je ne critique pas, une structure ouverte et des articles "a mano" est probablement la meilleure façon de permettre au wiktionnaire d'être enrichi par le plus grand nombre de personnes possible.
Mais comme le wiktionnaire semble avoir atteint une certaine maturité, que sa forme ne devrait plus connaître de bouleversements, et il est peut-être temps de tenter d'organiser ces informations pour les rendre accessibles aux machines.
verdy_p, je trouve tes idées passionnantes, les avantages que tu laisses entrevoir sont très prometteurs, mais je n'ai pas une vision aussi détaillée que toi de ce que cela implique techniquement, et ça peut faire un peu peur. Je suis convaincu qu'il est possible de faire cette migration de façon complètement transparente pour le contributeur, presque sans changer ses habitudes.
La clé serait peut-être dans la validation des articles.
Le contributeur pourrait les créer et les modifier exactement comme il le fait actuellement, mais il y aurait une étape de validation qui consisterait à extraire toutes les informations, à les intégrer dans la base de données et à regénérer l'article selon le modèle choisi.
Il n'aurait alors qu'à regarder cette page afin de s'assurer que le programme a bien "compris" l'article, et corriger le texte original dans le cas contraire.
Une fois l'article validé, c'est cette page générée qui serait conservée, cela permettrait d'avoir en même temps tous les avantages des deux mondes.
Concernant les verbes transitifs, je suis désolé d'avoir aiguisé ta curiosité pour rien, mais je voulais simplement tenter l'extraction d'une catégorie, et c'est tombé sur ça. Paindur11 octobre 2009 à 18:46 (UTC)
Merci pour le lien Lmaltier, c'est exactement ça. Mais comme je suis trop impatient, je vais essayer de me débrouiller avec ce que j'ai. Paindur11 octobre 2009 à 21:13 (UTC)
Merci pour ces nouvelles émoticônes qui, je l'espère, permettront de mieux communiquer et pas seulement de se comporter comme des gamins. Remarque : Importer sans importer l'historique c'est mal. Faut demander, ou, a minima, préciser la source dans la page de discussion, ou dans le "Résumé" de sa contribution. Stephane8888Discuter10 octobre 2009 à 22:25 (UTC)
Bouh, il a fait un copié-collé, c’est mal, il a brisé la licence GFDL/CC-BY-SA 3.0 ! En même temps, pour ce genre de page cela ne change pas grand’chose mais quand même Cdlt, VIGNERON * discut.13 octobre 2009 à 13:26 (UTC)
Les syntaxes #:, #:* et #* donnent des résultats différents, et cette différence a peut-être été exploités par certains, par exemple pour distinguer la ligne de traduction d'un exemple de l'exemple qui précède. Je suggérerais que le robot ne modifie pas la page s'il voit deux lignes consécutives utilisant deux syntaxes différentes parmi ces trois possibilités. Lmaltier10 octobre 2009 à 14:04 (UTC)
Je rejoins Lmaltier : j’avais essayé de faire faire ça en semi-automatique par mon bot (c’est à dire qu’il me présentait un diff que je devais valider avant toute modification réelle) et j’avais constaté des problèmes, avec des syntaxes auxquelles je ne m’attendais pas. Je ne me souviens pas des problèmes eux-mêmes (désolé), mais je me rappelle clairement qu’il y en avait.
Autrement, pour les exemples, on s’était mis d’accord pour #* Exemple et #*: Traduction exemple. Je ne vois pas à quoi peut servir #:*, mais je ne suis pas omniscient (la vérité est beaucoup plus proche du contraire ). --Eiku (d) 10 octobre 2009 à 14:58 (UTC)
Dakdada, tu es sûr que ce n’est pas plutôt #*: pour les traductions d’exemple ? Ça paraîtrait beaucoup plus logique (et c’est ce que j’utilise, d’ailleurs) --Eiku (d) 10 octobre 2009 à 21:33 (UTC)
Franchement, je ne connais pas assez bien la syntaxe du Wiktionnaire pour te le dire. Laissons les autres contributeurs réagir -- Quentinv57✍10 octobre 2009 à 15:02 (UTC)
Pour moi, il vaut mieux ne rien faire. Les boîte début sont utilisés actuellement essentiellement quand il y a plusieurs sens (sinon, ils ne sont pas indispensables). Par contre, ce qui n'est pas normal, c'est que le modèle a l'air de cacher les traductions, mais il n'y a pas besoin de robot pour arranger ça. Lmaltier10 octobre 2009 à 15:09 (UTC)
Les deux modèles ont également la même utilité. On a donc plutôt intérêt à uniformiser tout ça et à n'en laisser qu'un, n'est-ce-pas ? -- Quentinv57✍10 octobre 2009 à 15:19 (UTC)
J'avais transformé les modèles {{(}}{{-}}{{)}} pour qu'on n'ait justement pas besoin de {{boîte début}} etc. Il suffit en effect de rajouter une description pour créer un tableau déroulant (du genre {{(|sens 1}}). Donc je suis pour le remplacement proposé par Quentinv57. — Dakdada(discuter)10 octobre 2009 à 16:00 (UTC)
Ah bon, dans ce cas, d'accord, à condition que ce changement préserve le paramètre (mais ce n'est pas un tableau déroulant si on met le paramètre, c'est plutôt un tableau enroulant, ce qui est d'ailleurs bien mieux). Lmaltier10 octobre 2009 à 16:06 (UTC)
À ce propos, je viens de réparer le script de génération des boites. Désormais, il est possible de choisir de laisser les boites ouvertes (par défaut) ou de les fermer systématiquement, en cochant le gadget correspondant présent dans les préférences. Cela ne s'applique qu'aux boites créées par {{(}}{{-}}{{)}}. — Dakdada(discuter)13 octobre 2009 à 10:12 (UTC)
Non, chaque langue slave a son propre alphabet : même si ce sont des alphabets cyrilliques, il y a plein de variantes. Lmaltier10 octobre 2009 à 16:24 (UTC)
Le syntaxe s'améliorer tout le temps. Je pense qu'il faut l'utiliser le plus possible mais probablement pas par bot. Ça me paraît un peu compliqué pour un bot. Sinon il y a principalement Diligent (d · c · b) et moi qui s'en servons. Venez donc nombreux . Mglovesfun (disc.) 10 octobre 2009 à 17:04 (UTC)
Veuillez m'excuser, en tapant Niue en Google je ne savais pas que Niue est le nom du pays. Selon Wikipédia, la langue est le niouéen donc je vais faire des catégories redirigées. Arghhh. Mglovesfun (disc.) 11 octobre 2009 à 21:05 (UTC)
Oui, c'est sûr, les redirections sur les noms de catégories sont souvent utiles, en particulier pour les catégories de langues. Mais ça ne veut pas dire qu'on peut utiliser ces redirections dans les pages, c'est seulement pour les lecteurs qui veulent saisir un nom de catégorie manuellement. Lmaltier12 octobre 2009 à 19:02 (UTC)
J'ai ajouté quelques précisions à la page d’aide si vous pouviez me faire des retours ou modifier la page si vous le jugez nécessaire, l’idéal serait certainement de « fusionner » avec {{ébauche2-exe}}, merci Serpicozaure(discuter)12 octobre 2009 à 03:35 (UTC)
Ah, un modèle qui pourrait bien me servir. Zut alors, va falloir que j’apprenne son utilisation ! --Eiku (d) 12 octobre 2009 à 21:55 (UTC) ; Bon, merci quand même, Serpicozaure :) --Eiku (d)
flex-lettre
Je suis tombé sur Ä qui utilise une section flex-lettre, nommée « forme de lettre ». Étant donné que ça n'a rien d'une flexion, il faudrait renommer ce modèle. Une idée pour un autre nom ? Ou faut-il éviter de chercher trop loin et utiliser simplement {{lettre}} ? — Dakdada(discuter)12 octobre 2009 à 13:54 (UTC)
À la réflexion ce débat peut être repris à la suite de celui de janvier concernant les formes médianes et finales des lettres arabes, à l'issu duquel j'avais constaté des jours entiers de travail de classification sur ces {{-flex-lettre-}} dans plusieurs codages (Unicode....) effacés (aujourd'hui dans ا il y a du rouge). JackPotte12 octobre 2009 à 17:14 (UTC)
Je comprends ton point de vue, mais diacritique signifie : « Qui sert à distinguer plusieurs lettres écrites presque de la même façon ». Ce sont donc des lettres différentes. Mais ce ne sont pas des "lettres de l'alphabet". Stephane8888Discuter12 octobre 2009 à 17:25 (UTC)
Je pense que lettre est un doublon inutile de caractère. Une lettre est un catactère. Un chiffre aussi, je ne sais pas à quel point il est utile de les séparer. On ne dit pas forme de chiffre et forme de caractère, alors pourquoi accepter forme de lettre ? Mglovesfun (disc.) 12 octobre 2009 à 21:01 (UTC)
La différence entre lettre et caractère, c'est que la lettre s'écrit avec un caractère et appartient à une langue. Il a alors une prononciation, un genre, etc. Par exemple, w est une lettre qui se dit « double v » en français, et est masculin. Une même lettre peut s'écrire avec plusieurs caractères différents. — Dakdada(discuter)13 octobre 2009 à 10:24 (UTC)
Très important : la mention « |fr » est à réserver à la ligne de définition exclusivement
Je voudrais attirer votre attention à tous sur une erreur à ne pas commettre, qui est en train de devenir fréquente, malheureusement, et qui provoque des effets secondaires indésirables... Les formes {{familier|fr}} {{popu|fr}} {{vulg|fr}} {{dés|fr}}, etc. sont à réserver aux lignes de définition des articles exclusivement . La mention « |fr » sert à classer automatiquement le mots dans la catégorie signalées : mots vulgaires, mots familiers, mots désuets, etc. Il ne faut surtout pas l’utiliser pour les dérivés, synonymes, antonymes, traduction, etc., car cela fausse la classification des mots ! On a ainsi le mot contrarier catégorisé dans termes vulgaires en français ! Un petit malin (qu'il se dénonce ! ) a cru bon de mettre faire chier à la section synonymes (ça, c'est bien), mais a rajouté {{vulg|fr}}, et ça... pas bien ! Il fallait mettre simplement {{vulg}}. Ce n'est bien sûr pas le seul article a être faussement classé... Je récapitule : le modèle {{xxx|fr}} est à réserver exclusivement pour les définitions. Pour les sections dérivés, synonymes, dérives, traductions, etc., n'utiliser que {{xxx}}. Merci de votre attention et de votre compréhension. Cordialement. --Actarus(Prince d'Euphor)13 octobre 2009 à 06:32 (UTC)
Je suis d'accord avec toi sur ce point, Vigneron. En effet, l'une des caractéristiques essentielles d'un bon logiciel, c'est justement qu'il est user-friendly, comme disent les Anglo-Saxons. Je crois que les dresseurs de bots vont avoir du travail... --Actarus(Prince d'Euphor)13 octobre 2009 à 07:29 (UTC)
Doit-on mettre juste {{vulg}} ou {{vulg|nocat=1}} ?
Je suis en train de me lancer dans le remplissage des pages d'annexes de rimes, et je fais un grand usage de ces petits modèles ({{argot}}, {{mari}}, {{désuet}}, etc). Aujourd'hui je précise : {{argot|nocat=1}}. est-ce correct ? Stephane8888Discuter13 octobre 2009 à 12:55 (UTC)
Dites, ce n'est pas possible de mettre juste {{argot|nocat}} ? Ça ne change pas énormément l'écriture, mais c'est quand même plus sympa à lire. En fait c'est tout à fait possible, c'est juste qu'il faudrait le généraliser si ça vous va. — Dakdada(discuter)13 octobre 2009 à 13:15 (UTC)
Oh oui, oui, s'il vous plait. Sinon on peut aussi utiliser : {{term|Désuet}} mais on perd l'avantage du modèle (possibilité de changement automatique). Stephane8888Discuter13 octobre 2009 à 21:16 (UTC)
Je rappelle qu'on a le droit d'écrire des choses sans utiliser de modèles. On peut très bien écrire (vulgaire) après un synonyme sans utiliser de modèle, et c'est ce que je fais. Utiliser un modèle n'a aucun intérêt dans ce cas. J'ai même écrit tout ce paragraphe sans utiliser un seul modèle... Ce n'est pas un cas où utiliser un modèle est utile : le commentaire qu'on veut mettre est vraiment lié au mot synonyme par exemple, changer ce commentaire globalement en un autre est toujours à éviter, car le nouveau peut être moins approprié dans ce cas précis. Lmaltier13 octobre 2009 à 21:18 (UTC)
C'est vrai que je ne digère pas trop le passage de Vieux en Vieilli qui détruit (selon moi) l'information que j'ai voulu apporté aux articles (c-a-d la distinction Désuet/Vieux). Stephane8888Discuter14 octobre 2009 à 08:28 (UTC)
Je crois que {{vieux}} a toujours été une redirection. Sinon ajouter nocat=1 (ou n'importe quel caractère) ne sert à rien pour les modèles comme {{rare}} et {{désuet}}. Ça les enlève d'une catégorie cachée, c'est tout. Oki, depuis 2005 le modèle:vieux est une redirection. Mglovesfun (disc.) 14 octobre 2009 à 08:36 (UTC)
Je crois que c'est une erreur ; vieilli, pour un mot, veut dire qu'il tend à sortir de l'usage, mais que la majorité des locuteurs le comprennent encore. vieux veut dire qu'un mot est sorti de l'usage complètement (ou presque) et que seul un public lettré (forcément minoritaire) comprend encore. --Actarus(Prince d'Euphor)17 octobre 2009 à 15:28 (UTC)
Effectivement, je me demandais si on devrait créer des pseudo-langues, ou plus précisément des codes ISO 639. Par exemple LL. sur en.wikt (latin tardif). Dans les étymologiques, du {{etyl|bas-latin|fr}} mettrait ledit mot dans la Catégorie:Mots français dérivés d’un mot bas-latin. Je ne dis pas que je suis pour, simplement qu'ils le font déjà en anglais. Sinon en-us ou en-uk pour anglais américain/britannique me semble pas trop mal non. Plus. Et bien sûr, le célèbre {{nocat}}. Mglovesfun (disc.) 13 octobre 2009 à 21:40 (UTC)
Pour : on distingue déjà français de ancien français, et grec de grec ancien, donc pourquoi pas plusieurs codes ISO pour latin ? JackPotte13 octobre 2009 à 22:52 (UTC)
Mais comme tu le dis, ce sont de vrais codes ISO 639. ISO = International Standards Organization (une traduction ne me semble pas nécessaire). Donc je propose des faux codes. Sinon pour nocat, ce n'est pas simple, parce que si {{rare}} ajoute la catégorie ], qu'est-ce qu'on peut mettre à la place de langue qui fait que ce modèle ne catégorise pas ? Mglovesfun (disc.) 14 octobre 2009 à 07:33 (UTC)
L'ennui c'est que les mots du bas latin (sans trait d'union...) sont très souvent, et le plus souvent, des mots reconstitués, donc non attestés. La remarque vaut encore plus pour le latin populaire (ou vulgaire). Il est tout de même un peu gênant de créer des articles de formes reconstituées, donc seulement hypothétiques, même si telle ou telle forme reconstituée a très probablement existé. --Actarus(Prince d'Euphor)14 octobre 2009 à 07:45 (UTC)
Créer des codes ISO c’est impossible pour nous (seule l’ISO peut le faire ), tu veux dire inventer nos propres codes langues (différence importante). ISO possède déjà des codes pour l’ancien français (fro), le moyen français (frm), le grec ancien (grc), vieil anglais (ang), etc. mais rien pour distinguer la latin archaïque, la latin classique, le bas latin (dit aussi latin vulguaire) le latin médiévale, le latin humaniste, ou bien le latin contemporain (dit latin moderne). Actarus, si la majorité vient de reconstitution, il existe cependant des attestations (on en trouve plusieurs sur la Vicifons dont s:la:Appendix Probi par exemple). Dans ce cas, je crois que la recommandation de l’ISO est de suffixé le code ISO 639 (par exemple fr-1990 pour une orthographe post 1990). Typiquement, en-US et en-UK ou fr-FR et fr-CA sont des codes ISO valides (mais avec les capitales c’est mieux pour ne pas confondre les normes). Cdlt, VIGNERON * discut.14 octobre 2009 à 13:42 (UTC)
Oui mais non. Selon moi, ils sont tout de même trop proche pour avoir deux codes langue distincts (un peu comme on ne crée pas deux codes langue pour le « français de la rue » et le « français littéraire », ce qui n’est pas le cas pour l’arabe standard et ses 30 « dialectes » qui possèdent des codes distincts). Cdlt, VIGNERON * discut.15 octobre 2009 à 19:18 (UTC)
Arf ! Non, justement, ils ne sont pas très proches, car ils ne désignent pas la même réalité. Le bas latin désigne le latin écrit à partir du IIIe siècle de notre ère et qui présente des différences sensibles avec le latin classique. Le latin populaire (ou vulgaire) désigne le latin parlé par la plèbe illettrée quelle que soit l'époque. Do you see what I mean ? --Actarus(Prince d'Euphor)17 octobre 2009 à 15:23 (UTC)
Oui mais non (bis ). Parmi les 3000 à 7000 langues du monde, ces différents latins sont assez proches, et le latin vulgaire est plus proche du bas latin (je ne dis jamais populaire, il y a peut-être une confusion semblable à celle pamplemousse/pomélo, tu as des sources/références ?) que du latin classique ou archaïque. Donc pas vraiment de quoi justifié deux codes langues.
Pour résumer et être constructif, on peut inventer un code pour la bas-latin (mais pas pour les autres, cela ne me semble pas utile, pas encore en tout cas). Le code ll est libre et déjà utilisé sur en.wikt. Une autre solution est de suffixer le code et par exemple mettre la-300. Il faudrait regarder ce qui se fait ailleurs. Cdlt, VIGNERON * discut.19 octobre 2009 à 11:53 (UTC)
Conventions relatives aux catégories
Bonjour. Je suis en train de faire le ménage dans les catégories de façon assez importante, et je suis tombé sur un os de taille : les catégories doivent-elles être, dans le cas général, au pluriel, ou bien au singulier ?
En effet, la plupart des catégories sont au singulier, ce qui est - je le trouve - particulièrement illogique. De plus, Wikipédia utilise systématiquement un nom au pluriel, tout comme dans la page des conventions sur les catégories, Convention:Catégories, dans laquelle ne se trouve citée aucune catégorie au singulier, même si elle ne dit pas explicitement qu'elles doivent être au pluriel.
Oui, je pense que le pluriel est la norme actuelle, et je suis surpris que la plupart soient au singulier. Mais il faut voir au cas par cas, bien sûr : une catégorie Lexique en français de la préhistoire a un nom singulier, mais au sens pluriel, et n'a aucune raison d'être changée. Lmaltier13 octobre 2009 à 21:30 (UTC)
Ca marche. A l'avenir, je renommerai les catégories que je croise qui sont au singulier. Vous pouvez également en lister quelques unes sur la PDD de mon bot, je me ferais un plaisir de les traîter -- Quentinv57✍14 octobre 2009 à 15:01 (UTC)
En cherchant l'origine de certaines erreurs dans les articles je tombe assez souvent sur des modifications de bots (exemple : prononciation de corsetier).
Afin d'éviter d'avoir à farfouiller partout pour savoir d'où viennent telles séries de modifications, et de découvrir tout d'un coup telle série d'articles ajoutés par un bot, il est souhaitable que les robots généralistes, c'est-à-dire ceux qui n'ont pas des tâches précises comme les interwikis, mais des tâches ponctuelles comme des changements de modèles, gardent un journal de leur modifications.
J'entend par là un journal de ce type-là : Utilisateur:Daahbot/Historique. Sans pour autant nécessiter autant de détails (je suis assez pointilleux), je pense qu'il est essentiel que les dresseurs de bot répertorient toutes les actions de leurs bots, surtout si celles-ci n'ont pas été forcément discutées (genre des ajouts de listes de mots, la plupart des articles viennent de là). J'encourage d'ailleurs vivement les dresseurs de bot a récapituler les modifications et ajouts qu'ils ont déjà faits auparavant.
Ça permet notamment, en cas de problèmes, de pouvoir rapidement revenir sur les articles ajoutés ou modifiés. Je pense qu'il faut qu'il y ait suffisamment de précisions pour que quelqu'un d'autre que le dresseur du bot puisse défaire ou refaire les même modifications. Et puis ça fait bien d'avoir un CV pour son bot. — Dakdada(discuter)14 octobre 2009 à 14:09 (UTC)
Merci, j'avais vu . Je me suis dis que cette recommandation pouvait être faite à tous les dresseurs de bot, d'où ce message plus général. — Dakdada(discuter)14 octobre 2009 à 15:30 (UTC)
Bonjour, si je puis me permettre je voudrais signaler deux choses :
Modèle:w à protéger
Je suggère de protéger le modèle:w, maintenant utilisé sur beaucoup de pages : si un vandale le remplaçait par des injures, elles seraient diffusées sur des centaines de pages simultanément.
(Détails : l'année dernière j'avais improvisé ce modèle:w qui n'existait pas ici et me manquait. Je viens juste de le rebricoler pour l'améliorer, et je me suis dit que normalement je n'aurais pas dû pouvoir le modifier aussi facilement...) 62.147.27.19115 octobre 2009 à 10:02 (UTC)
Mglovesfun s’en est chargé. Ceci dit, j’aurais tendance à supprimer ce modèle, ou bien au moins à le substituer automatiquement. La syntaxe {{w|Le Petit Prince}} est presque aussi longue que ] et {{w|lang=en|The Little Prince}} plus long que ]. Donc l’utilité me parait faible et le gain presque nul. Cdlt, VIGNERON * discut.15 octobre 2009 à 19:10 (UTC)
Je ne connaissais pas l'astuce de laisser vide après la barre verticale | après le lien pour éviter de réécrire la même chose derrière. Donc c'est vrai que quand on sait cela, l'intérêt du modèle est limité. Il a donc un intérêt lus évident uniquement vers les liens dans les langues étrangères puisque {{w|lang=en|The Little Prince}} est plus court que ] (The Little Prince) et ] (w:en:The Little Prince) n'est pas très jolie au rendu (surtout à cause du en: devant). Pamputt15 octobre 2009 à 19:26 (UTC)
Signe de mort dans le logo
Dans le gros logo type Scrabble en haut à gauche, le premier signe « シ » est le kana japonais shi qui signifie d'abord « la mort ». Je suppose qu'il a été choisi pour son aspect souriant, alors je suggère de le remplacer par un proche kana encore plus souriant « ツ » qui n'a lui pas de connotations.
(Détails : シ est la syllabe katakana (article katakana) shi : c'est la prononciation de plusieurs mots japonais homophones mais d'abord de celui qui signifie la mort ; il est donc souvent évité par superstition, ou dans les hôpitaux et hospices, etc. Par exemple le nombre 4 se dit aussi shi mais on utilise en général le synonyme yon pour éviter de prononcer ou d'afficher la mort, c'est pourquoi les gags en 4 cases japonais s'appellent des yonkoma (article yonkoma) ce qui signifie littéralement « quatre-cases ». En revanche, le katakana ツ qui se prononce tsu n'évoque aucun mot.) 62.147.27.19115 octobre 2009 à 10:02 (UTC)
C'est une des nombreuses critiques qu'on peut faire à ce logo. Je crois d'ailleurs qu'il était question de le remanier à nouveau, mais je n'ai pas regardé si ça avait bougé. — Dakdada(discuter)15 octobre 2009 à 13:56 (UTC)
Moi, je trouve le logo parfait, et il a beaucoup de caractères communs avec celui de Wikipédia, qui a largement prouvé son succès (idée de jeu, présence de caractères d'écritures diverses), tout en étant nettement plus joli. Il s'agit là de la première critique sérieuse que je vois, mais c'est très facile à adapter. Après, bien sûr, tout est une question de goût personnel. Lmaltier15 octobre 2009 à 22:09 (UTC)
Je pense aussi qu’il ne faut pas jeter le logo pour une erreur. Ce logo est récent, donc il est possible qu’il ne change pas avant un certain temps. Je remarque que les japonais sont restés à l’ancien logo (comme de nombreux projets d’ailleurs). Les discussions « officielles » sont sur : meta:Wiktionary/logo (et autres sous-pages). Cdlt, VIGNERON * discut.16 octobre 2009 à 08:58 (UTC)
Je suis également attaché au concept de ce logo (quant aux caractères et au trait, je n’ai rien contre les améliorer si quelqu’un a une idée). --Eiku (d)
Pour moi, ce n’est pas du tout un problème. C’est vrai que シ peut signifier la mort, mais on écrit toujours 死. Le problème, c’est un caractère chinois dans le logo. Il me semble 漢, mais il est trop déformé. — TAKASUGI Shinji (d) 28 octobre 2009 à 04:48 (UTC)
Ce n'est pas du tout un cas particulier, les noms de langues sont toujours des locutions figées, c'est assez évident. Lmaltier15 octobre 2009 à 15:57 (UTC)
Euh oui, cela me semble une bonne idée. Quelle est/pourrait être le problème ? Quelle est la question derrière ta question ? Tu voudrais changer ce paragraphe ? Cdlt, VIGNERON * discut.15 octobre 2009 à 19:07 (UTC)
Pour moi ce n'est pas une si bonne idée de le faire (même automatiquement) car tout comme Wiktionnaire:Liste d’expressions françaises les utilisateurs ne verront plus les mots déjà créés depuis la liste rouge (et perdront du temps à tenter de les y ajouter). Je propose donc de garder une liste complète jusqu'à annihilation de ces maudites pages à commencer (pardon j'adore torturer les allégories). JackPotte16 octobre 2009 à 16:51 (UTC)
Très bonne idée de gérer tout ça. Un seul problème : parfois le mot existe, donc en bleu, mais sans le français (wharf est un bon exemple, voyez son historique). Mglovesfun (disc.) 16 octobre 2009 à 16:58 (UTC)
Je tiens quand même à signaler qu'en ce qui concerne le tchèque, ces listes sont suivies par Diligent qui les modifie régulièrement. Par respect pour son travail, je pense qu'il vaut mieux ne pas y toucher et le laisser gérer ça lui-même. Quant au français, peut-être vaudrait-il mieux ne garder que les mots à rentrer, cela me semblerait plus lisible. Chrisaix16 octobre 2009 à 17:04 (UTC)
La catégorie:français a déjà une liste complète des mots et locutions en français. Si j'étais le seul à pouvoir décider, je fusionnerais la liste des mots français manquants pour en supprimer le reste. Dites-moi ce que fait l'index français fait que la catégorie français ne fait pas ? Mglovesfun (disc.) 16 octobre 2009 à 17:07 (UTC)
Je suis plutôt d'accord avec toi. Fusionner les deux pour ne garder que les mots manquants me semble le plus logique et le plus utile. Chrisaix16 octobre 2009 à 20:58 (UTC)
Hé bé. La première fois que WikiMedia met à jour les pages les plus demandées depuis 2007, au moins ! Sinon un mot demandé et un mot qui nous manque, ce n'est pas la même chose. Mglovesfun (disc.) 16 octobre 2009 à 23:14 (UTC)
Donc on fait quoi ? On supprime toutes ces pages d'index inutiles, et on actualise les mots manquants ?
Bonjour. Certains wiktionnaires utilisent des drapeaux comme illustrations des langues. Nous ne le faisons pas parce qu'il ne peut pas y avoir de correspondance drapeaux - langues, sauf très rares exceptions, comme l'espéranto. Par exemple, le français est parlé dans de nombreux pays (il e, et il n'y a pas que le français parlé en France. Associer le français au drapeau français, même associé à deux ou trois autres, serait donc très trompeur (dans les deux sens). Je pense donc qu'il vaut mieux ne pas commencer... Lmaltier14 octobre 2009 à 16:35 (UTC)
Ce n’est pas parce que j’utilise des drapeaux pour symboliser les dialectes kurdes que les utilisateurs du Wiktionnaire sont obligés de suivre mon (mauvais ?) exemple. Le drapeau kurde est utilisé sur la plupart des sites multilingues où le kurde figure, notamment sur le Wîkîferheng. Je ne voyais donc pas de problème particulier. De plus, la langue kurde est étroitement liée à l’Histoire du Kurdistan. Mon intention n’était bien sûr pas de tromper l’opinion. Un petit mot me paraissait terne pour indiquer les dialectes. Si nous n’avons pas le droit d’utiliser les drapeaux pour désigner les langues de toutes façons, peux-tu remplacer les modèles par de simples mots, mais avec une taille de police plus grande que celle du texte? Je ne sais pas comment faire ça. CathFR14 octobre 2009 à 17:12 (UTC)
Je pense qu'il est préférable de conserver une présentation cohérente. Et puis, certaines personnes parlant kurde peuvent ne pas se reconnaître dans le drapeau du Kurdistan (mais je ne connais rien au sujet). Lmaltier16 octobre 2009 à 16:49 (UTC)
Dommage que les langues n’aient pas un drapeau (ou autre symbole) propre. La francophonie a bien un emblème, mais je ne sais pas si d’autres langues ont la même chose (je crois même que non). --Eiku (d) 16 octobre 2009 à 20:24 (UTC)
Puisque vous semblez tous préférer que personne n’utilise pas de drapeaux pour les langues, je laisse tomber. Merci d’avoir pris le temps d’en discuter. CathFR20 octobre 2009 à 17:49 (UTC)
Effectivement. Le drapeau du Brésil est par exemple indiqué pour le portugais, parmi d'autres, mais le portugais n'est bien sûr pas la seule langue du Brésil. Inversement, le portugais est pas mal parlé en France, mais il n'y a bien sûr pas le drapeau français. Mélanger les frontières politiques et les frontières linguistiques n'est pas une bonne idée. Et puis, ce cas montre bien à quel point des drapeaux peuvent distraire de l'essentiel. Lmaltier20 octobre 2009 à 19:41 (UTC)
Images
Pour diviser la discussion en deux. Je dirais que les images posent assez souvent des problèmes ici. Parce que toutes nos boîtes de déclinaison se situent à droite. Parfois j'enlève les images non parce que je pense qu'elles ne servent à rien, mais plutôt parce que je veux ajouter un pluriel, un féminin ou une prononciation. Donc je n'ai pas de commentaire pour les drapeaux, simplement qu'il faut très bien gérer les images dans les articles, sinon on a du mal à trouver les autres informations. Mglovesfun (disc.) 16 octobre 2009 à 17:15 (UTC)
Pour certains articles, j’ai vu que les images étaient reléguées à la fin de la page, avec des numéros. C’est mieux à mon avis que de supprimer l’image (j’ai moi-même passé pas mal de temps à chercher certaines images, et ça me ferait mal qu’elles soient purement et simplement supprimées). --Eiku (d) 16 octobre 2009 à 17:33 (UTC)
Si l'image permet de faciliter la compréhension du sens, il vaut toujours mieux la laisser, en la mettant après le tableau de déclinaison éventuel. Lmaltier16 octobre 2009 à 17:46 (UTC)
Effectivement. Le drapeau du Brésil est par exemple indiqué pour le portugais, parmi d'autres, mais le portugais n'est bien sûr pas la seule langue du Brésil. Inversement, le portugais est pas mal parlé en France, mais il n'y a bien sûr pas le drapeau français. Mélanger les frontières politiques et les frontières linguistiques n'est pas une bonne idée. Et puis, ce cas montre bien à quel point des drapeaux peuvent distraire de l'essentiel. Lmaltier20 octobre 2009 à 19:39 (UTC)
Quand on modifie une page, ce qui apparaît en bas c'est les outils d'éditions (edit tools). Chaque fois qu'on modifie une page, on doit charger cette page MediaWiki. Donc, peut on essayer le plus possible de fusionner les sous-sections par alphabet au lieu de par langue. Par exemple, pour l'allemand il n'y a que et tout ça on peut mettre dans « Romain ». C'est à la fois une façon de le rendre plus simple, et de permettre à l'utilisateur de charger les pages du Wiktionnaire plus rapidement. Qui se dit contre ? Mglovesfun (disc.) 17 octobre 2009 à 11:28 (UTC)
A première vue, ça me semble une bonne idée. C'est vrai que ces listes posent un vrai problème de performance à certains utilisateurs. Lmaltier17 octobre 2009 à 11:33 (UTC)
À moi entre autres. Lorsque je dois utiliser l'alphabet grec ou l'alphabet russe ou le romaji ou l'API, je dois descendre tout en bas de la page pour avoir des tableaux où les lettres sont minuscules et illisibles. Ce serait quand même beaucoup plus sympa de reprendre l'idée de la bêta Açai et d'avoir les tableaux en haut, facilement accessibles sans avoir à scroller, avec des caractères suffisamment gros pour les pointer facilement, et tout en gardant la fenêtre d'édition sur l'écran (ce que le scroll empêche). Donc, d'accord, moins de listes, plus facilement accessibles et plus facilement lisibles. Ça, ce serait une grande avancée dans le Wiktionnaire . Chrisaix17 octobre 2009 à 12:08 (UTC)
Je vois pas mal de sections qu'on peut fusionners, mais j'hésite parce que déjà là j'ai cassé les titres des sections. Au fait, pour le romaji c'est des macrons normaux ? Sinon il faudrait les rajouter. Mglovesfun (disc.) 17 octobre 2009 à 12:44 (UTC)
Je ne suis pas sur que fusionner tout le « romain » (latin conviendrait mieux comme nom du coup) soit une bonne idée car il est très très étendue (des dizaines de milliers de caractères) mais pourquoi pas fusionner les plus courant (mais là bon courage pour déterminer ce qui est courant ou pas, typiquement ÿ en français ou -le tout récent en Unicode- ẞ en allemand ne sont pas courant mais tout de même nécessaire).
Tu pourrais aussi créer une case dans les préférences pour pouvoir désactiver cet outil très lourd (et qui ne me sert jamais).
Mglovesfun : qu’apelles-tu « macrons normaux » ? Pour faire un distinguo du signe diacritique combiné ? Dans ce cas oui, on utilise ō et pas ō). Cdlt, VIGNERON * discut.17 octobre 2009 à 15:13 (UTC)
J’ai fait du ménage. N’oubliez pas de vider votre cache pour que ça fasse effet. Notons que EditTools n’est pas pleinement compatible avec la bêta Açai ni WikEd. Urhixidur27 octobre 2009 à 15:01 (UTC)
Il vaut mieux avoir ses papiers quand on cherche à éditer un texte comme celui ci-dessous, en laissant appuyée la flèche de droite du clavier, le curseur tourne en rond :
Grâce à la page de Koxinga on essaie d'éliminer le plus possible les modèles de trois lettres qui ne sont pas dédiés aux langues. Quelques exceptions.
{{fam}} et {{mpl}} étant des codes langues, il faudrait supprimer la redirection. Mais pour le moment, je mets simplement un mot disant qu'ils sont à remplacer par {{familier}} et {{mplur}}.
{{inv}}, ce n'est pas un code langue donc ça ma gêne pas de garder la redirection. Mais les codes ISO 639 changent donc il est assez important de réserver tous les sigles de trois lettres (sans majuscule ni diacritique) aux langues. Donc CaBot (d · c · b) remplace {{inv}} par {{invar}}.
Pour les autres, comme {{dro}} et {{mar}} qui sont beaucoup moins utilisés, autant les remplacer et les supprimer afin de les garder pour les langues. Je signale que dro est un code ISO 639-3 actuel.
Sinon pour les noms des modèle, le nom entier doit toujours être au moins une redirection, par exemple {{commerce}} parce que {{comm}} est très ambigu. Sinon pour les mots courts comme {{droit}} mettre toutes les 5 lettres me semble bien. Mglovesfun (disc.) 17 octobre 2009 à 11:58 (UTC)
Complètement d’accord, pour moi le nom complet devrait même être le nom du modèle (plutôt que au mieux une redirection).
Les modèles de trois lettres doivent toujours être un modèle code langue (dans l’idéal, ceux de deux lettres et éventuellement ceux de quatre lettres aussi mais c’est moins critique). Cdlt, VIGNERON * discut.17 octobre 2009 à 15:02 (UTC)
Je l'ai limité à 1 edit par minute dans la journée (entre 8h et 22h) pour ne pas encombrer les serveurs. Sinon, il fonctionne à 6 edits par minute la nuit. Ayant mis les heures un peu au pif, j'irais demander à un développeur de MediaWiki son avis afin d'optimiser la chose.
Bien entendu, si mon bot venait à faire une connerie, n'hésitez surtout pas à appuyer sur le bouton d'arrêt d'urgence que je viens d'ajouter sur sa page utilisateur.
CaBot n'a pas tout fait. Il en reste au moins 10 qui sont utilisés. Pour {{tdm}} c'est différent parce que c'est utilisé que dans des autres modèles, donc il faut trouver de quels modèles il s'agit, et le remplacer. Mglovesfun (disc.) 19 octobre 2009 à 06:53 (UTC)
Je ne vois vraiment pas de quels modèles tu veux parler... J'insiste sur le fait que je n'ai pas remplacé les liens dans les articles, mais uniquement les inclusions de ces modèles. S'il y a eu malentendu et que tu veux que je m'occupe aussi des liens qui pointent faire ces modèles, je peux aussi le faire -- Quentinv57✍21 octobre 2009 à 12:36 (UTC)
Le modèle pour les contractions. Je suppose qu'il faut l'utiliser avec soin, mais je vois son intérêt. Par exemple he’s et he’d ne me semblent pas d'être des « locutions verbales », mais des contractions de pronom + verbe. Alors qu'en dites-vous ? Mglovesfun (disc.) 19 octobre 2009 à 06:35 (UTC)
Je ne sais pas pour -élis-. Mais par exemple, si he’s est une « forme de locution verbale », de quelle locution verbale s’agit-il ? Je n’ai aucune idée. Mglovesfun (disc.) 19 octobre 2009 à 12:28 (UTC)
Dans ces cas, on pourrait peut-être utiliser forme verbale, car c'est le verbe qui est quand même le plus important, non ? Mais il y a aussi les cas de du ou au en français, de na en portugais. Contraction ne me plait pas vraiment, parce que ce n'est pas assez précis, mais le problème n'est pas évident. Lmaltier19 octobre 2009 à 19:19 (UTC)
Pour restauration. Finalement, forme de locution verbale est plutôt une mensonge. Contraction n'est pas très précise, non, mais on peut expliquer la nature de la contraction dans l'article, non ? Il va falloir organiser un vote, ou non ? Mglovesfun (disc.) 20 octobre 2009 à 13:16 (UTC)
ContreDoublon de {{-abrév-}}. Inutile, car ce sera toujours une contraction de quelque chose (locution verbale, etc.). Sinon il va falloir rebrousser chemin pour les diverses pages concernant les abréviations et acronymes, qui sont jusqu’ici classés selon le lexème cible (par ex. « Mme » est un nom commun). Urhixidur27 octobre 2009 à 13:55 (UTC)
Contre fortement. Je suis d’accord avec Urhixidur. Wiktionnaire français est plus logique que Wiktionnaire anglais, comme d’habitude, parce que nous n’utilisons pas abréviation comme classe. Ce terme n’explique rien. Contraction non plus. Si l’on catégorise here’s comme contraction, comment catégorise-t-on here is ? Ces deux locutions avec un sujet et un verbe mais sans fonction comme phrase sont (formes de) locutions verbales. Il est aussi important de distinguer l’auxiliaire ’ve et le suffixe -n’t. — TAKASUGI Shinji (d) 3 novembre 2009 à 03:35 (UTC)
On peut dire que c'est une forme de verbe auquel le pronom est intégré, ce n'est pas faux, de même que au est une forme de préposition à laquelle l'article est intégré (ou une forme d'article auquel la préposition est intégrée...) Lmaltier6 novembre 2009 à 07:24 (UTC)
Le noyau de la phrase est le verbe conjugué, non pas le sujet. Le mot chuis est donc une forme de être plutôt que de je, et le mot chais une forme de savoir. They’ve comprend deux mots, le sujet they et l’auxiliaire ’ve, et il est donc une locution de l’auxiliaire plutôt que du pronom. En revanche, don’t est un mot avec le suffixe -n’t. Classer les deux comme contractions, cela n’explique rien du tout grammaticalement. Personnellement, je voudrais plutôt supprimer les articles de they’ve etc., parce que ’ve est attaché au sujet très librement, par exemple my wife and I’ve been married, dont le sujet est my wife and I « ma femme et moi ». Mais certains peut-être les trouvent utiles. — TAKASUGI Shinji (d) 6 novembre 2009 à 13:31 (UTC)
Contre Pour information, la définition de au et de du dans le Petit Larousse commence bien par contraction, mais ils sont classés comme articles. On n'a qu'à appliquer le même genre de principe, c'est ce qui donne le plus de renseignements, et par ailleurs contraction n'est pas une catégorie grammaticale. C'est comme VIP, qui est classé initialism sur le Wiktionary, et comme nom commun par nous (ce qu'il est, incontestablement). Lmaltier6 novembre 2009 à 17:43 (UTC)
Comme en anglais, je préfère que tous les prénoms soit classés par langue et pas simplement par masculin ou féminin. C'est d'une petite importance, j'avoue, mais entre autres choses on va finir avec tous les systèmes d'écritures ensemble ! Latin, cyrillique, grec, kanji (etc.) Mais franchement, il y a plus pressant sur le Wiktionnaire que ça. Mglovesfun (disc.) 19 octobre 2009 à 09:36 (UTC)
J'allais le mettre sur la page de Quentin, mais autant mettre ici devant tout le monde.
Pour les modèles qui catégorisent de façon automatique en français, comme {{marine}} il faudrait ajouter {{marine|lang}} pour les sections non-françaises. Il m'arrive assez souvent d'en trouver.
À propos des modèles catégorisants, est-ce qu'il y en a une liste (pour éviter de les mettre dans des pages de discussion ou des pages personnelles, par exemple, comme ça m'est souvent arrivé) ?
Sinon, comme Robert Ullmann (d · c · b) le fait en anglais, trouver une liste de tous les pluriels dont le singulier n'existe pas encore. C'est PiedBot qui les a importés (correctement). Mais sans prononciation ni singulier, ils sont très peu utile pour le moment. Mglovesfun (disc.) 19 octobre 2009 à 15:15 (UTC)
Personnellement j'aurai peut-être le temps de tourner une vidéo (.ogg ou ogv) d'ici 2013 pour permettre à chacun de créer son robot Médiawiki en 1 heure (pour éviter que les (Requête bot) ne s'accumulent pendant 6 mois comme cet été). JackPotte19 octobre 2009 à 15:56 (UTC)
@Mglovesfun : est-il possible de créer les flexions à l'aide d'un bot ? Si {{invar}} n'est pas apposé dans la section de langue concernée, la page devrait par conséquent exister. Mais je me trompe peut-être... -- Quentinv57✍21 octobre 2009 à 12:54 (UTC)
Créer toutes les flexions demandées nécessitera que le robot ait les connaissances d'un académicien : par exemple le cas par cas (voire l'étymologie) semble la seule façon de différencier tous les féminins de -teur en -teuse (menteur) des -trice (instituteur). JackPotte22 octobre 2009 à 12:48 (UTC)
C'est normal, on étudie les mots, et chaque écriture différente de chaque mot a droit à sa page (ce qui permet en même temps d'accueillir éventuellement d'autres langues sur chacune des pages). On ne doit donc pas fusionner ces deux pages (mais il est judicieux que l'une renvoie à l'autre, surtout si une des deux orthographes domine très nettement dans l'usage). Il est déjà indiqué que ce sont des orthographes alternatives. Lmaltier19 octobre 2009 à 19:14 (UTC)
Et pourtant, il doit bien y avoir fusion, car les deux contiennent des informations qui relèvent d'un article principal (étymologie, traductions et définitions). En outre, l'article principal ne devrait-il pas être contre-jour, qui est vraisemblabement le plus utilisé ? — Dakdada(discuter)20 octobre 2009 à 15:42 (UTC)
En attendant qu'une décision soit prise pour savoir quelles pages de Wiktionnaire (il y en a peu) peuvent contenir les modèles {{Politique}} et {{Recommandation}} (modèles tout à fait acceptables par ailleurs), je supprime ces modèles mis sans concertation par Mglovesfun dans certaines pages comme s'il avait décidé de lui-même qu'une page contient la politique officielle de Wiktionnaire et une autre non. --Béotien lambda20 octobre 2009 à 18:11 (UTC)
Je pense que Mglovesfun s'est basé sur les catégories que j'ai cité ci-dessus, et n'a pas fait ce choix arbitrairement. Ce sont en effet les pages contenues dans ces catégories qui doivent contenir ces modèles. -- Quentinv57✍22 octobre 2009 à 10:57 (UTC)
Avis
Ces modèles, qui peuvent avoir leur intérêt, doivent être employés avec circonspection et avec l'accord de la collectivité. Les pages concernées doivent être recensées, leur état d'achèvement doit être avéré en ce qui concerne celles fixant la politique officielle de Wiktionnaire, le but étant qu'il n'y ait pas de pages de recommandation mais que toutes les pages puissent se targuer de donner une conduite à suivre officielle. --Béotien lambda20 octobre 2009 à 18:30 (UTC)
Ces modèles sont très utiles pour permettre aux débutants de prendre conscience rapidement de la "politique" du projet. Ces modèles sont très "puissants" car ils officialisent le contenu des pages concernées. Un consensus (ou absence d'avis contraire) est donc souhaitable. Stephane8888Discuter20 octobre 2009 à 18:42 (UTC)
Quand j'ai dit « N'hésitez pas à modifier les pages concernées », je voulais dire précisément ça. Comme n'importe quelle page du Wiktionnaire, si vous n'êtes pas d'accord, vous la modifiez ! Sinon j'ai essayé de faire ce qui me semblait le plus logique - mettre les pages avec beaucoup de modifications, d'informations sur les pages de discussion. Si je ne voulais pas qu'on modifie les pages, pourquoi avertir tout le monde ici ? Je cherche avant tout le consensus, ce qui (sur le Wiktionnaire) m'est plus important que mon propre avis. Mglovesfun (disc.) 20 octobre 2009 à 18:58 (UTC)
Contre ces modèles : il y a presque autant de type de recommandations que de contributeurs et ceux-ci sont déjà visibles dans l'historique. Par ailleurs, la politique est déjà assez visible dans Aide:Sommaire (même si selon moi nous devrions créer un moteur de recherche spécial pour, comme w:Aide:Sommaire) sans que nous polluions certaines pages avec ces probables pertes de temps qui de plus discréditeraient les autres articles. JackPotte20 octobre 2009 à 20:08 (UTC)
Autant de type de recommandations que de contributeurs ??? Déjà visibles dans l'historique ??? Discréditeraient les autres articles ??? On ne doit pas parler de la même chose. La page de sommaire de l'aide est effectivement une aide, mais elle ne mentionne pas toutes les pages utiles. Lmaltier20 octobre 2009 à 20:29 (UTC)
Par principe, je suis Pour toute amélioration de la recherche d’aide / de recommandations : je passe souvent un certain temps à chercher dans les pages d’aide (celles dont j’ai le plus besoin ne sont jamais sur le sommaire de l’aide). --Eiku (d) 20 octobre 2009 à 20:41 (UTC)
Locution figée (etc.)
Ce serait bien de discuter des futurs changements à nos critères. Pour moi être une « locution figée » ne suffit pas. Si une locution figée est une expression qui fait penser à quelque chose de précis, homme nu et femme nue pourraient être des locutions figées. Je n'aime pas conserver les trucs qu'on comprend ce que c'est dès qu'on voit le titre de l'article magasin de chaussures. Donc je suis contre accepter les locutions figées qui n'ont pas de sens spécial, mais fortement pour écouter vos opinions. Mglovesfun (disc.) 20 octobre 2009 à 19:04 (UTC)
Je recopie ce que j'ai écrit ailleurs. Locution figée a le même sens que set phrase en anglais. D'après une explication citée dans : Une locution figée est une chaîne lexicale de deux ou plusieurs mots. Formant un tout indissociable, elle doit être saisie, lors du décodage, comme une seule unité lexicale. J'ajouterais que c'est aussi et surtout une seule unité lexicale lors du codage de la pensée, c'est-à-dire lorsqu'on parle et qu'on écrit. Lors du décodage, c'est-à-dire lorsqu'on écoute quelque chose, elle doit effectivement être considérée comme une seule unité lexicale, mais ce n'est le cas en pratique que quand on la connait, pas quand on ne la connait pas (ce qui peut parfois empêcher de la comprendre, mais pas toujours).
Par exemple, hôtel de ville, syndicat d’initiative ou pomme de terre sont des locutions figées incompréhensibles si on les connait pas. faire contre mauvaise fortune bon cœur est aussi une locution figée, mais qui peut être comprise même si on ne l'a jamais entendue, mais qu'on connaît le sens des mots. tout vient à point à qui sait attendre est aussi une locution figée (comme tous les proverbes), mais facilement compréhensible par tous, tout comme saumon de l’Atlantique ou magasin de chaussures. Pourquoi refuser les noms standards de magasins quand ils sont composés typographiquement de plusieurs mots et les accepter quand il y en a un seul ? Pour le cerveau, ça revient exactement au même. Dans le cas de saumon atlantique, on comprend, même si on ne sait pas que c'est le nom attribué à une espèce précise
« Formant un tout indissociable, elle doit être saisie, lors du décodage, comme une seule unité lexicale ». Mais un magasin de chaussures, c'est un ] ] ], facile de séparer les unités. Mglovesfun (disc.) 20 octobre 2009 à 20:20 (UTC)
Oui, c'est facile de les séparer, bien sûr, mais le cerveau ne les sépare pas en pratique, que ce soit quand on veut parler du magasin (la locution vient toute faite à l'esprit, on ne la reconstruit pas mentalement) ou quand on en entend parler, et c'est pour ça que c'est une locution figée. Lmaltier20 octobre 2009 à 20:24 (UTC)
Ce principe est très bien. Mais attention : les locutions figées que l’on peut comprendre sans les connaître sont (logiquement) plus facile à définir (magasin de chaussures : magasin où l’on vend des chaussures), et les gens qui comme moi ont du mal à écrire des définitions risquent de se concentrer sur elles (céder à la facilité), alors que la priorité est de définir celles qui sont difficiles à comprendre. --Eiku (d) 20 octobre 2009 à 20:48 (UTC)
Autrement, je n’ai vraiment pas l’impression que mon cerveau traite le saumon de l’Atlantique comme une seule unité lexicale, contrairement à magasin de chaussures. Et je pense aussi que dans certaines langues étrangères, le cerveau traite parfois un mot (sans espaces à l’intérieur) comme plusieurs unités. --Eiku (d) 20 octobre 2009 à 20:52 (UTC)
Je ne pense pas que ce soit le cas, ni que ça risque d'être le cas. Je pense que c'est plutôt le contraire, ces locutions sont forcément négligées (y compris par moi, qui ai pourtant fortement tendance à me concentrer sur le plus facile). Quand elles ne sont pas en français, je pense que la priorité est de les mettre dans les tableaux de traduction, c'est là qu'elles sont le plus indispensables (ainsi que dans les synonymes, qu'elles soient en français ou pas).
Pour saumon de l’Atlantique, ça ne m'étonne pas, c'est sans doute parce que tu n'es pas ichtyologiste.
Si tu penses à l'allemand, les mots à rallonge sont vraiment considérés comme des mots (mais je ne sais pas comment le cerveau les traite...). On a beaucoup parlé du mot allemand le plus long utilisé dans un document officiel, qui était une suite de nombreux mots accolés. Mais chaque langue est un cas particulier. Lmaltier20 octobre 2009 à 21:05 (UTC)
Comme sur en: j'étais contre la suppression de Siberian cat. Ce n'est pas simplement un chat qui est sibérien. Mais un magasin de chaussures, Lmaltier, tu sembles parler au niveau cognitif, et non pas au niveau lexical. Donc on dirait que c'est soit encyclopédique, soit inutile ici. Mglovesfun (disc.) 20 octobre 2009 à 20:57 (UTC)
On ne dit pas « magasin de souliers » mais « magasin de chaussures », ce "choix" des locuteurs fait partie de la description de la langue. Cependant, puisque cette locution se comprend d'elle même : mérite-t-elle un article ? Cette information peut être précisée comme hyponyme de magasin, comme dérivés de chaussure, dans Thésaurus:boutique (français)Thésaurus:français/boutique et Thésaurus:chaussure (français)Thésaurus:français/chaussureThésaurus:chaussure/français. L'intérêt d'avoir une section "Traductions" ne justifie pas (pour tout le monde) le fait d'avoir un article (Chrisaix serait d'accord mais Darkdada contre...)Stephane8888Discuter21 octobre 2009 à 08:24 (UTC)
On écrit toujours magasin de chaussures, avec un s. Si tu te poses la question, c'est que ce n'est pas évident pour toi, et que la page te serait donc utile... Ce n'est pas parce qu'on peut y mettre un tableau de traductions qu'il faut créer la page, c'est parce que c'est le nom utilisé de façon classique pour désigner ce magasin, ce qui n'est pas du tout évident (on ne dit pas chaussurerie, par exemple). Il mérite donc tout autant sa place que animalerie ou poissonnerie, par exemple. Le fait que ce soit facile à comprendre n'est pas un argument, ou alors cet argument s'appliquerait aussi bien aux magasins que je viens de citer, ou à des mots comme utilisable, qui sont tout aussi faciles à comprendre si on connaît leurs composants. Lmaltier21 octobre 2009 à 20:23 (UTC)
Je suis d'accord. Les attestations Internet donnent magasin de chaussure plus fréquent que magasin de chaussures, idem pour la fréquence des requêtes Google. (heureusement que sur Google livres la proportion est de 1/15e... !) Stephane8888Discuter21 octobre 2009 à 20:58 (UTC)
Ah bon, alors, je me trompais. Preuve de plus que créer la page serait utile. Les s qui manquent, c'est très fréquent sur Internet, mais à ce point, ça me semble quand même significatif, et il faut absolument en tenir compte.
La communauté internationale des wikis (dont le représentant le plus connu est la WikiMedia Fundation), qui promeut la libre diffusion du savoir, est sous le choc (et en particulier sa branche francophone) :
« Après des semaines de commentaires dégradants que les contributeurs du Wiktionnaire se sont envoyés dans la gueule via les pages de discussion dédiées, et ce sans aucun respect pour la moindre notion de courtoisie, ceux-ci sont parvenus à un consensus (comme cela est la règle parmi eux) : "nous sommes tous des cons, il y a consensus sur ce fait" (...) "En conséquence, nous avons décidé de supprimer toutes les 1 517 969 pages qui posent problème, et de revenir aux fondamentaux : le verbe avoir". » — (Agence Pense Fesse, octobre 2009)
L'APF refuse de citer ses sources, mais certains fuitages mentionnent :
(non, j'ai trop honte pour vous)
Merci Szyx pour cette intervention sarcastique (qui aime bien, châtie bien) et pleine d'autodérision. Puisque le problème majeur vient des disputes entre éminents membres de la communauté, je propose qu'on fasse appelle, avant que les choses ne dégénèrent, à un médiateur, un wiki-pompier (je me propose) qu'on pourrait solliciter rapidement, par mail si besoin. Ses missions ne seraient pas d'arbitrer, ni de solliciter un "vote-sanction", mais de formaliser les arguments de chaque partie, de rappeler les principes fondamentaux, d'organiser une discussion plus large, et surtout d'éviter que les différences de point de vue dégénèrent en conflit. Un contributeur dégouté (Szyx, Koxinga, ...) c'est une catastrophe pour le Wiktionnaire... Stephane8888Discuter22 octobre 2009 à 19:20 (UTC)
(Dépêche APF) Wikipmédiationary annonce que son modérateur principal, Stephane666, a décidé de se sacrifier en s'immolant par le feu sur la Place de la Concorde (union de cœurs et de volontés entre des personnes (gnaaa ?)), afin que son exemple soit un exemple pour les exemples futurs : sa photo en croix sera désormais inclusionnée dans le logo du Wikktionnaire, et l'article Stéphane sera définitivement protégé en écriture, en souvenir de son vain sacrifice. Dieu ait son âme.
Pour ma part, je suis têtu (oui). Pour éviter toute dispute je pourrais simplement ignorer ce qui se passe ici, mais je pense que ce serait la solution la plus facile, pas la meilleure. Mglovesfun (disc.) 23 octobre 2009 à 10:20 (UTC)
Ce ne serait pas la meilleure solution, c'est sûr. La meilleure option est de discuter autour d'une problématique, présenter ses arguments, chercher à convaincre (argument contre argument). Si vraiment il n'en sort rien de consensuel, alors laisser mûrir les idées. Les contributeurs changent parfois d'avis au fil du temps et des arguments. En revanche s'ils se braquent, ou pire, s'ils prennent en grippe un contributeur, les espoirs de convaincre s'amenuisent... Stephane8888Discuter23 octobre 2009 à 17:03 (UTC)
Je conçois que partir médecin humanitaire en Afrique pourrait justifier l'abandon des contributions au meilleur dictionnaire du monde, mais certainement pas un problème de communication. JackPotte24 octobre 2009 à 11:23 (UTC)
N’empêche qu’elle a raison, cette APF… Et même si j’adore discuter (et il s’en prive pas, le bougre), j’ai l’impression que je serais plus utile si je ne participais pas aux discussions. Bien sûr que je détériorerais les articles, mais au moins, ça n’aurait pas d’effet sur l’ambiance de la wikidémie ! --Eiku (d) 25 octobre 2009 à 00:20 (UTC)
J'ai(me) l'esprit d'équipe, aussi quand je lis certains "échanges" ou observe certaines "contributions", je me demande parfois ce que je fais dans la nôtre ... Dernier exemple, Actarus s'évertuant (tuant, c'est le mot!) à supprimer une remarque sur l'étymologie de parking, faux anglicisme ou faux-ami au même titre que planning, smoking etc. Si vous avez du temps à perdre, suivez l'édifiant historique de parking ... esprit (d'équipe), et vous vous demanderez peut-être avec moi : esprit (tout court), es-tu là ? Et un cordial merci à celles et ceux qui préfèrent cultiver nos tomates communes ! Henri Pidoux27 octobre 2009 à 19:26 (UTC)
Tu sais, peu m’importe ce qu’il y a sur Wikipédia (façon de parler : bien sûr, j’apprécie d’y trouver ce que j’y cherche ). S’il y a de la redondance entre Wikipédia et le Wiktionnaire, tant pis, du moment que le Wiktionnaire ne se met pas à faire des articles d’encyclopédie. --Eiku (d) 23 octobre 2009 à 19:15 (UTC)
Moi je viens d'essayer d'y sculpter un entonnoir d'octet pour guider les lecteurs cherchant un dictionnaire par ici. JackPotte24 octobre 2009 à 11:19 (UTC)
Que les articles soit supprimés ou pas sur la Wikipédia, il y a quelques informations à récupérer. Je l’ai fait rapidement pour 剣, avis aux amateurs. Cdlt, VIGNERON * discut.27 octobre 2009 à 11:44 (UTC)
Digramme ?
X a ajouté une explication du sz en polonais . C’est faux parce qu’il est plutôt digramme comme ch\ʃ\ en français. En tous cas, il n’y a pas de modèle pour les digrammes. Pensez-vous que nous en avons besoin ? — TAKASUGI Shinji (d) 24 octobre 2009 à 16:05 (UTC)
On pourrait, mais veut-on vraiment créer des pages pour tous les groupes de lettres représentant des phonèmes uniques (pas seulement les digrammes, par exemple sch, œufs, aient, où, ont) ? Lmaltier24 octobre 2009 à 16:11 (UTC)
Un modèle catégorisant les digrammes, diphtongues et autres trigrammes ne serait-il pas mieux sur une page d'annexe, à cause de leur faible intérêt lexical (qui ne nécessite pas d'article complet) ? JackPotte24 octobre 2009 à 16:25 (UTC)
Petit vote concernant les modèles à remplacer dans les sections de langue
Salut à tous !
On m'avait demandé il y a quelques temps d'adapter mon robot afin d'isoler les sections de langue et de pouvoir alors répondre à cette requête.
J'ai donc adapté mon robot, tout fonctionne à merveille ! (du moins en apparence ^^). Seulement, cette requête n'a pas fait objet d'un consensus, ce qui explique que je tenais à connaître votre avis avant de lancer mon robot sur plusieurs milliers de pages.
De quelle requête parle-t-on ? Car la page Discussion Wiktionnaire:Bot/Requêtes (qui est amené à grandir) contient déjà 2 sections... la première contient 5 propositions de changement et la seconde en liste plus de 25 ! Certaines de ces propositions sont injustifiées ({{-étym-|fr}}), inutiles ({{Suisse|es}}) !?! Je souhaiterais vivement qu'on traite une à une les propositions de cette page.
Ce que demande Quentin57, c'est qu'on l'aide à y voir plus clair. Il veut être sûr de ne pas faire n'importe quoi avec son puissant robot.
Bonjour, Travaillant surtout sur Wikipédia, j'ai été amené ponctuellement à consulter l'article à reculons du Wiktionnaire. J'ai remarqué que la section « Références » de cet article donne des indications et des liens externes vers le Dictionnaire de l’Académie Française, huitième édition (1932-1935). Les deux liens externes aboutissent sur le site du CNRTL à « Cette forme est introuvable ». En fait, il faudrait faire un lien externe vers la forme « reculons (à) », pour ce qui concerne le dictionnaire de l'Académie, dont le lien externe est http://www.cnrtl.fr/definition/academie8/reculons%20(à). Curieusement, sur le même site du CNRTL, le TLFi retient la forme légèrement différente « reculons à » dont le lien externe est http://www.cnrtl.fr/definition/reculons%20à. Je ne maîtrise pas du tout les règles du Wiktionnaire et me permets seulement de signaler ce point. Geralix26 octobre 2009 à 20:44 (UTC)
Tu as bien fait. Je pense que les liens vers le DAF sont créés par un bot d’import, d’où l’erreur (fouettez-moi si je suis en train d’insulter ceux qui ont tout importé manuellement). Corriger avec un bot me semble un peu difficile (le bot devrait envoyer des requêtes au CNRTL et regarder les résultats… mouais) --Eiku (d) 26 octobre 2009 à 21:51 (UTC)
Ce serait bien si on avait un gadget similaire sur le Wiktionnaire (quoique plus discret, en créant simplement un lien sur les mots surlignés). — Dakdada(discuter)27 octobre 2009 à 09:18 (UTC)
Merci, je l'ai copié : il est désormais disponible dans nos gadgets. Il faudrait par contre l'améliorer, notamment pour pouvoir faire des liens vers des locutions. — Dakdada(discuter)27 octobre 2009 à 10:08 (UTC)
Par contre c'est un peu trop invasif d'avoir une bulle qui apparaît à chaque double clic…Ce qu'il faudrait c'est plutôt un petit cadre qui s'afficherait dans la colonne de gauche, dès qu'on sélectionne un élément (au lieu de double-cliquer). — Dakdada(discuter)27 octobre 2009 à 12:36 (UTC)
Moi j'aime bien le cadre mais quand je double-clique sur des mots italiens, je ne trouve jamais mon bonheur dedans…Le langage est donc un paramètre essentiel (ensuite on verra pour n'afficher que l'étymologie ou les traductions en fonction de ce script d'importation). JackPotte27 octobre 2009 à 13:00 (UTC)
La principale amélioration à apporter (tu l'as peut-être déjà faite) serait d'inverser la capitalisation de la première lettre pour réessayer quand on ne trouve pas le mot. Et l'idéal serait que ce soit intégré, ou intégrable, dans les navigateurs pour être disponible automatiquement sur tous les sites du monde. Et aussi qu'on puisse définir une liste de langues préférées, par ordre de préférence, pour qu'il aille chercher en priorité dans les wiktionnaires écrits dans ces langues. Lmaltier27 octobre 2009 à 17:19 (UTC)
Je suis d’accord avec Darkdadaah : sélectionner permettrait pour beaucoup de mots français d’exclure le 's' des mots au pluriel, et d’avoir ainsi une définition au lieu de « pluriel de … » (sans parler des locutions). --Eiku (d) 30 octobre 2009 à 16:52 (UTC)
Quand on regarde le code source (HTML) des pages du Wiktionnaire, on se rend vite compte que les caractères spéciaux prennent une place énorme : 2000 lignes de codes sur 2300, soit 88% en nombre de caractères (sur la page que je modifie en ce moment) ! Autrement dit, on charge à chaque fois 10 fois plus de code que ce dont on a besoin. Si on considère que 1 Mo de données correspond au contenu d'un dictionnaire simple, alors à chaque page modifiée (et rafraîchie) on télécharge plus d'un cinquième de dictionnaire ! Ça fait un peu beaucoup.
Les caractères spéciaux sont chargés à chaque fois qu'on modifie une page, alors qu'on les utilise rarement, ou seulement une partie ; bref la plupart du temps ils sont plus encombrants qu'utiles, ils pompent une grosse partie de la bande passante et les pages se chargent lentement, surtout pour les petites connexions (ils ne sont même pas mis en cache...). Vraiment pas terrible.
Ne serait-il pas préférable de réduire la liste des caractères spéciaux au strict minimum (alphabet latin français, API, modèles, autres alphabets simples) et de rajouter le reste à l'aide de gadgets, comme c'est fait sur Wikipédia ? Certes, il faudra être identifié pour utiliser les gadgets et utiliser les caractères, mais c'est fort peu payer pour ce que ça coûte en ce moment (surtout si on en rajoute encore). Au moins, les différents alphabets seront modifiables séparément et on ne chargera que ceux qu'on veut utiliser, en les sélectionnant facilement dans nos préférences. — Dakdada(discuter)27 octobre 2009 à 16:10 (UTC)
J’avoue ne pas saisir du tout de quoi tu parles. Quand le fureteur brasse de l’Unicode, tous les caractères se valent, et le rendu dépend des polices installées localement. Qu’est-ce que ça a à voir avec le code source ? Urhixidur27 octobre 2009 à 17:00 (UTC)
Il s'agit des listes de caractères, dont certaines cachées, situées en dessous des fenêtres d'édition. Effectivement, c'est un problème très sérieux pour certains utilisateurs (ça l'était pour moi avec mon ancien ordinateur, ça devenait de plus en plus insupportable). On peut en dire autant, malheureusement, de la table des matières des catégories pour le français. La solution proposée me semble intéressante, mais il faudrait que ce soit vraiment ultra-simple pour les utilisateurs. Lmaltier27 octobre 2009 à 17:14 (UTC)
Oui, mais en laissant tout de même un ensemble de caractères spéciaux très courants et difficiles à taper, typiquement les lettres accentuées français (éàùï... et leurs majuscules), les apostrophes typographiques, guillemets et autres signes de ponctuation plus ou moins courant en français ou dans la plupart des langues. Je ne suis pas sûr qu'il faille en mettre beaucoup plus par défaut, à part quelques modèles courants, et encore.
Puisque ça se fera par l'intermédiaire des gadgets, il n'y aura alors rien de plus simple : il suffira de cocher les cases des groupes de caractères spéciaux que l'on souhaite avoir. — Dakdada(discuter)27 octobre 2009 à 18:49 (UTC)
Le problème n'est pas la tâche en elle-même, c'est que pour la réaliser il me faudrait le statut de développeur. Et là, je peux toujours rêver -- Quentinv57✍28 octobre 2009 à 09:00 (UTC)
NB: Cela dit, si on ne trouve pas le moyen de le mettre en cache (ça m'étonnerait qu'on y arrive, franchement), je suis pour mettre la liste dans un gadget uniquement comme proposé ci-dessus. Pour ma part, j'ai déja modifié des pages en grec et ajouté des prononciations, et je n'ai jamais pour autant eu besoin de cet outil
Tu parles des pages en cours de modification. C'est vrai que c'est volumineux, et pénalisant : au minimum 3 secondes pour charger une page (et parfois davantage). Stephane8888Discuter28 octobre 2009 à 08:50 (UTC)
Ça va prendre un peu de temps, car les fonctions javascript de notre boîte d'outils sont un peu obsolètes. Je vais les remplacer par ce qu'il y a sur Wikipédia, ce sera plus propre. — Dakdada(discuter)28 octobre 2009 à 14:54 (UTC)
Pour taper les caractères spéciaux, j’utilise ça, maintenant. Ça marche pas pour tous les systèmes, mais quand ça marche, ça vaut le coup. --Eiku (d) 28 octobre 2009 à 23:17 (UTC)
En parlant de ça, moi j'utilise SCIM (sous Linux) qui me permet d'écrire en API en tapant du X-SAMPA. Il doit être possible d'écrire dans tous les autres scripts, mais ça nécessite la connaissance des autres alphabets. — Dakdada(discuter)30 octobre 2009 à 15:29 (UTC)
Ah, oui, j’ai aussi ça avec UIM, mais ça impose de connaître X-SAMPA… Ceci dit, il serait peut-être temps que je m’y mette . --Eiku (d)
Réduction drastiquedraconienne du poids des pages
Je n'ai fait que la première étape de conversion (mise à jour des fonctions) et les pages ont déjà perdu 75% de leur poids… (c'est Wikimédia qui va nous dire merci). J'ai l'impression qu'elles se chargent beaucoup plus vite chez moi (je parle des pages de modification).
Une seconde étape serait de reléguer certaines pages de caractère dans des gadgets, et de filtrer les caractères à garder en dehors du menu déroulant, ceux que l'on juge les plus importants (je suis sûr qu'on n'a pas besoin souvent de † ou ‡ par exemple, et que {{{}}} ne doit pas servir à grand monde).
Mais avant ça il faudrait vérifier que tout marche aussi bien qu'avant : merci donc de prévenir s'il y a des problèmes. N'oubliez pas de vider vos cache !). — Dakdada(discuter)31 octobre 2009 à 16:04 (UTC)
Est-ce normal ? Une grande partie des caractères spéciaux semble avoir disparu lorsqu'on est dans la rubrique "Modifier" (d'un article). Difficile alors d'indiquer par exemple la prononciation d'un mot en phonétique internationale. Danjafrez31 octobre 2009 à 22:01 (UTC)
Bravo excellent initiative (certains serveurs sont un peu surchargés en ce moment, notamment ceux de Commons, il pourrait y avoir quelques problèmes d’affichage des images, rien de grave, surtout que des nouveaux serveurs sont déjà commandés). Par contre chez moi je ne vois aucune changement. De plus, serait-il possible de désactiver complètement ces caractères via un gadget (je ne m’en sers jamais jamais). Cdlt, VIGNERON * discut.1 novembre 2009 à 12:08 (UTC)
Si tu ne vois aucun changement, tant mieux, le but de la première étape était de changer la partie technique seulement (tout au plus devrais-tu sentir un chargement plus rapide de la page).
Soit dit en passant, « drastique » est un anglicisme dans cet usage (le mot français n’a qu’un sens technique en pharmacologie). Il vaut mieux dire « draconien ». Urhixidur4 novembre 2009 à 14:39 (UTC)
Problèmes de performance (2) : catégories et modèles
Je profite qu'on parle des problèmes de performance liés au poids des pages pour réaborder un autre problème : l'utilisation des catégories et des modèles a un coût, qu'il faut mettre en regard avec leur utilité (ou inutilité, souvent). Par exemple, ouvrez en modification des pages comme Inde (ou India, mais c'est moins énorme) et allez voir la liste des modèles utilisés et la liste des catégories. Quelques propositions :
Pour les modèles de langues, on pourrait faire un grand pas en n'utilisant plus que les modèles du genre fr (et pas fr/type), ce qui diviserait presque par deux le nombre de modèles utilisés (et donc le nombre de pages accédées). Dakdada a déjà fait une proposition dans ce sens.
Pour les autres modèles, veiller à ne pas créer de modèles sans en avoir discuté et pesé le pour et le contre, y compris du point de vue performance (même s'il peut y avoir des cas évidents)
Même chose pour les modifications de modèles qui les rendent plus compliqués.
Pour les catégories, c'est pareil, il faut penser à la fois à l'utilité réelle qu'elles peuvent avoir (être certains qu'elles seront vraiment utilisées), ainsi qu'à l'impact sur les performances, avant de rajouter des catégories.
Je ne suis pas sûr que la surutilisation des catégories ait un impact tellement important en terme de performances. Par contre, en ce qui concerne les modèles, je suis tout à fait d'accord avec toi -- Quentinv57✍27 octobre 2009 à 19:32 (UTC)
Remplacer les modèles du site (avec un robot une fois, puis des {{subst:...}} à chaque nouvel article) serait en effet intéressant les contributeurs bas débit, et surtout ceux n'ayant pas le temps d'apprendre nos centaines de modèles par cœur (et ceux qui passent derrière en patrouille RC). JackPotte27 octobre 2009 à 20:10 (UTC)
Non, je m'y oppose fortement. Inclure les modèles directement dans les pages ne permettra plus de lister toutes les pages contenant ce modèle. Et comme un exemple vaut mieux qu'un long discours : une page contenant {{subst:-drv-}} au lieu de {{-drv-}} n'apparaîtra plus dans cette liste. Et adieu les modifications à grande échelle ! -- Quentinv57✍28 octobre 2009 à 09:10 (UTC)
Avec la fréquence relativement élevée des dumps ces derniers temps, c'est un peu moins un problème. Mais on perdrait surtout les avantages des modèles, qui évitent aussi de repasser sur toutes les pages à chaque fois qu'on veut changer un petit truc. Ce n'est pas l'idéal, mais c'est le mieux qu'on ait pour le moment.
Je suis du même avis que toi en ce qui concerne le renommage de ces modèles. Par contre, tu viens de dire une abération en ce qui concerne les modèles : te rends-tu compte du travail supplémentaire que demande l'exploitation d'un dump, quand on peut se servir de listes toutes faites ? -- Quentinv57✍28 octobre 2009 à 10:39 (UTC)
J'ai dit « un peu moins » seulement ^^ En fait quand il s'agit de traiter des grandes listes, je préfère en général créer d'abord une liste à partir du dump avant de passer par les liens vers le modèle pour la finition, mais c'est juste ma manière de faire. Ça ne me fait pas grand chose de plus à faire (il faudrait que je pense à publier mes scripts d'ailleurs). — Dakdada(discuter)28 octobre 2009 à 10:53 (UTC)
Il y a un problème avec le modèle fr-conj-1, avec certains verbes les première et deuxième personnes de l’indicatif imparfait ont des prononciations erronées. Par exemple acheter : nous achetions /nu.z ͜ a.ʃə.tɔ̃/ vous achetiez /vu.z ͜ a.ʃə.te/. --moyogo/ ⁽ᵈⁱˢᶜᵘᵗᵉʳ⁾27 octobre 2009 à 22:00 (UTC)
Je me suis attaqué au premier problème, et le modèle fonctionne maintenant sauf dans un cas : les formes en /j/ final aux temps ind.i.1p, 2p et sub.p.1p, 2p. Spécifiquement :
bailler (pron=ba|pc=j) donne : baillions /ba.i.jjɔ̃/, bailliez /ba.i.jje/ → /ba.jie/
crier (pron=kʁi|e=non|j=j) donne : criions /kʁi.jjɔ̃/, criiez/kʁi.jje/ → /kʁi.jie/
grasseyer (pron=ɡʁa.sɛ|pc=j) donne : grasseyions /ɡʁa.sɛ.i.jjɔ̃/, grasseyiez /ɡʁa.sɛ.i.jje/ → /ɡʁa.sɛ.jie/
méfier (pron=me|pc=f|ill=i|j=fj) donne : méfiions /me.fjjɔ̃/, méfiiez /me.fjje/ → /me.fi.je/
méfier a aussi un problème au cond.p et ind.fs, car on a partout /me.fjə.…/ au lieu de /me.fi.…/ (ça doit relever des paramètres utilisés)
ployer (pron=plwa|j=j|e=non) donne : ployions /plwa.i.jjɔ̃/, ployiez /plwa.i.jje/ → /plwa.jie/
ployer a aussi un problème au ind.fs et cond.ps, car on a partout /plwa..…/ au lieu de /plwa.…/
rayer (en y) (pron=ʁɛ|pc=j) donne : rayions /ʁɛ.i.jjɔ̃/ et rayiez /ʁɛ.i.jje/ → /ʁɛ.jie/
rayer (en i) (pron=ʁɛ|j=j|e=non) a aussi un problème au ind.fs et cond.ps, car on a partout /ʁɛ..…/ au lieu de /ʁɛ.…/
scier (pron=|pc=s|ill=i|j=sj) donne : sciions /sjjɔ̃/, sciiez /sjje/ → /si.je/
torréfier (pron=tɔ.ʁe|pc=f|ill=i|j=fj) donne : torréfiions /tɔ.ʁe.fjjɔ̃/, torréfiiez /tɔ.ʁe.fjje/ → /tɔ.ʁe.fi.je/
torréfier a aussi un problème au ind.fs et cond.ps, car on a partout /tɔ.ʁe.fjə.…/ au lieu de /tɔ.ʁe.fi.…/
Les autres cas types sont parfaits. Va falloir examiner ça soigneusement pour corriger sans casser le reste. (Les liaisons ne sont pas affichées non plus, mais c’est un problème distinct) Urhixidur28 octobre 2009 à 14:41 (UTC)
Donc il semble que lorsque pc=j, ces finales sont /pron.jiɔ̃/, /pron.jie/ (la pc disparaît). La seule alternative est représentée par les verbes dont le radical se termine par un i (méfier, scier, torréfier), car alors la finale en /…i.jie/ devient /…i.je/. J’ai bon espoir d’évacuer 'ill' du modèle. Urhixidur28 octobre 2009 à 19:42 (UTC)
Ce ne serait pas mieux de créer un modèle spécifique pour les verbes en -ier, -iller, -yer, plutôt que de complexifier encore plus fr-conj-1 ? — Dakdada(discuter)28 octobre 2009 à 20:37 (UTC)
J’ai la ferme intention de simplifier fr-conj-1 plutôt que de le compliquer. Je bidouille ça à part ({{fr-conj-1-alt}}) pour ne pas casser plus ce qui l’est déjà assez comme ça. Pour ce qui est du problème des liaisons évoqué plus tôt, c’est ma police Code2000 qui avait besoin d’être mise à jour à la version 1.17 (j’avais 1.13 et le caractère de liaison diacritique double brève souscrite n’y apparaissait pas). Urhixidur30 octobre 2009 à 15:22 (UTC)
Merci de vous attaquer à ça. Il y avait des problèmes au modèle du premier groupe, ce que ça faisait n'était pas 100 % conforme à l'aide, mais j'avais renoncé à changer devant la difficulté de comprendre le code. Pour ce qui est de plusieurs modèles pour le premier groupe, je pense que, si le nom des paramètres est rendu plus clair, et que l'utilisation est très bien expliquée, un seul peut suffire (sauf pour les dérivés d'envoyer). Et pour le deuxième groupe aussi, un seul modèle suffit (mais ça ne suffit évidemment pas dans le cas du troisième groupe). Cela a le gros avantage de n'avoir à s'habituer qu'à un seul modèle. D'un autre côté, cela le rend nécessairement plus compliqué, et c'est un problème très sérieux quand on veut le modifier. En tout cas, je pense qu'il ne fait surtout pas le compliquer encore. Pour les cas un peu compliqués, et en particulier les locutions du genre s’en moquer, on pourrait prévoir un modèle général qui ne s'occuperait que de présentation, et auquel il faudrait passer explicitement toutes les formes. C'est mieux que de vouloir compliquer à outrance en rendant le code incompréhensible. Un modèle qui ne peut être modifié que par son auteur, c'est une vraie catastrophe pour le projet. Lmaltier31 octobre 2009 à 11:18 (UTC)
Bouton de la barre de recherche : "consulter" ou "lire" ?
Bonjour. Sur translatewiki (wiki pour traduire l'interface de MediaWiki), Delhovlyn avait changé le bouton en « lire » par défaut en février, suite au sondage qui avait obtenu un consensus total. Vous avez donc déjà eu le bouton lire durant plusieurs mois. Verdy p pense, à raison, que les autres wikis francophones ont leur mot à dire, et doivent être consultés au sujet de ce changement. Par contre, il a réverté Delvhovlyn et a remis « consulter », sans vous demander votre avis. :(
permet de mieux différencier « consulter » de « lire », plusieurs anciens Wikipédiens ont témoigné qu'ils n'arrivaient pas à faire la différence auparavant.
J'ajoute que ce serait bien d'harmoniser les wikis francophones à ce niveau. Voilà, j'ai laissé un message sur tous les wikis francophones pour leur demander si ils veulent adopter le bouton « lire ». Amicalement, Dodoïste31 octobre 2009 à 10:39 (UTC)
Je n'en avais pas conscience. Je ne vois pas d'inconvénient à utiliser Lire, et ça permet effectivement de mieux différencier les deux boutons Lire et Rechercher. Lmaltier31 octobre 2009 à 11:05 (UTC)
Bilan des avis 9 pour et 1 neutre. Sur les 6 wikis, 4 montrent une approbation, les 2 autres n'ont pas répondu. Vu que la plupart des wikis sont d'accord, et qu'il n'y a aucune opposition, j'ai changé le bouton en lire. La modification devrait prendre effet dans un ou deux jours. Amicalement, Dodoïste2 novembre 2009 à 11:50 (UTC)
Pour les translittérations. Au lieu de le faire à la main comme on le fait maintenant. Il pourrait resembler fortement au Modèle:pron, avec une police et un lien pour chaque langue, si la sous-section existe. Je vois beaucoup d'avantages. Seul problème, l'insérer dans les pages. Mglovesfun (disc.) 31 octobre 2009 à 15:11 (UTC)
Je vois que tu as dit que c'était demandé par le Wiktionnaire, en faisant référence à un vote. Mais le vote ne concernait pas du tout ça. Lmaltier2 novembre 2009 à 21:36 (UTC)