De ce que j’ai pu voir dans le Wiktionnaire jusqu’à présent, il y a trois domaines différents qui permettent de classer les articles :
Actuellement, si les catégories grammaticales sont à peu près bien cernées (avec quand même de nombreux problèmes), c’est loin d’être le cas des autres catégories. Ce travail a donc pour but de clarifier ces catégories, et de savoir quelle est la place exacte des lexiques, des thématiques et des annexes.
La première chose à prendre en compte est le nombre de niveaux d’inclusion des catégories. Certaines en ont sept, huit, voire plus. Ça n’a plus aucun sens. Il faut absolument les limiter à trois ou quatre maximum. Dans cette optique, il faut choisir un ordre de priorité. Soit les langues arrivent en dernier, soit ce sont les catégories. En fin de compte, les deux systèmes se valent, à l’inverse de ce que je pensais au début. Mais il faut faire un choix. Actuellement, ils se croisent, donnant des choses parfois bizarres. Exemple : les locutions. Il y a à la fois les différents types de locutions et les langues. Tout est mélangé. Dans les langues, il y a les types de locutions, et dans les types de locutions, il y a les langues. Résultat : BORDEL COMPLET !!!
La deuxième est que certaines langues possèdent des catégories grammaticales ou subgrammaticales qui leur sont propres. Il faut aussi prendre en compte ces cas uniques et créer les modèles correspondants, comme cela a été fait en français.
La troisième chose est que lorsque des catégories sont créées, elles sont elles-mêmes indexées dans d'autres catégories, comme par exemple les lexiques. Théoriquement, il y a un paramètre otpionnel pour ranger le lexique par ordre alphabétique. Malheureusement, il y a trois cas : soit il n’y a rien, soit il y a le mot avec une minuscule, soit il y a le mot avec une majuscule. On retrouve les trois cas, traités n’importe comment. Il faut donc trouver un système qui empêche ce genre d’erreurs tout à fait normales.
En français, il y a 9 catégories grammaticales : adjectifs, adverbes, articles, conjonctions, interjections, noms, prépositions, pronoms, verbes.
À cela se rajoutent : classificateurs, corrélatifs, particules, postpositions.
Par contre, ne sont pas des catégories grammaticales : abréviations, acronymes, apocopes, affixes, déterminants, inflexions, locutions, niveaux de langue, noms de domaine internet, onomatopées, préfixes, sigles, suffixes...
Ce sont des catégories qui ne contiennent pas des classes grammaticales proprement dites, mais qui classent néanmoins les mots en fonction de leur forme.
On voit donc qu’une catégorie se rapporte plus à des mots, alors que la thématique se rapporte à une idée. Dit en d’autres termes, la catégorie se rapporte au référé, alors que la thématique se rapporte au référent. Pour le lexique, rien n'est précisé, ce n’est qu’une liste alphabétique. L’annexe, elle, vient se rajouter à quelque chose existant déjà. Ce n’est donc pas un système de classification.
Pour l’instant, il y a une séparation en deux : les lexiques et les thématiques. Il vaut mieux enlever cette distinction, d’autant plus que le mot "Thématiques" est utilisé incorrectement pour l’instant.
Ce qui existe déjà (entre parenthèses, le nombre de langues qui utilisent la catégorie) :
RÉSULTAT : 4329 catégories le 31/07/2006 à 23 h 28.
Les lexiques qui existent déjà (74 différents) : agriculture, anatomie, architecture, art, astronomie, bijouterie, biochimie, biologie, biologie cellulaire, botanique, bourse, chasse, chimie, chirurgie, cinéma, climat, coiffure, communication, cosmétique, couture, cuisine, culture, danse, économie, éducation, électronique, emploi, équitation, famille, génétique, géographie, géologie, géométrie, géophysique, Guerre de Étoiles, héraldique, histoire, histologie, informatique, justice, linguistique, littérature, loisirs, marine, mathématiques, mécanique, médecine, musique, navigation, paléontologie, peinture, philosophie, physique, politique, psychologie, religion, sciences, scolarité, sédimentologie, sentiments, sport, statistiques, sylviculture, tauromachie, temps, textile, traditions, transports, travail, urbanisme, ustensiles, zoologie.
De façon à être le plus logique possible et à ne plus laisser de place à la création intempestive de catégories redondantes, je propose de ne plus faire de distinction entre « Lexiques » et « Thématiques ». En effet, pour l’instant, ce qui est appelé Thématiques ne sont en réalité que des lexiques sur un sujet précis, alors que ce qui est appelé Lexiques sont des lexiques sur un thème plus large. C’est plus une source de confusions qu’autre chose, même si l’idée était très bonne au départ. D’où les quelques règles suivantes.
L’ensemble des catégories est divisé en trois parties : Grammaire, Autres et Thématiques, plus les caractères et les conventions internationales.
Caractères {{=car=}} Conventions internationales {{=conv=}}
NOTE : Il faudra changer le modèle car pour qu’il soit homogène. Ce qui est logique, dans la mesure où un caractère ne se rapporte pas à une langue en particulier (sans cas spéciaux, comme ß), sauf en ce qui concerne sa prononciation.
Classes grammaticales ├ Adjectifs {{-adj-|xx}} ├ Adejctifs comparatifs (de, en...) {{-adj-|xx|comp}} ├ Adejctifs indéfinis {{-adj-|xx|indef}} ├ Adjectifs numéraux {{-adj-|xx|num}} ├ Cardinaux {{-adj-|xx|card}} └ Ordinaux {{-adj-|xx|ord}} ├ Adjectifs possessifs {{-adj-|xx|pos}} ├ Adjectifs qualificatifs {{-adj-|xx|qual}} ├ Adjectifs d’appartenance (ru) {{-adj-|xx|app}} ├ Adjectifs courts (ru) {{-adj-|xx|court}} ├ Adjectifs en na (ja) {{-adj-|xx|na}} ├ Adjectifs en no (ja) {{-adj-|xx|no}} ├ Adjectifs toponymiques {{-adj-|xx|topo}} ├ Adjectifs variables (ja) {{-adj-|xx|var}} ├ Adejctifs superlatifs (de, en...) {{-adj-|xx|super}} └ Locutions adjectivales {{-adj-|xx|loc}} ├ Adverbes {{-adv-|xx}} └ Locutions adverbiales {{-adv-|xx|loc}} ├ Articles {{-art-|xx}} ├ Articles définis {{-art-|xx|def}} ├ Articles indéfinis {{-art-|xx|indef}} └ Articles partitifs {{-art-|xx|part}} ├ Classificateurs {{-clas-|xx}} ├ Conjonctions {{-conj-|xx}} ├ Conjonctions de coordination {{-conj-|xx|c}} └ Conjonctions de subordination {{-conj-|xx|s}} └ Locutions conjonctives {{-conj-|xx|loc}} ├ Corrélatifs {{-corr-|xx}} ├ Interjections {{-int-|xx}} └ Locutions interjectives {{-int-|xx|loc}} ├ Noms communs {{-nom-|xx}} └ Locutions nominales {{-nom-|xx|loc}} ├ Noms propres {{-nom-|xx|pr}} └ Locutions nominales {{-nom-|xx|locpr}} ├ Particules {{-part-|xx}} ├ Postpositions {{-post-|xx}} ├ Prépositions {{-prep-|xx}} └ Locutions prépositives {{-prep-|xx|loc}} ├ Pronoms {{-pronom-|xx}} ├ Pronoms démonstratifs {{-pronom-|xx|dem}} ├ Pronoms indéfinis {{-pronom-|xx|indef}} ├ Pronoms interrogatifs {{-pronom-|xx|int}} ├ Pronoms personnels {{-pronom-|xx|pers}} ├ Pronoms possessifs {{-pronom-|xx|poss}} ├ Pronoms relatifs {{-pronom-|xx|rel}} └ Locutions pronominales {{-pronom-|xx|loc}} └ Verbes {{-verb-xx}} ├ Verbes du premier groupe (es, fr, it) {{-verb-|xx|1}} ├ Verbes du deuxième groupe (es, fr, it) {{-verb-|xx|2}} ├ Verbes du troisième groupe (es, fr, it) {{-verb-|xx|3}} ├ Verbes irréguliers (de, en, nl) {{-verb-|xx|irr}} ├ Verbes forts (de, en, nl) {{-verb-|xx|fort}} ├ Verbes faibles (de, en, nl) {{-verb-|xx|faible}} ├ Verbes déponents (el, grc, la) {{-verb-|xx|dep}} ├ Verbes de mouvement (ru) {{-verb-|xx|mouv}} └ Locutions verbales {{-verb-|xx|loc}}
NOTE 1 : Tous les modèles {{-adj-...-}}, {{-pronom-...-}}... disparaissent pour ne garder que les classes grammaticales de base. Même {{-nom-pr-}} disparaît aussi. Les locutions ne forment pas une classe grammaticale, mais elles seront quand même rassemblées dans une catégorie "Locutions".
NOTE 2 : Les modèles {{-adj-}}, {{-adj-|xx|num}}, {{-art-}}, {{-conj-}} et {{-pronom-}} ne devraient plus (en théorie) être utilisés du tout. Mais je ne suis pas sûr que tout le monde connaisse les subtilités de chaque langue...
Contient les catégories non-grammaticales, mais qui répartissent les mots en fonction de leur forme (et qui ne rentrent dans aucune thématique).
Autres ├ Abréviations {{C|xx|abr}} ├ Acronymes {{C|xx|acr}} ├ Expressions {{C|xx|exp}} ├ Figures de style {{C|xx|figure}} ├ Linguistique {{C|xx|ling}} ├ Noms de domaine internet {{C|xx|internet}} ├ Noms de langues {{C|xx|langue}} ├ Noms de sciences {{C|xx|science}} ├ Onomatopées * {{-onoma-|xx}} ├ Palindromes {{C|xx|pal}} ├ Périphrases {{C|xx|péro}} ├ Ponctuation {{C|xx|ponct}} ├ Préfixes * {{-pref-|xx}} ├ Proverbes * {{-prov-|xx}} ├ Sigles {{C|xx|sigle}} └ Suffixes * {{-suf-|xx}}
NOTE : Bien que les onomatopées, préfixes, proverbes et suffixes ne soient pas des classes grammaticales, je pense qu’on peut conserver les modèles déjà en place.
Art ├ Architecture {{C|xx|architecture}} ├ Bijouterie {{C|xx|bijouterie}} ├ Cinéma {{C|xx|cinéma}} ├ Danse {{C|xx|danse}} ├ Dessin {{C|xx|dessin}} ├ Musique {{C|xx|musique}} ├ Peinture {{C|xx|peinture}} └ Sculpture {{C|xx|sculpture}} Culture ├ Argot {{C|xx|argot}} ├ Armes {{C|xx|armes}} ├ Bourse {{C|xx|bourse}} ├ Calendrier {{C|xx|calendrier}} ├ Chasse {{C|xx|chasse}} ├ Coiffure {{C|xx|coiffure}} ├ Cosmétique {{C|xx|cosmétique}} ├ Couleurs {{C|xx|couleur}} ├ Cuisine {{C|xx|cuisine}} ├ Aliments {{C|xx|aliment}} └ Boissons {{C|xx|boisson}} ├ Économie {{C|xx|économie}} ├ Éducation {{C|xx|éducation}} ├ Emploi {{C|xx|emploi}} ├ Famille {{C|xx|famille}} ├ Francophonie {{C|xx|francophonie}} ├ Justice {{C|xx|justice}} ├ Loisirs {{C|xx|loisir}} ├ Métiers {{C|xx|métier}} ├ Mobilier {{C|xx|meuble}} ├ Mots inventés {{C|xx|inventé}} ├ Néologismes {{C|xx|néologisme}} ├ Philosophie {{C|xx|philosophie}} ├ Politesse {{C|xx|politesse}} ├ Politique {{C|xx|politique}} ├ Religions {{C|xx|religion}} ├ Sentiments {{C|xx|sentiment}} ├ Sports {{C|xx|sport}} ├ Tauromachie {{C|xx|tauromachie}} ├ Textiles {{C|xx|textile}} ├ Traditions {{C|xx|tradition}} ├ Véhicules {{C|xx|véhicule}} └ Vêtements {{C|xx|vêtement}} Histoire-Géographie ├ Archéologie {{C|xx|archéologie}} ├ Gentilés {{C|xx|gentilé}} ├ Héraldique {{C|xx|héraldique}} ├ Pays {{C|xx|pays}} ├ Termes géographiques {{C|xx|géographie}} ├ Urbanisme {{C|xx|urbanisme}} └ Villes {{C|xx|ville}} Sciences et techniques ├ Aéronautique {{C|xx|aéronautique}} ├ Agriculture {{C|xx|agriculture}} ├ Astronomie {{C|xx|astronomie}} ├ Biologie {{C|xx|biologie}} └ Biologie cellulaire {{C|xx|biologieC}} ├ Botanique {{C|xx|botanique}} ├ Céréales {{C|xx|céréale}} ├ Fleurs {{C|xx|fleur}} ├ Fruits {{C|xx|fruit}} ├ Légumes {{C|xx|légume}} └ Plantes {{C|xx|plante}} ├ Chimie {{C|xx|chimie}} ├ Biochimie {{C|xx|biochimie}} ├ Géologie {{C|xx|géologie}} ├ Informatique {{C|xx|informatique}} ├ Marine {{C|xx|marine}} ├ Mathématiques {{C|xx|mathématiques}} ├ Médecine {{C|xx|médecine}} ├ Anatomie {{C|xx|anatomie}} ├ Chirurgie {{C|xx|chirurgie}} ├ Pathologie {{C|xx|pathologie}} └ Psychologie {{C|xx|psychologie}} ├ Physique {{C|xx|physique}} ├ Électronique {{C|xx|électronique}} ├ Mécanique {{C|xx|mécanique}} ├ Optique {{C|xx|optique}} └ Zoologie {{C|xx|zoologie}} ├ Animaux {{C|xx|animal}} ├ Batraciens {{C|xx|batracien}} ├ Insectes {{C|xx|insecte}} ├ Mammifères {{C|xx|mammifère}} ├ Oiseaux {{C|xx|oiseau}} ├ Poissons {{C|xx|poisson}} └ Reptiles {{C|xx|reptile}}
En pratique : Comment seront classés les mots ?
PREMIÈRE CHOSE TRÈS IMPORTANTE : L’indexation grammaticale ne sera plus faite par les contributeurs mais sera automatique. Pour ce faire, un moyen très simple : changer tous les modèles grammaticaux et leur adjoindre un paramètre de langue. Par exemple : {{-nom-|fr}} indexera automatiquement un nom commun en français. Il faudra trouver un système automatique de désaccentuation du mot pour le classer correctement par ordre alphabétique. Encore une chose à laquelle le contributeur n’aura plus à penser... Ainsi, il ne lui restera plus qu’à trouver la catégorie thématique la mieux appropriée.
Exemples :
On peut se laisser surprendre par la longueur des noms, mais d’une part, il n’y aura pas plus de catégories qu’avant, et d’autre part, une dénomination comme "français/Thématiques/Sciences et techniques/Zoologie/Animaux" sera un peu plus logique que "Animaux en français". De plus, cela permettra de faire en sorte que les catégories soient TOUJOURS rangées correctement.
Lors de la création des catégories, il faudrait qu’un robot surveille que la catégorie existe bien. Sinon, il faudra lui mettre les paramètres suivants :
Exemple : Création de ]. Elle contient (pour l’instant) uniquement "Locutions nominales".
Il y aura donc :
NOTE : La catégorie "Noms communs" ne devra jamais rien contenir d’autre que la liste des langues dans lesquelles des noms communs ont été référencés. Cette catégorie ne sera jamais utilisée dans des articles.