Il y a plusieurs manières d'appréhender la flexion des substantifs finnois. Le dictionnaire de KOTUS (une référence très respectée, et qui sera utile au projet), par exemple, utilise un système de 51 classes de substantifs, avec des sous-classes! Toutefois, plusieurs de ces classes sont très similaires les unes aux autres. Il y a des tonnes de classes possibles car il y a un ensemble de règles qui mène à des changements phonologiques et le choix d'une terminaison casuelle plutôt qu'une autre. Certaines règles s'appliquent simultanément, d'autres sont mutuellement exclusives. Mais il y a beaucoup moins de règles que de classes de paradigmes!
Pour comprendre le procédé de déclinaison, il faut commencer par comprendre le concept d'harmonie vocalique et de gradation consonantique. (J'appelle ça gradation consonantique par calque avec l'anglais consonant gradation; alternance consonantique est le terme moins anglicisant.) Il faut aussi comprendre un peu la syllabification, car c'est la structure syllabique qui détermine quand la gradation consonantique se produit.
Un détail important:
Ce document est un résumé des propriétés à prendre en compte pour illustrer le volume de travail à faire et introduire les concepts linguistiques essentiels. Ce n'est PAS le résultat d'une recherche approfondie sur tous les détails exactes de la flexion finnoise! Mais en principe, la recherche approfondie à faire pour le projet ne va pas révéler une grande quantité de travail supplémentaire. Elle va révéler que je dois définir les règles de flexion de manière plus précise et exhaustive que je ne l'ai fait jusqu'à présent. Elle va aussi révéler la présence plus ou moins élevées de paradigmes exceptionnels et aider à décider comment les intégrer, ou s'il vaut mieux les ignorer. Le travail de recherche supplémentaire va aussi permettre de mieux définir les étapes de dérivation et leur ordre.
But de cette section: expliquer grosso modo comment on passe d'une vedette d'entrée de dictionnaire à une flexion précise.
Pour passer d'un substantif finnois à son paradigme entier, ça aide de considérer le processus de dérivation comme un ensemble d'étapes. Il y a plus qu'un moyen de conceptualiser ces étapes, et l'ordre à suivre. L'ordre importe car il est susceptible de changer le résultat. Je crois que dériver les flexions finnoises à l'aide d'étapes serait plus facile que les dériver en appliquant un grand nombre de conditions simultanément, mais c'est peut-être à revoir. Voici une manière de concevoir ces étapes, juste pour contextualiser les concepts à introduire.
Voici les mêmes étapes, mais avec un mot précis (kana; «poulet»), décliné au partitif singulier.
Cet ordre n'est peut-être pas le meilleur pour la création de déclinaisons automatiques, ça sera à retravailler plus tard. C'est juste pour donner une idée. Cet exemple d'étapes sert aussi à contextualiser l'ordre dans lequel j'introduirai les concepts, soit:
But de cette section: expliquer le rapport entre la vedette de dictionnaire et la racine + illustrer dans quelle mesure on peut convertir une vedette en racine et vice versa.
Au début de la dérivation, la racine est identique à la forme nominative singulière la majorité du temps. Encore plus souvent, on peut déduire quelle est la racine en observant la forme nominative singulière, même si la racine est différente de la forme nominative singulière. La prévisibilité est à 100% et bidirectionnelle: quand la vedette finit par -ton, la racine finit toujours par -ttoma- et vice versa.
Par contre, parfois, prédire la racine en fonction de la forme nominative singulière n'est pas possible car plusieurs options sont possibles pour un même type de mot (ex: ceux qui terminent en -i). Dans ces cas, la prévisibilité de forme est unidirectionnelle: on peut prédire la forme nominative singulière en fonction de la racine, mais pas l'inverse. Il y a aussi des cas de racine irrégulière, et de ce que je me plais à appeler des racines semi-régulières (expliqué à la fin de la section)...
Dans la section qui suit, je vais utiliser FNS pour signifier «forme nominative singulière». Quand la ligne inclut "il y a X options", c'est qu'on entre dans le territoire où la prévisibilité de la forme devient unidirectionnelle.
Les grandes lignes de l'identification de la racine à cette étape sont les suivantes.
(Voici une version plus explicite de ce que l'organisation des points cherche à communiquer: on peut prédire les racines de tous les mots qui terminent soit en -nen, -in, ou -ton, et ça sera correct 100% du temps. Après avoir éliminé les mots en -nen, -in, et -ton, il reste quelques mots qui n'ont aucune de ces fins, mais terminent tout de même en -n. Tous ces mots restants ne sont pas tout à fait réguliers.)
Certaines racines sont irrégulières et c'est peine perdue d'essayer de les dériver à partir de la FNS, on se retrouverait avec une règle compliquée qui s'applique à un ou deux mots.
Certaines racines sont régulièr...esques. La règle est complexe, on voit plus qu'une version de la racine dans le paradigme, et il y a peu de mots concernés. C'est ce que j'appelle des racines "semi-régulières"; en fait, elles étaient régulières par le passé, et elles sont les fossiles des règles de déclinaison d'autrefois. À cause de ça, elles peuvent aussi parfois avoir plus de formes acceptables que la moyenne; ce faisant, elles combinent ce qui est acceptable dans plusieurs paradigmes. Toute cette complication concerne principalement des mots dont la fin de la FNS et/ou la racine est une consonne; donc sammal, manner, säen,... C'est une zone grise importante dans la création d'un engin de déclinaison automatique. Elles n'ont pas été relevées exhaustivement dans cette section; il faudrait faire une liste de mots précis et les comparer, pour mieux illustrer l'ampleur du défi qu'elles posent.
Une autre complication à relever, qui a un impact sur toute la déclinaison: une petite classe de mots composés ont deux racines susceptibles de changer lors de la déclinaison, et les formes déclinées prennent deux terminaisons casuelles. Dans ces cas peu fréquents, on se retrouve confrontés à quelque chose comme Uusi+maa → Uude-n+maa-n (-n = terminaison génitive singulière). Par comparaison, le cas de figure le plus commun, c'est un mot composé où il n'y a qu'une racine à relever pour la déclinaison, et qu'une terminaison casuelle à ajouter: iso+äiti → iso+äidi-n.
Référence: https://kaino.kotus.fi/sanat/nykysuomi/taivutustyypit.php
Ce premier tableau couvre tous les cas où la FNS et la racine sont identiques en début de dérivation. Résumé des fins possibles: toutes les voyelles courtes, toutes les voyelles longues, toutes les voyelles complexes. La bidirectionnalité ne cesse qu'avec i et e. (Toutes les combinaisons ne sont pas admissibles pour les voyelles complexes: il n'y aura jamais de mot en -öa ou -öy (?). ▲ Le tableau présent couvre les voyelles complexes principales mais n'est pas exhaustif.)
FNS | Racine | Exemple | Note |
---|---|---|---|
-a | -a | kala → kalan («poulet») | |
-o | -o | valo → valon («lumière») | |
-u | -u | pulu → pulun («pigeon») | |
-ä | -ä | kerä → kerän («cercle») | |
-ö | -ö | FNS & racine identiques | |
-y | -y | lyijy → lyijyn («plomb») | |
-e | -e | nalle → nallen («ourson») | prévisibilité unidirectionnelle, voir autres options pour -e dans les autres tableaux. |
-i | -i | risti → ristin («croix») | prévisibilité unidirectionnelle, voir autres options pour -i dans les autres tableaux. |
-aa | -aa | maa → maan («terre») | |
-oo | -oo | ? → ? («?») | j'en trouve pas, est-ce que ça existe? |
-uu | -uu | kuu → kuun («lune») | |
-ää | -ää | sää → sään («climat») | |
-öö | -öö | köö → köön («queue de billard») | |
-yy | -yy | kyy → kyyn («vipère») | |
-ii | -ii | pii → piin («silicone») | |
-ee | -ee | filee → fileen («filet») | à revoir, susceptible de se comporter irrégulièrement car ces mots sont surtout des emprunts? |
-ea | -ea | vaikea → vaikea («difficile») | |
-eä | -eä | tärkeä → tärkeän («important») | |
-ie | -ie | tie → tien («route») | |
-uo | -uo | suo → suon («marais») | |
-yö | -yö | työ → työ («travail») |
Ce deuxième tableau couvre tous les cas où la FNS et la racine diffèrent en début de dérivation.
□ = Racine illustrée avec une forme essive, pas génitive, parce que le génitif déclencherait la gradation et ça nuirait à la compréhension. (Genre FNS → forme génitive, ça donnerait käsi → käden, ça nuit à montrer le -te. Donc à la place c'est présenté käsi → katënä.)
FNS... | Racine | Exemple | Note |
---|---|---|---|
-e | -ee | hame → hameen («jupe») | prévisibilité unidirectionnelle! |
-e | -(e) | kantele → kantelen («kantele») | prévisibilité unidirectionnelle! forme semi-régulière! |
-i | -e | ovi → oven («porte») | prévisibilité unidirectionnelle! |
-i | -te | □ käsi → kätenä («main») | prévisibilité unidirectionnelle! (pas schématisable comme bidirectionnelle avec une approche type si → te non plus, parce qu'on trouve boksi → boksin, passi → passin, etc.) |
-mpi | -mpa | □ vanhempi → vanhempana («parent») | (prévisibilité unidirectionnelle lorsque schématisé comme i→a, mais bidirectionnelle lorsque schématisé comme mpi→mpa..??? ▲) |
-nen | -se | ihminen → ihmisen («personne») | |
- | - | → («») |
But de cette section: expliquer l'harmonie vocalique, qui contribue à déterminer les terminaisons casuelles acceptables pour un mot donné.
L'harmonie vocalique est un type d'assimilation. L'harmonie vocalique impose une certaine homogénéité sur les propriétés des voyelles, dans un domaine phonologique donné (par exemple, au sein d'un mot). Dans le cas du finnois, la propriété concernée est leur position avant/arrière.
Voici, en résumé, comment l'harmonie vocalique affecte la déclinaison en finnois: Les terminaisons casuelles ont souvent deux versions harmoniques, une avant et une arrière. Seule une version harmonique est acceptable pour un mot donné. Ce qui détermine quelle version est acceptable, c'est la qualité avant ou arrière des voyelles présentes dans la racine du mot en tête.
Commençons par jeter un coup d'oeil aux voyelles du finnois.
Voyelles d'avant | ä | ö | y |
---|---|---|---|
Voyelles neutres | e | i | |
Voyelles d'arrière | a | o | u |
L'idée de base, c'est que les voyelles d'arrière et les voyelles d'avant ne peuvent pas se côtoyer (= olö est un mot inacceptable). Les voyelles d'avant peuvent côtoyer les voyelles neutres (= käsi est un mot acceptable), et les voyelles d'arrière peuvent côtoyer les voyelles neutres (= tori est un mot acceptable). L'harmonie vocalique est le procédé phonologique qui maintient cette ségrégation entre les voyelles d'arrière et les voyelles d'avant. Elle empêche la formation de racines désharmonisées. De plus, elle repère une valeur harmonique quelque part (dans la racine d'un mot) et la copie ailleurs (dans la terminaison de cas du même mot), d'où son importance pour la déclinaison.
Les terminaisons casuelles qui ne contiennent que des voyelles neutres ou aucune voyelle n'ont qu'une seule version; l'harmonie ne les concerne pas. Voici un inventaire des terminaisons casuelles qui n'ont qu'une version: -n, -t, -den, -tten, -en, -ten, -lle, -seen, -ksi, -tse.
Les terminaisons casuelles qui peuvent contenir ä ou a se comportent de la façon suivante:
Voici des paires de terminaisons harmonisées. Quand il y a une terminaison casuelle harmonisée antérieurement, il y a toujours un homologue harmonisé postérieurement, et vice versa.
Harmonie postérieure | Harmonie antérieure |
---|---|
-a | -ä |
-ta | -tä |
-ssa | -ssä |
-sta | -stä |
-lta | -ltä |
-lla | -llä |
-na | -nä |
Ces inventaires de terminaisons ont couvert la majorité du terrain.
Voici des exemples concrets, avec la terminaison casuelle harmonisée en gras:
Quand la racine n'a que des voyelles neutres, c'est l'harmonie antérieure qui s'applique, d'où vedessä et ristissä.
Deux complications:
TLDR;
Harmonie vocalique
→ / {a, o, u} (...) _
But de cette section: expliquer dans quel environnement phonologique la gradation est déclenchée.
But de cette section: expliquer la gradation consonantique, qui change parfois la racine dans une partie du paradigme de déclinaison.
La gradation consonantique est un type de mutation consonantique, c'est-à-dire de passage d'une consonne à une autre dans certains environnements. Comme il est habituellement le cas chez les règles phonologiques, la relation entre le son de départ et le son final n'est pas complètement arbitraire. On peut généralement isoler une propriété spécifique qui a changé, pour un ensemble de mutations: par exemple, acquisition du voisement en ce qui concernerait un ensemble de mutations /p/→/b/, /t/→/d/ et /k/→/g/. (Il peut aussi y avoir plus qu'une propriété, et propriété est entendu au sens de feature.)
Dans le cas du finnois, la consonne de la syllabe finale de la racine peut muter (dans les conditions décrites dans la section précédente). On peut schématiser les changements possibles à l'aide d'un tableau à quatre champs, car la gradation varie à deux niveaux: celui de la direction (grade fort en FNS → grade faible en forme génitive singulière OU vice versa) et celui du type de mutation (changement de la longueur OU autre changement de qualité; surtout voisement/assimilation de mode d'articulation.) Dans le tableau ci-dessous, la première forme est la FNS et la deuxième forme est la forme génitive singulière.
Changement de longueur | Autre changement de qualité | |
---|---|---|
Gradation classique | matto → maton | mato → madon |
Gradation inverse | puute → puutteen | pyyde → pyyteen |
Deux choses à noter:
La section suivante est un inventaire des types précis de gradation consonantique qu'on rencontre, avec un exemple par type. L'exemple sert à illustrer et suit l'ordre FNS → forme génitive singulière.
Longueur
(On rencontre aussi bb → b et gg → g, mais juste parmi des verbes qui sont aussi des emprunts, donc je crois que ça peut être ignoré pour comprendre la flexion des noms; à vérifier, mais à priori c'est très marginal. Cette note ne tient pas compte de la direction et elle est identique dans les deux sections.)
Qualité
(On ne rencontre pas le problème de prévisibilité unidirectionnelle dans les cas de gradation de qualité classique, contrairement aux cas de gradation de qualité inverse.)
Longueur
(On rencontre aussi bb → b et gg → g, mais juste parmi des verbes qui sont aussi des emprunts, donc je crois que ça peut être ignoré pour comprendre la flexion des noms; à vérifier, mais à priori c'est très marginal. Cette note ne tient pas compte de la direction et elle est identique dans les deux sections.)
Qualité
(Attention! Parfois on rencontre le grade faible dans la FNS et la forme génitive; c'est une complication aux mots où on a une gradation de qualité inverse. J'ai inclus une note et un exemple pour v → p mais ça ne s'arrête pas là. C'est un problème de prévisibilité unidirectionnelle. Quand la racine a un grade fort et certaines conditions s'appliquent, certaines flexions prennent le grade faible: donc viive → viipeen.
MAIS il y aussi des cas où la racine ressemble à un grade faible, et la consonne reste identique dans tout le paradigme, comme toive → toiveen; il n'y a en fait aucune mutation, mais on ne peut pas le prédire en regardant la FNS. On ne prédire ce qui se produira qu'en regardant la racine!
C'est un peu embêtant à expliquer clairement, mais en gros, ce qu'il faut comprendre, c'est qu'il n'y a qu'une règle p → v, plus précisément → , et cette règle peut s'appliquer de manière classique, auquel cas on a p → v = → ... et elle peut s'appliquer de manière inverse, auquel cas on a aussi p → v = → ... que je présente comme v → p parce que v correspond à la FNS, et la FNS est la vedette, ce qui fait en sorte qu'on peut l'utiliser comme base automatiquement définie, et c'est probablement pratique d'intégrer la FNS à un programme de flexion automatique. Mais la base réelle est la racine, qui est parfois distincte de la FNS, et du point de vue phonétique, il n'y a aucune règle qui transforme v; il n'y a qu'une règle qui transforme p, mais pas toujours aux mêmes endroits dans le paradigme. Les endroits dans le paradigme où il y a un grade fort en direction classique, sont les endroits où il y a un grade faible dans la direction inverse.)
▲ Cette dernière note est probablement difficile à suivre. Elle serait plus compréhensible avec un tableau, ou plusieurs tableaux, qui illustrent la distribution des gradations dans les paradigmes. Il faut la réécrire ou au moins l'éditer.
But de cette section: faire un survol des autres propriétés qui déterminent l'inventaire des terminaisons casuelles acceptables, et quels genres de changement à la racine on observe mis à part ceux de la gradation.