La 8e édition du Dictionnaire de l’Académie française (DAF) a été intégré au Wiktionnaire dès 2006, suite au passage dans le domaine public de l’ouvrage.
Voir le communiqué de presse.
La 8e et dernière édition du Dictionnaire de l’Académie française a été publiée de 1932 à 1935. Cet ouvrage collectif est dans le domaine public 70 ans après la date de publication, soit le 31 décembre 2005 au plus tard pour le dernier volume (le dépôt légal de chaque volume est ce qui compte).
J’ai obtenu une confirmation de Jean-Baptiste Soufron sur ce point. (Dixit Yann (d · c · b), 2 mai 2005)
La 8e édition du Dictionnaire de l’Académie française contient 2 tomes. Le premier tome (A-G, 622 pp.) a été publié en 1932, et le deuxième tome (H-Z, 743 pp.) a été publié en 1935. L’auteur de l’œuvre est l’Académie (avec un grand A), il s’agit d’une personne morale et d’une œuvre collective. (Est dite collective l’œuvre créée sur l’initiative d’une personne physique ou morale qui l’édite, la publie et la divulgue sous sa direction et son nom et dans laquelle la contribution personnelle des divers auteurs participant à son élaboration se fond dans l’ensemble en vue duquel elle est conçue, sans qu’il soit possible d’attribuer à chacun d’eux un droit distinct sur l’ensemble réalisé. Article L113-2)
Ensuite, il faut lire ceci : L’œuvre collective est, sauf preuve contraire, la propriété de la personne physique ou morale sous le nom de laquelle elle est divulguée. Cette personne est investie des droits de l’auteur. (Article L113-5)
La durée des droits est ensuite de 70 ans : Pour les œuvres pseudonymes, anonymes ou collectives, la durée du droit exclusif est de soixante-dix années à compter du 1er janvier de l’année civile suivant celle où l’œuvre a été publiée. La date de publication est déterminée par tout mode de preuve de droit commun, et notamment par le dépôt légal. (Article L123-3)
Donc, le premier volume (A-G) est dans le domaine public depuis le 1er janvier 2003, et le deuxième volume (H-Z) est dans le domaine public depuis le 1er janvier 2006.
Les articles L123-8 et L123-9 relatifs à la prorogation des droits d’une durée égale à la guerre ne s’appliquent pas ici (ils ne concernent que les héritiers des auteurs décédés, or l’Académie n’a pas d’héritier).
La 8e édition est disponible en ligne à (on peut aussi le consulter sur la version informatisée de l’ATILF). Avec un petit script, on peut facilement télécharger l’intégralité du document. Cela comprend 21 « volumes » d’environ 66 pages web chacun, ce qui fait environ 14.5 Mio de texte brut, soit environ, par extrapolation, 33 700 articles.
Il semble qu’il y ait un problème avec la banque de données de ce système. Donc, il manquerait peut-être des articles. Ce point devra être vérifié avec l’Université de Chicago. Par ailleurs, les bases de données elles-mêmes sont peut-être protégées par le droit d’auteur (à vérifier) : Art. L.112-3. Les auteurs de traductions, d’adaptations, transformations ou arrangements des œuvres de l’esprit jouissent de la protection instituée par le présent code sans préjudice des droits de l’auteur de l’œuvre originale. Il en est de même des auteurs d’anthologies ou de recueils d’œuvres ou de données diverses, tels que les bases de données, qui, par le choix ou la disposition des matières, constituent des créations intellectuelles. On entend par base de données un recueil d’œuvres, de données ou d’autres éléments indépendants, disposés de manière systématique ou méthodique, et individuellement accessibles par des moyens électroniques ou par tout autre moyen. Ce qui signifie que l’on ne peut peut-être pas réutiliser par des scripts les articles publiés sur internet.
Le gros du travail est de convertir ces données dans le format wiki, puis de créer ou de compléter des articles avec un bot. Ajouter de nouveaux articles sera facile. Le problème sera d’intégrer les nouveaux articles avec les articles déjà existants. Par ailleurs, Gerard Meijssen a dit que la nouvelle structure serait prête en août 2005.
La question se pose donc s’il faut intégrer le DAF avant ou après la migration vers la nouvelle structure. Les critères à prendre en compte sont :
Vu la taille et la qualité des définitions, il est peut-être préférable de prendre le DAF comme base plutôt que le Wiktionnaire actuel.
Il semble que le bot en Python "pywikipediabot" demande une structure de la source peu adaptée à ce qu’on veut faire. Il faut donc soit
J’ai essayé le n°2, mais ne connaissant pas le Python…J’ai aussi cherché un autre bot, de préférence en Perl et j’ai trouvé w:en:User:Pearle/pearle.pl.
Finalement, FoeNyx m’a donné un coup de main pour modifier le bot en Python.