Ce programme python s’appuie sur Pywikibot. Il lit le fichier texte créé par find-LLbot-doublon.cpp, récupère le contenu de chaque page contenue dans ce fichier texte et supprime toutes les prononciations qui apparaissent plus d’une fois.
Pour exécuter:
import pywikibot
import re
site = pywikibot.Site('fr','wiktionary')
f = open("double_llbot.txt", "r")
for line in f.readlines():
items = line.split("\t")
titre = items
titre = titre]")]
page = pywikibot.Page(site, titre)
wikitext = page.text
ini_wikitext = wikitext
new_wikitext = ""
for audio in items:
print(f"Traitement de {titre}, {audio}")
new_wikitext = ""
first = True
for line in wikitext.split('\n'):
if audio.strip() in line:
if first:
first = False
new_wikitext += line + "\n"
else:
pass
else:
new_wikitext += line + "\n"
wikitext = new_wikitext
if ini_wikitext == new_wikitext:
continue
page.text = new_wikitext
#print(new_wikitext)
page.save(summary="Suppression des prononciations en double", botflag=True)
f.close()