Zu den Korrekturen:
{{Ref-Duden}}
oder aber (am Beispiel „Schar“) nur {{Ref-Duden|Schar}}
.{{Ref-Duden|Schar_Gruppe_Menge|Schar (Gruppe, Menge)}}
und{{Ref-Duden|Schar_Pflugschar|Schar (Pflugschar)}}
{{Ref-Duden|Rostocker_Einwohner_Rostock|Rostocker (Einwohner aus Rostock)}}
{{Wortart fehlt|Adjektiv|W=j|anm={{Ref-Duden|Rostocker_Adjektiv_Rostock|Rostocker (Adjektiv Rostock)}}}}
ein, siehe diese Korrektuer{{Wortart fehlt|Substantiv|zus=, {{m}}|anm={{Ref-Duden|Schur_Verdruss_Plage|Schur (Verdruss, Plage)}}}}
, siehe hierEs ist geplant, zukünftig neben ca. 2 - 3 x im Jahr stattfindenden kompletten Suchläufen über alle Seiten mit einem Link zu duden.de auch einen täglichen Suchlauf (nach 02:00 Uhr, da die Wikimedia-Datenbanken die UTC-Zeit speichern) über Einträge zu machen, die entweder am vorherigen Tag neu angelegt oder bearbeitet wurden und die einen Link zu duden.de enthalten.
Dadurch bleibt das Wiktionary noch aktueller, was die Links zu duden.de anbetrifft und außerdem wird es dann bei den ca. 2 - 3 x im Jahr stattfindenden kompletten Suchläufen auch weniger Treffer und damit weniger zu korrigieren geben.
Es ändert sich dafür eigentlich nur das SQL:
select /* SLOW_OK */
distinct concat("] —> ",
concat(replace(el.el_to_domain_index, '//de.duden.www.', '//www.duden.de')),el.el_to_path)
from recentchanges rc,
externallinks el
where rc.rc_namespace = 0
and rc.rc_timestamp >= concat(DATE_FORMAT(DATE_SUB(NOW(), INTERVAL 1 DAY), '%Y%m%d'),'00')
and rc.rc_timestamp <= concat(DATE_FORMAT(DATE_SUB(NOW(), INTERVAL 1 DAY), '%Y%m%d'),'99')
and rc.rc_bot = 0
and el.el_from = rc.rc_cur_id
and el.el_to_domain_index like 'https://de.duden.www.%'
and el.el_to_path like '/rechtschreibung/%'
order by rc.rc_title;
Wobei die beiden rc.rc_timestamp dann natürlich variabel übergeben werden müssen.
Das concat(DATE_FORMAT(DATE_SUB(NOW(), INTERVAL 1 DAY), '%Y%m%d'),'00')
erzeugt dabei einen '2022021900' (ausgehend vom 20.02.22 also einen Tag zurück) und das concat(DATE_FORMAT(DATE_SUB(NOW(), INTERVAL 1 DAY), '%Y%m%d'),'99')
dann einen '2022021999'.
Es wird außerdem auch nur nach Bearbeitungen von Menschen (and rc.rc_bot = 0
) gesucht.
Es wird dasselbe python-Skript wie unter Benutzer Diskussion:UT-Bot/Duden-Link-Check#python verwendet, außer dass andere Dateinamen verwendet werden:
#
# bitte bei Bedarf in den 2 folgenden Parametern den kompletten Pfad ergänzen!!
linkfilename = "duden_links_taeglich.txt"
logfilename = "duden_taeglich.log"
#
Im Normalfall gibt es selten mehr wie 200 Bearbeitungen an Einträgen mit einem Link zu duden.de. Das Script sollte also max. 10 - 15 Minuten brauchen.
Sofern überhaupt fehlerhafte Links gefunden wurden, wird der Inhalt von duden_taeglich.log dann mittels add_text.py umseitig (also auf Benutzer:UT-Bot/Duden-Link-Check/täglich) mit dem jeweiligen aktuellem Datum als Überschrift abgespeichert.
Wer dann beim täglichen Korrigieren mitmachen will, setzt Benutzer:UT-Bot/Duden-Link-Check/täglich einfach auf seine BEO (Achtung: die Seite wird aber immer von einem Bot aktualisiert!!). Wer dann zuerst kommt, mahlt zuerst. Sehr viel kann da in Zukunft sowieso nicht mehr zusammenkommen.
Ich muss mir dann noch etwas überlegen, was man machen kann, wenn duden.de nachts ab 01:00 Uhr eine Wartung laufen lässt oder sonstwie offline ist...
(t. b. c)