#{{Silbentrennung}} -> {{Worttrennung}} (ur'{Silbentrennung}} ??', u'{Worttrennung}}'), #verschiebe Pipe nach 'Sprache Subst/Adj/Verb/Adv Übersicht, VerbTab' an Anf der nächsten Zeile (ur'({{*?(Substantiv Übersicht|Adjektiv Übersicht|Verb Übersicht|Adverb Übersicht|Verb-Tabelle)) *?\| *?\s\n *?(\w)', u'\\1\n|\\3'), #entlinke Bspwörter wie ] oder ], ausgenommen [[w: [[:w: [[q: [[s: (WP, wikiquote, wikisource) #erkennt max nur je 10 Links in {Beispiele}; Leerzeile markiert Ende der {Beispiele} (ur'(eispiele}}*?)\]*?)\]\](.*?\s$\n^\s$\n)', u'\\1\\2\\3'), ... 10x (ur'(eispiele}}*?)\]*?\|(]*?)\]\](.*?\s$\n^\s$\n)', u'\\1\\2\\3'), ... 10x #enthält {Ref-Grimm} 3 Pkte und kein ßäöüÄÖÜ, entferne die Pkte (ur'({{Ref-Grimm\|+?)\|\.\.\.}}', u'\\1}}'), #enthält {Ref-Grimm} ein 'ßäöüÄÖÜ' und 3 Pkte, ersetze es durch 'sz|ae|oe|ue|Ae|Oe|Ue' und entferne die Pkte (ur'({{Ref-Grimm\|*?)ß(*?)\|\.\.\.}}', u'\\1sz\\2}}'), (ur'({{Ref-Grimm\|*?)ä(*?)\|\.\.\.}}', u'\\1ae\\2}}'), (ur'({{Ref-Grimm\|*?)ö(*?)\|\.\.\.}}', u'\\1oe\\2}}'), (ur'({{Ref-Grimm\|*?)ü(*?)\|\.\.\.}}', u'\\1ue\\2}}'), (ur'({{Ref-Grimm\|*?)Ä(*?)\|\.\.\.}}', u'\\1Ae\\2}}'), (ur'({{Ref-Grimm\|*?)Ö(*?)\|\.\.\.}}', u'\\1Oe\\2}}'), (ur'({{Ref-Grimm\|*?)Ü(*?)\|\.\.\.}}', u'\\1Ue\\2}}'), #entferne {Ähnlichkeiten}, falls leer (ur'(\s\n){{Ähnlichkeiten}}\s\n', u'\\1'), (ur'\s\n{{Ähnlichkeiten}}\s\n:', u''), #entferne Kommentar, Kategorie (ur'<!-- /(Flexions|Dialekt)tabelle\s?\n/-->', u''), (ur'(Ähnlichkeiten}})<!-- tot beim Eintrag von Tod\, und umgekehrt -->\s', u'\\1'), (ur'<!-- Links/Rechts -->', u''), (ur'<!-- Unterbegriffe absteigend nach Größe sortiert -->', u''), (ur'\s\n\\]\s\n', u''), #''f'' -> {{f}} (ur'} \'\'()\'\'', u'} {{\\1}}'), #in Flexvorl: des Kind(e)s -> des Kinds<br />des Kindes (ur'(\|*? (Singular|Plural)=)(*?)\(e\)(*)', u'\\1\\3\\4<br />\\3e\\4'), #-> genau eine Zeile vor Textbausteinen sowie vor Flexvorl der wichtigsten Sprachen, nicht mehr und nicht weniger (ur'\s*?\n{{(Anmerkung|Alternative Schreibweisen|Nebenformen|Silbentrennung|Aussprache|Bedeutungen|Abkürzungen|Herkunft|Synonyme|Gegenwörter|Oberbegriffe|Unterbegriffe|Beispiele|Redewendungen|Sprichwörter|Charakteristische Wortkombinationen|Abgeleitete Begriffe|Referenzen}|Grammatische Merkmale|Grundformverweis|Quellen|Ähnlichkeiten|Adjektiv-Tabelle|Verb-Tabelle|Deutsch|Englisch|Italienisch|Französisch|Polnisch|Katalanisch|Lateinisch|Okzitanisch|Tschechisch|Spanisch|Ungarisch)', u'\n\n{{\\1'), #entferne Leerzeichen nach Doppelpkt oder 2 Doppelpkten am Zeilenanf (ur'\s\n(:{1,2}) +()', u'\n\\1\\2'), #ersetze Diverses (ur'<br clear="all"( /)?>', u'{{Absatz}}'), (ur' \.( | )(\d)', u' Seite \\2'), (ur'(<br)/??>', u'\\1 />'), (ur'Wikipedia-Artikel „\*?)\|]*?\]\]“', u'{{Wikipedia|\\1}}'),
python replace.py -ns:0 -dotall -regex -multiline -xml:"C:\Pfad\dewiktionary-20120321-pages-articles.xml" -excepttitle:: -excepttitle:ation\) -fix:Worttrg
(ur'Wikipedia-Artikel „\*?)\|]*?\]\]“', u'{{Wikipedia|\\1}}'), (ur'(Isländischer )??Wikipedia-Artikel „\*?)\|]*?\]\]“', u'Isländischer {{Wikipedia2|is|\\2}}'), (ur'(Färöischer )??Wikipedia-Artikel „\*?)\|]*?\]\]“', u'Färöischer {{Wikipedia2|fo|\\2}}'), (ur'(Englischer )??Wikipedia-Artikel „\*?)\|]*?\]\]“', u'Englischer {{Wikipedia2|en|\\2}}'), (ur'(Russischer )??Wikipedia-Artikel „\*?)\|]*?\]\]“', u'Russischer {{Wikipedia2|ru|\\2}}'), (ur'(Italienischer )??Wikipedia-Artikel „\*?)\|]*?\]\]“', u'Italienischer {{Wikipedia2|it|\\2}}'), (ur'(Schwedischer )??Wikipedia-Artikel „\*?)\|]*?\]\]“', u'Schwedischer {{Wikipedia2|sv|\\2}}'), (ur'(Lateinischer )??Wikipedia-Artikel „\*?)\|]*?\]\]“', u'Lateinischer {{Wikipedia2|la|\\2}}'),
#schreibe S. aus und klammere Zitate (mit AnfZeichen unten beginnend) aus; siehe ] (ur'^(*? )\.( | )(\d)', u'\\1Seite \\3'),
#entferne alle {Ähnlichkeiten} die leer sind, egal ob mit oder ohne Doppelpkt in der Folgezeile (ur'^{{Ähnlichkeiten}}\r?\n:?\s*?\r?\n\s*$', u''),
(ur'{Silbentrennung}}', u'{Worttrennung}}'),
#eliminiere {Fremdsprachige Beispiele} und <br /> (Lyrik); nacheinander abgearbeitet! (ur'^{{Fremdsprachige Beispiele*?\n^\|?? ??(\]*?\])\s$\n^\| ??(*?)<br ??/??>(*?)<br ??/??>(*?)<br ??/??>(*?)<br ??/??>(*?)<br ??/??>(*?)\s$\n^\| ??(*?)\s$\n^\|?}} ??', u':\\1 \\2\n::\\3\n::\\4\n::\\5\n::\\6\n::\\7\n::\\8'), #1Bsp 5ZUmbr (ur'^{{Fremdsprachige Beispiele*?\n^\|?? ??(\]*?\])\s$\n^\| ??(*?)<br ??/??>(*?)<br ??/??>(*?)<br ??/??>(*?)<br ??/??>(*?)\s$\n^\| ??(*?)\s$\n^\|?}} ??', u':\\1 \\2\n::\\3\n::\\4\n::\\5\n::\\6\n::\\7'), #1Bsp 4ZUmbr (ur'^{{Fremdsprachige Beispiele*?\n^\|?? ??(\]*?\])\s$\n^\| ??(*?)<br ??/??>(*?)<br ??/??>(*?)<br ??/??>(*?)\s$\n^\| ??(*?)\s$\n^\|?}} ??', u':\\1 \\2\n::\\3\n::\\4\n::\\5\n::\\6'), #1Bsp 3ZUmbr (ur'^{{Fremdsprachige Beispiele*?\n^\|?? ??(\]*?\])\s$\n^\| ??(*?)<br ??/??>(*?)<br ??/??>(*?)\s$\n^\| ??(*?)\s$\n^\|?}} ??', u':\\1 \\2\n::\\3\n::\\4\n::\\5'), #1Bsp 2ZUmbr (ur'^{{Fremdsprachige Beispiele*?\n^\|?? ??(\]*?\])\s$\n^\| ??(*?)<br ??/??>(*?)\s$\n^\| ??(*?)\s$\n^\|?}} ??', u':\\1 \\2\n::\\3\n::\\4'), #1Bsp 1ZUmbr (ur'^{{Fremdsprachige Beispiele*?\n^\|?? ??(\]*?\])\s$\n^\| ??(*?)\s$\n^\| ??(*?)\s$\n^\|?}} ??', u':\\1 \\2\n::\\3'), #ohne ZUmbr #verschiebe Pipe nach 'Sprache Subst/Adj/Verb/Adv Übersicht, VerbTab' an Anf der nächsten Zeile (ur'({{*?(Substantiv Übersicht|Adjektiv Übersicht|Verb Übersicht|Adverb Übersicht|Verb-Tabelle)) *?\| *?\s\n *?(\w)', u'\\1\n|\\3'), #entlinke Bspwörter wie ] oder ], ausgenommen [[w: [[:w: [[q: [[s: (WP, wikiquote, wikisource) #erkennt max nur je 10 Links in {Beispiele}; Leerzeile markiert Ende der {Beispiele} (ur'(eispiele}}*?)\]*?)\]\](.*?\s$\n^\s$\n)', u'\\1\\2\\3'), (ur'(eispiele}}*?)\]*?)\]\](.*?\s$\n^\s$\n)', u'\\1\\2\\3'), (ur'(eispiele}}*?)\]*?)\]\](.*?\s$\n^\s$\n)', u'\\1\\2\\3'), (ur'(eispiele}}*?)\]*?)\]\](.*?\s$\n^\s$\n)', u'\\1\\2\\3'), (ur'(eispiele}}*?)\]*?)\]\](.*?\s$\n^\s$\n)', u'\\1\\2\\3'), (ur'(eispiele}}*?)\]*?)\]\](.*?\s$\n^\s$\n)', u'\\1\\2\\3'), (ur'(eispiele}}*?)\]*?)\]\](.*?\s$\n^\s$\n)', u'\\1\\2\\3'), (ur'(eispiele}}*?)\]*?)\]\](.*?\s$\n^\s$\n)', u'\\1\\2\\3'), (ur'(eispiele}}*?)\]*?)\]\](.*?\s$\n^\s$\n)', u'\\1\\2\\3'), (ur'(eispiele}}*?)\]*?)\]\](.*?\s$\n^\s$\n)', u'\\1\\2\\3'), (ur'(eispiele}}*?)\]*?\|(]*?)\]\](.*?\s$\n^\s$\n)', u'\\1\\2\\3'), (ur'(eispiele}}*?)\]*?\|(]*?)\]\](.*?\s$\n^\s$\n)', u'\\1\\2\\3'), (ur'(eispiele}}*?)\]*?\|(]*?)\]\](.*?\s$\n^\s$\n)', u'\\1\\2\\3'), (ur'(eispiele}}*?)\]*?\|(]*?)\]\](.*?\s$\n^\s$\n)', u'\\1\\2\\3'), (ur'(eispiele}}*?)\]*?\|(]*?)\]\](.*?\s$\n^\s$\n)', u'\\1\\2\\3'), (ur'(eispiele}}*?)\]*?\|(]*?)\]\](.*?\s$\n^\s$\n)', u'\\1\\2\\3'), (ur'(eispiele}}*?)\]*?\|(]*?)\]\](.*?\s$\n^\s$\n)', u'\\1\\2\\3'), (ur'(eispiele}}*?)\]*?\|(]*?)\]\](.*?\s$\n^\s$\n)', u'\\1\\2\\3'), (ur'(eispiele}}*?)\]*?\|(]*?)\]\](.*?\s$\n^\s$\n)', u'\\1\\2\\3'), (ur'(eispiele}}*?)\]*?\|(]*?)\]\](.*?\s$\n^\s$\n)', u'\\1\\2\\3'), #enthält {Ref-Grimm} 3 Pkte und kein ßäöüÄÖÜ, entferne die Pkte (ur'({{Ref-Grimm\|+?)\|\.\.\.}}', u'\\1}}'), #enthält {Ref-Grimm} ein 'ßäöüÄÖÜ' und 3 Pkte, ersetze es durch 'sz|ae|oe|ue|Ae|Oe|Ue' und entferne die Pkte (ur'({{Ref-Grimm\|*?)ß(*?)\|\.\.\.}}', u'\\1sz\\2}}'), (ur'({{Ref-Grimm\|*?)ä(*?)\|\.\.\.}}', u'\\1ae\\2}}'), (ur'({{Ref-Grimm\|*?)ö(*?)\|\.\.\.}}', u'\\1oe\\2}}'), (ur'({{Ref-Grimm\|*?)ü(*?)\|\.\.\.}}', u'\\1ue\\2}}'), (ur'({{Ref-Grimm\|*?)Ä(*?)\|\.\.\.}}', u'\\1Ae\\2}}'), (ur'({{Ref-Grimm\|*?)Ö(*?)\|\.\.\.}}', u'\\1Oe\\2}}'), (ur'({{Ref-Grimm\|*?)Ü(*?)\|\.\.\.}}', u'\\1Ue\\2}}'), #entferne {Ähnlichkeiten}, falls leer (ur'^{{Ähnlichkeiten}}\r?\n:?\s*?\r?\n\s*$', u''), #entferne Kommentar, Kategorie (ur'<!-- /(Flexions|Dialekt)tabelle\s?\n/-->', u''), (ur'(Ähnlichkeiten}})<!-- tot beim Eintrag von Tod\, und umgekehrt -->', u'\\1'), (ur'<!-- Links/Rechts -->', u''), (ur'<!-- Unterbegriffe absteigend nach Größe sortiert -->', u''), (ur'\s\n\\]\s\n', u''), #''f'' -> {{f}} (ur'} \'\'()\'\'', u'} {{\\1}}'), #in Flexvorl: des Kind(e)s -> des Kinds<br />des Kindes (ur'(\|*? (Singular|Plural)=)(*?)\(e\)(*)', u'\\1\\3\\4<br />\\3e\\4'), #-> genau eine Zeile vor Textbausteinen sowie vor Flexvorl der wichtigsten Sprachen, nicht mehr und nicht weniger (ur'\s*?\n{{(Anmerkung|Alternative Schreibweisen|Nebenformen|Worttrennung|Aussprache|Bedeutungen|Abkürzungen|Herkunft|Synonyme|Gegenwörter|Oberbegriffe|Unterbegriffe|Beispiele|Redewendungen|Sprichwörter|Charakteristische Wortkombinationen|Abgeleitete Begriffe|Referenzen}|Grammatische Merkmale|Grundformverweis|Quellen|Ähnlichkeiten|Adjektiv-Tabelle|Verb-Tabelle|Deutsch|Englisch|Italienisch|Französisch|Polnisch|Katalanisch|Lateinisch|Okzitanisch|Tschechisch|Spanisch|Ungarisch)', u'\n\n{{\\1'), #entferne Leerzeichen nach Doppelpkt oder 2 Doppelpkten am Zeilenanf (ur'\s\n(:{1,2}) +()', u'\n\\1\\2'), #ersetze Diverses (ur'^:\2\]', u':'), (ur'<br clear="all"( /)?>', u'{{Absatz}}'), (ur'^(*? )\.( | )(\d)', u'\\1Seite \\3'), (ur'Wikipedia-Artikel „\*?)\|]*?\]\]“', u'{{Wikipedia|\\1}}'), (ur'(Englischer )??Wikipedia-Artikel „\*?)\|]*?\]\]“', u'Englischer {{Wikipedia2|en|\\2}}'), (ur'(Russischer )??Wikipedia-Artikel „\*?)\|]*?\]\]“', u'Russischer {{Wikipedia2|ru|\\2}}'), (ur'(Italienischer )??Wikipedia-Artikel „\*?)\|]*?\]\]“', u'Italienischer {{Wikipedia2|it|\\2}}'),
#ersetze Vorl {Fremdspr Bsp} mit 1 Bsp (ur'^{{Fremdsprachige Beispiele*?\n^\| ??(\]*?\]) ??\s\n^\| ??(*?)\s\n^\| ??(*?)\s\n^\|??}}', u':\\1 \\2\n::\\3'), #verschiebe Pipe nach 'Sprache Subst/Adj/Verb/Adv Übersicht, VerbTab' an Anf der nächsten Zeile (ur'({{*?(Substantiv Übersicht|Adjektiv Übersicht|Verb Übersicht|Adverb Übersicht|Verb-Tabelle)) *?\| *?\s\n *?(\w)', u'\\1\n|\\3'), #entlinke Bspwörter wie ] oder ], ausgenommen [[w: [[:w: [[q: [[s: (WP, wikiquote, wikisource) #erkennt max nur je 10 Links in {Beispiele}; Leerzeile markiert Ende der {Beispiele} (ur'(eispiele}}*?)\)\]\](.*?\s$\n^\s$\n)', u'\\1\\2\\3'), #] -> i (ur'(eispiele}}*?)\\](.*?\s$\n^\s$\n)', u'\\1W\\2\\3'), #] -> W, ] -> We (ur'(eispiele}}*?)\]*?)\]\](.*?\s$\n^\s$\n)', u'\\1\\2\\3'), (ur'(eispiele}}*?)\]*?)\]\](.*?\s$\n^\s$\n)', u'\\1\\2\\3'), (ur'(eispiele}}*?)\]*?)\]\](.*?\s$\n^\s$\n)', u'\\1\\2\\3'), (ur'(eispiele}}*?)\]*?)\]\](.*?\s$\n^\s$\n)', u'\\1\\2\\3'), (ur'(eispiele}}*?)\]*?)\]\](.*?\s$\n^\s$\n)', u'\\1\\2\\3'), (ur'(eispiele}}*?)\]*?)\]\](.*?\s$\n^\s$\n)', u'\\1\\2\\3'), (ur'(eispiele}}*?)\]*?)\]\](.*?\s$\n^\s$\n)', u'\\1\\2\\3'), (ur'(eispiele}}*?)\]*?)\]\](.*?\s$\n^\s$\n)', u'\\1\\2\\3'), (ur'(eispiele}}*?)\]*?)\]\](.*?\s$\n^\s$\n)', u'\\1\\2\\3'), (ur'(eispiele}}*?)\]*?)\]\](.*?\s$\n^\s$\n)', u'\\1\\2\\3'), (ur'(eispiele}}*?)\]*?\|(]*?)\]\](.*?\s$\n^\s$\n)', u'\\1\\2\\3'), (ur'(eispiele}}*?)\]*?\|(]*?)\]\](.*?\s$\n^\s$\n)', u'\\1\\2\\3'), (ur'(eispiele}}*?)\]*?\|(]*?)\]\](.*?\s$\n^\s$\n)', u'\\1\\2\\3'), (ur'(eispiele}}*?)\]*?\|(]*?)\]\](.*?\s$\n^\s$\n)', u'\\1\\2\\3'), (ur'(eispiele}}*?)\]*?\|(]*?)\]\](.*?\s$\n^\s$\n)', u'\\1\\2\\3'), (ur'(eispiele}}*?)\]*?\|(]*?)\]\](.*?\s$\n^\s$\n)', u'\\1\\2\\3'), (ur'(eispiele}}*?)\]*?\|(]*?)\]\](.*?\s$\n^\s$\n)', u'\\1\\2\\3'), (ur'(eispiele}}*?)\]*?\|(]*?)\]\](.*?\s$\n^\s$\n)', u'\\1\\2\\3'), (ur'(eispiele}}*?)\]*?\|(]*?)\]\](.*?\s$\n^\s$\n)', u'\\1\\2\\3'), (ur'(eispiele}}*?)\]*?\|(]*?)\]\](.*?\s$\n^\s$\n)', u'\\1\\2\\3'), #enthält {Ref-Grimm} 3 Pkte und kein ßäöüÄÖÜ, entferne die Pkte (ur'({{Ref-Grimm\|+?)\|\.\.\.}}', u'\\1}}'), #enthält {Ref-Grimm} ein 'ßäöüÄÖÜ' und 3 Pkte, ersetze es durch 'sz|ae|oe|ue|Ae|Oe|Ue' und entferne die Pkte (ur'({{Ref-Grimm\|*?)ß(*?)\|\.\.\.}}', u'\\1sz\\2}}'), (ur'({{Ref-Grimm\|*?)ä(*?)\|\.\.\.}}', u'\\1ae\\2}}'), (ur'({{Ref-Grimm\|*?)ö(*?)\|\.\.\.}}', u'\\1oe\\2}}'), (ur'({{Ref-Grimm\|*?)ü(*?)\|\.\.\.}}', u'\\1ue\\2}}'), (ur'({{Ref-Grimm\|*?)Ä(*?)\|\.\.\.}}', u'\\1Ae\\2}}'), (ur'({{Ref-Grimm\|*?)Ö(*?)\|\.\.\.}}', u'\\1Oe\\2}}'), (ur'({{Ref-Grimm\|*?)Ü(*?)\|\.\.\.}}', u'\\1Ue\\2}}'), #entferne {Ähnlichkeiten}, falls leer (ur'^{{Ähnlichkeiten}}\r?\n:?\s*?\r?\n\s*$', u''), #entferne Kommentar, Kategorie (ur'<!-- /(Flexions|Dialekt)tabelle\s?\n/-->', u''), (ur'(Ähnlichkeiten}})<!-- tot beim Eintrag von Tod\, und umgekehrt -->', u'\\1'), (ur'<!-- Links/Rechts -->', u''), (ur'<!-- Unterbegriffe absteigend nach Größe sortiert -->', u''), (ur'\s\n\\]\s\n', u''), #''f'' -> {{f}} (ur'} \'\'()\'\'', u'} {{\\1}}'), #in Flexvorl: des Kind(e)s -> des Kinds<br />des Kindes (ur'(\|*? (Singular|Plural)=)(*?)\(e\)(*)', u'\\1\\3\\4<br />\\3e\\4'), #-> genau eine Zeile vor Textbausteinen sowie vor Flexvorl der wichtigsten Sprachen, nicht mehr und nicht weniger (ur'\s*?\n{{(Anmerkung|Alternative Schreibweisen|Nebenformen|Worttrennung|Aussprache|Bedeutungen|Abkürzungen|Herkunft|Synonyme|Gegenwörter|Oberbegriffe|Unterbegriffe|Beispiele|Redewendungen|Sprichwörter|Charakteristische Wortkombinationen|Abgeleitete Begriffe|Referenzen}|Grammatische Merkmale|Grundformverweis|Quellen|Ähnlichkeiten|Adjektiv-Tabelle|Verb-Tabelle|Deutsch|Englisch|Italienisch|Französisch|Polnisch|Katalanisch|Lateinisch|Okzitanisch|Tschechisch|Spanisch|Ungarisch)', u'\n\n{{\\1'), #entferne Leerzeichen nach Doppelpkt oder 2 Doppelpkten am Zeilenanf (ur'\s\n(:{1,2}) +()', u'\n\\1\\2'), #ersetze Diverses (ur'^:\2\]', u':'), (ur'<br clear="all"( /)?>', u'{{Absatz}}'), (ur'^(*? )\.( | )(\d)', u'\\1Seite \\3'), (ur'(<br)/??>', u'\\1 />'), (ur'Wikipedia-Artikel „\*?)\|]*?\]\]“', u'{{Wikipedia|\\1}}'), (ur'(Englischer )??Wikipedia-Artikel „\*?)\|]*?\]\]“', u'Englischer {{Wikipedia2|en|\\2}}'), (ur'(Russischer )??Wikipedia-Artikel „\*?)\|]*?\]\]“', u'Russischer {{Wikipedia2|ru|\\2}}'), (ur'(Italienischer )??Wikipedia-Artikel „\*?)\|]*?\]\]“', u'Italienischer {{Wikipedia2|it|\\2}}'),
#ersetze Vorl {Fremdspr Bsp} mit 2 Bsp (ur'^{{Fremdsprachige Beispiele*?\n^\| ??(\]*?\]) ??\s\n^\| ??(*?)\s\n^\| ??(*?)\s\n^\| ??(\]*?\]) ??\s\n^\| ??(*?)\s\n^\| ??(*?)(\s\n^\|??|)}}', u':\\1 \\2\n::\\3\n:\\4 \\5\n::\\6'), Rest wie oben
#ersetze Vorl {Fremdspr Bsp} mit 3 bis 6 Bsp (1-6 Bsp) (ur'^:??{{Fremdsprachige Beispiele*?\n^\|?? ??(\]*?\]) ??\s\n^\| ??(*?)\s\n^\| ??(*?)(?: ??\|)??(\s\n^\|??|)}}', u':\\1 \\2\n::\\3'), #1Bp (ur'^:??{{Fremdsprachige Beispiele*?\n^\|?? ??(\]*?\]) ??\s\n^\| ??(*?)\s\n^\| ??(*?)(?: ??\|)??\s\n^\|?? ??(\]*?\]) ??\s\n^\| ??(*?)\s\n^\| ??(*?)(?: ??\|)??(\s\n^\|??|)}}', u':\\1 \\2\n::\\3\n:\\4 \\5\n::\\6'), #2Bsp (ur'^:??{{Fremdsprachige Beispiele*?\n^\|?? ??(\]*?\]) ??\s\n^ ??\| ??(*?)\s\n^ ??\| ??(*?)(?: ??\|)??\s\n^ ??\|?? ??(\]*?\]) ??\s\n^ ??\| ??(*?)\s\n^ ??\| ??(*?)(?: ??\|)??\s\n^ ??\|?? ??(\]*?\]) ??\s\n^ ??\| ??(*?)\s\n^ ??\| ??(*?)(?: ??\|)??(\s\n^\|??|)}}', u':\\1 \\2\n::\\3\n:\\4 \\5\n::\\6\n:\\7 \\8\n::\\9'), #3Bsp (ur'^:??{{Fremdsprachige Beispiele*?\n^\|?? ??(\]*?\]) ??\s\n^ ??\| ??(*?)\s\n^ ??\| ??(*?)(?: ??\|)??\s\n^ ??\|?? ??(\]*?\]) ??\s\n^ ??\| ??(*?)\s\n^ ??\| ??(*?)(?: ??\|)??\s\n^ ??\|?? ??(\]*?\]) ??\s\n^ ??\| ??(*?)\s\n^ ??\| ??(*?)(?: ??\|)??\s\n^ ??\|?? ??(\]*?\]) ??\s\n^ ??\| ??(*?)\s\n^ ??\| ??(*?)(?: ??\|)??(\s\n^\|??|)}}', u':\\1 \\2\n::\\3\n:\\4 \\5\n::\\6\n:\\7 \\8\n::\\9\n:\\10 \\11\n::\\12'), #4Bsp (ur'^:??{{Fremdsprachige Beispiele*?\n^\|?? ??(\]*?\]) ??\s\n^\| ??(*?)\s\n^\| ??(*?)(?: ??\|)??\s\n^\|?? ??(\]*?\]) ??\s\n^\| ??(*?)\s\n^\| ??(*?)(?: ??\|)??\s\n^\|?? ??(\]*?\]) ??\s\n^\| ??(*?)\s\n^\| ??(*?)(?: ??\|)??\s\n^\|?? ??(\]*?\]) ??\s\n^\| ??(*?)\s\n^\| ??(*?)(?: ??\|)??\s\n^\|?? ??(\]*?\]) ??\s\n^\| ??(*?)\s\n^\| ??(*?)(?: ??\|)??(\s\n^\|??|)}}', u':\\1 \\2\n::\\3\n:\\4 \\5\n::\\6\n:\\7 \\8\n::\\9\n:\\10 \\11\n::\\12\n:\\13 \\14\n::\\15'), #5Bsp (ur'^:??{{Fremdsprachige Beispiele*?\n^\|?? ??(\]*?\]) ??\s\n^\| ??(*?)\s\n^\| ??(*?)(?: ??\|)??\s\n^\|?? ??(\]*?\]) ??\s\n^\| ??(*?)\s\n^\| ??(*?)(?: ??\|)??\s\n^\|?? ??(\]*?\]) ??\s\n^\| ??(*?)\s\n^\| ??(*?)(?: ??\|)??\s\n^\|?? ??(\]*?\]) ??\s\n^\| ??(*?)\s\n^\| ??(*?)(?: ??\|)??\s\n^\|?? ??(\]*?\]) ??\s\n^\| ??(*?)\s\n^\| ??(*?)(?: ??\|)??\s\n^\|?? ??(\]*?\]) ??\s\n^\| ??(*?)\s\n^\| ??(*?)(?: ??\|)??(\s\n^\|??|)}}', u':\\1 \\2\n::\\3\n:\\4 \\5\n::\\6\n:\\7 \\8\n::\\9\n:\\10 \\11\n::\\12\n:\\13 \\14\n::\\15\n:\\16 \\17\n::\\18'), #6Bsp Rest wie oben
#ersetze in ipa in cs Einträgen ɔ̹ durch ɔ (ur'({{Lautschrift\|*?)ɔ̹', u'\\1ɔ'), (ur'({{Lautschrift\|*?)ɔ̹', u'\\1ɔ'), (ur'(eispiele}}*?)\)\]\](.*?\s$\n^\s$\n)', u'\\1\\2\\3'), #] -> i (ur'(eispiele}}*?)\)\]\](.*?\s$\n^\s$\n)', u'\\1\\2\\3'), (ur'(eispiele}}*?)\\](.*?\s$\n^\s$\n)', u'\\1W\\2\\3'), #] -> W, ] -> We Rest wie oben
#nacheinander abgearbeitet! {{Adjektiv-Tabelle}} und {{Adjektiv-Tabelle (Deklination)}} -> {{Deutsch Adjektiv Übersicht}} #Grundform -> Positiv, 1. Steigerung -> Komparativ, 2. Steigerung -> Superlativ #mit Großbuchstaben beginnend: keine weiteren Formen=ja #(ur'^{{Adjektiv-Tabelle( \(Deklination\))? ??(\|\r?\n|\r?\n\|) ??Grundform ??= ??(*?)\r?\n\| ??1. Steigerung ??= ??(*?)\r?\n\| ??2. Steigerung ??= ??(*)', u'{{Deutsch Adjektiv Übersicht\n|Positiv=\\3\n|Komparativ=\\4\n|Superlativ=\\5\n|keine weiteren Formen=ja') #{{fehlend}} -> — #(ur'^{{Adjektiv-Tabelle( \(Deklination\))? ??(\|\r?\n|\r?\n\|) ??Grundform ??= ??(*?)\r?\n\| ??1. Steigerung ??= ??{{fehlend}}\r?\n\| ??2. Steigerung ??= ??{{fehlend}}', u'{{Deutsch Adjektiv Übersicht\n|Positiv=\\3\n|Komparativ=—\n|Superlativ=—') #mit Bildern #(ur'^{{Adjektiv-Tabelle( ??\(Deklination\))? ??(\|\r?\n|\r?\n\|)\|??( ??Bild*?) ??Grundform ??= ??(*?)\r?\n ??\| ??1. Steigerung ??= ??(*?)\r?\n\| ??2. Steigerung ??= ??(*?)', u'{{Deutsch Adjektiv Übersicht\n|\\3Positiv=\\4\n|Komparativ=\\5\n|Superlativ=\\6') #Rest (ur'^{{Adjektiv-Tabelle( ??\(Deklination\))? ??(\|\r?\n|\r?\n\|)\|?? ??Grundform ??= ??(*?)\r?\n ??\| ??1. Steigerung ??= ??(*?)\r?\n\| ??2. Steigerung ??= ??(*?)', u'{{Deutsch Adjektiv Übersicht\n|Positiv=\\3\n|Komparativ=\\4\n|Superlativ=\\5')
#nacheinander abgearbeitet! #{Ref-wissen.de|xy -> {Ref-wissen.de|Lexikon|xy #(ur'({{Ref-wissen.de\|)(*?)}}', u'\\1Lexikon|\\2}}') # Ampel, Häsling (Haesling) Uml sind schon ersetzt, Söldner, Abdomen #{Ref-wissen.de|Frostmusterböden|1104022 -> {Ref-wissen.de|Lexikon|Frostmusterboeden|Frostmusterböden #(ur'({{Ref-wissen.de\|)(*?)ö(*?)\|\d*?}}', u'\\1Lexikon|\\2oe\\3|\\2ö\\3}}') # Frostmusterboden #{Ref-wissen.de|xy|1104022 -> {Ref-wissen.de|Lexikon|xy #(ur'({{Ref-wissen.de\|)(*?)\|\d*?}}', u'\\1Lexikon|\\2}}') # Aerobiologie, per os, Bilge #{Ref-WBwissen.de|mäandrisch -> {Ref-wissen.de|Wörterbuch|maeandrisch|mäandrisch #(ur'{{Ref-WBwissen.de\|(*?)ä(*?)}}', u'{{Ref-wissen.de|Wörterbuch|\\1ae\\2|\\1ä\\2}}') # mäandrisch, maikäfern, Zeidelbär #{Ref-WBwissen.de|Schmöker -> {Ref-wissen.de|Wörterbuch|Schmoeker|Schmöker #(ur'{{Ref-WBwissen.de\|(*?)ö(*?)}}', u'{{Ref-wissen.de|Wörterbuch|\\1oe\\2|\\1ö\\2}}') # Schmöker, skandalös #{Ref-WBwissen.de|Bürgerkrieg -> {Ref-wissen.de|Wörterbuch|Buergerkrieg|Bürgerkrieg #(ur'{{Ref-WBwissen.de\|(*?)ü(*?)}}', u'{{Ref-wissen.de|Wörterbuch|\\1ue\\2|\\1ü\\2}}') # Bürgerkrieg, Flüchtlingswelle #{Ref-WBwissen.de|Linksaußen -> {Ref-wissen.de|Wörterbuch|Linksaussen|Linksaußen #(ur'{{Ref-WBwissen.de\|(*?)ß(*?)}}', u'{{Ref-wissen.de|Wörterbuch|\\1ss\\2|\\1ß\\2}}') # Linksaußen #{Ref-WBwissen.de|Gebrechen -> {Ref-wissen.de|Wörterbuch|Gebrechen #(ur'{{Ref-WBwissen.de\|(*?)}}', u'{{Ref-wissen.de|Wörterbuch|\\1}}') # Gebrechen, Rennpferd #{Ref-WBwissen.de|Freistoss|Freistoß -> {Ref-wissen.de|Wörterbuch|Freistoss|Freistoß (ur'{{Ref-WBwissen.de\|(+?)\|(+?)}}', u'{{Ref-wissen.de|Wörterbuch|\\1|\\2}}') # Freistoß, Lamäng
#verschiebe Pipe nach 'Sprache Subst/Adj/Verb/Adv Übersicht, VerbTab' an Anf der nächsten Zeile (ur'({{*?(Substantiv Übersicht|Adjektiv Übersicht|Verb Übersicht|Adverb Übersicht|Verb-Tabelle)) *?\| *?\s\n *?(\w)', u'\\1\n|\\3'), #enthält {Ref-Grimm} 3 Pkte und kein ßäöüÄÖÜ, entf die Pkte (ur'({{Ref-Grimm\|+?)\|\.\.\.}}', u'\\1}}'), #enthält {Ref-Grimm} ein 'ö' und 3 Pkte, ersetze es durch 'oe' und entf die Pkte (ur'({{Ref-Grimm\|*?)ö(*?)\|\.\.\.}}', u'\\1oe\\2}}'), #in Flexvorl: des Kind(e)s -> des Kinds<br />des Kindes (ur'(\|*? (Singular|Plural)=)(*?)\(e\)(*)', u'\\1\\3\\4<br />\\3e\\4'), #genau eine Zeile vor Textbausteinen, nicht mehr und nicht weniger (ur'(\r?\n)+?{{(Anmerkung|Alternative Schreibweisen|Alte Rechtschreibung|Nebenformen|Worttrennung|Aussprache|Bedeutungen|Abkürzungen|Herkunft|Synonyme|Gegenwörter|Oberbegriffe|Unterbegriffe|Beispiele|Redewendungen|Sprichwörter|Charakteristische Wortkombinationen|Abgeleitete Begriffe|Referenzen}|Grammatische Merkmale|Grundformverweis|Quellen|Ähnlichkeiten|Adjektiv-Tabelle|Verb-Tabelle)', u'\n\n{{\\2'), #genau eine Zeile vor Flexvorl häufiger Sprachen, nicht mehr und nicht weniger (Achtung: schopný) (ur'=(\r?\n)+?{{(Dänisch|Deutsch|Englisch|Französisch|Irisch|Isländisch|Italienisch|Katalanisch|Lateinisch|Niederländisch|Okzitanisch|Polnisch|Russisch|Spanisch|Tschechisch|Ungarisch)', u'=\n\n{{\\2'), #entf ] wenn Bild oder Bild 1 in Vorl (ur'(\|Bild( 1)??=.*?)\\]', u'\\1'), # Wegerich, Gefriertruhe #entf ] wenn {{Sprache|Arabisch}} (auch jede andere Spr sowie Umschrift) (ur'({{Sprache\|(?P<Spr>*?)}}.*?)\\]', u'\\1'), # du, ekwan, باب #entf ] wenn {{Wortart|Nachname|Sprache}} (auch jede andere Wortart) (ur'({{Wortart\|(?P<WArt>*?)\|*?}}.*?)\\]', u'\\1'), # Montag, dieser, P, SMS (ur'({{Wortart\|(?P<WArt>*?)\|(?P<Spr>*?)}}.*?)\\]', u'\\1'), # Albanien, Grenadinen #entf überzählige Leerst zw {Pl.} und {Lautschrift} (ur'{{Pl.}} +?{{Lautschrift\|', u'{{Pl.}} {{Lautschrift|'), # Polizei #entf Leerst nach Doppelpkt oder 2 Doppelpkten am Zeilenanf (ur'\s\n(:{1,2}) +()', u'\n\\1\\2'), #entf Leerst in ÜbersetzgsVorl vor }} und nach | (ur'({{Ü\|*?\|*?) }}', u'\\1}}'), (ur'({{Ü\|*?\|) (*?)}}', u'\\1\\2}}'), #entf überzählige Leerst in Überschr vor === (ur'^ *?==', u'=='), # szegénység (ur' ==', u' =='), # billion, zwirnen #erg fehlende Leerst in Überschr vor === und == (ur'()((=){2,3})\r?\n', u'\\1 \\2\n'), # sein, Rand #erg fehlende Leerst in Überschr nach === und == (ur'^==()', u'== \\1'), # Ethylen (ur'^(== *?) ??\({', u'\\1 ({'), # Aufschneider (ur'^==={', u'=== {'), # breakfast #''f'' -> {{f}} (ur' \'\'()\'\'', u' {{\\1}}'), (ur' \'\'m/f\'\'', u' {{mf}}'), # -> (ur'^:\2\]', u':'), (ur'<br clear="all"( /)??(br)??>', u'{{Absatz}}'), #S. oder p. -> Seite (ur'^(*? )\.( | )(\d)', u'\\1Seite \\3'), # ausgen Zitate (ur'(S\.|Seite)( | )(*? )Zitat S\.( | )(\d)', u'Seite \\3Zitat Seite \\5'), # Gentleman, Umlaut (ur' \.( | )((\d)*?\. ISBN)', u' Seite \\2'), # Sonagramm, Isotopie #-> <br /> (ur'(<br)/??>', u'\\1 />'), (ur'{{PAGENAME}}', u'{{subst:PAGENAME}}'), # Бојан, papír (ur'…', u'…'), # Hoffnung #IPA vor Hörbsp (ur'((<!--)??:{{Hörbeispiele}}*?)\r?\n(:{{IPA}}*?)\r?\n', u'\\3\n\\1\n'), # currus, akker #''kein Plural'' -> {{kPl.}} (ur'({{Pl\.}} )??\'\'kein Plural\'\'', u'{{kPl.}}'), # Korsika, Minsk #... -> … (…), sofern in oder nach Lautschrift| # scheint nun doch Konsens in der Community zu geben (ur'(\|}})', u'\\1…\\2'), # Gabel, Bönhase #Satzzeichen nach kursivem Wort ebenfalls kursiv, ausgen ''m'', ''mf'' (ur'(\'\'*?)\'\'()(\)', u'\\1\\2\'\'\\3'), # er, Meer #entf Leerst am Zeilenende, ausgen nach (ur'(.) +?\r?\n', u'\\1\n'), # Varietas, Hand #entf <!--{{Abkürzungen}}--> usw. (ur'<!-- ??{{(Alternative Schreibweisen|Abkürzungen|Herkunft|Synonyme|Gegenworte|Gegenwörter|Verkleinerungsformen|Oberbegriffe|Unterbegriffe|Redewendungen|Sprichwörter|Charakteristische Wortkombinationen|Abgeleitete Begriffe|Ähnlichkeiten|----)}} ??-->', u''), #entf div Kommentare (ur'<!--( Bedeutung \, andere Bedeutung \,\.\.\. angeben - möglichst kurze Erklärung ??|-*?| hinter jedem oder vor allen Synonymen angegen, auf welche Bedeutung es/sie sich bezieht/en | Oberbegriffe aufsteigend nach Größe sortiert | für Bedeutung \, andere Bedeutung \, usw\. | Oberbegriffe aufsteigend nach Größe sorchent | Unterbegriffe absteigend nach Größe sorchent | Hier kannst du weitere Bausteine einsetzen, zum Beispiel für Synonyme Ober- oder Unterbegriffe. Eine Auswahl solcher Bausteine findest du über diesem Bearbeitungsfenster! | /Übersetzungstabelle |alphabetisch sortiert| tot beim Eintrag von Tod\, und umgekehrt | Links/Rechts | /(Flexions|Dialekt|Übersetzungs)tabelle(\r?\n)??/ ??| vor jedem Synonym angeben, auf welche Bedeutung es sich bezieht | Einträge üblicher Nachbarworte insbesondere gebräuchlicher Kombinationen \(was man sofort damit verbindet\)| vor jedem Synonym angeben, auf welche Bedeutung es sich bezieht )-->', u''), # Hering, Seidenschwanz, friend, drängen, Geschützturm, zulässig (ur'<!--( Trennzeichen "·"|{{----}}|- Substantiv Tabelle -)-->', u''), # contributo, Erbspüree, pische #entf in Überschr {{Wortart|Wortverbg}}, aber nur wenn auch {{Wortart|Redewendung}} (ur'({{Wortart\|Redewendung\|*?}}), {{Wortart\|Wortverbindung\|*?}}', u'\\1'), # Hals- und Beinbruch (ur'{{Wortart\|Wortverbindung\|*?}}, ({{Wortart\|Redewendung\|*?}})', u'\\1'), # auf der Nase herumtanzen #entf in Überschr {{Wortart|Eigenname}}, aber nur wenn {{Wortart|Toponym}} folgt # mit lookahead assertion: (ur'{{Wortart\|Eigenname\|*?}}, (?={{Wortart\|Top)', u''), # Skottland #entf leere ÜbersetzungsVorl, ausgen en fr it es (ur'\*{{(ar|ca|cs|da|eo|fi|fo|hu|is|ja|ko|la|nl|oc|pl|pt|ro|ru|sq|sr|tr|zh)}}: \ ??({{Ü\|\w\w\|}})??( {{}})??\r?\n', u''), # Tafelente, Olfaktorius, principio #entf Tabelle Dialektausdrücke falls leer (ur'{{Dialektausdrücke \(Deutsch\)\|\r?\n\*Alemannisch: ??\r?\n\*Bairisch: ??\r?\n\|\r?\n\*({{nds}}|Niedersächsisch): ??\r?\n\*Ostmitteldeutsch: ??\r?\n}}\r?\n', u''), (ur'{{Dialektausdrücke \(Deutsch\)\|\r?\n\*Berlinerisch: \ ??\r?\n\*Elsässisch: \ ??\r?\n\|\r?\n\*Kölsch: \ ??\r?\n\*Schwäbisch: \ ??\r?\n}}\r?\n', u''), # Pulverschnee (ur'{{Dialektausdrücke \(Deutsch\)\|\r?\n\*Bairisch: \ \\] ??\r?\n\*Elsässisch: \ \\] ??\r?\n\|\r?\n\*Kölsch: \ \\] ??\r?\n\*Schwäbisch: \ \\] ??\r?\n}}\r?\n', u''), # Anastazja #verlinke Sachgebiet (ur'({{Bedeutungen}}\r?\n: ??\]*?\] \'\')\??\]??(\'\':|:\'\')', u'\\1]:\'\''), # Note, violin, Rückgrat #entf einsamen Doppelpkt, wenn davor und danach 1 Leerz (ur'\r?\n\r?\n:\r?\n\r?\n', u'\n'), # Erbspüree #entf überflüssige Leerz, max 1 Leerz (=2 newlines) untereinander (ur'(\r?\n){3,}', u'\n\n'), #entf leere Kommentartags (ur'(\r?\n)*?<!--(\r?\n)+?-->(\r?\n)*?', u''), # heimur, Erdmaus #entkommentiere {Beispiele} (ur'(\r?\n)*?<!--(\r?\n)*?({{Beispiele}}\r?\n:\)(\r?\n)*?-->(\r?\n)*?', u'\n\n\\3\n'), # Portúgal, байрактар #entf (leere) Bausteine, wenn Folgezeile(n) leer und die darauffolgende Zeile nicht mit Doppelpkt beginnt (ur'{{(Alternative Schreibweisen|Abkürzungen|Herkunft|Synonyme|Gegenworte|Gegenwörter|Oberbegriffe|Unterbegriffe|Namensvarianten|Bekannte Namensträger|Redewendungen|Charakteristische Wortkombinationen|Abgeleitete Begriffe)}}(\r?\n){2,}()', u'\n\\3'), # Saksa, valere #entf (leere) Bausteine, sofern in Folgezeile : oder : oder : ] steht; diese Zeile hier darf nicht weiter oben stehen (ur'{{(Alternative Schreibweisen|Abkürzungen|Herkunft|Synonyme|Gegenworte|Gegenwörter|Weibliche Wortformen|Männliche Wortformen|Verkleinerungsformen|Oberbegriffe|Unterbegriffe|Bekannte Namensträger|Redewendungen|Charakteristische Wortkombinationen|Abgeleitete Begriffe|Ähnlichkeiten)}}\r?\n:( ??\ ??)?( ??\\])?\r?\n()', u'\\4'),
(ur'{{veraltet}}', u'{{va.}}'), # Greißler (ur'{{veraltet(\|)}}', u'{{va.\\1}}'), # Zelebrität
(ur'Hawaianisch', u'Hawaiianisch'), # hekau, aka (ur'hawaianisch', u'hawaiianisch'), # aa #entf auskommentierte Texte (Maori) (ur'<!--{{Silbentrennung}} *?\r?\n:·(\r?\n)?-->\r?\n\r?\n', u''), # Fabrisíus, Αριστοφάνης (ur'<!--{{Silbentrennung}} *?\r?\n:, {{Pl\.}} -->\r?\n\r?\n', u''), # honi (ur'{{(Ober|Unter)begriffe}}\r?\n<!-- (Ober|Unter)begriffe a(uf|b)steigend nach Größe sortiert\r?\n:(\)??\r?\n-->\r?\n\r?\n', u''), # honi, pepakonu (ur'{{Synonyme}}\r?\n<!-- hinter jedem oder vor allen Synonymen angegen, auf welche Bedeutung es/sie sich bezieht/en\r?\n:\ *?\r?\n(\r?\n)?-->\r?\n\r?\n', u''), # quiell, tatanga (ur'<!-- hinter jedem oder vor allen Synonymen angegen, auf welche Bedeutung es/sie sich bezieht/en-->\r?\n', u''), (ur'{{Beispiele}}\r?\n<!-- für Bedeutung \, andere Bedeutung \, usw\.\r?\n:\ *?\r?\n(\r?\n)?-->\r?\n', u'{{Beispiele}}\n:\n'), # honi, uaua (ur'{{Charakteristische Wortkombinationen}}\r?\n<!-- Einträge üblicher Nachbarworte insbesondere gebräuchlicher Kombinationen \(was man sofort damit verbindet\)\r?\n:\ *?\r?\n(\r?\n)?-->\r?\n\r?\n', u''), # honi, uaua (ur'{{Abgeleitete Begriffe}}\r?\n<!-- Abgeleitete Begriffe alphabetisch sortiert \(z\.B\. Wörterbuch, wortgewandt\) :\ *?\r?\n\r?\n(\r?\n)?-->', u''), # vene, quiell (ur'<!-- ??{{Alternative Schreibweise}} ??-->', u''), # pōpokorua, whakakai (ur' ??<!--\(Bild\)\|\r?\nBild=\?\?\?\.jpg\|210px\|1\|\?\?\?-->', u''), # jannarzu, marché de Noël #verschiebe Pipe nach 'Sprache Subst/Adj/Verb/Adv Übersicht, VerbTab' an Anf der nächsten Zeile (ur'({{*?(Substantiv Übersicht|Adjektiv Übersicht|Verb Übersicht|Adverb Übersicht|Verb-Tabelle)) *?\| *?\s\n *?(\w)', u'\\1\n|\\3'), #in Flexvorl: des Kind(e)s -> des Kinds<br />des Kindes (ur'(\|*? (Singular|Plural)=)(*?)\(e\)(*)', u'\\1\\3\\4<br />\\3e\\4'), #genau eine Zeile vor Textbausteinen, nicht mehr und nicht weniger ###(ur'(\r?\n)+?{{(Anmerkung|Alternative Schreibweisen|Alte Rechtschreibung|Nebenformen|Worttrennung|Aussprache|Bedeutungen|Abkürzungen|Herkunft|Synonyme|Gegenwörter|Oberbegriffe|Unterbegriffe|Beispiele|Redewendungen|Sprichwörter|Charakteristische Wortkombinationen|Abgeleitete Begriffe|Referenzen}|Grammatische Merkmale|Grundformverweis|Quellen|Ähnlichkeiten)}}', ### u'\n\n{{\\2}}'), # Emblem, agat (ur'(\r?\n)+?{{(Adjektiv-Tabelle|Verb-Tabelle)', u'\n\n{{\\2'), # kurzweilen #genau eine Zeile vor Flexvorl häufiger Sprachen, nicht mehr und nicht weniger (Achtung: schopný) (ur'=(\r?\n)+?{{(Dänisch|Deutsch|Englisch|Französisch|Irisch|Isländisch|Italienisch|Katalanisch|Lateinisch|Niederländisch|Okzitanisch|Polnisch|Russisch|Spanisch|Tschechisch|Ungarisch)', u'=\n\n{{\\2'), #neue Zeile nach Worttrg (ur'({{Worttrennung}}): ', u'\\1\n:'), # Eysturríki (ur'({{Worttrennung}})(\S)', u'\\1\n:\\2'), #pona, marchew #entf ] wenn Bild oder Bild 1 in Vorl (ur'(\|Bild( 1)??=.*?)\\]', u'\\1'), # Wegerich, Gefriertruhe #entf Leerst nach Doppelpkt oder 2 Doppelpkten am Zeilenanf (ur'\s\n(:{1,2}) +()', u'\n\\1\\2'), #entf Leerst in ÜbersetzgsVorl vor }} und nach | (ur'({{Ü\|*?\|*?) }}', u'\\1}}'), (ur'({{Ü\|*?\|) (*?)}}', u'\\1\\2}}'), #entf überzählige Leerst in Überschr vor === (ur' ==', u' =='), # billion, zwirnen #erg fehlende Leerst in Überschr vor === und == (ur'()((=){2,3})\r?\n', u'\\1 \\2\n'), # sein, Rand #erg fehlende Leerst in Überschr nach === und == (ur'^==()', u'== \\1'), # Ethylen (ur'^(== *?) ??\({', u'\\1 ({'), # Aufschneider (ur'^==={', u'=== {'), # breakfast #''f'' -> {{f}} (ur' \'\'()\'\'()', u' {{\\1}}\\2'), (ur' \'\'m/f\'\'', u' {{mf}}'), # -> (ur'^:\2\]', u':'), (ur'<br clear="all"( /)??(br)??>', u'{{Absatz}}'), #S. oder p. -> Seite (ur'^(*? )\.( | )(\d)', u'\\1Seite \\3'), # ausgen Zitate (ur'(S\.|Seite)( | )(*? )Zitat S\.( | )(\d)', u'Seite \\3Zitat Seite \\5'), # Gentleman, Umlaut (ur' \.( | )((\d)*?\. ISBN)', u' Seite \\2'), # Sonagramm, Isotopie #-> <br /> (ur'(<br)/??>', u'\\1 />'), (ur'{{PAGENAME}}', u'{{subst:PAGENAME}}'), # Бојан, papír (ur'…', u'…'), # Hoffnung #''kein Plural'' -> {{kPl.}} (ur'({{Pl\.}} )??\'\'kein Plural\'\'', u'{{kPl.}}'), # Korsika, Minsk #... -> … (…), sofern in oder nach Lautschrift| (ur'(\|}})', u'\\1…\\2'), # Gabel, Bönhase #Satzzeichen nach kursivem Wort ebenfalls kursiv, ausgen ''m'', ''mf'' #vorerst auskommentiert, s. Disku zu WT:Typografie ###(ur'(\'\'*?)\'\'()(\)', u'\\1\\2\'\'\\3'), # er, Meer #entf Leerst am Zeilenende, ausgen nach (ur'(.) +?\r?\n', u'\\1\n'), # Varietas, Hand #entf in Überschr {{Wortart|Wortverbg}}, aber nur wenn auch {{Wortart|Redewendung}} (ur'({{Wortart\|Redewendung\|*?}}), {{Wortart\|Wortverbindung\|*?}}', u'\\1'), # Hals- und Beinbruch (ur'{{Wortart\|Wortverbindung\|*?}}, ({{Wortart\|Redewendung\|*?}})', u'\\1'), # auf der Nase herumtanzen #entf in Überschr {{Wortart|Eigenname}}, aber nur wenn {{Wortart|Toponym}} folgt # mit lookahead assertion: (ur'{{Wortart\|Eigenname\|*?}}, (?={{Wortart\|Top)', u''), # Skottland #entf leere ÜbersetzungsVorl, ausgen en fr it es (ur'\*{{(ar|ca|cs|da|eo|fi|fo|hu|is|ja|ko|la|nl|oc|pl|pt|ro|ru|sq|sr|tr|zh)}}: \ ??({{Ü\|\w\w\|}})??( {{}})??\r?\n', u''), # Tafelente, Olfaktorius, principio #verlinke Sachgebiet (ur'({{Bedeutungen}}\r?\n: ??\]*?\] \'\')\??\]??(\'\':|:\'\')', u'\\1]:\'\''), # Note, violin, Rückgrat #entf einsamen Doppelpkt, wenn davor und danach 1 Leerz (ur'\r?\n\r?\n:\r?\n\r?\n', u'\n'), # Erbspüree #entf überflüssige Leerz, max 1 Leerz (=2 newlines) untereinander ###(ur'(\r?\n){3,}', u'\n\n'), #entf leere Kommentartags (ur'(\r?\n)*?<!--(\r?\n)+?-->(\r?\n)*?', u''), # heimur, Erdmaus #entkommentiere {Beispiele} (ur'(\r?\n)*?<!--(\r?\n)*?({{Beispiele}}\r?\n:\)(\r?\n)*?-->(\r?\n)*?', u'\n\n\\3\n'), # Portúgal, байрактар #entf (leere) Bausteine, wenn Folgezeile(n) leer und die darauffolgende Zeile nicht mit Doppelpkt beginnt (ur'{{(Alternative Schreibweisen|Abkürzungen|Herkunft|Synonyme|Gegenworte|Gegenwörter|Oberbegriffe|Unterbegriffe|Namensvarianten|Bekannte Namensträger|Redewendungen|Charakteristische Wortkombinationen|Abgeleitete Begriffe)}}(\r?\n){2,}()', u'\n\\3'), # Saksa, valere #entf (leere) Bausteine, sofern in Folgezeile : oder : oder : ] steht; diese Zeile hier darf nicht weiter oben stehen (ur'{{(Alternative Schreibweisen|Abkürzungen|Herkunft|Synonyme|Gegenworte|Gegenwörter|Weibliche Wortformen|Männliche Wortformen|Verkleinerungsformen|Oberbegriffe|Unterbegriffe|Bekannte Namensträger|Redewendungen|Charakteristische Wortkombinationen|Abgeleitete Begriffe|Ähnlichkeiten)}}\r?\n:( ??\ ??)?( ??\\])?\r?\n()', u'\\4'),
#Ortsnamen-Grundwort -> Ortsnamengrundwort (ur'\\]', u']'), # Hain (ur'Wortart\|Ortsnamen-Grundwort', u'Wortart|Ortsnamengrundwort'), # -bach, -by #füge fehlende Leerst zw Komma und {{Wortart| ein (ur',{{Wortart\|', u', {{Wortart|'), # -möle, Meksîk #ers auskommentierte ] und ] (ur'<!--(\r?\n)+?{{(Silben|Wort)trennung}}\r?\n:, {{Pl\.}}\r?\n\r?\n{{Aussprache}}\r?\n:\\]: {{fehlend}}, {{Pl\.}} {{fehlend}}\r?\n:\\]: {{Lautschrift\|…}}, {{Pl\.}} {{Lautschrift\|…}}\r?\n-->', u'{{Worttrennung}}\n:, {{Pl.}}\n\n{{Aussprache}}\n:{{IPA}} {{Lautschrift|…}}, {{Pl.}} {{Lautschrift|…}}\n:{{Hörbeispiele}} {{fehlend}}, {{Pl.}} {{fehlend}}'), # sólskjálftafræði, mačka #entf Müll (ur'\r?\n<!-- Abgeleitete Begriffe alphabetisch sortiert \(z\.B\. Wörterbuch, wortgewandt\) :\ ??(\r?\n)+?-->\r?\n', u'\n\n'), # honi, pepakonu #entf aus Vorl {{Wikipedia|}} Leerst nach | und vor }} (ur'({{Wikipedia\|) +(+?) +}}', u'\\1\\2}}'), # cervogia, pepakonu (ur'({{Wikipedia\|spr=(+?)\|) +(+?) +}}', u'\\1\\3}}'), # reo, hōʻikeʻike #{Abkürzungen} vor {Herkunft}; erkennt leider keine fremden Schriften (ur'({{(Anker\|)??Herkunft}}\r?\n\|<>(){}„“/.,;!?"#]*?\r?\n\r?\n)({{Abkürzungen}}.+?\r?\n\r?\n)', u'\\3\\1'), # Grundstück, Achill #weiterer Botlauf mit -excepttext:{{----}} -excepttext:{{2x----}} #(ur'({{Herkunft}}.+?\r?\n\r?\n)({{Abkürzungen}}.+?\r?\n\r?\n)', u'\\2\\1'), (ur'{{veraltet}}', u',{{va.}}'),
#korr Reihenfolge der Formen: zuerst Sg, dann Pl #(ur'({{Grammatische Merkmale}}\r?\n)(\*Nominativ Plural des Su*?\r?\n)(\*Genitiv Singular des Su*?\r?\n)(\*Genitiv Plural des Su*?\r?\n)(\*Dativ Singular des Su*?\r?\n)(\*Dativ Plural des Su*?\r?\n)(\*Akkusativ Singular des Su*?\r?\n)(\*Akkusativ Plural des Su*?\r?\n)', u'\\1\\3\\5\\7\\2\\4\\6\\8'), # Buchfinken, Athleten (ur'({{Grammatische Merkmale}}\r?\n)(\*Nominativ Plural des Substantivs )(?:\'\'\')?(*?)(?:\'\'\')?\r?\n(\*Genitiv Plural des Substantivs )(?:\'\'\')?(*?)(?:\'\'\')?\r?\n(\*Dativ Singular des Substantivs )(?:\'\'\')?(*?)(?:\'\'\')?\r?\n(\*Akkusativ Plural des Substantivs )(?:\'\'\')?(*?)(?:\'\'\')?\r?\n', u'\\1\\6\'\'\'\\7\'\'\'\n\\2\'\'\'\\3\'\'\'\n\\4\'\'\'\\5\'\'\'\n\\8\'\'\'\\9\'\'\'\n'), # Ballaste, Astronyme
#Vorlagenname: {{Tschechisch Verb Übersicht Imperf/Perf -> imperfektiv/perfektiv}}. Entf Leerst in Vorl (ur'{{Tschechisch Verb Übersicht Imperf', u'{{Tschechisch Verb Übersicht imperfektiv'), # vařit, trvat (ur'{{Tschechisch Verb Übersicht Perf', u'{{Tschechisch Verb Übersicht perfektiv'), (ur'(\|imperfektiv) +?=', u'\\1='), (ur'(\|perfektiv) +?=', u'\\1='), (ur'(\|\d\. Person Singular) +?=', u'\\1='), (ur'(\|\d\. Person Plural) +?=', u'\\1='), (ur'(\|Präteritum Femininum) +?=', u'\\1='), (ur'(\|Partizip Perfekt) +?=', u'\\1='), (ur'(\|Partizip Passiv) +?=', u'\\1='), (ur'(\|Imperativ Singular) +?=', u'\\1='),
#Bot findet keine Lemmata mit mehreren verlinkten Wörtern im Titel #schreibe alle Eintr in Kat:S&L_Schreibweise in Datei _CHLI.txt (1701 Eintr) #(ur'==\r?\n', u'== \n'), #_CHLI.txt: entf Eintr, wo in Lemma ss mehrmals vorkommt: Begrüssungskuss, Fliessgewässer, Reissverschluss, # Weissrusse, Weisswasser etc.; alle ss -> ß #danach lese Eintr aus Datei _CHLI.txt und ergänze: {{Alternative Schreibweisen}}\n:{{CH&LI}} ], falls nicht vorhanden. #{{CH&LI}} zw {{Wortart}} und {{Worttrennung}} (ur'== +?((+?)(?:\*?) \((+?==(?:\r?\n)+?=== +?{{Wortart\|+?\|Deutsch}}+?===(?:\r?\n)+?))({{Alternative Schreibweisen}}\r?\n:{{CH&LI}} +?\+?\]\](?:\r?\n)+?)?({{Worttr)', u'== \\1{{Alternative Schreibweisen}}\n:{{CH&LI}} ]\n\n\\6'), #Gliedermaßstäbe, grüße, Glatzer Neiße, Fehler: Großer Bär, Weißer Sonntag #{{CH&LI}} zw {{Flextabelle}} und {{Worttrennung}} (ur'== +?((+?)(?:\*?) \((+?==(?:\r?\n)+?=== +?{{Wortart\|+?\|Deutsch}}+?===(?:\r?\n)+?{{(?:Deutsch Substantiv Üb|Deutsch Adjektiv Üb|Deutsch adjekt|Verb-Tab)+?}}(?:\r?\n)+?))({{Alternative Schreibweisen}}\r?\n:{{CH&LI}} +?\+?\]\](?:\r?\n)+?)?({{Worttr)', u'== \\1{{Alternative Schreibweisen}}\n:{{CH&LI}} ]\n\n\\6'), # anreißen, Abbildungsmaßstab, dreißigste, Außenstehende, lichtes Maß #{{CH&LI}} zw {{Wortart}} und {{Nebenformen}} (ur'== +?((+?)(?:\*?) \((+?==(?:\r?\n)+?=== +?{{Wortart\|+?\|Deutsch}}+?===(?:\r?\n)+?))({{Alternative Schreibweisen}}\r?\n:{{CH&LI}} +?\+?\]\](?:\r?\n)+?)?({{Nebenfor)', u'== \\1{{Alternative Schreibweisen}}\n:{{CH&LI}} ]\n\n\\6'), # Dreikantmaßstabes
#Bot findet nur Fälle ß -> ss und keine Lemmata mit mehreren verlinkten Wörtern im Titel #schreibe alle Eintr in Kat:Alte_Schreibweise_(Deutsch) in Datei _AlteSch.txt (1705 Eintr) #(ur'==\r?\n', u'== \n'), #_AlteSch.txt: entf Eintr, wo in Lemma ss 2x vorkommt: Baßschlüssel, Begrüßungskuss, Renaissanceschloss #alle ß -> ss #danach lese Eintr aus Datei _AlteSch.txt und ergänze: {{Alte Rechtschreibung}}\n:], falls nicht vorhanden. #Aufruf: python replace.py -ns:0 -dotall -regex -multiline -fix:AlteSch -excepttitle:: -excepttitle:tion\) -file:_AlteSch.txt #{{Alte Rechtschreibung}} zw {{Wortart}} und {{Worttrennung}} (ur'== +?((+?)(?:\*?) \((+?==(?:\r?\n)+?=== +?{{Wortart\|+?\|Deutsch}}+?===(?:\r?\n)+?))({{Alte Rechtschreibung}}\r?\n: +?\+?\]\](?:\r?\n)+?)?({{Worttr)', u'== \\1{{Alte Rechtschreibung}}\n:]\n\n\\6'), # zusammengepasst #{{Alte Rechtschreibung}} zw {{Flextabelle}} und {{Worttrennung}} (ur'== +?((+?)(?:\*?) \((+?==(?:\r?\n)+?=== +?{{Wortart\|+?\|Deutsch}}+?===(?:\r?\n)+?{{(?:Deutsch Substantiv Üb|Deutsch Adjektiv Üb|Deutsch adjekt|Verb-Tab)+?}}(?:\r?\n)+?))({{Alte Rechtschreibung}}\r?\n: +?\+?\]\](?:\r?\n)+?)?({{Worttr)', u'== \\1{{Alte Rechtschreibung}}\n:]\n\n\\6'), # Zündschloss #{{Alte Rechtschreibung}} zw {{Wortart}} und {{Nebenformen}} (ur'== +?((+?)(?:\*?) \((+?==(?:\r?\n)+?=== +?{{Wortart\|+?\|Deutsch}}+?===(?:\r?\n)+?))({{Alte Rechtschreibung}}\r?\n: +?\+?\]\](?:\r?\n)+?)?({{Nebenfor)', u'== \\1{{Alte Rechtschreibung}}\n:]\n\n\\6'), # Messwerte, mit einem Schisslaweng
#ersetze in {Ref-cs-volny} ANSI durch UTF8 (ur'(-volny\|*?)%E1', u'\\1á'), (ur'(-volny\|*?)%E1', u'\\1á'), (ur'(-volny\|*?)%E1', u'\\1á'), (ur'(-volny\|*?)%E1', u'\\1á'), (ur'(-volny\|*?)%E9', u'\\1é'), (ur'(-volny\|*?)%E9', u'\\1é'), (ur'(-volny\|*?)%E9', u'\\1é'), (ur'(-volny\|*?)%E9', u'\\1é'), (ur'(-volny\|*?)%ED', u'\\1í'), (ur'(-volny\|*?)%ED', u'\\1í'), (ur'(-volny\|*?)%ED', u'\\1í'), (ur'(-volny\|*?)%ED', u'\\1í'), (ur'(-volny\|*?)%F3', u'\\1ó'), (ur'(-volny\|*?)%FA', u'\\1ú'), (ur'(-volny\|*?)%FA', u'\\1ú'), (ur'(-volny\|*?)%FD', u'\\1ý'), (ur'(-volny\|*?)%FD', u'\\1ý'), (ur'(-volny\|*?)%FD', u'\\1ý'), (ur'(-volny\|*?)%FD', u'\\1ý'), (ur'(-volny\|*?)%EC', u'\\1ě'), (ur'(-volny\|*?)%EC', u'\\1ě'), (ur'(-volny\|*?)%EC', u'\\1ě'), (ur'(-volny\|*?)%EC', u'\\1ě'), (ur'(-volny\|*?)%9A', u'\\1š'), (ur'(-volny\|*?)%9A', u'\\1š'), (ur'(-volny\|*?)%9A', u'\\1š'), (ur'(-volny\|*?)%9A', u'\\1š'), (ur'(-volny\|*?)%E8', u'\\1č'), (ur'(-volny\|*?)%E8', u'\\1č'), (ur'(-volny\|*?)%E8', u'\\1č'), (ur'(-volny\|*?)%E8', u'\\1č'), (ur'(-volny\|*?)%F8', u'\\1ř'), (ur'(-volny\|*?)%F8', u'\\1ř'), (ur'(-volny\|*?)%9E', u'\\1ž'), (ur'(-volny\|*?)%9E', u'\\1ž'), (ur'(-volny\|*?)%9E', u'\\1ž'), (ur'(-volny\|*?)%F9', u'\\1ů'), (ur'(-volny\|*?)%F9', u'\\1ů'), (ur'(-volny\|*?)%F2', u'\\1ň'), (ur'(-volny\|*?)%EF', u'\\1ď'), (ur'(-volny\|*?)%9D', u'\\1ť'), (ur'(-volny\|*?)%9D', u'\\1ť'), (ur'(-volny\|*?)%D8', u'\\1Ř'), (ur'(-volny\|*?)%8A', u'\\1Š'), (ur'(-volny\|*?)%DA', u'\\1Ú'), (ur'(-volny\|*?)%C8', u'\\1Č'),
#ersetze {{Ref-Canoo| durch {{Ref-CanooT|, aber nur wenn danach ein % steht (ur'{{Ref-Canoo(\|*?%*?)', u'{{Ref-CanooT\\1'), #ersetze in {Ref-UniLeipzig} ANSI durch UTF8 #?UniLeipzig hat Probleme mit zweibuchstabigen Wörtern mit Umlaut beginnend: Öl (ur'({{Ref-UniLeipzig\|*?)%E4', u'\\1ä'), (ur'({{Ref-UniLeipzig\|*?)%C4', u'\\1Ä'), (ur'({{Ref-UniLeipzig\|*?)%F6', u'\\1ö'), (ur'({{Ref-UniLeipzig\|*?)%D6', u'\\1Ö'), (ur'({{Ref-UniLeipzig\|*?)%FC', u'\\1ü'), (ur'({{Ref-UniLeipzig\|*?)%DC', u'\\1Ü'), (ur'({{Ref-UniLeipzig\|*?)%DF', u'\\1ß'), (ur'({{Ref-UniLeipzig\|*?)%E4', u'\\1ä'), (ur'({{Ref-UniLeipzig\|*?)%C4', u'\\1Ä'), (ur'({{Ref-UniLeipzig\|*?)%F6', u'\\1ö'), (ur'({{Ref-UniLeipzig\|*?)%D6', u'\\1Ö'), (ur'({{Ref-UniLeipzig\|*?)%FC', u'\\1ü'), (ur'({{Ref-UniLeipzig\|*?)%DC', u'\\1Ü'), (ur'({{Ref-UniLeipzig\|*?)%DF', u'\\1ß'), (ur'({{Ref-UniLeipzig\|*?)%E4', u'\\1ä'), (ur'({{Ref-UniLeipzig\|*?)%C4', u'\\1Ä'), (ur'({{Ref-UniLeipzig\|*?)%F6', u'\\1ö'), (ur'({{Ref-UniLeipzig\|*?)%D6', u'\\1Ö'), (ur'({{Ref-UniLeipzig\|*?)%FC', u'\\1ü'), (ur'({{Ref-UniLeipzig\|*?)%DC', u'\\1Ü'), (ur'({{Ref-UniLeipzig\|*?)%DF', u'\\1ß'), (ur'({{Ref-UniLeipzig\|*?)%E4', u'\\1ä'), (ur'({{Ref-UniLeipzig\|*?)%C4', u'\\1Ä'), (ur'({{Ref-UniLeipzig\|*?)%F6', u'\\1ö'), (ur'({{Ref-UniLeipzig\|*?)%D6', u'\\1Ö'), (ur'({{Ref-UniLeipzig\|*?)%FC', u'\\1ü'), (ur'({{Ref-UniLeipzig\|*?)%DC', u'\\1Ü'), (ur'({{Ref-UniLeipzig\|*?)%DF', u'\\1ß'), #füge in {Ref-Grimm} id= vor die id ein (ur'({{Ref-Grimm\|+?\|)(\w\w\d{2,6}}})', u'\\1id=\\2'),
#] #ers {{Ref-CanooT| durch {{Ref-Canoo| und gleichzeitig ANSI (egal ob Groß- od Kleinschreibung) durch UTF8 (ur'({{Ref-Canoo)T??(\|*?)%4', u'\\1\\2ä'), (ur'({{Ref-Canoo)T??(\|*?)%4', u'\\1\\2Ä'), (ur'({{Ref-Canoo)T??(\|*?)%6', u'\\1\\2ö'), (ur'({{Ref-Canoo)T??(\|*?)%6', u'\\1\\2Ö'), (ur'({{Ref-Canoo)T??(\|*?)%', u'\\1\\2ü'), (ur'({{Ref-Canoo)T??(\|*?)%', u'\\1\\2Ü'), (ur'({{Ref-Canoo)T??(\|*?)%', u'\\1\\2ß'), (ur'({{Ref-Canoo)T??(\|*?)%4', u'\\1\\2ä'), (ur'({{Ref-Canoo)T??(\|*?)%4', u'\\1\\2Ä'), (ur'({{Ref-Canoo)T??(\|*?)%6', u'\\1\\2ö'), (ur'({{Ref-Canoo)T??(\|*?)%6', u'\\1\\2Ö'), (ur'({{Ref-Canoo)T??(\|*?)%', u'\\1\\2ü'), (ur'({{Ref-Canoo)T??(\|*?)%', u'\\1\\2Ü'), (ur'({{Ref-Canoo)T??(\|*?)%', u'\\1\\2ß'), (ur'({{Ref-Canoo)T??(\|*?)%4', u'\\1\\2ä'), (ur'({{Ref-Canoo)T??(\|*?)%4', u'\\1\\2Ä'), (ur'({{Ref-Canoo)T??(\|*?)%6', u'\\1\\2ö'), (ur'({{Ref-Canoo)T??(\|*?)%6', u'\\1\\2Ö'), (ur'({{Ref-Canoo)T??(\|*?)%', u'\\1\\2ü'), (ur'({{Ref-Canoo)T??(\|*?)%', u'\\1\\2Ü'), (ur'({{Ref-Canoo)T??(\|*?)%', u'\\1\\2ß'), (ur'({{Ref-Canoo)T??(\|*?)%4', u'\\1\\2ä'), (ur'({{Ref-Canoo)T??(\|*?)%4', u'\\1\\2Ä'), (ur'({{Ref-Canoo)T??(\|*?)%6', u'\\1\\2ö'), (ur'({{Ref-Canoo)T??(\|*?)%6', u'\\1\\2Ö'), (ur'({{Ref-Canoo)T??(\|*?)%', u'\\1\\2ü'), (ur'({{Ref-Canoo)T??(\|*?)%', u'\\1\\2Ü'), (ur'({{Ref-Canoo)T??(\|*?)%', u'\\1\\2ß'), (ur'({{Ref-Canoo)T??(\|*?)%0', u'\\1\\2à'), (ur'({{Ref-Canoo)T??(\|*?)%9', u'\\1\\2é'), ##entf Ref-Canoo, wenn mit Leerzeichen. Ref-Canoo kennt keine Wortkombis (ur':\\] {{Ref-Canoo\|*? *?}}\r?\n', u''), #Glatzer Kessel ##entf Ref-Canoo, wenn + enthält. Ref-Canoo kennt keine Wortkombis (ur':\\] {{Ref-Canoo\|*?\+*?}}\r?\n', u''), #Ausnahme: Futur II, dicht machen #spazieren gehen, entweder...oder ##ers 3 Pkte in Ref-Canoo, Ref-DWDS, Ref-UniLeipzig durch Seitentitel (ur'(== +?(*?) +?\(.*?{{Ref-Canoo\|)\.\.\.', u'\\1\\2'), #aufgeweckt (ur'(== +?(*?) +?\(.*?{{Ref-DWDS\|)\.\.\.', u'\\1\\2'), (ur'(== +?(*?) +?\(.*?{{Ref-UniLeipzig\|)\.\.\.', u'\\1\\2'), ##damit es schneller geht, auch Uni-Leipzig: (ur'({{Ref-UniLeipzig\|*?)%4', u'\\1ä'), (ur'({{Ref-UniLeipzig\|*?)%4', u'\\1Ä'), (ur'({{Ref-UniLeipzig\|*?)%6', u'\\1ö'), (ur'({{Ref-UniLeipzig\|*?)%6', u'\\1Ö'), (ur'({{Ref-UniLeipzig\|*?)%', u'\\1ü'), (ur'({{Ref-UniLeipzig\|*?)%', u'\\1Ü'), (ur'({{Ref-UniLeipzig\|*?)%', u'\\1ß'), (ur'({{Ref-UniLeipzig\|*?)%4', u'\\1ä'), (ur'({{Ref-UniLeipzig\|*?)%4', u'\\1Ä'), (ur'({{Ref-UniLeipzig\|*?)%6', u'\\1ö'), (ur'({{Ref-UniLeipzig\|*?)%6', u'\\1Ö'), (ur'({{Ref-UniLeipzig\|*?)%', u'\\1ü'), (ur'({{Ref-UniLeipzig\|*?)%', u'\\1Ü'), (ur'({{Ref-UniLeipzig\|*?)%', u'\\1ß'), (ur'({{Ref-UniLeipzig\|*?)%0', u'\\1à'), (ur'({{Ref-UniLeipzig\|*?)%9', u'\\1é'), ##%20 -> + (ur'({{Ref-UniLeipzig\|*?)%20(*?)', u'\\1+\\2'), (ur'({{Ref-UniLeipzig\|*?)%20(*?)', u'\\1+\\2'), (ur'({{Ref-UniLeipzig\|*?)%20(*?)', u'\\1+\\2'), (ur'({{Ref-UniLeipzig\|*?)%20(*?)', u'\\1+\\2'), (ur'({{Ref-UniLeipzig\|*?)%20(*?)', u'\\1+\\2'), (ur'({{Ref-UniLeipzig\|*?)%20(*?)', u'\\1+\\2'), #schließlich neuer Botlauf: {{Ref-CanooT| -> {{Ref-Canoo| (ur'(== +?(*?) +?\(.*?{{Ref-Canoo\|)\.\.\.', u'\\1\\2'), (ur'{{Ref-CanooT\|', u'{{Ref-Canoo|'),
#] #Aufruf: python replace.py -ns:0 -dotall -regex -multiline -excepttitle:: -excepttitle:tion\) -transcludes:"Ref-Grimm" -fix:Grimm -save:_Grimm.txt #speichere alle Eintr mit id in Ref-Grimm in Datei _Grimm.txt (6129 titles saved), außer Komma enthaltend, aber incl. äöüÄÖÜß #{{Ref-Grimm|wasser, ''n.''}}, {{Ref-Grimm|berg, ''m.''|id=GB04143}}, {{Ref-Grimm|Öl, Öhl|id=GO01443}}, #(ur'({{Ref-Grimm\|*?id=*?})', u'\\1xy'), #Wörter, auf die mit Grimm mit zumindest 2 verschiedenen id´s im Eintrag verlinkt wird: #er, Bruch, Wetter, Benachrichtigung, Löffel, Ball, Tor, Streber, Hut?, mir, sieben, Steuer, wollen, zwirnen, Neffe, Kiefer, Schote, Gewerk, Stift, #acht, Weihe, Stelze, schier, Kunde, Scheide?, Kegel, Enkel, Band, (sondern), Tau, (Taube), Reis, Kapelle, Leiter, Gericht, wiegen, Nähe, Troll, #offen, Zimt, Pricke?, Lahnung, ergeben, folgen, fest, Gicht, Krätze, Ried, losen, hinter, Bund, rein, Rabatz, Golf, endlich, albern, ziepen, #Krause?, reinigen, Pinke, Borg, Eimer, tönen, verhaspeln, bereiten, Muff, ok Buckel, erschrecken, brüderlich, Schütz, Otter, #Matte, striezen, weichen, Fund, Kluft, rotten, erzen, wahrlich, recht, recht haben, Funk, eichen, tuchen, ledern, schwofen, Schopf, #Wacke, nieder, Knäuel, Rotte, stutzen, Schotte, strippen, Völle, einleben, eh, la, Ficke, Säckel, geren, ausschaffen, #wissen, Wissen #entf manuell alle Wörter in obiger Liste aus Datei _Grimm.txt #scheint ein Fehler bei Grimm vorzuliegen, id ist nötig: Deckel, Münze, überraschen, Stätte #ersetze äöüÄÖÜß durch ae oe ue Ae Oe Ue sz, entf |id=wwddddd #Aufruf: python replace.py -ns:0 -dotall -regex -multiline -fix:Grimm -excepttitle:: -excepttitle:tion\) -file:_Grimm.txt (ur'({{Ref-Grimm\|*?)ä', u'\\1ae'), (ur'({{Ref-Grimm\|*?)ö', u'\\1oe'), (ur'({{Ref-Grimm\|*?)ü', u'\\1ue'), (ur'({{Ref-Grimm\|*?)Ä', u'\\1Ae'), (ur'({{Ref-Grimm\|*?)Ö', u'\\1Oe'), (ur'({{Ref-Grimm\|*?)Ü', u'\\1ue'), (ur'({{Ref-Grimm\|*?)ß', u'\\1sz'), (ur'({{Ref-Grimm\|*?)ä', u'\\1ae'), (ur'({{Ref-Grimm\|*?)ö', u'\\1oe'), (ur'({{Ref-Grimm\|*?)ü', u'\\1ue'), (ur'({{Ref-Grimm\|*?)Ä', u'\\1Ae'), (ur'({{Ref-Grimm\|*?)Ö', u'\\1Oe'), (ur'({{Ref-Grimm\|*?)Ü', u'\\1ue'), (ur'({{Ref-Grimm\|*?)ß', u'\\1sz'), (ur'({{Ref-Grimm\|*?)ä', u'\\1ae'), (ur'({{Ref-Grimm\|*?)ö', u'\\1oe'), (ur'({{Ref-Grimm\|*?)ü', u'\\1ue'), (ur'({{Ref-Grimm\|*?)Ä', u'\\1Ae'), (ur'({{Ref-Grimm\|*?)Ö', u'\\1Oe'), (ur'({{Ref-Grimm\|*?)Ü', u'\\1ue'), (ur'({{Ref-Grimm\|*?)ß', u'\\1sz'), (ur'({{Ref-Grimm\|*?)\|id=*?}', u'\\1}'),
#entf {{Siehe auch|Grundform (Deklination|Konjugation)]]}} in Eintr flektierter Formen #] (ur'{{Siehe auch\|\*?\(*?\)\]\]}}\r?\n\r?\n', u''), # braver, seiend
#] #Aufruf: python replace.py -ns:0 -dotall -regex -multiline -excepttitle:: -excepttitle:tion\) -xml:"C:\Pfad\dewiktionary-20130808-pages-articles.xml" -fix:Umlaute -transcludes:"Ref-Grimm" -transcludes:"Ref-Duden" -save:_Umlaute.txt -xmlstart: #speichere alle Eintr in _Umlaute.txt #entf aus Umlaute.txt alle Sonderfälle: Feuer, Quelle, Statue, Konfluenz, Baguette, Taekwondo, Maestro, Konstituente, # Jahreszeit, Tierkreiszeichen, sexuell, bauen, Israel, oszillieren,.. #Die Rückauflösung der Umlaute, sowie des Unterstrichs in die Satz/Sonderzeichen ist per Bot nicht zuverlässig machbar. #Aufruf: python replace.py -dotall -regex -multiline -fix:Umlaute -file:_Umlaute.txt #ers in {Ref-Grimm} und {Ref-Duden} ae oe ue Ae Oe Ue sz durch ä ö ü Ä Ö Ü ß (ur'({{Ref-(Grimm|Duden)\|*?)ae', u'\\1ä'), #Wärmezähler (ur'({{Ref-(Grimm|Duden)\|*?)oe', u'\\1ö'), #Pförtner (ur'({{Ref-(Grimm|Duden)\|*?)ue', u'\\1ü'), (ur'({{Ref-(Grimm|Duden)\|*?)Ae', u'\\1Ä'), (ur'({{Ref-(Grimm|Duden)\|*?)Oe', u'\\1Ö'), (ur'({{Ref-(Grimm|Duden)\|*?)Ue', u'\\1Ü'), (ur'({{Ref-(Grimm|Duden)\|*?)sz', u'\\1ß'), (ur'({{Ref-(Grimm|Duden)\|*?)ae', u'\\1ä'), (ur'({{Ref-(Grimm|Duden)\|*?)oe', u'\\1ö'), (ur'({{Ref-(Grimm|Duden)\|*?)ue', u'\\1ü'), (ur'({{Ref-(Grimm|Duden)\|*?)Ae', u'\\1Ä'), (ur'({{Ref-(Grimm|Duden)\|*?)Oe', u'\\1Ö'), (ur'({{Ref-(Grimm|Duden)\|*?)Ue', u'\\1Ü'), (ur'({{Ref-(Grimm|Duden)\|*?)sz', u'\\1ß'), (ur'({{Ref-(Grimm|Duden)\|*?)ae', u'\\1ä'), (ur'({{Ref-(Grimm|Duden)\|*?)oe', u'\\1ö'), (ur'({{Ref-(Grimm|Duden)\|*?)ue', u'\\1ü'), (ur'({{Ref-(Grimm|Duden)\|*?)Ae', u'\\1Ä'), (ur'({{Ref-(Grimm|Duden)\|*?)Oe', u'\\1Ö'), (ur'({{Ref-(Grimm|Duden)\|*?)Ue', u'\\1Ü'), (ur'({{Ref-(Grimm|Duden)\|*?)sz', u'\\1ß'), (ur'({{Ref-(Grimm|Duden)\|*?)ae', u'\\1ä'), (ur'({{Ref-(Grimm|Duden)\|*?)oe', u'\\1ö'), (ur'({{Ref-(Grimm|Duden)\|*?)ue', u'\\1ü'), (ur'({{Ref-(Grimm|Duden)\|*?)Ae', u'\\1Ä'), (ur'({{Ref-(Grimm|Duden)\|*?)Oe', u'\\1Ö'), (ur'({{Ref-(Grimm|Duden)\|*?)Ue', u'\\1Ü'), (ur'({{Ref-(Grimm|Duden)\|*?)sz', u'\\1ß'),
#ers in Vorl Ref-DWDS Pluszeichen durch Leerzeichen (ur'({{Ref-DWDS\|*?)\+(*?}})', u'\\1 \\2'), (ur'({{Ref-DWDS\|*?)\+(*?}})', u'\\1 \\2'),
### ACHTUNG (\r?\n)*? am Ende der ur-Zeile funzt nicht (vor Interwikilinks) -> \r?\n{0,} (ur'\r?\n{0,}<!-- Weitere Homonyme?? können durch "{{subst:Formatvorlage}}" eingefügt werden\.\r?\nÜberzählige Überschriften \(z\.B\. gleiche?? Sprache?? wie vorherige Eintragung\) löschen\. -->\r?\n{0,}', u'\n\n'), #31 S. Fabeltier, EKG, APO, APPD (ur'\r?\n{0,}<!-- {{Ähnlichkeiten}} tot beim Eintrag von Tod\, und umgekehrt -->\r?\n{0,}', u'\n\n'), #3 S. Fabeltier, HP, französ. (ur'<!-------- Spielte ich nur\, dann \.\.\. -------->\r?\n', u''), #mehr als 100 S. anästhesieren belagern zutragen
(ur'{{Lit-Drosdowski: Vornamen', u'{{Lit-Duden: Lexikon der Vornamen'),
#ers nach LitVorlagen S. od p. durch Seite (ur'({{Lit-*? )\.( | )((\d)*?</ref)', u'\\1Seite \\3'), #in ref-tags: Achill, Laura (ur'({{Lit-*? )\.( | )((\d)*?\r?\n{0,})', u'\\1Seite \\3'), #Afghane, Alexander, Hacke, Anhänger #Ref-Duden: entf 2. Parameter falls mit 1. Parameter identisch (lookahead assertion) (ur'({{Ref-Duden\|(?P<Wort>*?))\|(?P=Wort)}}', u'\\1}}'), #Ampel, Gründer #Ref-wissen.de: entf 2. Parameter (nur ohne Ziffer am Ende) falls 3. Parameter (Umlaut enthaltend) existiert (ur'({{Ref-wissen\.de\|\w*?\|)\w*?\D\|(\w*?\w*?}})', u'\\1\\2'), #Anwältin, Dreikäsehoch, (sonst Problem: Freya, Silk, Westbank) #Ref-Grimm, Ref-Duden: wenn 2. Parameter = Seitentitel -> entf 3. Parameter #(ur'^== +?(?P<Titel>*?) +?\(*?==$', u'\\1'), ## !!Ermittlung des Seitentitels und Speichern in "Titel"!! ## (ur'(^== +?(?P<Titel>*?) +?\(*?==$.*?{{Ref-Grimm\|(?P=Titel))\|*?\D}}', u'\\1}}'), #Bild, Igel|, stad, (para3 nicht id=xyxyZiffer) (ur'(^== +?(?P<Titel>*?) +?\(*?==$.*?{{Ref-Duden\|(?P=Titel))\|*?\D}}', u'\\1}}'), #Füller {{Ref-Duden|Füller|s=Füller}}, Lüge
#] #ers {erweitern|Beispiele|Deutsch} durch {Beispiele fehlen|spr=de} (ur'{{erweitern\|Beispiele\|Deutsch}}(?:\r?\n)(.*?{{Beispiele}}(?:\r?\n):\) *?\r?\n', u'\\1 {{Beispiele fehlen|spr=de}}\n'), #Intralogistik, Bellevue, Huk
#entf 2. Parameter, falls vorhanden (ur'({{Ref-Goethe\|*?)\|*?}}', u'\\1}}'), #paddeln, geil, Achtung:Akt, wenn Para2=... existiert meist das Lemma bei Goethe nicht
#entf in Ref-Grimm ... (ur'({{Ref-Grimm)\|\.\.\.\|\.\.\.}}', u'\\1}}'), #Omi #entf 2. Param, falls mit 1. Param identisch, egal ob dahinter benannter Param id= steht oder nicht (ur'({{Ref-(Pfälzisch|Grimm|Elsässisch|Goethe|Lothringisch|Pfälzisch|Rheinisch|Rheinisch2|Wander|Adelung|Duden)\|(?P<Wort>*?))\|(?P=Wort)(\||})', u'\\1\\4'), #Bauch, Eichelheher, mööte, Kontinuum, Achtung:Alp # füge id= vor ID-Nr. ein (ur'({{Ref-(Meyers|Meyer|Lexer|Grimm|Wander|Pfälzisch|Adelung)\|*?\|)(\w\w\d{5}}})', u'\\1id=\\3'), #Wegwarte, Weißer, kalfatern
(ur'({{Ref-Meyer)\|', u'\\1s|'), #Problem bei Ref-Meyer1905: manchmal gibt es einen Eintrag in Zeno.org, jedoch bei Meyers keinen: Sakramentskapelle, Apothema
#] (ur'(\[\[Kategorie:Tschechisch )-( Listen\, Übersichten und Verzeichnisse)', u'\\1–\\2'), #35 pages: WT:Tschechisch/Übersicht der Zahlen (ur'(\[\[Kategorie:Deutsch )-( Listen\, Übersichten und Verzeichnisse)', u'\\1–\\2'), #89 pages: WT:Deutsch/Erikativ
#] (ur' *?\', u' {{Ref-dictcc|eo|\\1}}'), #baki #zweiter Botlauf: #alternativer Aufruf, wenn Dump nicht aktuell: python pwb.py replace -ns:0 -dotall -regex -multiline -fix:deeo -excepttitle:: -transcludes:"Ref-dictcc" #ers {{Ref-dictcc|eo|<deutsches Wort>}} durch {{Ref-dictcc|eo|<pagename>}} falls dort nicht schon <pagename> steht (ur'(^==) +((?P<Titel>*?) +?\(*?==$.*?{{Ref-dictcc\|eo\|)((?P=Titel)|*?)}}', u'\\1 \\2\\3}}'), #balai, alegorio, desegni
#{{Ref-MittelhochdeutschBMZ -> {{Ref-BMZ und setze vor die id 'id=' falls id vorhanden (ur'{{Ref-MittelhochdeutschBMZ(\|*?)}}', u'{{Ref-BMZ\\1}}'), #Kunkel (ur'{{Ref-MittelhochdeutschBMZ(\|*?\|)(\w\w\d{5})}}', u'{{Ref-BMZ\\1id=\\2}}'), #slüpfen
#entf ] wenn Sprichwort od Redewendung (ur'\n\n\\]', u''), #aller guten Dinge sind drei, alles in einen Topf werfen, am Ball bleiben
#2 Läufe, zuerst Dialektausdrücke, dann Rest; jeweils mit Formsachen #1. Lauf: #], ] #ers {{Ü-links}} mit {{Dialektausdrücke durch {{Ü-Tabelle= usw. (ur'^{{Ü-links}}(.+?)^{{Ü-Abstand}}(.+?)^{{Ü-rechts}} ??( ??<!-- für weitere Sprachkürzel siehe den Link (rechts )??unterhalb des Editierfensters -->)?(?:\r?\n{1,})^{{Dialektausdrücke \(*?\)\|(*?)^\|(.*?^}})', u'{{Ü-Tabelle|Ü-links=\\1|Ü-rechts=\\2|Dialekttabelle=\\5|D-Rechts=\\6'), #Aal, Teilchenbeschleuniger, sein, abattre, Hammer, Erdbeere #entf überflüssige Leerzeilen, max 1 Leerz (=2 newlines) untereinander (ur'(\r?\n){3,}', u'\n\n'), #verstehen #entf Leerzeichen nach Doppelpkt oder 2 Doppelpkten am Zeilenanf (ur'\s\n(:{1,2}) +()', u'\n\\1\\2'), # -> (ur'^:\2\]', u':'), #titulieren (ur'^:\3\]', u':'), #Aufladesystem, Burgunder #setze richtigen Bindestrich (ur'(^:\)', u'\\1–\\2'), #Austernfischer, Brot (ur'(^:\)', u'\\1–\\2'), #tief # -> (ur'^(:\)', u'\\1 \\2'), #Umluft, Kanal, Korsar # -> (ur'^:\', u':'), #Lichtstock, fence #entf Leerzeichen am Zeilenende (ur'(.) +?\r?\n', u'\\1\n'), (ur'{{Verb-Tabelle', u'{{Deutsch Verb Übersicht'), #ausbrechen #Befehl_du -> Imperativ Singular (ur'({{(Verb-Tabelle|Deutsch Verb Übersicht).*?^\|)Befehl_du(=*?\n.*?^}})', u'\\1Imperativ Singular\\3'), #verbrechen, liegen #Befehl_ihr -> Imperativ Plural (ur'({{(Verb-Tabelle|Deutsch Verb Übersicht).*?^\|)Befehl_ihr(=*?\n.*?^}})', u'\\1Imperativ Plural\\3'), #sprechen, wiegen #Flexbox: |Bild= ans Ende (ur'(^{{(?:Verb-Tabelle|+? +? Übersicht\r?\n)*?)(^\|Bild+?)(^\|+?)}}', u'\\1\\3\\2}}'), #Auto, Baum, Amphibie, arbeiten #Beispiele: entf Leerzeichen zw “ und <ref> (ur'(^{{Beispiele}}.*?“) +?(<ref>.*?^{{)', u'\\1\\2'), #Lüftung, Apostel, B2B, Modul?! (ur'(^{{Beispiele}}.*?“) +?(<ref>.*?^{{)', u'\\1\\2'), (ur'(^{{Beispiele}}.*?“) +?(<ref>.*?^{{)', u'\\1\\2'), (ur'(^{{Beispiele}}.*?“) +?(<ref>.*?^{{)', u'\\1\\2'), (ur'(^{{Beispiele}}.*?“) +?(<ref>.*?^{{)', u'\\1\\2'), #entf {Ähnlichkeiten} falls leer (ur'^{{Ähnlichkeiten}}\r?\n\r?\n', u''), #Elektrochemie, Gjermani #Hörbsp: {fehlend} -> {Audio|} (ur'(^:{{Hörbeispiele}}+?){{fehlend}}', u'\\1{{Audio|}}'), #August, Hallo, aloofness (ur'(^:{{Hörbeispiele}}+?){{fehlend}}', u'\\1{{Audio|}}'), (ur'(^:{{Hörbeispiele}}+?){{fehlend}}', u'\\1{{Audio|}}'), (ur'(^:{{Hörbeispiele}}+?){{fehlend}}', u'\\1{{Audio|}}'), #verlinke Sachgebiet, Doppelpkt kursiv (ur'(^{{Bedeutungen}}\n^: ??\]*?\] \'\')\??\]??(\'\':|:\'\')', u'\\1]:\'\''), # Allabreve, Andromeda, depravation #ers {{AE}} durch {{amer.}}, ebenso {{BE}} durch {{brit.}} (ur'{{AE((\|.)+?}})', u'{{amer.\\1'), #Aquarellmaler, 1 (ur'{{BE((\|.)+?}})', u'{{brit.\\1'), #Billion #Hörbsp: schreibe AussprLand aus (ur'(^:{{Hörbeispiele}}+?)\((US-)??merik\.\)', u'\\1(amerikanisch)'), #abattoir, cat, Amazon (ur'(^:{{Hörbeispiele}}+?)\((US-)??merik\.\)', u'\\1(amerikanisch)'), (ur'(^:{{Hörbeispiele}}+?)\(rit\.\)', u'\\1(britisch)'), #chilly (ur'(^:{{Hörbeispiele}}+?)\(rit\.\)', u'\\1(britisch)'), (ur'(^:{{Hörbeispiele}}+?)\(sterr\.\)', u'\\1(österreichisch)'), #Armbanduhr, Hinweis (ur'(^:{{Hörbeispiele}}+?)\(sterr\.\)', u'\\1(österreichisch)'), #erg Vorl {Audio|En-us- um (amerikanisch) (ur'{{Audio\|En-us-(*?)\.ogg}}', u'{{Audio|En-us-\\1.ogg|\\1 (amerikanisch)}}'), #huzza #entf {{----}} und {{2x----}} (ur'(^+?$)\n\n??^{{----}}\n\n??(^=== {{Wortart)', u'\\1\n\n\\2'), #Kohl, Bug, Adorf, (ur'(^+?$)\n\n??^{{2x----}}\n\n??(^== +?\({{Sprache)', u'\\1\n\n\\2'), #April, Andreas, Jeremane ###-> Ref-canoo, noch allgemeinen Konsens abwarten ###(ur'{{Ref-Canoo', u'{{Ref-canoo'), #Hahn #2. Lauf: #Ü-links, 0 oder mehr Zeilen entweder mit {{Übers umleiten oder *{{de}}:, Ü-rechts. Entf des Sprachkürzelkommentars (ur'^{{Ü-links}} ??((?:\r?\n{1,})(?:(?:^*?{{Übersetzungen umleiten*?\r?\n)*?|(?:^*?{{+?}} ??:*?\r?\n)*?))(?:\r?\n)*?^ ??{{Ü-rechts}}(?: ??<!-- ??für weitere Sprachkürzel siehe den Link (?:rechts )??unterhalb des (?:Editier|Bearbeitungs)fensters ??-->)?', u'{{Ü-Tabelle|Ü-links=\\1|Ü-rechts=\n}}'), #Bayern, Hannibal, Repertoire, Venus #Ü-links, 0 oder mehr Zeilen entweder mit {{Übers umleiten oder *{{de}}:, Ü-Abstand, 0 oder mehr Zeilen entweder mit {{Übers umleiten oder *{{de}}:, Ü-rechts. Entf gleichzeitig Sprachkürzelkommentar (ur'^{{Ü-links}} ??((?:\r?\n{1,})(?:(?:^*?{{Übersetzungen umleiten*?\r?\n)*?|(?:^*?{{+?}} ??:*?\r?\n)*?))(?:\r?\n)*?^ ??{{Ü-Abstand}} ??((?:\r?\n{1,})(?:(?:^*?{{Übersetzungen umleiten*?\r?\n)*?|(?:^*?{{+?}} ??:*?\r?\n)*?))(?:\r?\n)*?^ ??{{Ü-rechts}}(?: ??<!-- ??für weitere Sprachkürzel siehe den Link (?:rechts )??unterhalb des (?:Editier|Bearbeitungs)fensters ??-->)?', u'{{Ü-Tabelle|Ü-links=\\1|Ü-rechts=\\2}}'), #Aal, Bank, Mensch, Polen #entf überflüssige Leerzeilen, max 1 Leerz (=2 newlines) untereinander (ur'(\r?\n){3,}', u'\n\n'), #entf Leerzeichen nach Doppelpkt oder 2 Doppelpkten am Zeilenanf (ur'\s\n(:{1,2}) +()', u'\n\\1\\2'), # -> (ur'^:\2\]', u':'), (ur'^:\3\]', u':'), #setze richtigen Bindestrich (ur'(^:\)', u'\\1–\\2'), (ur'(^:\)', u'\\1–\\2'), (ur'(^:\)', u'\\1–\\2'), #sitzen # -> (ur'^(:\)', u'\\1 \\2'), # -> (ur'^:\', u':'), #entf Leerzeichen am Zeilenende (ur'(.) +?\r?\n', u'\\1\n'), (ur'{{Verb-Tabelle', u'{{Deutsch Verb Übersicht'), #Befehl_du -> Imperativ Singular (ur'({{(Verb-Tabelle|Deutsch Verb Übersicht).*?^\|)Befehl_du(=*?\n.*?^}})', u'\\1Imperativ Singular\\3'), #Befehl_ihr -> Imperativ Plural (ur'({{(Verb-Tabelle|Deutsch Verb Übersicht).*?^\|)Befehl_ihr(=*?\n.*?^}})', u'\\1Imperativ Plural\\3'), #Flexbox: |Bild= ans Ende (ur'(^{{(?:Verb-Tabelle|+? +? Übersicht\r?\n)*?)(^\|Bild+?)(^\|+?)}}', u'\\1\\3\\2}}'), #Beispiele: entf Leerzeichen zw “ und <ref> (ur'(^{{Beispiele}}.*?“) +?(<ref>.*?^{{)', u'\\1\\2'), (ur'(^{{Beispiele}}.*?“) +?(<ref>.*?^{{)', u'\\1\\2'), (ur'(^{{Beispiele}}.*?“) +?(<ref>.*?^{{)', u'\\1\\2'), (ur'(^{{Beispiele}}.*?“) +?(<ref>.*?^{{)', u'\\1\\2'), (ur'(^{{Beispiele}}.*?“) +?(<ref>.*?^{{)', u'\\1\\2'), #erg Leerzeichen vor {{Beispiele fehlen}} (von Fisch21 mit AWB) (ur'(^:\) ??({{Beispiele fehlen)', u'\\1 \\2'), #hangya, gjalpë, platina #PAGENAME -> Seitentitel (hat im Eintragsnamensraum nichts verloren) (ur'{{PAGENAME}}', u'{{subst:PAGENAME}}'), #Abilio, ti #entf {Ähnlichkeiten} falls leer (ur'^{{Ähnlichkeiten}}\r?\n\r?\n', u''), #Hörbsp: {fehlend} -> {Audio|} (ur'(^:{{Hörbeispiele}}+?){{fehlend}}', u'\\1{{Audio|}}'), (ur'(^:{{Hörbeispiele}}+?){{fehlend}}', u'\\1{{Audio|}}'), (ur'(^:{{Hörbeispiele}}+?){{fehlend}}', u'\\1{{Audio|}}'), (ur'(^:{{Hörbeispiele}}+?){{fehlend}}', u'\\1{{Audio|}}'), #verlinke Sachgebiet, Doppelpkt kursiv (ur'(^{{Bedeutungen}}\n^: ??\]*?\] \'\')\??\]??(\'\':|:\'\')', u'\\1]:\'\''), # Allabreve, Andromeda, depravation #ers {{AE}} durch {{amer.}}, ebenso {{BE}} durch {{brit.}} (ur'{{AE((\|.)+?}})', u'{{amer.\\1'), (ur'{{BE((\|.)+?}})', u'{{brit.\\1'), #Hörbsp: schreibe AussprLand aus (ur'(^:{{Hörbeispiele}}+?)\((US-)??merik\.\)', u'\\1(amerikanisch)'), (ur'(^:{{Hörbeispiele}}+?)\((US-)??merik\.\)', u'\\1(amerikanisch)'), (ur'(^:{{Hörbeispiele}}+?)\(rit\.\)', u'\\1(britisch)'), (ur'(^:{{Hörbeispiele}}+?)\(rit\.\)', u'\\1(britisch)'), (ur'(^:{{Hörbeispiele}}+?)\(sterr\.\)', u'\\1(österreichisch)'), (ur'(^:{{Hörbeispiele}}+?)\(sterr\.\)', u'\\1(österreichisch)'), #erg Vorl {Audio|En-us- um (amerikanisch) (ur'{{Audio\|En-us-(*?)\.ogg}}', u'{{Audio|En-us-\\1.ogg|\\1 (amerikanisch)}}'), #entf {{----}} und {{2x----}}, deaktiviert bis allgemeiner Konsens ###(ur'(^+?$)\n\n??^{{----}}\n\n??(^=== {{Wortart)', u'\\1\n\n\\2'), ###(ur'(^+?$)\n\n??^{{2x----}}\n\n??(^== +?\({{Sprache)', u'\\1\n\n\\2'), #ers div (ur'(\.|te) Aufl\.', u'\\1 Auflage'), #Alfanzerei, Phrase (ur'{{W(\|+?}})', u'{{WP\\1'), #Hof, Konsum (ur'{{Lautschrift\|\.\.\.}}', u'{{Lautschrift|…}}'), #DDP, Eva (ur'({{Lateinisch Substantiv Übersicht) 2', u'\\1'), #Aulonia, abactus (ur'{{Alte Rechtschreibung}}', u'{{Veraltete Schreibweisen}}'), #Kreuz (ur'^{{Silbentrennung}}', u'{{Worttrennung}}'), #Bazyli #entf Kommentar (ur'(^{{Ähnlichkeiten}}) ??<!--+?>', u'\\1'), #Haase, Ingrid, Rot (ur'^<!--- {{Ü-links}} ??\r?\n^\*{{de}}: \ ??\r?\n^\*{{en}}: \ {{Ü\|en\|}} ??\r?\n^{{Ü-Abstand}} ??\r?\n^\*{{fr}}: \ {{Ü\|fr\|}} ??\r?\n^\*{{es}}: \ {{Ü\|es\|}} ??\r?\n^{{Ü-rechts}} --> ??\r?\n\r?\n', u''), #forner (ur'<!-- :{{Übersetzungen umleiten\|1\|\|1}} -->\n', u''), #hombrillo, burdo, sifrino #ab Liste Fisch21: hombrillo #nach Ähnl Neuzeile (ur'(^{{Ähnlichkeiten}}) ??', u'\\1\n:'), #Az., Hemi, Achtung:Egeusz #{Herkunft fehlt -> {QS Herkunft (ur'{{Herkunft fehlt\|belegen}}', u'{{QS Herkunft|unbelegt}}'), #Adverb. Kommentar erst beim nächsten Botlauf (ur'{{Herkunft fehlt}}', u'{{QS Herkunft|unzureichend}}'), #Alligator