Protokoll des 2. Wiktionary-Treffens am 10. und 11.05.2014 in Berlin.
Bitte an die Teilnehmer: Vielleicht können wir diesmal in Gemeinschaftsarbeit das Protokoll erstellen (jeder übernimmt ein paar Themen?), zur Erinnerung kann ja Live-Protokoll: link verwendet werden.
Teilnehmer:
Alle Teilnehmer stellen sich kurz vor: Beruflicher, sprachlicher Hintergrund, Interessen, Weg zu Wiktionary etc.
Grundsätzlich: Zu keinem der besprochenen Themen können beim Treffen endgültige Beschlüsse gefasst werden. Wir sammeln Vorschläge, Tendenzen, Meinungen, die dann in der Teestube diskutiert und gegebenenfalls per Meinungsbild beschlossen werden.
Immer wieder monieren Wiktionary-Mitarbeiter oder -Nutzer die ausschließliche Angabe der standardsprachlichen IPA laut Duden oder Krech/Stock. Besonders süddeutsche und österreichische Sprecher irritieren Ausspracheangaben wie Ludwig , da dies der Aussprache in Schule und regionalen Fernseh-/Radiosendern widerspricht. Es werden Möglichkeiten der Darstellung am Beispiel von pfiffig diskutiert. Um den Ausspracheabschnitt nicht in unübersichtlicher Weise aufzublähen, wäre eine aus-/einblendbare Tabelle wünchenswert, die Platz für die zugehörigen Hörbeispiele (und Reime?) bietet.
Wie eine solche Tabelle konkret aussehen könnte, muss noch erarbeitet und mit der Community diskutiert werden.
Eine Überlegung war auch, in den Ausspracheabschnitt nur begrenzt Varianten aufzunehmen, also evtl. Standard/Bühne/norddeutsch/süddeutsch, alle anderen Varianten sollen bei Bedarf im jeweiligen Dialektabschnitt angeführt werden.
Präsentation Benutzer:Hubertl zu w:Wörterbuch der bairischen Mundarten in Österreich. Es besteht Aussicht, dass die unglaubliche Anzahl an gesammelten Daten unter Freier Lizenz genutzt werden kann.
Die Geschäftsstelle in Wien (Claudia Garád) hat vor annähernd 8 Monaten den Kontakt zur österr. Akademie der Wissenschaften aufgebaut, um langfristig, nach dem Modell des Bundesdenkmalamts, eine Zusammenarbeit auf verschiedenen Ebenen zu ermöglichen. Die ersten Schritte werden nun mit Eveline Wandl-Vogt, Projektleiterin der Datenbank der bairischen Mundarten in Österreich @ Electronically Mapped gemacht. Sie war schon in Bremen beim Glam-Treffen als Vortragende dabei, ein gemeinsamer Vortrag bei der Wikimania ist vorgesehen. Ein Dialektprojekt war aber schon seit dem Sommer geplant, denn wir konnten letztes Jahr bereits 3.200 Audiodateien vor dem Verfall retten. (Amstetten, Niederösterreich).
Ziel des Projekts ist die Schaffung einer Struktur in Wikimedia-Projekten - in dieser Angelegenheit vorerst und vorrangig auch auf Wiktionary-Ebene - welche die Übernahme von Daten der ÖAW ermöglichen soll. Darüber hinaus solle eine Software erstellt werden, welche es ermöglicht, Worte, Phraseme, Texte auf einfache Art als Hörbeispiel einzugeben. Wobei das keinesfalls auf Regionalsprachen beschränkt sein soll, sondern es ermöglichen soll, jegliche Sprache mit Audiodaten durch ausgewählte Sprecher erweitern bzw. ersterfassen zu können. Inzwischen hat sich auch bereits Rudolf Muhr bereiterklärt, sich am Projekt als wissenschaftlicher Betreuer zu beteiligen und ebenfalls einen außergewöhnlich großen Beitrag bestehender Daten (so zB. das Aussprachewörterbuch des Österr. Deutsch) zum Wikimedia-Projekt beizutragen.
Eine erste Präsentation vor internationalem akad. Fachpublikum wird auf der Konferenz Pluricentric languages worldwide and pluricentric theory Anfang Juli an der Universität Surrey, Guildford, UK durchgeführt, gemeinsam mit R. Muhr, der die wissenschaftliche Seite präsentieren wird, sowie ich als entsendeter Vertreter von Wikimedia Österreich mit dem Anliegen, dieses Projekt unter den Prämissen und Möglichkeiten von Wikimedia darzustellen und Kooperationen auf internationaler Ebene auszuloten. Ein Monat darauf wird dieses Projekt dann bei der Wikimania vorgestellt werden. (Update 13. Mai). ...
Wir sprechen über die unterschiedlichen Vorgehensweisen bei der Angabe von regionalsprachlichen/mundartlichen Varianten im Übersetzungsabschnitt: Beispielsweise wird {{nds}} (Niederdeutsch/Plattdeutsch) mal unter den „normalen“ Sprachen eingetragen, mal im Dialektabschnitt. Das englische Wiktionary hat gar keinen extra Abschnitt für Dialekte und sortiert alles, auch {{bar}} (Bairisch), ganz normal ein.
Wir sollten möglichst einfache Kriterien dafür finden, was an welcher Stelle eingetragen werden soll.
Zur Problematik der (Haupt-)Lemma-Findung für „Dialekteinträge“ (zahlreiche verschriftlichte Varianten des gleichen Wortes) erläutert Benutzer:Seidenkäfer die Vorgehensweise einschlägiger Wörterbücher und wird ein Beispiel erstellen, wie Dialekt-Einträge aussehen können.
...
Wir diskutieren den Sinn der „Wortart“ Wortverbindung. Gibt es eine Begründung für Einträge, die allein Wortverbindung sind? Können nicht alle wünschenswerten Einträge Wortkategorien wie Substantiv, Verb, Adjektiv, Adverb, Redewendung, Sprichwort etc. zugeordnet werden? Evtl. auch Adverbialphrase, Nominalphrase ...?
Tendenz: Wortart „Wortverbindung“ auflösen.
Tendenz: Auflösen, gehört – wenn nicht Redewendung – in Wikiquote. Es gibt ein paar Problemfälle, z. B. zurück zur Natur.
...
Präsentation Benutzer:Betterknower, Benutzer:BetterkBot
In der kurzen Präsentation wurde gezeigt, wie ein Botlauf denn so funktioniert. Voraussetzung dafür ist ein kleines Skript auf der Basis regulärer Ausdrücke, die Installation von Python, ein aktueller Dump als Datenquelle, sowie natürlich ein Botflag. Das Programm läuft im cmd-Fenster. Siehe auch mw:Manual:Pywikibot. Nach diesem Test wurde auch die Möglichkeit aufgezeigt, mit dem AutoWikiBrowser zu arbeiten, bei dem vor allem die Scan-Funktion für die Analyse des Wiktionary-Datenbestands zu erwähnen ist; als Bot eignet er sich ja nicht besonders. Auch hier sind oft Regex-Kenntnisse und auf jeden Fall ein Dump erforderlich.
Benutzer:DerHexer weist auf verschiedene Fördermöglichkeiten hin: Wikipedia:Förderung, zum Beispiel speziell Wikipedia:Literaturstipendium, Österreich: Wikimedia Österreich.
Es besteht auch für das Wiktionary die Möglichkeit, sich um Unterstützung für Programmierung zu bemühen. Hätten wir beispielsweise ein Konzept für eine benutzerfreundliche Oberfläche für das Erfassen/Formatieren von Einträgen oder Ähnliches, könnten wir da mal nachfragen, ob das jemand für uns programmiert. Oder wir schlagen jemanden vor, der das leisten könnte und dann dafür bezahlt wird.
Benutzer:Stepro regt an, eine Wunschseite für fehlende Bilder einzurichten. Es kommt ja öfter mal vor, dass man auf Commons kein geeignetes Bild findet. Fleißige Fotografen würden vielleicht gerne mal solche Wünsche erfüllen. Kann man an einer geeigneten Stelle bei Commons einen Link auf diese Wiktionary-Bilderwunschliste unterbringen?
Der Vorschlag wurde von allen begrüßt und auch gleich umgesetzt.
Ein bisschen Spaß muss sein am Abschluss eines Tages, wo man sich heiser geredet hat und die Köpfe rauchten:
Präsentation Benutzer:Alexander Gamauf (Kurzfassung):
Die Diskussion ergab die grundsätzliche Zustimmung, Charakteristische Wortkombinationen nach syntaktischen Kriterien zu gliedern ("mit Attribut:", "als Akkusativobjekt:"). Zweifel wurden bei der Gliederung attributiv/prädikativ/adverbial bei Adjektiven (siehe z. B. "flugunfähig") geäußert, da keine vollständige Darstellung angegeben wurde. Kollokationstests ergäben sich automatisch durch Angabe von Kollokationen bei verschiedenen Bedeutungen.
Quellen:
Es gibt Vorschläge, die bisherige Praxis des schematischen Eintrags Charakteristischer Wortkombinationen nach Muster von Gotha nicht mehr zu unterstützen und die Benutzer zu ermutigen, stattdessen nur noch ortstypische Wortkombinationen einzutragen, wie zum Beispiel in den Karpaten. Die schon vorhandenen Einträge können natürlich erhalten bleiben und werden durch neue ergänzt. Die Hilfeseite soll entsprechend angepasst werden und im Abschnitt Toponyme nur Beispiele mit ortsspezifischen Wortkombinationen zeigen.
Für Charakteristische Wortkombinationen wie „nach Gotha reisen, aus Gotha stammen etc.“ wäre ein besserer Platz bei den entsprechenden Verben.
Zur Unterscheidung verschiedener Bedeutungen dienen bisher Zahlen in eckigen Klammern (z.B. , im Folgenden -Markierung genannt), die der jeweiligen Bedeutung eines Lemmas vorangestellt werden. Diese -Markierungen werden dann in weiteren Einträgen auf der Seite zur Identfikation der spezifischen Bedeutung benutzt, zum Beispiel bei Synonymen, Textbeispielen, Übersetzungen und Referenzen. Auf umfangreichen Seiten kann es dazu kommen, dass der Benutzer häufig auf der Seite herumblättern muss, um -markierte Einträge einer Bedeutung zuordnen zu können.
Ein Verbesserungsvorschlag besteht darin, dass bei allen Einträgen, die sich über die -Markierung auf eine Bedeutung beziehen, der Bedeutungstext durch Bewegung des Mauszeigers auf die -Markierung angezeigt wird. Auf diese Weise kann die jeweilige Bedeutung an jeder Stelle mit einer -Markierung abgelesen werden.
Das gleiche Verfahren bietet sich für die Betrachtung der Referenzen und Quellenangaben an, wie es bei der englischen Wikipedia schon realisiert ist.
Es gab grundsätzliche Zustimmung zur Einführung einiger weiterer Textbausteine. Sie sollen dazu dienen, relevante Informationen unterzubringen, die bisher in keinem Textbaustein untergebracht werden können. Damit sie nur dann eingesetzt werden, wenn sie wirklich gebraucht werden, sollen sie eher nicht in den Formatvorlagen enthalten sein, sondern über das Auswahlmenü über dem Bearbeitungsfenster extra eingefügt werden müssen.
Das Sichten sollte auf die Namensräume Verzeichnis, Reim und Thesaurus ausgeweitet werden. Dazu muss wohl bei Bugzilla angefragt werden. →Anfrage
Wir haben lange Listen von Seiten mit ungesichteten Versionen und gänzlich ungesichteten Seiten. Unser größtes Problem beim Sichten sind Übersetzungen, die schwer zu überprüfen sind. Unter den Teilnehmern wird die Vorgehensweise befürwortet:
{{Ü?|...}}
) und zu sichtenBei den gänzlich ungesichteten Seiten sind oft Qualitätsmängel das Problem. In diesen Fällen kann ein QS-Baustein gesetzt und der Eintrag mit dieser Kennzeichnung gesichtet werden.
Die wenigen noch verbliebenen Einträge aus der alten Literaturliste sollen zeitnah durch das Erstellen neuer Vorlagen ersetzt werden. Bei sehr selten eingebunden Vorlagen (1- bis 5-mal) kann die allgemeine Literaturvorlage verwendet werden. Georges wenn möglich mit Hilfe eins Bots ersetzen.
Benutzer:Kronf hat sich bereits vor einiger Zeit des veralteten Portals angenommen und Themen, Seiten und Kategorien überarbeitet, zusammengefasst, aktualisiert für Autoren, die sich bei der Wartung des Wiktionarys beteiligen wollen. Das Ergebnis findet allgemeinen Anklang.
Für weitere Ideen ist im Portal noch genügend Platz. Eventuell auch zur Dokumenation des Fortschritts für gemeinsam in Angriff zu nehmende Projekte wie „alle noch nie gesichteten Einträge abarbeiten“, „Prüfung der Hörbeispiele“ etc.
Kurze Überlegung, die beim Mittagessen aufkam.
Formatierer hat ein Skript von Conrad.Irwin importiert, das ein Eingabefeld zur Ergänzung von Listen bereitstellt. Wir setzen es standardmäßig auf den Verzeichnis- und Reim-Seiten ein. Im Falle der Reime übernimmt beim Abspeichern ein weiterer Teil des Skripts die Einfügung der Reim-Zeile in den Ausspracheabschnitten der eingetragenen Wörter. Diese Edits werden im Namen (mit dem Konto) des Benutzers durchgeführt, der die Reim-Seite ergänzt hat. Probleme dabei:
Daher Vorschlag: Diese Edits soll ein spezieller Account mit Botflag und Sichterrecht vornehmen, falls das möglich ist.