Wereldwijd gezien is het doel van Wiktionary om alle woorden uit alle talen te beschrijven in alle talen. Als Nederlandstalig onderdeel van Wiktionary is het doel van WikiWoordenboek: de beschrijving van alle woorden uit alle talen in het Nederlands. Deze pagina werkt uit wat we met daarmee in de praktijk bedoelen.
WikiWoordenboek bestaat hoofdzakelijk uit pagina's, ingedeeld in secties per taal, waarin "woorden" uit die taal worden beschreven. Er zijn twee redenen om "woorden" tussen aanhalingstekens te zetten.
De term lemma wordt gebruikt voor de beschrijving van een "woord" in een bepaalde taal. Dat kan dus ook een teken of een frase zijn. En het kan zowel gaan om een trefwoord of om een woordvorm. Deze pagina beschrijft zo eigenlijk welke lemma's in WikiWoordenboek horen.
Omdat het om beschrijving gaat, beperkt WikiWoordenboek zich tot talen die kunnen worden geschreven. Soms is de schrijfwijze officieel vastgesteld: dan beschrijven we vanaf dat tijdstip alleen de vorm(en) uit die spelling. In talen of perioden zonder officiële spelling volgen we de schrijfwijze(n) uit betrouwbare bronnen, zoals degelijke woordenboeken, zie hieronder onder Woorden Dit maakt het beter mogelijk om de informatie op WikiWoordenboek in andere bronnen na te gaan.
De lemma's hebben betrekking op woorden: welke vormen ze aannemen, welke betekenissen ze hebben, hoe ze gebruikt worden en hoe ze zijn ontstaan. Het is uitdrukkelijk niet de bedoeling om de omschrijving van een betekenis uit te breiden tot de beschrijving van een onderwerp: daarvoor zijn zusterprojecten als Wikipedia en Wikibooks beter geschikt.
Er bestaat een enorme variatie aan talen die meer of minder van elkaar verschillen. Bij het beschrijven van die diversiteit ontkom je niet aan afbakening van verschillende talen, maar over elke afbakening is discussie mogelijk. Om wereldwijde samenwerking mogelijk te maken, is er een internationale standaard ISO 639-3 met een onderverdeling in ongeveer 8.000 verschillende talen met een eigen taalcode. Deze standaard wordt regelmatig bijgewerkt.
Deze standaard omvat ook sommige kunsttalen die in gebruik zijn en een behoorlijke documentatie hebben.
Binnen de standaard ISO 639-3 bestaan ook tientallen codes voor een macrotaal, een taal die wordt beschreven als gemeenschappelijke voertaal voor sprekers van een groep verwante talen. Soms is een macrotaal gebruikt vooruitlopend op een definitieve onderverdeling van een groep talen of het aanwijzen van een standaardtaal daarbinnen. In dat geval kan het zinvol zijn de code voor macrotaal niet te gebruiken of te vervangen door die standaardtaal. Dit vereist wel voldoende kennis van de talen in kwestie.
Als het nodig is om aan te geven dat bepaalde woorden of betekenissen alleen in een bepaald gebied gangbaar zijn, kan dat worden aangegeven met een globale indicatie daarvan, bijvoorbeeld (VS).
De indeling volgens ] vormt de basis voor de beschrijving van woorden in WikiWoordenboek. Deze indeling omvat ook historische talen, zoals Oudgrieks en Middelnederlands. Dit betekent omgekeerd dat De Nederlands (nld) niet alleen het hedendaags Nederlands, maar al het Nederlands vanaf de 16e eeuw omvat. Dit leidt er soms toe dat de beschrijving op WikiWoordenboek verschilt van woordenlijst.org of Van Dale's Groot woordenboek van de Nederlandse taal.
In sommige gevallen bestaat er een contextlabel om aan te geven dat een woord alleen in een bepaalde periode is gebruikt, zoals {{Vroegnieuwnederlands}}.
Als een woord iets beschrijft dat niet meer voorkomt en daardoor niet meer gangbaar is, kan het label {{historisch|<ISO>}} aan die betekenis worden toegevoegd.
Als het nodig is om aan te geven dat een bepaalde betekenis van woord niet meer gangbaar is omdat daarvoor nu een ander woord wordt gebruikt, kan dat worden aangegeven met {{verouderd}}. In dat geval wordt onder het kopje {{-syn-}} vermeld welk woord nu in die betekenis wordt gebruikt.
Als een woord een andere spelling heeft gekregen, wordt dat aangegeven met {{oudeschrijfwijze}}
Vanuit de talen binnen één taalfamilie is het soms mogelijk woorden te uit de oerversie van die taal te reconstrueren. Deze woorden beginnen altijd met een asterisk (*) om aan te geven dat het om een reconstructie gaat. De taalcode wordt in dit geval ontleend aan de drielettercode uit ISO 639-5 gevolgd door -pro. Hierbij hoort altijd een bronvermelding te worden gegeven; het is daarnaast van belang dat voor een gereconstrueerde taal alleen bronnen worden gebruikt die dezelfde uitgangspunten gebruiken.
Een woord is een tekenreeks waaraan in een taal een of meer betekenissen worden toegekend.
Om praktische redenen beperkt WikiWoordenboek zich tot reeksen bestaand uit tekens die zijn vastgelegd in de Unicode-standaard. Deze omvat tegenwoordig een groot aantal schriftsoorten en bijvoorbeeld ook Chinese karakters, spijkerschrift en hiërogliefen.
De kortste tekenreeks met een betekenis is natuurlijk een enkel teken. In principe kan elk teken dat binnen de Unicode-standaard is vastgelegd op WikiWoordenboek als symbool {{-symbool-}} in het universeel taalgebruik (qtu) worden beschreven.
Mensen bedenken voortdurend nieuwe woorden. Een woord wordt pas echt een onderdeel van een taal, wanneer iemand het zonder verdere uitleg kan gebruiken in communicatie met een onbekende die dezelfde taal spreekt. Dit hoeft geen willekeurige onbekende te zijn: WikiWoordenboek bevat ook woorden die mensen binnen een bepaald vakgebied gebruiken. Maar woorden die alleen in kleine kring gangbaar zijn, horen (nog) niet tot de taal.
Er zijn twee manieren om vast te stellen of een woord voldoende gangbaar is om het in WikiWoordenboek op te nemen.
Als een woord wordt opgenomen, kunnen ook alle grammaticaal correcte verbuigingen van het woord opgenomen, tenzij er een betrouwbare bron die een of meer vormen uitsluit (in welk geval je ook kunt stellen dat die vormen grammaticaal niet correct zijn). Bij gegronde twijfel over de gangbaarheid, kan die op de pagina waarop de vorm staat worden aangegeven. De lezer is daarmee beter geholpen dan met het weglaten van het lemma.
Een reeks woorden met een bepaalde betekenis die niet zonder meer is af te leiden uit de betekenis van de afzonderlijke woorden, kan worden meegenomen bij de beschrijving van het belangrijkste woord uit de reeks. Het is ook mogelijk om de frase als geheel te beschrijven en daarheen te verwijzen vanaf de woorden die onderdeel van de reeks zijn. Dit verdient de voorkeur naarmate er meer informatie over de frase te geven is.
Er zijn ook frasen die op zichzelf goed begrijpelijk zijn, maar die de kenmerkende manier vormen om iets in die taal te zeggen. Ook deze kunnen afzonderlijk worden beschreven.