Wikcionário:Portal comunitário » Manutenção » Problemas espinhosos
Vários códigos que são popularmente vistas como línguas, quando analisadas mais a fundo, se revelam ser na verdade macrolínguas.
Cabe ver também o idioma protossemita e ] referentes a idiomas e seus códigos.
Segundo a Wikipédia a língua chinesa é na verdade uma família de línguas. Quando se fala de chinês está se falando na verdade de mandarim (ou, menos frequentemente, cantonês). Nosso projeto conta com mais de dois mil verbetes classificados como vocábulos chineses (código zh). A maioria desses deveria provavelmente ser passado para mandarim. Todas as categorias relativas a chinês deveriam ser em seguida eliminadas.
O norueguês não é exatamente uma macrolíngua, mas considerando que temos três códigos diferentes para ele (no, nn e nb) e que só há duas línguas reconhecidas como oficiais (no e nn), algum trabalho deve ser feito nessa área.
A questão do idioma norueguês foi resolvida em 2022/23, o código no não deve mais ser usado, agora só usamos nb e nn.
O servocroata é um diassistema linguístico segundo linguistas. Nenhum país tem esse idioma como oficial, mas sim o bosníaco, sérvio, o croata ou o montenegrino. Com exceção do último, todos os demais possuem códigos de idioma: sh, bs, sr, hr. O Wikcionário em inglês trata todas como língua única, as categorias das variedades são vazias e redirecionamentos.
O tupi é um tronco linguístico que abrange diversos idiomas diferentes e não um idioma em si. Antigamente, os autores consideravam tupi um idioma e várias etimologias e dicionários antigos utilizavam essa terminologia. Mais recentemente, é considerado que a língua indígena que influenciou vários vocábulos do português brasileiro é o tupi antigo (código tpw) e o idioma que seria o "tupi moderno", ainda falado hoje em dia, é o nheengatu (código yrl). Assim, os verbetes catalogados anteriormente sob o código tu devem ser passados para o código tpw, do tupi antigo.
Os caracteres sino-japoneses que são usados na China, Japão, Coreia e outrora no Vietnã foram desenvolvidos em nosso projeto sem muito controle e em sua maioria apresentam graves problemas de formatação e também de conteúdo.
Seria necessário desenvolver um plano-piloto para esses caracteres, melhorar alguns deles a título de exemplo e quando se chegasse a um consenso sobre como proceder, aí sim fazer as várias melhorias que se fazem necessárias.