Die folgende Tabelle enthält einige Sprachen, mit den bei ihr jeweils üblichen Sonderzeichen. In der zweiten Spalte werden die Sonderzeichen in Form vom Entitäten angegeben, in der dritten Spalte wird dasselbe Wort bzw. dasselbe Zeichen in UTF-8-Kodierung angegeben. Eine unterschiedliche Ausgabe der Einträge in der zweiten und dritten Spalte weist auf eine fehlende oder eingeschränkte UTF-8-Unterstützung des Browsers hin.
Zeichen, die in den drei letzten Spalten gleichermaßen nicht korrekt angezeigt werden, sondern als Platzhalter erscheinen (je nach Browser häufig „?“ oder „□“), sind nicht auf ein Problem mit UTF-8 zurückzuführen. Hier weiß der Rechner einfach nur nicht, wie das entsprechende Zeichen aussieht, weil der nötige Zeichensatz nicht installiert ist. Mit Texten, die solche Zeichen enthalten, kann in der Regel ganz normal gearbeitet werden – auch wenn der Rechner nicht weiß, wie das Zeichen aussieht, so weiß er doch, um welches Zeichen es sich handelt, und behandelt das Zeichen also z. B. nicht wie ein Fragezeichen, sondern wie dasjenige Zeichen, für das der Platzhalter jeweils steht. Für eine korrekte Darstellung sollte dann ein Unicode-Zeichensatz installiert und eventuell der Browser entsprechend konfiguriert werden.
Hilfe zur Abhilfe für verschiedene Browser/Betriebssystem-Konfigurationen gibt es auf Wiktionary:Browser-Hinweise.
Sonderzeichen aus verschiedenen Sprachen | |||||
---|---|---|---|---|---|
Sprache | Angabe der Sonderzeichen in | ||||
benannten Entitäten¹ | numerischen Entitäten (dezimal) |
numerischen Entitäten (hexadezimal) |
UTF-8-Kodierung | ||
a | b | c | d | ||
1 | Spanisch | Español | Español | Español | Español |
2 | Türkisch | Türkçe | Türkçe | Türkçe | Türkçe |
3 | Slowenisch | Slovenščina | Slovenščina | Slovenščina | Slovenščina |
4 | Rumänisch | Română | Română | Română | Română |
5 | Tschechisch | Česky | Česky | Česky | Česky |
6 | Griechisch | Ελληνικά | Ελληνικά | Ελληνικά | Ελληνικά |
7 | Bulgarisch (Kyrillisch) | Български | Български | Български | |
8 | Russisch (Kyrillisch) | Русский | Русский | Русский | |
9 | Hebräisch | עברית | עברית | עברית | |
10 | Arabisch | لعربية | لعربية | لعربية | |
11 | Japanisch | 日本語 | 日本語 | 日本語 | |
12 | Koreanisch | 한국어 | 한국어 | 한국어 | |
13 | Chinesisch (vereinfacht) | 用统一码 | 用统一码 | 用统一码 | |
14 | Chinesisch (traditionell) | 讓統一碼 | 讓統一碼 | 讓統一碼 | |
15 | Lautschrift (IPA) | ||||
16 | - <code>Lautschrift</code>
|
|
|
| |
17 | - mit vorgeg. Zeichensatz | ||||
17b | - allg. Zeichensatz ohne Serifen | ||||
17c | - allg. Zeichensatz ohne Serifen | ||||
17d | - benutzerdef. Zeichensatzvorgabe (in Skin.css) | ||||
18 | Silbentrennzeichen | Sil|ben|trenn·zei·chen | Sil|ben|trenn·zei·chen | Sil|ben|trenn·zei·chen | Sil|ben|trenn·zei·chen |
19 | kurzer/langer Gedankenstrich | – / — | – / — | – / — | – / — |
20 | Anführungszeichen unten/oben | „ / “ | „ / “ | „ / “ | „ / “ |
21 | Eurosymbol | € | € | € | € |
22 | Hochgestellte Zahlen | km² m³ | km² m³ | km² m³ | km² m³ |
23 | Zeichen Ux2302 Haus | ⌂ | ⌂ | ⌂ | |
24 | Zusammengesetzte diakritische Zeichen | č Č ā A̅ h̵ h̶ h̷ h̴ a̱ v̇ a̲ a̲ | č Č ā A̅ h̵ h̶ h̷ h̴ a̱ v̇ a̲ a̲ | č Č ā A̅ h̵ h̶ h̷ h̴ a̱ v̇ a̲ a̲ | |
25 | - Mehrfach zusammengesetzte | ạ̃ḃ̯c̈̊d̤̥e̡ͤf̸⃥ g̳̅h̳̅i̳̅ ĵ̺̀ k͢l m͡n o͏p q̃⃝ | ạ̃ḃ̯c̈̊d̤̥e̡ͤf̸⃥ g̳̅h̳̅i̳̅ ĵ̺̀ k͢l m͡n o͏p q̃⃝ | ạ̃ḃ̯c̈̊d̤̥e̡ͤf̸⃥ g̳̅h̳̅i̳̅ ĵ̺̀ k͢l m͡n o͏p q̃⃝ |
¹) Nicht für alle Sonderzeichen sind benannte Entitäten definiert, daher enthält dies Spalte nicht alle Beispielwörter. Vereinzelt wurden auch in dieser Spalte numerische Entitäten verwendet: für den Kleinbuchstaben c mit Hatschek (č), den Großbuchstaben C mit Hatschek (Č), den Kleinbuchstaben a mit Hatschek (ă), den griechischen Kleinbuchstaben alpha mit Akzent Akut (ά) und den senkrechten Silbentrennstrich (|).