homoglyphen.de

Hilfe

Homoglyphen sind Schriftzeichen, die auf dem Bidschirm/im Ausdruck gleich oder ähnlich aussehen, obwohl sie typischerweise eine verschiedene Bedeutung und auch Aussprache haben. Ein bekanntes Beispiel sind der lateinische Großbuchstabe O und die Ziffer 0. Ein weniger bekanntes Beispiel, unter Verwendung verschiedener Alphabete, ist der lateinische Großbuchstabe H, der griechische Großbuchstabe Eta Η (U+0397) und der kyrillische Großbuchstabe En Н (U+041D)

Dies Site ist als Referenz zu Homoglyphen in Unicode gedacht sowie als Onlinewerkzeug für Webmaster und Programmierer, die homographe Wörter mit Hilfe von Unicode-Homoglyphen nutzen oder sich über ihre Auswirkung informieren wollen.

Aus Sicherheitsgesichtspunkten muß die Möglichkeit von homoglyphen Zeichen bekannt sein, weil sie in Domainnamen und URLs verwandt werden kann, Web-Benutzer zu täuschen (siehe Unicode Technical Report #36 des Unicode Consortium.)

Es gibt auch nützliche und legitime Anwendungen für Homoglyphen. Zum Beispiel möchte jemand seinen Namen auf einer Website nennen, die in Suchmaschinen indiziert wird, aber bevorzugen daß zum Schutz der eigenen Privatsphäre die Seite nicht bei einer Suche nach diesem Namen gefunden wird. Dieses wird in manchen Fällen durch Benutzung einer Bitmapgraphik statt eines Textes realisiert. Die Verwendung eines Homographen aus Homoglyphen eines anderen Alphabets ist in manchen Fällen eine weniger aufwändige Lösung. Voraussetzung ist, daß der Computer und Browser, die ein Leser der betreffenden Website benutzt, zeichensatzmäßig die Grapheme des entsprechenden Alphabets darstellen kann. Zum Beispiel ist das griechische Zeichen omikron ο heutzutage auf den meisten Computern darstellbar, so daß ein lateinisches o in einem Namen dadurch ersetzt werden könnte.

Der "Fullwidth Latin" (Originaltitel) Codebereich von Unicode ist möglicherweise nicht die beste Wahl für den oben genannten Zweck, weil diese Zeichen dem gleichen Graphem entsprechen wie der entsprechende Glyph aus dem lateinischen Standardzeichensatz (die Zeichen mit voller Breite ABCⅮ... entsprechen den normalen Zeichen ABCD..., sind aber für Anwendungen in chinesischen, japanischen und koreanischen (CJK)-Computeranwendungen gedacht, wo sie typographisch besser mit den asiatischen Zeichen harmonieren. Eine leistungsstarke Suchmaschine wird deshalb zur Indizierung möglicherweise diese Zeichen zu den entsprechenden lateinischen Zeichen normalisieren.

Benutzung der Website homoglyphen.de: Sie können auswählen, welche Zeichenbereiche angezeigt werden, indem Sie die Auswahlboxen beim jeweilgen Bereichsnamen anklicken. Dann wird eine entsprechende Tabelle angezeigt. Falls Sie dann einen Text in das Eingabefeld oben eingeben, zeigt diese Site einen Text an, in dem (soweit möglich) die Zeichen durch ihre Homoglyphen ersetzt sind. Es wird dann auch die HTML-Codierung des neuen Textes angezeigt. Falls in den Alphabeten die in der Tabelle dargestellt sind mehrere Möglichkeiten für Homoglyphen eines Zeichen zur Auswahl stehen, wird zufällig ausgesucht - deshalb wird nach dem nächsten Klicken des Knopfes im Formular möglicherweise eine anderer homographe Schreibweise angeboten.

Grenzen dieser Site:Ihr Betriebssystem und Browser müssen Unicode und UTF-8 darstellen können um diese Site darstellen zu können, und die Fonts sie auf dem Computer installiert sind müssen die jeweiligen Zeichen darstellen können. Sie werden sehr wahrscheinlich für einige Zeichen, insbesondere aus nicht verbreiteten Alphabenten wie z.B. Cherokee, Ersatzzeichen angezeigt bekommen die zeigen daß das Zeichen selbst nicht darstellbar ist. Diese Ersatzzeichen können betriebssystem-/browserabhängig z.B. Quadrate oder Fragezeichen sein. Dies ist ein clientseitiges Problem, kein serverseitiges.

Sie können auch eine Tabelle von Homoglyphen aus ausgewählten Alphabeten ausdrucken - dafür gibt es die Auswahlbox für eine druckerfreundliche Darstellung.

Diese Site konzentriert sich auf Homoglyphen lateinischer Buchstaben. Es gibt auch eine große Zahl von Homoglyphen zwischen anderen Alphabeten. Zum Beispiel sehen eine größere Anzahl von Glyphen aus Graphemen der kyrillischen, griechischen und koptischen Alphabete gleich oder ähnlich aus.

Bekannter Bug: Wenn man diese Site in Firefox ansieht, zeigt der Browser manchmal nach Wechsel in die druckerfreundliche Darstellung manche vertikale Striche in der Zeichentabelle nicht an. Das liegt vermutlich an der Rendermaschine von Firefox. Eine korrekte Dastellung wird meist schnell durch Neuladen oder Aus- und Wiedereinschalten der Auswahl für druckerfreundliche Darstellung erreicht.

Impressum/weitere rechtliche Hinweise

Verantwortlich für diese Site: Tomas Schild, Lange Furche 31, 72072 Tübingen, Deutschland, <tomas@schild.net>.

Der Unicode™-Standard ist © Unicode, Inc.