Nie mehr Tofu

Noto von Google enthält alle im Unicode-Standard festgelegten Schriftzeichen – ein ambitioniertes Unterfangen.

Tofu ist hässlich. Nicht das weiße Soja-Lebensmittel, sondern das leere Rechteck, das auf Bildschirmen anstelle eines fehlenden Schriftzeichens erscheint. Dieser Kasten ähnelt einem typischen Tofu-Würfel und enthält manchmal noch ein X oder ein Fragezeichen. Bei dieser Hässlichkeit handelt es sich um das sogenannte Notdef-Zeichen, das als Platzhalter einspringt, wenn einem Font die passende Glyphe für ein Schriftzeichen fehlt. Betroffen sind zumeist Sonder- und Akzentzeichen bei kostenlosen Fonts, die oft nur das lateinische Alphabet und arabische Zahlen enthalten. Manchmal fehlen ihnen schon die Umlaute. In einem solchen Fall greift das Betriebssystem zunächst auf einen anderen Font zurück, um etwa ein Ü anzuzeigen. Das Ergebnis ist dann auch hässlich, weil der Ersatzumlaut im Text wie ein Fremdkörper wirkt.

Fehlt die passende Glyphe, erscheint das Notdef-Symbol – wahrlich keine Schönheit.

Viel schlimmer sieht es aus, wenn einem Text, der in einer exotischen Sprache geschrieben ist, alle passenden Glyphen fehlen – dann besteht der Text ausschließlich aus Tofu. Besonders problematisch ist das für Nachrichtenseiten: Der pakistanische Daily Express etwa veröffentlicht seine in Urdu geschriebenen Artikel notgedrungen in Bilddateien, damit Tofu nicht die Lektüre verhindert. Auf den meisten Computern und Smartphones ist der passende Schriftsatz schlicht nicht vorhanden.

No More Tofu

Das muss doch besser gehen, entschied Google und startete 2011 das Projekt Noto. Dessen Teamleiter Bob Jung kennt Tofu noch aus den 1980er Jahren, als er in Tokyo lebte und mit einem amerikanischen Computer arbeitete. Dem grauen Kasten fehlten die passenden Fonts für asiatische und viele andere Zeichen. Also gab es Tofu, Tofu, Tofu. Damals war das kein ungewöhnlicher Anblick. Dreißig Jahre später ist Tofu für Jung und seine Internationalisierungsabteilung aber nicht mehr akzeptabel, schließlich soll die ganze Welt Android und ChromeOS vernünftig nutzen können. Je mehr Sprachen abgedeckt werden, desto mehr potenzielle Kunden erreicht Google.

Der ambitionierte Plan des Google-Teams: Es sollte eine Schriftfamilie entstehen, die alle im Unicode-Standard enthaltenen Sprachen und Zeichensysteme abdeckt – das sind mehr als 800 geschriebene Sprachen und 100 Schriftsysteme mit insgesamt 110.000 Zeichen und Emojis. So wollen Bob Jung und sein Team sicherstellen, dass es keinen Tofu mehr gibt.

Daher der Projektname: Noto steht für «No More Tofu».

Mit ihrem Umfang ist Noto eine der größten Schriftfamilien der Welt und eines der umfangreichsten Typografie-Projekte. Die Fonts enthalten unzählige Sonderzeichen und bis zu acht unterschiedliche Strichstärken, von zart bis fett. Für einige besonders detailreiche Schriftsprachen mit starker vertikaler Ausprägung werden zudem getrennte Versionen für gedruckte Dokumente und für Bildschirme angeboten. Im Nachhinein war Bob Jung ziemlich überrascht über den Ehrgeiz seines Teams.

Zwar decken auch anderen Schriftarten viele Zeichensysteme ab, etwa die Arial Unicode MS von Microsoft. Doch diese und andere große Schriftfamilien sind nicht immer einheitlich gestaltet, findet Jung. Mischt man verschiedene Sprachen, sieht ein Text schnell hässlich aus. Das sollte bei Noto anders sein. Bei der Gestaltung stand neben guter Lesbarkeit auch ein harmonisches Aussehen in allen Sprachen im Fokus. Google legt für Android und seine Geräte Wert darauf, dass die Anwender bei einem Sprachwechsel nicht das Gefühl haben, plötzlich eine andere Plattform vor sich zu haben. Deshalb sollen die verschiedenen Zeichensysteme trotz ihrer Eigenheiten zusammengehörig wirken, wie entfernte Verwandte. Dazu müssen etwa die Strichstärke der Buchstaben sowie viele kleine typografische Feinheiten zueinander passen. Mit Noto ist ein problemloser Mix der Sprachen und Schriftzeichen möglich.

Ausgestorbene Schriften

Die aufwendige Detailarbeit konnte Google nicht allein bewerkstelligen. Für die Umsetzung der Schriftgroßfamilie wurde die amerikanische Font-Firma Monotype beauftragt. Sie ist verantwortlich für weltweit bekannte Schriften wie Times New Roman und Arial. Fast 40 Mitarbeiter waren an Noto beteiligt, außerdem Hunderte externe Forscher, Designer, Muttersprachler und Linguisten. Google koordinierte und finanzierte das Projekt und gab die Richtung vor. Auch die letzten ästhetischen Entscheidungen traf Google.

Am Anfang stand die Umsetzung der weit verbreiteten Zeichensysteme, angefangen bei lateinischen und asiatischen Schriftzeichen; letztere lieferte Adobe zu. Monotype hat außerdem seltene Sprachen digitalisiert, darunter akademische und tote Sprachen, die im Alltag niemand mehr spricht. Die Schriftsprache Ogham etwa verwendeten die Menschen vom vierten bis ins sechste Jahrhundert in Irland, wenn sie ihre Symbole in Steinsäulen ritzten. Heute kann man die Schriftzeichen digital reproduzieren, was für wissenschaftliche Arbeiten hilfreich ist.

Mit Noto sind für einige Sprachen erstmals Fonts entstanden. In Afrika etwa hat die Fulani-Sprachgemeinschaft endlich die Möglichkeit, ihr Adlam-Alphabet auch digital zu nutzen. Erst kürzlich hat das Unicode-Konsortium die Sprache in seinen Standard aufgenommen. Monotype arbeitete mit den beiden Erfindern des vergleichsweise jungen Adlam-Schriftsystems zusammen, um ihren Vorstellungen gerecht zu werden. Die Digitalisierung der Schriftzeichen sichert zudem ihr digitales Erbe.

Um die Schriftzeichen korrekt als Font umzusetzen, hat sich das Monotype-Team ausgiebig mit den Schriften und ihren historischen Entwicklungen befasst. Schließlich sollten die Noto-Fonts die verschiedenen Kulturen repräsentieren und Muttersprachler zufriedenstellen. Eine besondere Herausforderung war die tibetische Schrift: Während lateinische Buchstaben eher linear und geometrisch aussehen, wirken die tibetischen Buchstaben wegen ihrer kalligrafischen Tradition verschnörkelter. Zudem brauchen die Buchstaben mehr vertikalen Platz als etwa das lateinische Alphabet. Tibetische Mönche halfen den Font-Entwicklern bei der Gestaltung und lieferten wertvolles Feedback zum «Noto Tibetan»-Font.

Selbst nach mehrjähriger Arbeit ist das Noto-Projekt noch nicht abgeschlossen. Regelmäßig ergänzt das Unicode-Konsortium seinen Standard um weitere Zeichensysteme – sie sollen immer auch Teil der Noto-Familie werden. Auf diesem Weg könnte eines Tages vielleicht sogar Klingonisch die Noto-Familie ergänzen – vorausgesetzt, das Unicode-Konsortium nimmt die erfundene Sprache in seinen Standard auf. Bis dahin müssen Klingonen weiterhin mit Tofu leben.


Der Text erschien in anderer Form in der c't 5/2017. Einige Details habe ich aktualisiert, einige Passagen umgeschrieben und erweitert.