Die Schriftunterstützung hilft dabei, Textpassagen in einem Wiki richtig darzustellen, für die der Rechner beim Leser keine Zeichenkodierungen kennt.

Seit 2013 ist das Feature „Universal Language Selector“ (ULS) zusammen mit dem „Input Method Editor“ (IME) als Paket ULS/IME verfügbar.

Die Funktionen setzen voraus, dass der Leser JavaScript aktiviert hat.

Zeichendarstellung (ULS)

Bearbeiten

Allgemein gilt:

  • Bei jedem Zeichen im Text wird der abgespeicherten Zeichen-Nummer (Code) zur Darstellung auf dem Rechner der Leser eine grafische Repräsentation (Glyphe) zugeordnet.
  • Wenn eine solche Zuordnung nicht gefunden wird, werden Platzhalter wie □, ¤ oder ? angezeigt. Firefox gibt innerhalb des Rechtecks den Hexadezimalcode des Zeichens an, also meist vier Buchstaben und Ziffern (selten fünf) in Mini-mini-Schrift.
  • Die Zuordnungen werden in Paketen (Fonts) zusammengefasst, die in unterschiedlichen Gestaltungen und Stilen einen Zeichensatz unterstützen. Für einen Code können mehrere Fonts eine Definition liefern; die nach bestimmten Regeln zuerst gefundene Grafik wird angezeigt.
  • Moderne Rechner und Browser (etwa Firefox) unterhalten eine Datenbank, in der sie die Codes aller auf dem Rechner installierten Fonts protokollieren. Wenn in dem aktuell zur Anzeige benutzten Font ein Code nicht mit der Grafik belegt ist, zeigen sie mittels dieser Datenbank ersatzweise aus dem zunächst gefundenen Font eine Grafik an. Diese mag in Stil und Größe nicht zur Umgebung passen, ist aber besser als das Rechteck mit dem Code. Microsoft Internet Explorer macht dies nicht; zumindest nicht in früheren Versionen wie IE6.
  • In einfacherer Software können nur solche Fonts gefunden werden, die entweder in dem HTML-Dokument oder im Browser ausdrücklich für den momentanen Kontext vereinbart wurden.

ULS:

  • Wenn die MediaWiki-Erweiterung „ULS“ aktiviert ist und der Benutzer JavaScript aktiviert hat, dann wird jedes beim Leser dargestellte HTML-Dokument des Wiki durchsucht, ob es Textelemente mit der Sprachdeklaration lang= enthält.
  • Für jedes Textelement mit lang= wird überprüft, ob die Zeichen bereits dargestellt sind; ansonsten wird ggf. vom Wiki-Server ein geeigneter Webfont heruntergeladen, für künftige Seiten auf dem Rechner des Lesers gespeichert und für die aktuelle Seite genutzt.
  • Das gilt nur für die inhaltlich dargestellten Bereiche der Seiten in der Normalansicht und Seitenvorschau.
    • Unabhängig von der Schriftunterstützung für den dargestellten Wikitext ist die Schriftart für das Bearbeitungsfeld. Der Quelltext wird traditionell in Schreibmaschinenschrift dargestellt; das lässt sich aber inzwischen bei angemeldeten Benutzern in den Einstellungen (Registerkarte „Bearbeiten“) ändern.

ULS ist zurzeit verfügbar für Arabisch, Hebräisch, viele nichtlateinische Sprachen aus Ostasien bis zum indischen Subkontinent (nicht aber CJK: Chinesisch/Japanisch/Koreanisch) sowie einige Schriften des Altertums.

  • Nur angemeldete Benutzer können dies in den Einstellungen dauerhaft anschalten.
    • Registerkarte „Benutzerdaten“ → „Weitere Spracheinstellungen“ → „Schriftarten“ → Auswahlbox „Schriftarten herunterladen, falls nötig“ aktivieren
    • Anschließend bei „Schriftart für … auswählen“ im Dropdown die gewünschte Schriftart auswählen.
  • Bei nicht angemeldeten Benutzern („IP“) ist das vermutlich ähnlich möglich, jedoch nur bezogen auf das momentane Browser-Profil und ausgelöst an gleicher Stelle wie die IME-Konfiguration.

2013 wurde das Verfahren nur auf enzyklopädische Artikel und den Portalrahmen angewendet; 2014 greift es in allen Namensräumen auf der gesamten Seite.

Input Method Editor (IME)

Bearbeiten

Der IME ist eine Eingabemethode für Schriftzeichen, die Benutzer nicht auf ihrer Tastatur haben. Zum einen bei der Eingabe von Suchbegriffen, zum anderen beim Bearbeiten des Wikitextes erleichtert dies das Arbeiten.

Der IME wird dargestellt durch ein kleines Tastatursymbol  , das rechts unter jedem Eingabefeld erscheint, wenn diese Funktion aktiv ist.

Für die klassische Quelltext-Bearbeitung erscheint seit vielen Jahren unterhalb des Bearbeitungsfeldes eine Auswahl an Sonderzeichen, die durch Anklicken an der momentanen Textposition eingefügt werden. Dabei kann zwischen zwei Dutzend Sprachen gewählt werden; JavaScript ist erforderlich.

Benutzerkonfiguration

Bearbeiten

Alle Benutzer (auch ohne Anmeldung) können die gewünschte Funktionalität über ein Zahnrad neben „Sprachen“ (meist am linken Rand des Portals) erreichen; es öffnet sich ein Optionsformular.

Das Optionsformular enthält auch einen Zugang zur Sprachunterstützung. Falls IME aktiviert ist, lässt es sich auch von jedem Eingabefeld aus erreichen.

Die Einstellungen werden mittels Cookie[1] gespeichert (vermutlich nur für die Dauer einer Browser-Sitzung).

Angemeldete Benutzer können die „Sprache der Benutzeroberfläche“ in der

dauerhaft festlegen,[2] wodurch sie bei der Anmeldung auf unterschiedlichen Rechnern und über eine Browser-Sitzung hinaus auf die gleichen Werte zugreifen können. Auf dieser Einstellungsseite befindet sich auch ein weiterer Link (Weitere Spracheinstellungen) zum Optionsformular.

Im zweiten Halbjahr 2013 war das System zwangsweise auf sämtlichen Wikiseiten aktiv und praktisch nicht oder nur mit besonderen Spezialkenntnissen deaktivierbar. Anfang 2014 war es zeitweilig abgeschaltet, weil die Server die Anfragen nicht mehr hinreichend bedienen konnten. Seitdem ist es auf lateinisch verschrifteten Wikis ein Opt-in; Benutzer können und müssen sich aktiv dafür entscheiden.

Vorlagen

Bearbeiten

Traditionell werden in der Wikipedia fremdsprachliche Textpassagen, vor allem aber solche mit fremden Schriften, von Vorlagen umschlossen, wie sie in der Kategorie:Vorlage:mit Schriftfamilie aufgelistet sind.

Dies ist auch weiterhin erforderlich.
  • Die Vorlagen liefern regelmäßig auch die Sprachdeklaration lang= – ohne diese wirkt ULS auch nicht.
  • Diese Vorlagen deklarieren auch eine Schriftfamilie (einen oder mehrere Fonts). Das wirkt unabhängig von JavaScript und ist deshalb zwingend notwendig für Leser, die JavaScript deaktiviert haben.
  • Sie sorgen ferner für eine Vereinheitlichung des Schriftbildes, wenn entsprechend codierte Zeichen zwar in irgendeinem Font auf dem Rechner gefunden werden können (durch den „Font-Matching-Algorithmus“), diese jedoch unterschiedlich gestaltet sind.

Mittels der Vorlage:lang kann für eine Textsequenz eine Sprache direkt angegeben werden; über die Kategorie:Vorlage:Fremdsprachenunterstützung sind vorbereitete Vorlagen verfügbar, die bevorzugt genutzt werden sollten.

Vor- und Nachteile

Bearbeiten

Der Vorteil des Systems zeigt sich an Wikis, die in nichtlateinischen Schriften geschrieben sind. Die Entwicklung ging aus von Wikiprojekten zwischen Khmer und Indien, bei denen die Leser Probleme bei der Ausstattung ihrer Rechner hatten.

Umgekehrt erfordert der ULS-Algorithmus auf dem Rechner des Lesers Ressourcen:

  • Jede Wiki-Seite muss zunächst auf deklarierte Textpassagen durchsucht werden.
    • Jede gefundene Textpassage ist Zeichen für Zeichen zu analysieren, ob es bereits dargestellt werden konnte; falls nicht, ob ein Font heruntergeladen werden kann.
  • Wenn ein zusätzlicher Font abgerufen wird, ist Netzwerkkapazität erforderlich.
  • Etwas Speicherplatz wird auch benötigt; das ist weniger problematisch.
  • Zwar ist der Seitentext vermutlich bereits in den Grundzügen sichtbar und lesbar, während der Algorithmus noch daran arbeitet.
    • Es erscheint jedoch weiterhin das Sanduhr-Symbol und zeigt an, dass der Aufbau der Seite noch nicht abgeschlossen wurde.
    • Andere Skripte, die die Seite ggf. verändern sollen und die vom Benutzer aktiv eingesetzt werden, müssen sich die Rechenleistung teilen, werden ggf. erst später gestartet.
  • Insgesamt verlängert sich die Zeit für den Seitenaufbau.

Der Nutzen für Leser ohne Kenntnisse der entsprechenden Fremdsprache wird insbesondere auf lateinisch verschrifteten Projekten in Frage gestellt.

  • In einem Artikel, der sich speziell mit der fremden Sprache, Schrift oder Literatur beschäftigt, kann auch ohne Nutzung von Grafiken ein Eindruck der Schrift gewonnen werden, selbst wenn man die Zeichen (noch) nicht lesen kann.
  • Wenn in einem sonstigen Artikel in einer Endnote der Name eines Zeitungsjournalisten in seiner Originalsprache erwähnt wird, ist das für das Verständnis des Themas unerheblich.
  • Jeder Artikel muss erst einmal auf sprachlich deklarierte Textpassagen durchsucht werden, und jede Sprache und ggf. jedes Zeichen muss analysiert werden, was Zeit kostet. Dazu muss das System auch weitgehend aktiv sein.
    • Das gilt ebenso, wenn der gelesene Artikel rein deutschsprachige Themen behandelt.
  • Die Leser und Autoren der deutschsprachigen Wikipedia kommen mit den ihnen üblicherweise zur Verfügung stehenden Tastaturen in der Regel gut zurecht.
  • Wer Farsi lesen kann, hat vermutlich auch einen ar-Font nachinstalliert; viele Systeme haben ar-Glyphen auch bereits in einem Standard-Font.
    • Wer es aber ohnehin nicht entziffern kann, dem ist es meist völlig egal, ob da kleine Kästchen stehen oder ein „Krickelkrakel“. Jedoch gestaltet sich die Darstellung solcher Kästchen deutlich einfacher bzw. schneller.

Technisches

Bearbeiten

Mit der HTML-Deklaration

<input class="noime">

können Programmierer in Funktionsseiten des Projekts und generierten Formularen den IME deaktivieren.

Weitere Informationen

Bearbeiten
MediaWiki: Universal Language Selector – Freie Wikisoftware (englisch)

Anmerkungen

Bearbeiten
  1. uls-… (mehrere)
  2. uls-preferences
  NODES
INTERN 1
Note 1