Ist Ihnen beim Betrachten verschiedener HTML-Dokumente vielleicht etwas aufgefallen? Die Texte enthalten weder Umlaute (ä, ö, ü), noch das scharfe S (ß), noch sonstige Sonderzeichen. An einigen Stellen haben Sie höchstens so merkwürdige Begriffe wie Ü etc. bemerkt. Im Browser erscheinen dagegen die Umlaute und Sonderzeichen wie gewohnt. Warum dürfen Sie Umlaute nicht direkt im HTML-Dokument eingeben?
Der Grund hierfür liegt in der unterschiedlichen Kodierung solcher Sonderzeichen auf verschiedenen Rechnerplattformen. Bedingt durch die historische Entwicklung im Rechnerbereich sind nur die ersten 127 Zeichen des ASCII-Codes auf den meisten Rechnern identisch belegt. Diese ASCII-Codes enthalten aber lediglich die Buchstaben des englischen Alphabets, die Ziffern und einige Sonderzeichen wie Punkt, Komma, Bindestrich etc. Länderspezifische Zeichen wie Umlaute oder andere Sonderzeichen (z.B. Pfund, Akcent etc.) werden teilweise im Codebereich zwischen 127 und 255 abgelegt. Leider erfolgte diese Festlegung für verschiedene Betriebssysteme auf unterschiedliche Weise. Wenn Sie zum Beispiel unter DOS einen Text mit Umlauten per Editor eintippen und anschließend auf einer anderen Betriebssystemplattform ansehen, sind die Umlaute plötzlich verschwunden. Windows-Besitzer können dies sehr einfach nachvollziehen (Macintosh- und Unix-Besitzer kennen sicherlich auch das Problem).
Bei der Gestaltung von HTML-Dokumenten kann diese Besonderheit zu Problemen führen. Keine Angst, HTML besitzt schon Funktionen zur Unterstützung internationaler Zeichensätze. Allerdings sollten Sie sich hüten, Zeichen, deren Code oberhalb von 127 liegt, direkt im Editor einzutragen. Vielmehr sind die Zeichen entsprechend im Text zu kodieren.
In deutschen HTML-Dokumenten werden Sie wohl häufiger die Umlaute und das scharfe S verwenden. Die HTML-Spezifikation sieht vor, daß diese Zeichen mit besonderen Namen im Dokument angegeben werden. Für die deutschen Umlaute gilt die folgende Kodierung:
ä ä
Ä Ä
ö ö
Ö Ö
ü ü
Ü Ü
ß ß
Das betreffende Zeichen wird demnach mit dem &-Symbol eingeleitet und ist mit einem Semikolon (;) abzuschließen. Der Name zwischen diesen beiden Symbolen definiert eindeutig das Sonderzeichen. Der Großbuchstabe Ü wird mit dem Namen Uuml festgelegt, während das kleine ü den Namen uuml erhält. Dies bedeutet, daß Sie auf Groß-/Kleinschreibung im Namen achten müssen! Verwechseln Sie Groß- und Kleinbuchstaben, erhalten Sie anschließend eine falsche Schreibweise im Dokument.
Ein Text, der solche Umlaute enthält, sieht in der HTML-Darstellung etwas ungewöhnlich aus. Vielleicht laden Sie die Datei vorlage0.htm und geben den folgenden Text per Editor ein:
<P><B>Im Moment des größten Ärgers sprach eine Stimme zu mir:</B> <P><B>Lächle und sei froh, denn es könnte schlimmer kommen...</B> <P><B>und ich lächelte und war froh!</B> <P><B>... und es kam schlimmer, denn plötzlich gab es HTML</B>
Der gesamte Text sieht etwas krauselig aus. Achten Sie deshalb bei der Eingabe auf die korrekte Schreibweise (Groß-/Kleinschreibung) und vergessen auch das Semikolon hinter dem Namen des Sonderzeichens nicht. Sobald Sie dieses Dokument speichern und in einem Browser laden, erscheint ein lesbarer Text.
Anmerkungen: Um die schlecht lesbare Darstellung der Sonderzeichen zu vermeiden, unterstützen moderne Browser mehrere Zeichenkodierungen. Wenn Sie in der Webseite im Kopf eine Anweisung der Art:
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
einfügen, können Sonderzeichen wie Umlaute direkt eingetippt werden. Der Browser ist dann für die korrekte Darstellung verantwortlich. Bei Werkzeugen wie Micosoft FrontPage Express wird dieser META-Tag direkt im Code der Webseite eingefügt.
Vielleicht haben Sie sich darüber gewundert, daß in den bereits gezeigten Beispielen die Tags direkt im HTML-Dokument erscheinen (z.B. dieses Wort ist <B>fett</B> ausgezeichnet). Eigentlich sollte der Browser ja die beiden Tags erkennen und das dazwischenstehende Wort fett formatieren. Dies ist aber nicht erwünscht (im Text möchte ich ja den Tag vorstellen) und offensichtlich bemerkt der Browser dies auch.
Natürlich ist der Browser nicht "intelligent", der Trick liegt woanders. Die spitzen Klammern gehören ebenfalls zu den Sonderzeichen. Sie können diese zwar direkt im HTML-Dokument eingeben (die Zeichen liegen im Codebereich unterhalb von 127), dann erkennt der Browser den zugehörigen Tag. Um die spitzen Klammern als Text anzuzeigen, müssen Sie ähnlich wie bei Umlauten die Namen für die beiden Zeichen vergeben:
< <
> >
Die beiden Namen lehnen sich an die mathematische Notation an (less than, greater) und sind mit den Symbolen &..; einzufassen. Möchten Sie also die Tags im folgenden Text:
<B>Dieser Satz wird fett dargestellt</B>
im HTML-Dokument darstellen (so, daß der Browser diese nicht berücksichtigt), müssen Sie die beiden obigen Sonderzeichen verwenden. Die Textzeile sieht dann so aus:
<B>Dieser Satz wird fett dargestellt</B>
Dies sieht etwas "verstümmelt" aus, funktioniert aber perfekt - die Tags werden anschließend als Text im Browser ausgegeben. Sie können sich beispielsweise die HTML-Datei doc2_06.htm im Verzeichnis beispiel mit einem HTML-Editor ansehen. Diese Datei enthält die betreffenden Sonderzeichen.
Anmerkung: Arbeiten Sie mit einem HTML-Werkzeug, welches keine Tags, sondern direkt das formatierte Ergebnis zeigt (z.B. MS Internet Assistant, NaviPress, Starwriter etc.), brauchen Sie sich um diese Zeichen nicht zu kümmern. Sie tippen einfach den Text mit den <> ein. Das Werkzeug setzt automatisch die betreffenden Zeichen um.
Neben den oben erwähnten Sonderzeichen gibt es noch einige Namen, die Sie vermutlich häufiger in einem HTML-Dokument verwenden müssen. Hier eine kleine Aufstellung:
& Name für das Zeichen &
" Name für das Zeichen "
Zusätzlich gibt es noch Trennstriche und Leerzeichen, die folgendermaßen im HTML-Dokument einzutragen sind:
festes Leerzeichen (non breaking space)
  Leerzeichen der Breite des Buchstabens n
  Leerzeichen der Breite des Buchstabens m
&endash; Bindestrich mit der Breite des
Buchstabens n
&emdsh; Bindestrich mit der Breite des Buchstabens
m
Eine Aufstellung der Kodierung für andere Sonderzeichen finden Sie z.B. im HTML-Kompendium des Markt+Technik-Verlags.