So sieht eine
HTML-Seite als Anweisungsfolge aus...
Wenn Sie mit Werkzeugen wie Microsoft Word 97 arbeiten,
brauchen Sie sich wenig Gedanken um den Aufbau der einzelnen
Dokumente mit den zugehörigen HTML-Befehlen zu machen. Die HTML-Befehle
werden nur auf Wunsch angezeigt. Häufiger müssen (oder wollen)
Sie sich mit den "Niederungen" der HTML-Dokumentbeschreibungssprache
beschäftigen (z.B. weil Sie in einem Editor das Dokument
optimieren möchten, oder weil es Probleme mit der Anzeige im
Browser gibt). Dann interessiert der Aufbau eines Dokuments. Alle
heutigen HTML-Werkzeuge unterstützen die Anzeige (und teilweise
die Bearbeitung) der Dokumente im HTML-Quelltextformat. Eine HTML-Datei
besitzt dabei immer folgenden Aufbau:
<HTML>
<HEAD> <! Dies ist der Kopf des HTML-Dokuments>
<TITLE>Titel des Dokuments</TITLE>
</HEAD>
<BODY> <! Hier folgt der sichtbare Dokumentteil>
<P>
<IMG SRC="ERDE.gif" ALIGN="LEFT" ALT="Bild">
<B><FONT SIZE=5 COLOR=#00FF00>Unser erstes Beispiel</FONT></B>
<HR>
<H1><A NAME="a1">Dies ist eine einfache Überschrift</A></H1>
<P>
Hier kommt jetzt der Text:
<P>
Dieser Text ist <I>kursiv</I> und jetzt kommt <B>fetter</B> Text
der auch <U> unterstrichen</U> werden kann. Die folgenden
Zeilen zeigen direkt einige <B>HTML-Anweisungen</B> als Listing.
<P>
<FONT COLOR=#FF00FF>
<h1>Überschriftsebene 1</h1><BR>
<h2>Überschriftsebene 2</h3><BR>
</FONT>
Die nachfolgende Linie schließt das Dokument ab und
wird als "Ruler" bezeichnet.
<HR noshade>
</BODY>
</HTML>
Listing 1: Beispiel eines HTML-Quelltexts
Das Listing enthält die komplette Dokumentbeschreibung in
Form eines ASCII-Texts. Zusätzlich zum anzuzeigenden
Dokumentinhalt (der Text) enthält das HTML-Dokument noch
bestimmte Befehle, die die Struktur (die Formatierung) des
Dokuments festlegen. Die Befehle werden in spitze Klammern <
.. > gestellt.
Man bezeichnet diese Befehle auch als Tags. Diese Tags
stellen das Kernelement der HTML-Dokumentbeschreibungssprache dar.
Bei den Tags unterscheidet man dabei noch zwischen zwei Varianten:
- Es gibt dabei einfache Tags, die nur einen Befehl
einleiten. Der Tag <P> markiert zum Beispiel einen
neuen Absatz ein und muß nicht mit </P>
abgeschlossen werden.
- Die meisten HTML-Befehle bestehen jedoch aus einem Pärchen
mit einem einleitenden Tag (z.B. <B> für
Fettschrift ein) und einem abschließenden Tag (bei <B>
ist dies dann </B> für Fettschrift aus). Abschließende
Tags enthalten immer den Tag-Namen mit einem
vorangestellten Slashzeichen (/).
Zwischen einem einleitenden und einem abschließenden Tag
steht dann der Dokumentteil, der durch den Befehl beschrieben
wird. Mit der Anweisung:
<HTML> ...... </HTML>
wird dann das gesamte HTML-Dokument geklammert. Innerhalb
dieses Dokuments finden Sie weitere Tags, die den Dokumentkopf
<HEAD>, den Dokumentkörper <BODY> und den
anzuzeigenden Dokumentteil beschreiben.
... und so zeigt sie der Browser
Wenn Sie eine HTML-Datei in einen Browser (z.B. Netscape)
laden, liest dieser die einzelnen Befehle ein und zeigt das
Dokument anschließend im vorgegebenen Format an. Um die Seite
mit dem Code aus Listing 1 anzuzeigen, klicken Sie bitte auf die
nachfolgende Hyperlink-Verbindung. Damit erscheint ein
Bildschirmausschnitt mit der Anzeige der Seite im Netscape
Navigator. Über die Hyperlink-Verbindung im Kopf der
Beispielseite gelangen Sie wieder zu dieser Seite zurück.
Beispiel
anzeigen
Sie sehen eine Überschrift, zwei horizontale Linien und
verschiedene Textzeilen in der Anzeige. Hierbei zeigt der Browser
in der Regel die Texte verschiedenfarbig an. In der linken oberen
Ecke der Seite erscheint weiterhin ein kleines Bild (oder der
Text {Bild}).
Idealerweise sollte dabei jeder Browser die gleiche Ansicht für
das Dokument zeigen. Leider steckt der Teufel aber im Detail -
sprich: die Hersteller der Browser halten nicht immer die Regeln
der HTML-Spezifikation ein. Dies führt dazu, daß das Dokument
in jedem Browser etwas unterschiedlich angezeigt wird. Dies kann
von kleinen Abweichungen bis hin zu gravierenden Unterschieden
reichen. Selbst für das oben in Listing 1 gezeigte einfache
Dokument kommt es bereits zu gravierenden Unterschieden in der
Anzeige.
Wählen Sie die folgenden Punkte, um sich die jeweilige
Darstellung in verschiedenen Browsern anzeigen zu lassen.
- Variante
1: Wenn Sie auf den nebenstehenden Hyperlink klicken,
erscheint das Beispieldokument in der Darstellung des Netscape-Navigators
(Version 2.0). Interessant ist hier vor allem, daß der
Navigator das Attribut Unterstrichen aus diesem
Beispiel nicht darstellen kann.
- Variante
2: Wenn Sie auf den nebenstehenden Hyperlink klicken,
erscheint das Beispieldokument in der Darstellung des
Programms NaviPress (Version 1.1). Hier wird zwar
der Text mit korrekter Formatierung angezeigt. Sie sehen
aber sehr schnell einige Abweichungen zum Netscape-Navigator.
- Variante
3: Klicken Sie auf den nebenstehenden Hyperlink,
erscheint das Beispieldokument in der Darstellung des
CompuServe Mosaic Browers (Version 4.0). Hier wird
zwar der Text mit korrekter Formatierung angezeigt. Neben
dem fehlenden Bild sehen aber weitere Abweichungen zur
Anzeige des Netscape-Navigators (z.B. die horizontalen
Linien sind hier gleich, während bei den Varianten 1 und
2 die untere Linie von der oberen Linienform abweicht).
- Variante 4: Klicken
Sie auf den nebenstehenden Hyperlink, erscheint das
Beispieldokument in der Darstellung des Microsoft
Internet Explorers (Version 2.0). Hier wird zwar der
Text mit korrekter Formatierung angezeigt. Aber auch hier
ergeben sich im Vergleich mit den restlichen Browsern
einige Unterschiede in der Anzeige.
Die unterschiedliche Darstellung der HTML-Dokumente in
verschiedenen Browsern ist daher auch eines der Hauptprobleme
beim Erstellen von HTML-Dokumenten. Obwohl Netscape mit seinen
Browsern fast 80% des Marktes beherrscht, sorgen andere
Hersteller (z.B. Microsoft oder Spry) dafür, daß alternative
Browser in Benutzung sind.
HTML = HTML - eine Gleichung mit Unbekannten?
Im vorhergehenden Abschnitt klang es bereits an: Trotz HTML-Standard
gibt es offenbar Unterschiede in der Anzeige der Dokumente durch
die einzelnen Browser. Dies hat insbesondere zwei Ursachen:
- Der erste Grund in der unterschiedlichen Behandlung eines
HTML-Dokuments ist die Implementierung der HTML-Befehle
durch die Hersteller. Da die Browser auf verschiedenen
Plattformen laufen, muß die Anzeige auf verschiedene Geräte
abgestimmt werden. Daher kann die Schriftgröße oder die
Schriftfarbe zum Beispiel zwischen den Browsern auf
verschiedenen Plattformen abweichen. Wesentlich ärgerlicher
ist aber die Tatsache, daß vielfach Fehler und
Abweichungen in der Implementierung eines Befehls der
Grund für die unterschiedlichen Anzeigen sind.
- Die zweite Hürde bieten die unterschiedlichen HTML-Versionen
und die "Erweiterungen", die die einzelnen
Hersteller am HTML-Befehlssatz vorgenommen haben. Enthält
ein HTML-Dokument herstellerspezifische HTML-Befehle,
lassen sich diese nur von den Browsern dieses Herstellers
auswerten. Verwenden Sie den Browser eines anderen
Herstellers, kennt dieser häufig diese Befehle nicht und
ignoriert die Anweisungen.
In der Praxis haben Sie sich mit folgenden "Standards"
herumzuschlagen:
- Angefangen hat die ganze Sache mit HTML 1.0, der
ersten Version des HTML-Formats. Es handelt sich um eine
Sammlung sehr einfacher Befehle, die vom W3-Konsortium
mit Sitz in Genf als informelle Dokumente verbreitet
wurden. Der erste WWW-Browser mit graphischer Oberfläche
(Mosaic) führte dann dazu, daß HTML als
Dokumentbeschreibungssprache im Word Wide Web populär
wurde. Die Entwickler hatten hierbei neue Funktionen mit
integriert, die nicht im HTML-Standard festgelegt waren.
Die schnelle Verbreitung des Mosaic Browsers schaffte
dann einen "Defacto-Standard" an HTML-Befehlen,
der über HTML 1.0 hinausreichte.
- Um der Entwicklung Rechnung zu tragen, wurde vom W3-Konsortium
der HTML 2.0 Standard definiert. Dieser Standard
stellt eine Obermenge von HTML 1.0 dar, und bei der
Definition wurden verschiedene im Mosaic Browser
enthaltene "neue" Befehle offiziell mit übernommen.
Andere Befehle entfielen dagegen. Daher gibt es seit
HTML
2.0 die Situation, daß Befehle offiziell definiert
aber als überflüssig (obsolete) definiert sind. Diese
Befehle sollten nach dem Willen des W3-Konsortiums nicht
mehr verwendet werden (müssen aber aus Kompatibilitätsgründen
von den Browsern unterstützt werden).
- Die Dynamik des WWW erwies sich sehr schnell als Problem
für HTML 2.0. Der Sprachstandard enthält zwar viele
Elemente zur Beschreibung von Dokumentteilen (wie Texte,
Formatierungen und eingebettete Bilder etc.).
Andererseits fehlen in HTML so einfache aber wichtige
Dinge wie Tabellen, Farben für Schriftarten, Schriftgrößen
etc. Dies führte dazu, daß vom W3-Konsortium Anfang
1995 ein neuer Sprachstandard unter der Bezeichnung HTML
3.0 entworfen und als Vorschlag veröffentlicht wurde.
Der im HTML 3.0-Vorschlag vorgesehene Befehlsumfang war
leider zu umfangreich (z.B. Formeln, Klassen etc.). Es
gab keine kommerziell verfügbaren Browser, die den HTML
3.0-Befehlsumfang vollständig implementieren.
- Neben der Festlegung der HTML-Befehle durch das W3-Konsortium
kommen immer mehr kommerzielle Interessen bei der
Gestaltung von WWW-Browsern ins Spiel. Der Mosaic-Entwickler
Marc Andressen gründete die Firma Netscape und
entwickelte mit einem Großteil der ehemaligen Mosaic-Entwickler
einen eigenen Browser. Die Version 1.1 erreichte bereits
sehr schnell einen Marktanteil von ca. 70 %. Mit der
Version 2.0x des Netscape Navigators steht ein Browser für
verschiedene Plattformen zur Verfügung. Netscape setzte
mit diesem Browser einen Defakto-Standard für
Befehlserweiterungen, die weder durch HTML 2.0 noch durch
HTML 3.0 abgedeckt werden sondern firmenspezifisch sind.
Als dieser Text geschrieben wurde, stand die Version des
Netscape Browsers 3.0 zum Test zur Verfügung. Hier gibt
es weitere Befehle (z.B. HTML 3.2) und Neuerungen.
Mittlerweile existiert der Netscape Navigator, der zusätzliche
Neuerungen bietet.
- Ein anderer globaler Player im Markt der Browser ist die
Firma Microsoft, die mit dem Internet Explorer (1.0, 2.0)
massiv in den Markt drängt. Da dieses Programm kostenlos
abgegeben wird (und von einigen Online-Anbietern wie AOL
mit lizenziert wurde), schafft Microsoft weitere Fakten (und
einen neuen HTML-Standard). Der Internet Explorer bietet
ab der Version 2.0 eine Reihe von spezifischen Befehlen,
die von keinem anderen Browser genutzt werden. Die
Versionen 3.0 des Microsoft Internet Explorers und des
Netscape Navigators bieten weitere Befehle und die
Unterstützung von HTML 3.2. Der bei der Erstellung
dieses Dokuments als Beta-Version erhältliche Internet
Explorer 4.0 setzt diese Tradition fort und unterstützt
bereits viele der Erweiterungen, die mit HTML 4.0 eingeführt
werden.
- Bedingt durch diesen "Wildwuchs" und die
fehlende Akzeptanz der HTML 3.0-Spezifikation ergab sich
die Notwendig nach einer herstellerübergreifenden Lösung.
Seit Mai 1996 ist der Vorschlag für den HTML 3.0-Standard
vom Tisch (und damit nur noch Makulatur). An dessen
Stelle tritt ein neuer Standard HTML 3.2. Diese
Empfehlung stellt erstmals einen herstellerübergreifenden
Satz an Tags bereit, die von den meisten heutigen
Browsern unterstützt werden.
- Seit 1998 gibt es die Empfehlung HTML 4.0. Neben einigen
Erweiterungen zu HTML 3.2 wie Frames widmet sich HTML 4.0
den sogenannten Style Sheets, Frames und dynamic HTML.
Diese Erweiterungen werden aber in diesem Tutorial nicht
angesprochen, da sie über das Ziel einer Einführung
hinausgehen. Hinweise zu obigen Themen finden Sie in dem
bereits erwähnten HTML-Kompendium von Markt+Technik.
Mittlerweile liegt HTML 4.01 vor - es handelt sich eine
im wesentlichen um fehlerbereinigte Fassung von HTML 4.
- Aus heutiger Sicht wird HTML 4.01 der letzte Standard
sein, neue Entwicklungen des W3C befassen sich mit der
Extended Markup Language (XML), einer
universellen Sprache zur Beschreibung von Daten. XML lässt
sich auch zur Erweiterung von Webseiten verwenden (siehe
auch "Jetzt lerne ich XML" aus dem Markt + Technik-Verlag). Mit
XHTML wurde auch HTML in der Syntax von
XML neu formuliert. Wer jedoch HTML beherrscht, kann
eigentlich auch XHTML - es sind nur einige strengere
Regeln (z.B. Kleinschreibung von Tag- und Attributnamen,
korrekte Verwendung der Tags) zu beachten. Hinweise zu
XHTML finden Sie im HTML-Kompendium von Markt + Technik.
Die Vorschläge für HTML 3.2, HTML 4.0 und XHTM stammen vom W3-Konsortium,
wobei aber die Hersteller von Browsern wie IBM, Microsoft,
Netscape, Novell, SoftQuad, Spyglass und Sun einbezogen wurden.
Anmerkungen: Informationen über die einzelnen
Standards lassen sich vom Server des W3-Konsortiums
W3C-Server abrufen.
Tip: Eine komplette Referenz der HTML-Befehle einschließlich
der von Microsoft und Netscape definierten Extensions finden Sie
in dem erwähnten Buch.
Dokumentanfang
Zurück
(by Günter Born)