Drei grundlegende Konzepte oder Prinzipien sind es, die das World Wide Web charakterisieren: Hypermedia, die Client-Server-Architektur und die sogenannten Uniform Resource Locators. Sie sind Gegenstand dieses Kapitels.
Als Ausgangskonzept des WWW gilt Hypertext. Darunter ist eine Textart zu verstehen, welche die Linearität von Text aufhebt. Dies wird durch die Einführung von Links erreicht.
Ein Link (englisch für Verweis) ist ein Wort oder generell ein Textteil, welcher durch Anklicken zu einem anderen Textabschnitt führt.
Dieses Werkzeug wird dazu verwendet, zu näheren Erklärungen, weiteren Ausführungen oder generell kontextabhängigen Passagen zu führen.
Web-Browser stellen Links meist in blauer Farbe und zusätzlich noch unterstrichen dar.
In den Anfängen der Computer diente die Schrift entweder am Bildschirm oder in gedruckter Form auf Papier als Medium der Wahl. Später kam die Grafik mit ins Spiel, welche durch die Erweiterung um auditive Fähigkeiten von Computern ein Medienpaket abrundet, das man in seiner Gesamtheit als Multimedia bezeichnet.
Unter Hypermedia versteht man die Verschmelzung von Hypertext und Multimedia zu einem Medium, welches in seiner Art des Umganges mit Text und multimedialen Elementen ein neuartiges Konzept zur Informationspräsentation darstellt.
So wie bei allen Internet-Diensten kommt auch beim World Wide Web die Client-Server-Architektur zur Anwendung. Darunter versteht man eine
,,kooperative Informationsverarbeitung, bei der die Aufgaben zwischen Programmen auf verbundenen Rechnern aufgeteilt werden. Server (= Dienstleister) bieten über das Netz Dienstleistungen an, Clients (= Kunden) fordern diese bei Bedarf an`` ([48], Seite 64).
Eine andere Unterscheidung ist jene in einen benutzernahen Teil (= Client) und einen von allen Benutzern gemeinsam genutzten Teil (= Server) eines Informationssystems (vgl. [48], Seite 1031). Die Aufgabe der Server im World Wide Web ist es, WWW-Seiten zum Abruf bereitzuhalten. Neben dem Speicherplatz für die Dokumente ist dazu natürlich ein Internet-Anschluß mit einem entsprechenden Domain-Namen (z. B. www.wipaed.uni-linz.ac.at) notwendig, durch dessen Angabe die Seiten abgerufen werden können. WWW-Server werden vor allem von Internet-Providern und Forschungs-Organisationen (auch Universitäten) betrieben, erstere stellen gegen Entgelt Firmen und Privatpersonen Speicherplatz für deren Online-Dokumente zur Verfügung (vgl. [174], Seite 2 f).
Zum Abruf der so angebotenen Informationen benötigt der Benutzer ein Client-Programm, im World Wide Web Browser genannt (siehe Kapitel 3.2). Seine Aufgabe ist einerseits, sich um die Verbindung zum Server zu kümmern und die Daten von dort anzufordern. Andererseits muß die erhaltene Information optisch aufbereitet werden, da über die Internet-Verbindung lediglich eine Folge von Zeichen übertragen wird (mehr dazu in Kapitel 3.3).
Das dritte grundlegende Konzept des World Wide Web ist jenes der Uniform Resource Locators, meist kurz als URLs bezeichnet. Darunter versteht man Namensangaben, mit deren Hilfe jedes Dokument im Internet eindeutig bezeichnet werden kann.
Der Beginner's Guide to URLs im World Wide Web schreibt dazu:
,,Think of it as a networked extension of the standard filename concept: not only can you point to a file in a directory, but that file and that directory can exist on any machine on the network, can be served via any of several different methods, and might not even be something as simple as a file`` ([99]).
Die allgemeine Form eines Uniform Resource Locators ist
Protokoll://HostDomainname/Verzeichnispfad/Dokument
Diese Gliederung kann ungefähr mit einer Postanschrift in folgender Form verglichen werden:
Einschreiben://69.AltenbergerStr.4040.A/InstPäd&Psych/AbtWiPäd/ Gramlinger
Die Beförderungsart entspricht dabei dem Protokoll, die Anschrift dem Domainnamen des Hosts, die Abteilung dem Verzeichnispfad (bzw. der Ordnerfolge) und der Name des Empfängers dem jeweiligen Dokument.
Das Protokoll im WWW ist üblicherweise HTTP. Diese Abkürzung steht für Hypertext Transfer Protocol, das auf TCP/IP aufsetzt und die Übertragung der Daten zwischen WWW-Server und Client regelt. Dabei kommt gewöhnlich ein einfaches Get-Prinzip zur Anwendung: Der Client sendet an den Server einen sogenannten Request. Der Server reagiert mit der Übertragung der geforderten Daten (Response) und beendet die dadurch nur sehr kurz andauernde Verbindung (vgl. [137], Seite 178 f).
Manchmal ist es notwendig, vom WWW-Browser aus auf einen anderen Internet-Dienst zurückzugreifen, dem ein anderes Protokoll zugrunde liegt. Auch dies ist problemlos möglich, wenn auch leicht von der oben beschriebenen allgemeinen Form abgewichen wird. Tabelle 3.1 zeigt einen Überblick über die wichtigsten Protokolle (vgl. [174], Seite 318 ff; [48], Seite 392; [99]).
Tabelle 3.1: Protokolle bei URLs
Leider hat das URL-Konzept trotz aller Genialität auch einen entscheidenden Nachteil: Die Dokumente sind im gesamten Hyperspace nur einmal vorhanden. So kann es bei häufig nachgefragten Seiten leicht zu einer Überlastung des betreffenden Servers kommen, was für den Benutzer eine extrem lange Wartezeit bedeutet.
Eine Abhilfe könnte das System der URNs, der Uniform Resource Names darstellen, an dem schon seit 1991 gebastelt wird. Dabei wird das Dokument unter einem eindeutigen Namen an mehreren Stellen weltweit gespeichert; eine zentrale Liste gibt Auskunft über die beherbergenden Hosts. Wird das Dokument vom Client abgerufen, kann es direkt vom nächstgelegenen oder zur Zeit am besten erreichbaren Server bezogen werden (vgl. [174], Seite 5 f).
URLs und URNs werden zusammen als URIs - Uniform Resource Identifiers - bezeichnet. Ein URN ist demnach ,,Any URI which is not a URL`` ([120]).
Abbildung 3.1: Uniform Resource Identifiers