"Elektronisk publicering i World-Wide Web" : Introduktion till Internet.

Preben Hansen
(Swedish Institute of Computer Science ) och
Frans Lettenström
(BIBSAM)

Material publiserat för kursen "Elektronisk publicering i World-Wide Web".
17 Mars 1995. IDC-KTHB. Arrangerad av TLS.


Copyright ©1995 Preben Hansen och Frans Lettenström.


Internet : En Introduktion.

Detta avsnitt ger en kort beskrivning av olika informationstjänster och verktyg som man kan finna på Internet. Internet är en samling av olika mindre och större nätverk som sammankopplar miljoner av användare runtom i världen.
Nätverken gör det möjligt att samarbeta, dela resurser samt att finna, utbyta och dela information.

Den stora informationsmängd som utgör Internet för också med sig en del problem och svårigheter av olika slag: det är svårt att lokalisera relevant information; det är svårt att hålla ordning på den information man en gång hittat vilket betyder att det behövs olika mekanismer för att man ska kunna få tillgång till denna information på ett bra sätt.

Med en uppkoppling till Internet har man också en möjlighet att publicera information.
Ett utmärkande drag för Internet är möjligheten att distribuera information och teknologi, och att göra dessa resurser tillgängliga för en större publik.
Andra utmärkande drag för nätverken och de nätverksbaserade tjänsterna är att det sker en gradvis förskjutning från centralt etablerad service till server-baserade tjänster och från dator-till-dator kommunikation till mer distribuerade tjänster. Denna situation inom datakommunikationen möjliggör nya informationstjänster för biblioteken, och utgör samtidigt en förstärkning och utveckling av de traditionella tjänsterna.

Nätverket ger en struktur för en integrerad tillgång till en rad olika interna och externa samlingar och elektroniska informationsresurser.

Den enorma mängden av information som finns på Internet kräver att man har tillgång till olika typer av verktyg så att man kan :

Nedan följer en kort beskrivning av ett antal verktyg som kan användas på Internet. Detta förutsätter en anslutning till TCP/IP, antingen genom s k full uppkoppling eller uppringd (modem) uppkoppling. Till denna uppkoppling krävs sedan ett antal programvaror för att kunna använda den service som Internet erbjuder.

Det finns ingen enhetlig och entydig uppdelning av de olika nätverksbaserade verktygen. Vidare ska man vara medveten om att det hela tiden tillkommer nya verktyg och lösningar.

- grundläggande tjänster på Internet: (telnet, FTP, e-post och USENET News).
- verktyg för att finna programvara: (t ex Archie)
- verktyg för att finna personer: ( t.ex WHOIS, Finger)
- verktyg för att finna resurser: ( t ex Gopher)
- verktyg för att söka i indexerade databaser: (WAIS)
- verktyg för att finna material med länkat innehåll: (World Wide Web)
- verktyg för distribuerade filsystem (t ex Alex)
Det bör åter sägas att de olika verktygen som här beskrivs endast utgör ett urval av de vanligaste i sina kategorier. Det finns idag en hel del olika verktyg för olika plattformar, och att beskriva alla dessa skulle behöva en dokumentation för sig.

Elektronisk post (E-mail)

Elektronisk post är i grunden en fil med ett speciellt huvud som specificerar varifrån filen kommer och vart filen ska skickas. E-post är ett sätt att skicka meddelanden till varandra.
En förutsättning för att skicka och ta emot meddelanden från hela världen är att man har en e-post adress, en programvara för e-post och en uppkoppling till ett nätverk, t ex Internet.
Elektronisk post är den mest vanliga och kända tillämpningen på Internet. En användare kan sända ett elektroniskt meddelande till vem som helst på vilket nätverk som helst, förutsatt att det finns en uppkoppling eller en "gateway" från det egna nätverket till det nätverk som användaren vill sända sitt meddelande till.

En "gateway" är en dator vilken är kopplad till en eller flera nätverk samtidigt, och som kan skicka meddelandet mellan dessa nätverk. I de flesta fall känner programvaran till denna gateway och förmedlar brevet utan att du behöver göra något.
Meddelanden lagras i en s k brevlåda och kan därifrån läsas, skrivas ut och editeras.

Man skiljer på två olika sätt att lagra och komma åt sin post : central lagring innebär att man kan läsa sin post via en telnet-uppkoppling var som helst i världen där man kan komma åt Internet, och lokal lagring vilket innebär att man är hänvisad att läsa sin post på det lokal nätet.
Vissa hanterare av e-post hjälper till med överföring av olika typer av filer som kan bifogas ett brev.
MIME (Multipurpose Internet Mail Extensions) är en allmän standard som kommer att underlätta sändning av multimedial post, dvs ljud och bilder.


LISTSERV och USENET News

Distribution av meddelanden i elektroniska listor kan ske på flera sätt.
LISTSERV och USENET News är exempel på denna typ av service. LISTSERV-baserade s k "mailing" listor distribuerar meddelanden via e-post till alla prenumeranter på en specifik lista. USENET News som är ett s k konferenssystem eller en diskussionslista där meddelandena i en USENET newsgroup sänds i sin helhet till alla som har program för USENET. Lokalt kan man sedan välja vilka grupper man vill läsa. Det som är speciellt för dessa konferenser är att de dels erbjuder aktuell information och dels att dessa kan arkiveras. Arkiven kan sedan genomsökas och intressanta meddelanden kan återhämtas.

LISTSERV
En LISTSERV är en s k "mailing" lista för behandling och underhåll av en diskussionslista. Efter att ha installerat programvaran som finns fritt att hämta på Internet, beslutar man sedan vilket ämne denna server ska innehålla.
För att den ska fungera krävs att någon administrerar listan. Listan kan vara dels kontrollerad, dvs. att det finns någon som avgör vilka inlägg som är relevanta för listan och dels okontrollerad. Dessutom kan dessa distributions-listor vara slutna eller öppna. Ett exempel på öppen lista inom biblioteks-området är PACS-L..

USENET News
USENET News är ett elektronisk konferenssystem, där elektroniska meddelanden delas av många användare. USENET utvecklades först för Unix 1979. Meddelanden inom USENET grupperas ämnesvis och i en hierarkisk struktur av undergrupper i form av olika "newsgroups".

För att delta i USENET News behöver den egna organisationen sätta upp en egen USENET-server i det lokala nätverket. Dessutom behöver användaren ett klient-program, d v s ett läsverktyg, för att kunna kommunicera och välja nyhetsgrupper. Läsverktygen håller reda på vilka grupper användaren prenumererar på och vilka brev som redan är lästa. Ett inlägg kan besvaras privat eller öppet till alla, samt sparas och skrivas ut.

Individuella bidrag till en grupp kallas artikel och dessa meddelanden kan innehålla både vanlig text eller binär information. Vissa grupper har någon typ av redaktion eller kontroll som läser igenom meddelandena innan de distribueras i gruppen. Programvara för distribution av USENET News finns för ett flertal nätverk.


File transfer Protocol (FTP)

FTP står för File Transfer Protocol och är det protokoll som stöder överföring av filer mellan datorer på Internet.
FTP tillåter också överföring av olika typer av filformat, som t.ex vanliga textfiler och binära filer.
Oftast refererar man till FTP som en process och inte som ett protokoll och liksom de flesta tjänsterna på Internet, är FTP klient/server baserat, där man använder ett lokalt klient-program.
FTP kräver alltså en programvara (klienten), en uppkoppling till ett nätverk, ett användarnamn och ett "password". Men det finns även ett par andra sätt att använda sig av FTP som t.ex genom olika gateways och FTP servers via elektronisk post eller genom att använda en värddator och dennas FTP tillämpning.
Om den egna organisationen vill göra en viss information allmänt tillgänglig, kan man göra det genom att informationen läggs upp på den egna datorns FTP-area. Därefter kan man gå ut och på olika sätt annonsera om informations existens med adress till denna FTP-area.
FTP protokollet stöder även s k "Anonymous" FTP. I vanliga fall krävs det att man skriver in en ID-adress och ett password, men här används anonymous som användarnamn och det egna e-post adressen som password.
Anonymous FTP är kanske den vanligaste formen av filöverföring idag och erbjuder användaren en stor mängd information, programvara m m.

Telnet

Telnet (Telecommunications Network) innebär att man gör en uppkoppling till en extern dator i nätverket.
För att använda telnet, använder man ett speciellt program som kallas telnet eller rlogin (remote login).
Detta program används för att koppla upp sig till den dator man har specificerat genom att ange antingen IP-adressen eller det logiska namnet på den externa datorn. Telnet gör det alltså möjligt för en användare att via ett klient-program, etablera en kommunikation med en annan dator i ett annat nätverk. För att koppla upp sig till en annan dator behöver man en giltig användaridentitet och ett giltigt lösenord. Telnet erbjuder olika tjänster varav en är att verka som ett gränssnitt mellan slutanvändarens terminal och ett tillämpningsprogram i värddatorn.

Då telnet aktiveras blir den lokala datorn på nätverket en "virtuel terminal" i den externa datorns nätverk och agerar som om användaren befann sig där. Alla datorer som är uppkopplade på Internet har ett telnet-kommando eller ett PC-program, som gör samma sak.
Telnet används främst till att koppla upp sig till olika nätverksbaserade resurser och databaser. Då dessa är anslutna till ett nätverk kan användaren när som helst söka i dessa resurser från sin arbetsstation.


Katalogtjänster - "White Pages"

Hur finner man en person på Internet? En "White Pages" är en sorts telefonkatalog över användare på Internet, dvs de med en egen datoradress. Det finns idag inget enhetligt sätt för hur en användare ska finna en person på Internet. En "White Pages" katalog är en service som tillåter en användare att söka efter en persons namn eller e-post adress m m. En sådan katalogtjänst kan liknas vid en telefonbok eller ett register över användare på Internet.

I dessa kan den lokala institutionen lägga upp olika namn- och adressregister. En sådan katalog kan även bestå av register med andra typer av informations- och kommunikationstjänster. På Internet finns det en rad olika sådana tjänster och här kommer en del av dessa att presenteras: WHOIS, Finger, X.500, och Gopher CSO name server.

WHOIS
WHOIS server är en s k katalogtjänst som erbjuder dels en "White Pages"-katalog, men också en service som tillåter att man frågar en databas efter namn och elektroniska e-post adresser för registrerade användare på nätverket.
Det finns ett stort antal WHOIS servrar på Internet och man kan skaffa sig en lista på dem genom att göra en sökning i Archie för att få reda på vilka FTP arkiv som har denna lista över WHOIS-servers.
WHOIS samlar in information och lägger upp den i en sökbar databas.
Den information som här blir tillgänglig är elektroniska post-adresser, vanliga adresser, och telefonnummer till personer inom en institution, men (WHOIS) kan också ge uppgifter om nätverk, datoradresser och organisationer. WHOIS är tillgängligt för alla användare på Internet.

En WHOIS server kan nås via nätverket genom ett WHOIS-kommando, en Telnet-uppkoppling eller från ett klient-program på den egna lokala maskinen eller via en telnet-uppkoppling till den maskin som är värd för servern. WHOIS bygger på en frivillig informationsinsamling och i nuvarande form finns det inte en gemensam katalog för alla WHOIS servrar. Ett nytt protokoll WHOIS++ håller på att utarbetas för att förbättra detta och kommer inom kort att göras tillgängligt.

Finger
Finger är en katalogtjänst inom Unix-miljön och som erbjuder tre typer av information.
Först så kan man få reda på information om en speciell användare på Internet. Eftersom de flesta användarna har ett eget användarnamn, så kan man med hjälp av finger söka uppgifter om denna användare utifrån användarnamnet.
Det krävs att man vet vilken värddator personen använder och dennes användarnamn. Utifrån detta kan man få reda på en persons användarnamn, personens fulla namn, telefonnummer, m m.
Med finger kan man också få uppgifter om en dator. I detta fall specificerar man endast en maskinadress och värddatorn visar upp en summering av alla som varit inloggade på denna dator.
Till sist kan man använda denna tjänst för att visa upp en viss typ av information för användarna. Mängden av information du får på detta system genom finger beror på det system du frågar, och den individuella användaren.

Andra sätt att finna information om personer är X500, Gopher CSO name server, USENET News AdressServer, NETFIND och The KnowBot Information Service.


Archie

Archie utvecklades av Alan Emtage, Peter Deutsch och Bill Heelan vid McGill University Computing Center, Canada. Numera utvecklas Archie av Bunyip Information System Inc., Canada
Archie är utformad till att automatiskt bygga upp, och erbjuda en möjlighet till lokalisering i en elektronisk katalog - ett index, i form av en databas över de resurser som finns tillgängliga på olika FTP-arkiv för användare på Internet.
Tusentals noder (anslutna enheter i ett datanät) på Internet lagrar information i s k FTP-arkiv.
Men det kan vara svårt för en användare att finna den maskinadress där informationen finns lokaliserad som användaren söker. Archie underlättar detta arbete genom att ge användaren en möjlighet att söka i dessa arkiv. Databasen Archie innehåller namn på ca 1 500 FTP-arkiv som i sin tur hänvisar till sammanlagt ca 2,6 milj. filer (sept. 1993) runt om i världen.

Med Archie slipper man navigera sig genom hierarkiskt uppbyggda menyer på flera olika maskiner. Archie spårar istället upp de olika arkiv- och filnamnen. Vad Archie inte klarar av är att direkt koppla upp sig till den adress man får i en Archie-sökning (en ny version av Archie, xarchie ska dock klara av detta). Slutanvändaren måste efter en Archie-sökning göra en ny uppkoppling till det arkiv till vilken man fått adressen för att få tillgång till själva informationen.

Archie erbjuder sökning i två databaser: Internet Archives Database och Software Description Database.
Den vanligaste och mest använda av dessa två databaser är Internet Archive Database. Denna indexerar namn och platser på de filer som har gjorts tillgängliga i alla kända anonymous FTP-arkiv. Detta index är sedan sökbart och speciella program uppdaterar sedan automatiskt databasen och distribuerar detta index till ca 20 olika allmänt till-gängliga Archie-servrar runt om i världen. Efter att ha kopplat upp sig på en av de tillgängliga Archie-servrarna, ställer användaren en sökfråga. Resultatet blir en lista på olika fysiska platser (en maskinadress med en hänvisning till en filkatalog) där det sökta objektet kan återhämtas. Därefter kan man med ett lokalt FTP-program eller andra verktyg återhämta objektet till sin egen dator. Användaren kan i denna databas söka bl a :

	* 	filnamn
	* 	arkivnamn
	* 	innehållet i ett arkiv
Denna databas används med andra ord då ett filnamn eller namnet på en katalog är känt.
Databasen Software Description Database, används då en användare vet vad man är ute efter, men man vet inte det exakta namnet på filen där innehållet finns. Denna databas innehåller en kort beskrivande information av tusentals program, dokument och datafiler i olika FTP-arkiv på Internet. Användaren kan i denna databas utför sökningar på nyckelord och korta tillhörande beksrivningar. Denna databas uppdateras inte automatiskt, utan underhålls manuellt av system- eller databasadministratören.

Databasen Archie kan man nå och använda på flera olika sätt: Ett sätt innebär att man gör en telnet uppkoppling till en av de ca 20 olika Internet-noderna som tillhandahåller Archie servers. Ett annat sätt är att via elektronisk post utföra en Archie-sökning. Resultatet kommer sedan i form av ett elektroniskt brev. Ytterligare ett sätt är att använda sig av ett lokalt klient-program på den egna maskinen. Archie är numera även integrerat med andra informationssystem och verktyg som Gopher, WAIS.

Archie


Gopher

Internet Gopher utvecklades 1991 av Bob Alberti, Farhad Anklesaria, Paul Lindner, Mark McCahill och Daniel Torrey vid Computer and Information Services Department, University of Minesota och är ett distribuerat informationssystem.
Internet Gopher erbjuder ett gemensamt användargränssnitt för olika typer av nätverksinformation och tillåter användaren att navigera, söka och återhämta information som befinner sig på olika platser i en till synes likartad miljö. Informationen på Gopher representeras av 3 olika typer av menyer : lista på filkataloger (menyer med länkar till andra noder), dokument eller data, (innehåller text, bild eller andra mediatyper) och söknoder (tillåter användaren att göra nyckelordsbaserade sökningar).

Internet Gopher är ett protokoll som ligger på TCP/IP:s tilllämpningsnivå, och är ett klient/ server baserat system, där en Gopher-klient kommunicerar med en eller flera Gopher servrar för sökning och återhämtning av data och information över Internet. Ett system av länkar mellan olika servrar skapar på detta sätt ett nätverk som formar den s k globala Gopher-"världen". För att använda sig av en Gopher-klient måste man ha tillgång till Internet.
För att fullt ut använda sig av Gopher och den information som finns tillgänglig behöver man ytterligare progam på den egna datorn, t ex Telnet.

Då man navigerar genom informationensmängden i Gopher-"världen" visar den sig som en serie hierarkiskt länkade menyer. Denna menystruktur, organiserade i kataloger och filer, kan vara lokaliserade dels på en lokal server eller dels på en extern server. Ur användarens synpunkt ser all information ut som om den låg på samma maskin eller plats.
Informationen och objekten som finns åtkomlig kan vara en textfil, en binär fil (bilder och ljud), en katalogtjänst (phone book) eller en index-sökning. De flesta Gopher-klienterna erbjuder användaren att skapa egna "Bookmarks". Ett sådant håller ordning på den exakta platsen för ett objekt på en Gopher-server. Objekten på Gopher identifieras av typ, en titel, ett användarsynligt namn, en "selektor" (objektets namn i serverns filsystem), namnet på servern (host name), och ett port-nummer.

Dessutom erbjuder Gopher olika "gateways" (gränssnitts- och protokoll-konvertering mot t ex andra datanät eller system) till andra informationssystem som World-Wide Web, WAIS, Archie, X.500 och FTP. En senare version av Gopher har kommit ut som heter Gopher+. Denna ska kunna erbjuda bl a tjänster som formulär, MIME-funktionalitet och en typ av metainformation om varje resurs, t.ex författare, abstract m m.

VERONICA
VERONICA utvecklades 1992 av Steve Foster och Fred Barrie vid University of Nevada och kom till som en lösning på problemet med hur man kan finne resurser i den växande Gopher-"världen". De utvecklade en VERONICA server, en katalogtjänst som skulle ha samma funktion som Archie har i förhållande till Anonymous FTP.
VERONICA finns tillgängligt på de flesta topp-menyer inom Gopher, och erbjuder användaren en sökfunktion med hjälp av nyckelord.

VERONICA servern tar med regelbundna intervaller kontakt med alla kända Gopher servrar och ber om en kopia av alla menyer. Dessa menyer lagras och indexeras i en databas. Varje gång en användare gör en sökning, tillfrågas denna databas. Det speciella med VERONICA är att man vid en sökning kan använda de Boolska operatorerna and, or och not. VERONICA utför ej fulltext sökningar, och liksom Archie indexerar VERONICA inte innehållet.

VERONICA hjälper användaren att finna Gopher-baserad information utan att man behöver vandra mellan olika menyer på olika servrar. Då man gör en sökning skriver man i ett eller flera nyckelord.
VERONICA-servern genererar och returnerar därefter en Gopher-meny bestående av objekt som stämmer in på sökfrågan. Dessa objekt sammanställs i en, vad man kan kalla, "virtuell meny", dvs en meny innehållande de objekt som blev resultatet av sökningen. De olika resulterande objekten kan komma från olika håll i världen och ligga på olika servrar. Efter en sökning kan man direkt nå de erhållna objekten utifrån denna "virtuella" meny.

Jughead.
Jughead utvecklades av Rhett Jones vid University of Utha Computer Center 1993.
Jughead är ett liknande verktyg som Veronica, där Jughead endast söker igenom ett visst område inom Gopher-"världen". Syftet med en Jughead server är att underhålla en databas med alla de menyer som finns inom ett specifikt område, t ex inom ett universitet, ett land etc. Tillgång till Jughead får man på samma sätt som tillgång till VERONICA. Även att utföra en sökning liknar i mycket en VERONICA sökning. Man skriver in ett eller flera ord och Jughead letar fram en meny med Gopher objekt. Precis som VERONICA erbjuder Jughead sökning med de Boolska operatorerna and, or och not.


WAIS

WAIS (Wide Area Information Server) har tagits fram av Thinking Machines Corporation, Cambridge MA. USA i samarbete med Apple och Dow Jones News.
WAIS är ett distribuerat sök- och återhämtningssystem av information i fulltext i indexerade databaser på Internet. WAIS har ett enhetligt användargränssnitt och låter användaren på ett enkelt sätt söka igenom olika databaser oavsett var de är lokaliserade.
En WAIS databas består av en samling data som är tillgänglig genom ett WAIS Index på en server.
WAIS index innehåller nyckelord för alla ord som finns i de textbaserade dokumenten.

De olika databaserna har det gemensamma namnet"Directory-of-sources" , som är en lista på alla de olika databaserna som finns tillgängliga, och det är ur denna samling som användaren väljer ut den eller de databaser som användaren vill göra en sökning i. Detta innebär att man först måste söka igenom ett index av servrar som innehåller en katalog av källor, och sedan välja ut de databaser som man vill söka igenom.

WAIS protokollet är en utbyggnad av ANSI/ISO standard Z39.50-1988 Information Retrieval Service Definition and Protocoll Specifications for Library Applications, och är en grupp program som tillåter användaren att söka och koppla upp sig till olika typer av information från ett enda gränssnitt.
WAIS-systemet är nätverksbaserat och uppbyggt av tre delar: en klient, en server och ett kommunikationsprotokoll som sammanbinder dem. Detta brukar kallas för klient/server.
Kommunikationsprotokollet Z39-50 används för att överföra t.ex frågor och svaren på dessa frågor mellan klienten och servern. Klienten och servern är isolerade från varandra genom protokollet.

WAIS-klienten använder sig av ett naturligt språk då en sökfråga ska formuleras, vilken sedan översätts till WAIS-protokollet. Sökfrågan sänds sedan över nätverket till en server där databasen "Directory of Sources" är lokaliserad. Men först är man varit tvungen att välja ut en eller flera databaser ur "Directory of sources". WAIS sänder sedan frågan till den utvalda gruppen databaser. Databaserna på de olika servrarna upprätthåller inverterade index över de lagrade dokumentens innehåll och i dessa utföres en sökning i fulltext.
Servern får det översända meddelandet och översätter frågan till det egna språket och söker efter dokument i den efterfrågade databasen. En lista av relevanta dokument kodas sedan in i protokollet och sänds över till klienten i form av en lista med de relevanta objekt som innehåller det eller de nyckelord som specificerades i användarfrågan.
Vad WAIS menar med relevans är baserat på hur ofta nyckelordet förekommer i varje objekt. Mest relevant är det dokument som har de flesta förekomsterna av det sökta nyckelordet.
Om man av olika anledningar vill utöka sökningen, kan man använda en speciell metod inom WAIS som kallas för "Relevance feedback", vilket innebär att man kan söka efter dokument som är närbesläktade med det ursprungliga sökordet.
WAIS klienten fungerar på alla de stora operativsystemen, förutsatt att dessa är uppkopplade på Internet.
WAIS servrar (databaser) kan sättas upp, och kan därmed lösa vissa behov av lokala databaser, men även annan nätverksbaserad information på Internet kan samlas i en WAIS databas som t.ex. arkiv för mailing lists och news-grupper, RFC:s index och e-post adresser m m, men också fulltext databaser och bibliotekskataloger.


World-Wide Web (WWW eller W3)

World-Wide Web (även kallad WWW eller W3) utvecklades vid CERN, (European Particle Physics Laboratory) Geneve Schwietz, under ledning av Tim Berners-Lee.
World-Wide Web är ett samlingsnamn på distribuerad hypermedia baserat på hypertext för återhämtning av information och erbjuder ett sätt att "navigera" mellan dokument och objekt inom WWW-miljön.
För att förstå WWW måste man förstå vad hypertext innebär. Hypertext är data som innehåller länkar till annan data, och som inte är begränsad till att läsas linjärt, utan läses vad man kallar sekvensiellt.
Hypermedia är en term som används för ett hypertext-dokument som inte begränsas till att innehålla enbart text, utan även kan innehålla bilder, video och ljud. WWW är ett försök att organisera information på Internet som en samling hypertext dokument.

Ett informationssystem baserat på klient/server består av två separata program som kommunicerar med varandra genom att använda ett protokoll, dvs av regler för hur kommunikationen ska ske mellan klienten och servern.
Det protokoll som används av WWW är Hypertext Transport Protocol (HTTP). En WWW-klient (kallad "browser") är ett program som frågar efter dokument från en server då en sökfråga eller länk aktiveras. World-Wide Web är som sagt endast ett samlingsnamn för ett informationssystem som använder sig av klient/server, men borde kanske heta HTTP eftersom det är HTTP protokollet som utgör grunden för kommunikation av dokument.
Förutsättningar för att använda sig av en WWW-klient (t ex Mosaic, se nedan) är att man har full uppkoppling till Internet. WWW används ofta för att beskriva det kollektiva nätverk av servrar som "talar" HTTP, men också som ett globalt nätverk av information som använder detta protocol.

World-Wide Web kan beskrivas på följande sätt:
I WWW organiseras data till distribuerade hypertext-dokument, där noderna består av dokument, länkar, och olika index. Dokumenten kan vara av två typer. Dels text-dokument som kan läsas och dels index-dokument som man kan söka i.
En länk är en förbindelse mellan ett dokument (eller objekt) och ett annat dokument (eller objekt), men länken kan även finnas inom ett och samma dokumnet.
Hypertext-dokumentens länkar väljs ut på förhand och kan sedan följas av användaren. Då ett nytt ord eller begrepp introduceras i en text, gör hypertext det möjligt att peka på ett annat dokument som ger en föklaring till detta ord eller begrepp. Detta förutsätter att författaren markerar detta i sitt HTML-dokument. Det nya dokumentet med den relevanta sektionen öppnas genom att man aktiverar länken mellan ordet/begreppet och det nya dokumentet, som förklarar detta begrepp.

Den information som är tillgänglig via WWW kan struktureras på olika sätt:
Ett sätt kan vara att ordna informationen ämnesvis. Sedan kan informationen ordnas efter typ av serverprotokoll. Här listas alla tillgängliga servrar. Dessa inkluderar gateways till t.ex. WAIS, Gopher, Anonymous FTP, och HTTP servrar. Men även andra sätt att strukturera informationen förekommer.

A) Navigering i Hypertextdokument via länkar.

B) Kommunikation mellan klient och server med HTTP.

World-Wide Web

World-Wide Web använder sig av flera olika standarder för att kunna erbjuda all denna information. Det protokoll som WWW-klienten och servern använder sig av för att kommunicera och överföra dokument heter Hypertext Transmission Protocol (HTTP). Alla WWW klienter och servrar måste kunna förstå HTTP för att kunna sända och mottaga dokument av hypermedia format. HTTP är alltså det protokoll som WWW använder sig av för överföring av hypertext mellan en klient och en server. HTTP protokollet ligger ovanpå TCP/IP protokollets tillämpningsnivå

Det standardspråk som WWW använder för att skapa och känna igen hypertext dokument är HTML (Hypertext Makup Language) . HTML är ett textbeskrivningsspråk och beskriver hur ett dokument ska vara strukturerad eller kodat om de ska kunna innehålla länkar till andra dokument. (HTML är i sin tur en förenklad tillämpning av SGML, Standard Generalized Markup Language). Man kan säga att HTML definierar en rad regler för hur ett HTML baserat hypertextdokument ska formateras. WWW dokument som är skrivna i HTML har suffixet .html.

En annan standard är URL (Uniform Resource Locator), som används för att representera hypermedia-länkar. URL är ett försök till att beskriva den unika adressen för ett dokument eller ett objekt. Ett URL för ett dokument består av olika delar : den kod som identifierar vilket överföringsprotokoll som används för att få tillgång till dokumentet. Här kan man se om WWW använder Gopher, FTP eller Telnet protokollet. Vidare visar URL maskinadressen där dokumentet är lokaliserad. Därefter följer katalog- och filnamnet där dokumentet finns.
Ett URL kan se ut på följande sätt: URL: ftp://ftp.edinburgh.ac.uk/pub/mmaccess.
Detta dokument ligger alltså i ett FTP-arkiv (och därmed aktiveras automatiskt ett FTP-program för en uppkoppling till detta arkiv), och har maskinadressen edinburgh.ac.uk och filen ligger i katalogen /pub/ där filen har beteckningen mmaccess och URL: http://info.cern.ch/hypertext/WWW/TheProject.html. innebär att WWW-klienten tar kontakt med en HTTP server och återhämtar en HTML-fil. Dokument som inte är av HTML-format (suffix .html) kan finnas länkat inom WWW, men då kan innehållet inte länkas vidare till andra dokument.


This document is maintained by : Preben Hansen (SICS) and Frans Lettenström (BIBSAM)
preben@sics.se