Information and Language Engineering (ILE)

home people projects publications courses openings events contact
 

Events - Evenemang

Under våren 2000 kommer vi hålla några seminarier om specifika fackfrågor i området digitala bibliotek. Seminarierna kommer gå under torsdageftermiddagar 14:00 - ca 16:00 varefter vi gemensamt intar smörgås och öl för informellare diskussioner. Anmäl intresse någon dag innan!

Seminarium 23 mars 2000: Indexering

Idag är de flesta söksystem konstruerade för att söka i fulltextdatabaser. Systemet tabulerar orden i texten, sökningar görs genom att användaren anger ett antal söktermer och systemet hämtar de texter där termerna oftast förekommer. Det har fördelen att systemet har tillgång till alla ord i en text och därmed kan erbjuda hög täckning för de sökta termerna. Nackdelen är att användaren måste stå ut med låg precision eller mycket brus: ovidkommande dokument som råkar innehålla de sökta termerna.

Tidigare har sökning skett efter sakregister, där indextermer eller nyckelord valts ut ur texten av antingen författare eller av redaktörer och professionella indexerare. Dessa indextermer brukar vara valda ur en begränsad och relativt välorganiserad mängd termer -- en termdatabas eller tesaurus. Fördelen är att termerna är av hög kvalitet: texter är oftast korrekt indexerade. Nackdelen är att användaren måste lära sig termdatabasen för att kunna göra sökningar, att termdatabasen måste revideras fortlöpande och att arbetet med att utföra indexeringen är tungrodd och dyr.

På SICS vill vi gärna undersöka möjligheterna att
1) bygga hjälpverktyg för manuell indexering -- det skulle kunna sänka kostnaden för att åstadkomma ett sakregister;
2) bygga stödverktyg för underhåll av termdatabaser; och
3) bygga sökverktyg som kombinerar fördelarna hos fulltextsökning och sakregister.

Det här seminariet är främst riktat till dem som arbetar med indexering eller besläktade problem: förhoppningen är att vi på SICS ska hitta specifika frågor som intresserar någon eller några parter som arbetar med digitala bibliotek idag.

Seminarium 13 april 2000: Informationsförädling

Med informationsförädling menar vi användandet av olika sorters språkteknologi för att hitta, bearbeta, sammanställa och presentera information ur text utifrån ett specifikt perspektiv eller informationsbehov.

Detta innebär oftast en kombination av ett flertal tekniker såsom filtrering, klustring, indexering, resumering, informationsextraktion, koreferensanalys etc.

Man kan till exempel tänka sig att automatiskt söka få fram vad som är förgrunds- och bakgrundsinformation i ett antal nyhetstexter om samma ämne och använda förgrudsinformationen för att sammanställa en flertextsammanfattning.

Man kan föreställa sig ett system som med hjälp av informationsextraktionsmetoder plockar ut enkla eller komplexa relationer mellan objekt i texter och som genom att kombinera resultaten från flera textkällor hittar tidigare okända relationer.

I ILE-gruppen på SICS arbetar vi bland annat med att bygga upp ett informationsextraktionssystem och vi kommer på seminariet att presentera hur ett sådant system vanligtvis fungerar. Vår förhoppning är att seminariedeltagarna efter att ha fått en liten inblick i tekniken ska kunna komma med förslag på hur informationsextraktionsmetoder skulle kunna användas för att stödja deras specifika informationsbehandlingsbehov så att vi kan bygga system anpassade därefter.

Industridag 12 maj 2000

Mer information och program kommer.



 
home people projects publications courses openings events contact
Updated 000417.