Events - Evenemang
Under våren 2000 kommer vi hålla några seminarier om specifika fackfrågor
i området digitala bibliotek. Seminarierna kommer gå under torsdageftermiddagar
14:00 - ca 16:00 varefter vi gemensamt intar smörgås och öl för informellare
diskussioner. Anmäl intresse någon dag innan!
Seminarium 23 mars 2000: Indexering
Idag är de flesta söksystem konstruerade för att söka i fulltextdatabaser.
Systemet tabulerar orden i texten, sökningar görs genom att användaren
anger ett antal söktermer och systemet hämtar de texter där termerna oftast
förekommer. Det har fördelen att systemet har tillgång till alla ord i en
text och därmed kan erbjuda hög täckning för de sökta termerna. Nackdelen
är att användaren måste stå ut med låg precision eller mycket brus:
ovidkommande dokument som råkar innehålla de sökta termerna.
Tidigare har sökning skett efter sakregister, där indextermer eller
nyckelord valts ut ur texten av antingen författare eller av redaktörer och
professionella indexerare. Dessa indextermer brukar vara valda ur en
begränsad och relativt välorganiserad mängd termer -- en termdatabas eller
tesaurus. Fördelen är att termerna är av hög kvalitet: texter är oftast
korrekt indexerade. Nackdelen är att användaren måste lära sig
termdatabasen för att kunna göra sökningar, att termdatabasen måste
revideras fortlöpande och att arbetet med att utföra indexeringen är
tungrodd och dyr.
På SICS vill vi gärna undersöka möjligheterna att
1) bygga hjälpverktyg för
manuell indexering -- det skulle kunna sänka kostnaden för att åstadkomma
ett sakregister;
2) bygga stödverktyg för underhåll av termdatabaser; och
3) bygga sökverktyg som kombinerar fördelarna hos fulltextsökning och sakregister.
Det här seminariet är främst riktat till dem som arbetar med indexering
eller besläktade problem: förhoppningen är att vi på SICS ska hitta
specifika frågor som intresserar någon eller några parter som arbetar med
digitala bibliotek idag.
Seminarium 13 april 2000: Informationsförädling
Med informationsförädling menar vi användandet av olika sorters
språkteknologi för att hitta, bearbeta, sammanställa och presentera
information ur text utifrån ett specifikt perspektiv eller
informationsbehov.
Detta innebär oftast en kombination av ett flertal tekniker såsom
filtrering, klustring, indexering, resumering, informationsextraktion,
koreferensanalys etc.
Man kan till exempel tänka sig att automatiskt söka få fram vad som är
förgrunds- och bakgrundsinformation i ett antal nyhetstexter om samma
ämne och använda förgrudsinformationen för att sammanställa en
flertextsammanfattning.
Man kan föreställa sig ett system som med hjälp av
informationsextraktionsmetoder plockar ut enkla eller komplexa
relationer mellan objekt i texter och som genom att kombinera
resultaten från flera textkällor hittar tidigare okända relationer.
I ILE-gruppen på SICS arbetar vi bland annat med att bygga upp ett
informationsextraktionssystem och vi kommer på seminariet att
presentera hur ett sådant system vanligtvis fungerar. Vår förhoppning
är att seminariedeltagarna efter att ha fått en liten inblick i
tekniken ska kunna komma med förslag på hur
informationsextraktionsmetoder skulle kunna användas för att stödja
deras specifika informationsbehandlingsbehov så att vi kan bygga
system anpassade därefter.
Industridag 12 maj 2000
Mer information och program kommer.