fredag 24 februari 2012

Linked Open Data

I ett tidigare blogginlägg berättade vi om att vi har börjat arbeta med frågor om den semantiska webben och Linked Open Data. Redan under vårt första arbetsmöte stod det klart att det finns mycket kring dessa begrepp som behöver tydliggöras. Det finns få exempel men desto fler frågor. Vad är det som egentligen behövs för att kulturarvsinformationen ska kunna bli en del av länkad öppen data?

Under de senaste åren har digitaliseringsarbetet såväl i Sverige som internationellt handlat mycket om att uppnå en kritisk massa information på Internet bl a för att kunna bygga innehållsrika portaler och tematiska applikationer som drar till sig användarnas intresse.
Idag - när det digitala kulturarvet ökar alltmer - framgår det tydligt att kulturarvsinformationen måste bli presenterad på ett sätt som optimerar potentialen i informationen. Detta innebär bl a att sökning efter kulturarvsinformation på nätet måste övergå från att användarna bara får slumpmässiga sökresultat till att förse dem med sökresultat som är anpassade och strukturerade utifrån individuella sökbehov och sökmönster Det är också viktigt att effekten av den ökande mängden kulturarvsinformation inte ger en mättnadseffekt så att man slutar leta om det man söker inte finns bland de första sökträffarna.  Det fordras alltså fungerande system för att länka information, bygga applikationer och göra sökningar i kulturarvsinformationen så relevanta och användbara som möjligt, och det är just det man försöker uppnå med länkad öppen data. Idag är de praktiska exempel få men visionerna många om vad som skulle uppnås.

Det verkar också råda oenighet kring begreppet länkad öppen data och vad det egentligen innebär i fråga om öppenhet. Det är, som oftast, viktigt att förtydliga begreppen. Vad menas egentligen med att tillgängliggöra kulturarvsinformation på Internet som en del av Linked Open Data? Att använda Internet för att distribuera data är t.ex. inte detsamma som att data blir tillgänglig för alla webbanvändare (även e-post kommunikation sker via nätet).
På samma sätt blir data som tillgängliggörs på Internet inte ”öppen” automatiskt bara för att den finns där, lika lite som det blir möjligt att länka den till annat material. För att vara ”öppen” måste informationen kunna lyftas från sitt ursprungliga sammanhang för att utan hinder användas och återanvändas i andra kontexter. Open data handbok som getts ut av Open Knowledge Foundation beskriver de legala, sociala, och tekniska aspekter av länkad öppen data och ger följande definition: ”Open data is data that can be freely used, reused and redistributed by anyone - subject only, at most, to the requirement to attribute and sharealike”.

Sedan förra året har jag varit engagerad i ett EU-projekt som heter Linked Heritage - Coordination of Standards and Technologies for the enrichment of Europeana. Linked Heritage har som huvuduppdrag att tillföra kulturarvsportalen Europeana nytt material från både offentlig och privat sektor, att höja kvaliteten på den metadata som finns i Europeana och att förbättra sökning, åtkomst och användning av innehållet i Europeana. Arbetet i Linked Heritage grundar sig i stor utsträckning på resultaten från ett tidigare EU-projekt kallat Athena.

Linked Heritage har nyligen gett ut publikationen " Your terminology as a part of the semantic web recommendations for design and management", (som kan laddas ner från projektets webbplats). Den vänder sig i första hand till dem som arbetar vid europeiska kulturarvsinstitutioner (framförallt museer) med rekommendationer kring terminologier och flerspråkighet (dvs hur man kan hantera bl a flerspråkigt kulturarvsdata för att göra det möjligt att samma begrepp kan länkas till varandra).

Vikten av att använda sig av vedertagna standarder, metoder och format för det digitaliserade materialet framgår allt tydligare ju mer man fördjupar sig i frågan om förbättrad sökning och åtkomst. Man måste se den övergripande bilden; även om ett visst kulturarvsmaterial är säreget och en egen lösning för standarder eller format vid en första anblick verkar vara att föredra, så är det sällan att föredra i längden. Användning av vedertagna standarder gör det lättare att utveckla kopplingar till datamodeller och att ta del av befintligt arbete med enhetligt standardiserat material som är i ständig utveckling. Allt detta främjar i längden största möjliga tillgång till och användningen av kulturarvsmaterial.

Sättet som kulturarvsinstitutionerna digitaliserar och hanterar sina digitala kulturarvsdata är den viktigaste förutsättningen för att informationen från kulturarvsinstitutioner ska kunna anpassas till att vara en del av Linked Open Data både i Europeana och i den semantiska webben. Med kulturarvslyftet och andra satsningar på digitalisering runt hörnet hastar det att starta en mer omfattande diskussion i frågan.

”Om vi på allvar bestämde oss för att bli avsevärt mycket bättre på att publicera öppen data skulle det innebära fler och bättre tjänster”, sade Anna-Karin Hatt, It- och energiminister, i sitt tal häromdagen på Regional Digital Agenda Skåne och det gäller även tjänster för kulturarvsdata.

/Sanja Halling, Digisam

2 kommentarer:

  1. Risken är väl uppenbar att sådana här diskussioner, som så ofta, fastnar i diskussioner om teknik och olika teknikstandarder.

    När kan vi börja lägga upp material, frågar användarna? När blir det sökbart i de stora sökverktygen?

    - Ja, vi skall bara jobba färdigt den nya plus-plus-hyperversionen av den här senaste hotta Dublin Core-versionen. Sen är vi alldeles klara, blir kanske svaret.

    Men frågan är: Vad kan vi göra redan idag, med de verktyg som redan finns på banan? Behöver t.ex. Europeana egentligen utveckla ny överföringsstandarder och format?

    Jag tvivlar en smula.

    SvaraRadera
  2. Tack för din kommentar. Naturligtvis är det så att det finns en stark vilja hos både användarna och kulturarvsinstitutionerna att göra det digitala kulturarvet tillgängligt och användbart i så stor utsträckning som möjligt. Men grunden för att lyckas är att materialet är tekniskt hanterbart. Utan vedertagna tekniska standarder riskerar man att ha digital kulturarvsdata som inte kan presenteras, användas, länkas till andra data eller bevaras. Utveckling av tekniken är en ständigt pågående process och innebär självklart inte att man ska sitta och vänta på det som kommer i framtiden. Huvudsaken är att man använder sig av de vedertagna standarder och verktyg som finns till förfogande idag, vilka också ligger till grunden för framtida utveckling och förbättringar av bl a sökningsmöjligheter, åtkomst och användning. Det finns alltså två parallella spår i dagens arbete med den semantiska webben – dels arbete utifrån de verktyg som finns här och nu och dels utifrån ett mer långsiktigt och visionärt perspektiv. /Sanja

    SvaraRadera