Wpisy otagowane ‘dbpedia’

dbpedia.org – notka o projekcie

poniedziałek, 2 Listopad 2009

Wikipedia to największa społecznościowa encyklopedia dostępna w Internecie. Tak na marginesie: czy ktoś jeszcze pamięta taki produkt jak Microsoft Encarta Ecyclopedia? Jako, że to produkt Microsoft wpisałem “encarta encyklopedia” w okno microsoftowej wyszukiwarki bing. I co??? Na pierwszym miejscu jest link do wpisu o “Encyklopedia Encarta” w Wikipedii ;) . Link do strony właściwej był na drugim lub trzecim miejscu. Ciągnąc jeszcze przez chwilę lekki dryf od tematu dodam, że ze strony Microsoftu poświęconej ich encyklopedii dowiedziałem się właśnie, że z dniem 31 Października 2009 kończą projekty Encarta w tym encyklopedię! Poddali się.

Ok, czym jest dbpedia.org?  Co by nie mówić o rzetelności wielu wpisów w Wikipedii, trudno nie docenić ilości solidnej wiedzy tam zgromadzonej. Szkoda, żeby była zrozumiała wyłącznie dla ludzi. Dobrze byłoby, gdyby można było zadawać Wikipedii bardziej złożone zapytania niż tekstowy wpis w okno wyszukiwarki. Tak pomyślało kilku naukowców i biznesmenów z Niemiec i Stanów po czym postanowili “zsemantyzować” wikipedię poprzez wyodrębnienie danych z treści wpisów i ustrukturyzowanie ich oraz zapisanie w trójkach (więcej o trójkach tutaj).

I tak właśnie powstał projekt dbpedia.org. Obecnie to baza wiedzy składająca się z blisko 300 mln trójek opisujących 2,6 mln obiektów (ludzi, miejsc, firm itp.). Są to wpisy z anglojęzycznej wersji Wikipedii, która obecnie przechowuje łącznie ok. 3 mln wpisów. Jednak dzięki powiązaniu pomiędzy wpisami w różnych językach, dbpedia.org daje dostęp do ok. 260 tys. polskich wpisów. Korzystając z języka SPARQL można teraz odpytać ustrukturyzowaną Wikipedię o mnóstwo rzeczy np. o wszystkie miasta określonej wielkości w Ameryce Południowej związane z daną osobą.

Baza wiedzy, a właściwie bazy wiedzy, udostępnione są online oraz w postaci plików do ściągnięcia. Do przechowywania trójkowej bazy wiedzy online wykorzystano komercyjne oprogramowanie o nazwie OpenLink Virtuoso.

Zachęcam do zapoznania się z projektem, a w szczególności pobawienia się webowym interfejsem do składania zapytań w języku SPARQL (tutaj).