Wpisy otagowane ‘Semantic Web’

www kontra GGG

środa, 24 Marzec 2010

Właśnie sobie uświadomiłem, że nie napisałem dotychczas o jednym z kluczowych haseł, które propaguje konsorcjum W3C, a w szczególności Tim Berners-Lee,  w ramach upowszechniania koncepcji Semantic Web. Jest nim skrót GGG, którego rozwinięcie brzmi Giant Global Graph.

Pod koniec listopada 2007  Sir Tim użył tego zwrotu na swoim blogu. W zamyśle autora słowo Graph jest logicznym następcą swoich dwóch poprzedników czyli Net (sieć komputerów, bardziej kojarzona jako sieci lokalne lub o węższym zasięgu), Web (to co dziś nazywamy Internet, sieć treści i prostych usług). Wyjaśnia w swoim poście skąd pomysł na takie określenie. Warto przeczytać. Oczywiście pomysł na GGG jest trochę w myśl marketingowej zasady: produkt musi mieć dobrą nazwę. :) No cóż, sensowne idee też trzeba jakoś skutecznie sprzedawać. Można próbować pod marką Semantic Web lub Linked Data lub GGG.

Z pewnością użycie słowa graf wynika z graficznej reprezentacji osiowej koncepcji Semantic Web czyli tzw. trójek: dwa węzły grafu reprezentujące podmiot i dopełnienie oraz łącząca je linia/strzałka czyli krawędź grafu czyli orzeczenie.

Tak samo jak można reprezentować pojedyncze zdania/trójki przy użyciu grafu, można również reprezentować powiązania pomiędzy zbiorami trójek czyli triplestore’ami. Zatem połączone triplestore’y tworzą graf.

Rozrastający się graf powiązań pomiędzy danymi zgromadzonymi w różnych triplestore’ach to Gigantyczny Globalny Graf, czyli Giant Global Graph czyli GGG. :) Swoją drogą, ciekawe czy przyjmie się subdomena ggg (np. ggg.sejm.gov.pl) jako metoda adresowania np. SPARQLowych końcówek :)

A wracając do Sir Tim’a i mojego poprzedniego posta, niedawno tutaj, na TED.com, podsumował swój kolejny rok ewangelizowania  temacie Semantic Web.

Rząd Jej Królewskiej Mości a Semantic Web

piątek, 5 Marzec 2010

Rząd Jej Królewskiej Mości uruchomił ogólnodostępny serwis data.gov.uk , w którym publikuje dane z sektora publicznego w różnych konsumowalnych formatach. Co ważne, jest tam też końcówka, dzięki której można składać zapytania w SPARQL. Może w Polsce też się doczekamy takiego rozwiązania. Coś się w tym temacie dzieje. Więcej o temacie napisałem tutaj. Warto też rzucić okiem na projekt amerykański data.gov.

Semantic Web w medycynie

piątek, 15 Styczeń 2010

Trochę uprościłem i uogólniłem sprawę takim tytułem. Bardziej chodzi mi o wykorzystanie szeroko pojętych technologii semantycznych w inżynierii biomedycznej i biocybernetyce. Niektórzy specjaliści, moim zdaniem w znacznej mierze słusznie, wyraźnie oddzielają metody tworzenia i wykorzystywania ontologii dla celów naukowych od tych tworzonych dla tzw. celów administracyjnych np. biznesowych oraz od tych stanowiących realizację koncepcji Semantic Web. Rozwiązania naukowe i administracyjne charakteryzują się znacznie większą dyscypliną tworzenia i regułami rozwoju od potencjalnie swobodnych i samoregulujących się baz wiedzy opartych na koncepcji Semantic Web.

Wygląda na to, że badacze z zakresu medycyny, podobnie jak badacze z dziedzin związanych z szeroko pojętym bezpieczeństwem narodowym, dość szybko zainteresowali się technologiami semantycznymi. Trudno się dziwić. Mają do czynienia z poważnymi problemami opisanymi potężną liczbą danych rozproszonych globalnie i wzajemnie niekompatybilnych. Dość łatwo wyobrazić sobie jakie zalety może mieć połączenie rozsianych po całym świecie medycznych baz danych. Pokaże krótko gdzie można poczytać o tych pracach.

Do najbardziej uznanych przedsięwzięć zalicza się np. OBO Foundry czyli Open Biomedical Ontologies. To solidna, otwarta baza ontologii z zakresu medycyny. Można brać i używać. Wśród projektów powiązanych z OBO występuje jedno z największych przedsięwzięć w tej dziedzinie czyli Gene Ontology (GO), którego celem jest standaryzowanie reprezentacji genów i atrybutów produktów genowych u różnych gatunków roślin i zwierząt.

W wiele projektów związanych z projektowaniem, budową i utrzymywaniem ontologii na potrzeby medycyny zaangażowany jest Barry Smith z University of New York w Buffalo. Warto zajrzeć na jego stronę tutaj. Niezbyt piękna, ale treściwa. Dostępne są tam również wykłady na video. Warto poświęcić parę godzin na obejrzenie. Dobra angielszczyzna, do tego slajdy do pobrania. Kawał solidnej wiedzy. Video z jednego z kursów nie działa – napisałem w tej sprawie – jeśli coś będę wiedział, dam znać.

W Polsce też trochę się już w tej dziedzinie dzieje. Ostatnio natknąłem się na pracę ONTOLOGIA MAMMOGRAFII – STRUKTURA MODELU, DEFINICJE I INSTANCJE POJĘĆ napisaną przez Teresę Podsiadły-Marczykowską z IBIB PAN oraz Annę Guzik z Zakładu Radiologii Szpitala Grochowskiego przy ul. Grenadierów w Warszawie.

Istotną cechą prac z zakresu semantyzacji wiedzy medycznej jest połączenie jej z systemami elektronicznego zapisu zdrowia pacjenta (ang. EHR – electronic health record). Ale to już oddzielny temat. :)

Ciekawa prezentacja podsumowująca stan Semantic Web

środa, 30 Grudzień 2009

Uff.. Trochę spokojniejszy czas nastał więc czas odkurzyć blog. Nic ostatnio nie pisałem, ale to nie znaczy, że nic się nie działo. Póki co, trafiłem na bardzo interesującą prezentację z maja 2009 podsumowującą stan Semantic Web. Choć to ponad 150 slajdów warto poświęcić parę chwil. Autor naprawdę się przyłożył i ogarnął zasadnicze kwestie. Polecam.

Konferencja ICCCI 2009

czwartek, 15 Październik 2009

Pierwsza międzynarodowa konferencja poświęcona Collective Intelligence i Semantic Web już za nami. Odbyła  się we Wrocławiu 5 i 6 października i została zorganizowana przez Politechnikę Wrocławską. Dzięki życzliwości dra Radosława Katarzyniaka odpowiadającego za sprawy organizacyjne dostałem porcję informacji pokonferencyjnych, z którymi dziele się “na szybkiego” poniżej.

“1st International Conference on Computational Collective IntelligenceSemantic Web, Social Networks & Multiagent Systems

W dniach 5-7 października 2009 odbyła się konferencja ICCCI 2009.

Sesji inauguracyjnej przewodniczyli: pomysłodawca i przewodniczący komitetu programowego serii konferencji ICCCI konferencji prof. dr hab. inż. Ngoc Thanh Nguyen z Instytutu Informatyki, Dziekan Wydziału Informatyki i Zarządzania, dr hab. inż. Jerzy Świątek, prof. PWr., oraz Dyrektor Instytutu Informatyki prof. dr hab. inż. Zbigniew Huzar.

Celem konferencji było omówienie problematyki kolektywnej inteligencji obliczeniowej (ang. computational collective intelligence), działu sztucznej inteligencji, zajmującego się zastosowaniem przybliżonych metod obliczeniowych w modelowaniu i rozwiązywaniu problemów z zakresu grupowego podejmowania decyzji oraz przetwarzania wiedzy w środowiskach rozproszonych. Systemy webowe, sieci społeczne i systemy wieloagentowe, wymienione w tytule konferencji, stanowią podstawowy kontekst praktyczny zastosowania idei kolektywnej inteligencji obliczeniowej w grupowym przetwarzaniu wiedzy, rozwiązywaniu konfliktów i podejmowaniu decyzji.

Zaproszone wykłady plenarne przedstawili prof. Pierre Lévy z Uniwersytetu w Ottawie, prof. Piotr Jędrzejowicz z Akademii Morskiej w Gdyni oraz prof. Roman Słowiński z Politechniki Poznańskiej.

Trzydniowe obrady odbywały się w centrum konferencyjnym Hotelu Panorama we Wrocławiu. W konferencji udział wzięło 120 prelegentów i słuchaczy z kraju i zagranicy. Wygłoszono 90 referatów (ze 105 zaplanowanych wystąpień).

Konferencja miała międzynarodowy charakter. Uczestnicy reprezentowali wszystkie główne krajowe ośrodki naukowe (Wrocław, Poznań, Warszawa, Kraków, Szczecin, Gliwice, Lublin) oraz szereg zagranicznych ośrodków naukowych (Australia, Brazylia, Chorwacja, Cypr, Czechy, Finlandia, Francja, Niemcy, Islandia, Indie, Japonia, Malezja, Meksyk, Nowa Zelandia, Irlandia, Korea Pd., Rumunia, Słowacja, Hiszpania, Tajwan, Tajlandia, Holandia, Turcja, Wenezuela, Wietnam).

Materiały konferencyjne wydano w serii LNAI (Vol. 5796). Ze względu na wysoki poziom merytoryczny prac przesłanych do organizatorów konferencji, część z nich opublikowana została jako rozdziały w monografii naukowej wydanej w serii Studies in Computational Intelligence (vol. 244) – Springer Verlag.

W czasie konferencji zainaugurowano nowe międzynarodowe czasopismo Transactions on Computational Collective Intelligence – podserię LNCS wydawaną przez Springer Verlag i edytowaną przez prof. dr hab. inż. Thanh Ngoc Nguyena pracownika Instytutu Informatyki Politechniki Wrocławskiej.

Uroczysty bankiet odbył się w Starej Garbarni (Wrocław – Leśnica). W trakcie spotkania przedstawiono miejsce organizacji ICCCI 2010. Odbędzie się ona na Tajwanie.”


Poniżej statystki ilości prezentacji z poszczególnych ośrodków naukowych w Polsce:

Uczelnie Ośrodki naukowe (razem)
AGH

7

Polit. Gdańska

1

Kraków

7

Akademia Morska w Gdynii

1

Trójmiasto

4

WAT

1

Warszawa

7

IBS PAN

2

Poznań

9

Pols.-Jap. WSI Warszawa

2

Gliwice

1

Uni. Warsz.

1

Polit Warszawska

3

UAM

1

Szczecin

1

WSB Poznań

1

Olsztyn

1

Uniw.Ekon. Poznan

1

Wrocław

20

Polit. Poznań.

6

Uniw.Gdański

2

Polit. Świętokrz.

1

Zachodniopomorski Uniwersytet Technologiczny (Szczecin)

1

Olsztyn

1

Polit. Wrocł.

20

Zamość

1

KUL

1

Lublin 2


Tutaj lista krajów reprezentowanych podczas konferencji:

Australia
Brazylia
Chorwacja
Cypr
Czechy
Finladia
Francja
Niemcy
Islandia
Indie
Japonia
Malezja
Meksyk
N. Zelandia
Poland
Irlandia
Korea Pd.
Rumunia
Słowacja
Hiszpania
Tajwan
Tajlandia
Holandia
Turcja
Wenezuela
Wietnam

Przyznano dwie Best Paper Awards:
1. Proposal of a New Rule-based Inference Scheme for the Semantic Web Applications
Nalepa, Grzegorz J.; Furmańska, Weronika T.
2. A Multi-agent Model of Deceit and Trust in Intercultural Trade
Verwaart, Tim; Hofstede, Gert Jan; Jonker, Catholijn M.

To tyle, kiedy będzie miał coś więcej, podzielę się.

Niech zrobi się semantycznie..

poniedziałek, 5 Październik 2009

Chociaż Semantic Web to nie jest młody temat (zrodził się w zasadzie wraz z początkiem XXI w. !) wygląda na to, że chyba dopiero teraz zyskuje właściwą masę krytyczną. Praktycy nie zadają już pytania “czy?” tylko “jak?”. Coraz więcej danych udostępnianych jest w formatach konsumowalnych przez maszyny. Coraz więcej narzędzi i środowisk deweloperskich do pracy nad aplikacjami. Tym samym coraz więcej aplikacji. Warto śledzić tę technologię, bo wydaje się być “the next big thing” Internetu.

W swoim fundamentalnym założeniu idea jest bardzo prosta i przekonująca, a streszczę ją tak: “uczynić z Sieci sieć danych a nie tylko sieć treści.”  Spełnienie tego warunku ma szanse doprowadzić do sytuacji, w której maszyny będą publikować, gromadzić, zbierać dane, a ludzie będą tworzyli aplikacje, które będą te dane analizowały i na podstawie tych analiz przeprowadzały wnioskowanie. Dlaczego mamy tracić czas na gromadzenie danych, wyłuskiwanie ich z kontekstu różnych dokumentów skoro moglibyśmy swój potencjał intelektualny wykorzystać bardziej twórczo np. na analizę danych, wskazywanie które dane są potrzebne, poszukiwanie zależności między danymi, tworzenie praktycznych aplikacji wykorzystujących pozyskane dane.

Zanim ludzie zaczęli pisać i czytać książki musieli wkładać dużo więcej energii w pozyskiwanie informacji o świecie. Kiedy mogli wejść do biblioteki i z półki zdjąć książki dotyczące interesującego ich tematu, nie musieli się już skupiać na pozyskaniu źródła informacji, a głównie na jej przyswajaniu i analizie. W sensie cywilizacyjnym to wielki skok. Dziś przeglądamy dziesiątki stron internetowych oferujących dane dotyczące tych samych zagadnień w wielu różnych formatach. Dane o ilości mieszkańców w wybranym kraju możemy odczytać z dokumentu html umieszczonego np. w wikipedii, liczby umieszczonej w arkuszu kalkulacyjnym udostępnionym do ściągnięcia przez jakiś organ statystyczny, wyszukać ją w jakiejś prezentacji w formacie pdf itd. Jako ludzie nie mamy większego problemu żeby jednoznacznie zaklasyfikować znalezioną treść jako daną odpowiadającą naszym poszukiwaniom. Czy nie szkoda jednak czasu na ponowne odkrywanie rzeczy oczywistych? Moim zdaniem szkoda. I kiedy w Sieci zrobi się bardziej semantycznie nasz czas i energię będziemy mogli poświęcić na ciekawsze wyzwania. Więc niech zrobi się semantycznie…