Wpisy otagowane ‘sieć semantyczna’

trueknowledge.com – o projekcie

środa, 4 Listopad 2009

True Knowledge to bardzo ciekawy projekt korzystający z technologii sieci semantycznej. Jest to grupa produktów, którą autorzy promują określeniem “nowa klasa internetowych technologii wyszukiwania”.

U podstaw projektu leży własna ontologia służąca do reprezentacji wiedzy. Wygląda na to, że przynajmniej jednym ze źródeł danych jest wikipedia. Korzystając z formularza wyszukiwania możemy zadawać pytania w języku naturalnym. (Naturalnie w angielskim. ;) ) Nasze pytanie zostanie przetworzone dzięki analizie języka na ustrukturyzowane zapytanie do bazy wiedzy.  Tutaj można pobawić się formularzem do zadawania pytań i zobaczyć XML, w którym zwracane są wyniki.

Zauważyłem, że dość często zadawanie pytań generuje błędy aplikacji. Pewnie pytania są zbyt trudne. :) Ale to dopiero początki.

Proponuję np. zadanie pytania typu: “Where does Donald Tusk live?” albo “How old was Barrack Obama when Donald Tusk was born?”  W tych przypadkach dostałem poprawne odpowiedzi. Przyzwoicie działają pytania o daty, odległości itp. Można skorzystać z True Knowledge jak z konwertera miar zadając np. pytanie: “How many square  meters are in hectare?”

Ciekawostką jest fakt, że można uzyskać dostęp do API serwisu. Warto spędzić trochę czasu przyglądając się temu projektowi. Może nie przebije się na czołówkę semantycznych wyszukiwarek, ale z pewnością daje już namiastkę wiedzy, której możemy spodziewać się po wyszukiwarkach przyszłości.

Niech zrobi się semantycznie..

poniedziałek, 5 Październik 2009

Chociaż Semantic Web to nie jest młody temat (zrodził się w zasadzie wraz z początkiem XXI w. !) wygląda na to, że chyba dopiero teraz zyskuje właściwą masę krytyczną. Praktycy nie zadają już pytania “czy?” tylko “jak?”. Coraz więcej danych udostępnianych jest w formatach konsumowalnych przez maszyny. Coraz więcej narzędzi i środowisk deweloperskich do pracy nad aplikacjami. Tym samym coraz więcej aplikacji. Warto śledzić tę technologię, bo wydaje się być “the next big thing” Internetu.

W swoim fundamentalnym założeniu idea jest bardzo prosta i przekonująca, a streszczę ją tak: “uczynić z Sieci sieć danych a nie tylko sieć treści.”  Spełnienie tego warunku ma szanse doprowadzić do sytuacji, w której maszyny będą publikować, gromadzić, zbierać dane, a ludzie będą tworzyli aplikacje, które będą te dane analizowały i na podstawie tych analiz przeprowadzały wnioskowanie. Dlaczego mamy tracić czas na gromadzenie danych, wyłuskiwanie ich z kontekstu różnych dokumentów skoro moglibyśmy swój potencjał intelektualny wykorzystać bardziej twórczo np. na analizę danych, wskazywanie które dane są potrzebne, poszukiwanie zależności między danymi, tworzenie praktycznych aplikacji wykorzystujących pozyskane dane.

Zanim ludzie zaczęli pisać i czytać książki musieli wkładać dużo więcej energii w pozyskiwanie informacji o świecie. Kiedy mogli wejść do biblioteki i z półki zdjąć książki dotyczące interesującego ich tematu, nie musieli się już skupiać na pozyskaniu źródła informacji, a głównie na jej przyswajaniu i analizie. W sensie cywilizacyjnym to wielki skok. Dziś przeglądamy dziesiątki stron internetowych oferujących dane dotyczące tych samych zagadnień w wielu różnych formatach. Dane o ilości mieszkańców w wybranym kraju możemy odczytać z dokumentu html umieszczonego np. w wikipedii, liczby umieszczonej w arkuszu kalkulacyjnym udostępnionym do ściągnięcia przez jakiś organ statystyczny, wyszukać ją w jakiejś prezentacji w formacie pdf itd. Jako ludzie nie mamy większego problemu żeby jednoznacznie zaklasyfikować znalezioną treść jako daną odpowiadającą naszym poszukiwaniom. Czy nie szkoda jednak czasu na ponowne odkrywanie rzeczy oczywistych? Moim zdaniem szkoda. I kiedy w Sieci zrobi się bardziej semantycznie nasz czas i energię będziemy mogli poświęcić na ciekawsze wyzwania. Więc niech zrobi się semantycznie…