Mapowanie na ontologię typu wordnet istniejącej ontologii dziedzinowej
Co to jest?
Ontologia
Jest to formalna reprezentacja pewnej dziedziny wiedzy i definicja typów, właściwości i wzajemnych powiązań jednostek, które istotnie lub zasadniczo istnieją w danej dziedzinie.
Ontologie stosuje się w informatyce do reprezentacji m.in.:
- idei i założeń
- właściwości i relacji
Gdzie występuje?
- Inżynieria oprogramowania (struktury danych)
- W większości systemów o obiektowym modelu informacji
- Biblioteki, moduły
- Systemy eksperckie
- Przetwarzanie języka naturalnego
- Sztuczna inteligencja
- Modelowanie konceptualne
- Semantic Web
- Systemy e-learningowe
- Systemy wieloagentowe
Należy mieć na uwadze, że istnieją 2 definicje ontologii: filozoficzna i informatyczna. Obie są ze sobą bardzo powiązane.
Naukowcy komputerowi bardziej zajmują się ustalaniem stałych, kontrolowanych słownictwie, a filozofowie zajmują się przede wszystkim zasadami, takimi jak czy są takie rzeczy, jak ustalone esencje czy też trwałe przedmioty muszą być ontologicznie bardziej podstawowe niż procesy.
Struktura
Współczesne ontologie mają wiele strukturalnych podobieństw, niezależnie od języka, w jakim są wyrażane. Możemy wyróżnić następujące składniki:
- Instancje lub obiekty zawierające podstawę informacyjną
- Klasy, zestawy, kolekcje
- Aspekty, właściwości, cechy, właściwości lub parametry
- Relacje
- Ograniczenia
- Zasady
- Aksjomaty
- Wydarzenia odpowiedzialne za zmianę określonych właściwości ontologii
Struktura
W ramach struktury można wymienić również:
- Logikę formalną, teorię kategorii, teorię zbiorów zaliczającą się do formalizacji modelu
- Klasyfikację podstawowych pojęć w formie drzewiastej:
- Liście wyczerpujące wszystkie możliwości
- Ontologia jako rodzina drzew
- Język naturalny
- Systemy dedukcyjne

Rodzaje ontologii
Ontologia dziedzinowa
- Opisuje dany wycinek rzeczywistości, czyli konkretną domenę biznesową lub jej fragment
- Mają za zadanie uszczegóławiać terminologię dostarczaną przez ontologie wysokiego poziomu (opisujących pojęcia ogólne)
- Tworzone są przez specjalistów z dziedziny, mających za zadanie wyróżnić pojęcia oraz wskazać relacje między nimi
- Pojęcia nowo zdefiniowane mogą zostać wpisane w inne ontologie, ale rodzi to zazwyczaj wiele problemów
- Istnieje wiele metodologii określających zasady implementacji ontologii
- Przykładowe języki reprezentacji ontologii: OIL, DAML+OIL, RDF Scheme
Ontologia typu wordnet
- Spaja ogólną wiedzę o świecie oraz wiedzę ekspercką i dziedzinową
- Mają własne leksykalne bazy danych
- Sam wordnet dostarcza relacje pomiędzy pojęciami (relacje leksykalne, które później są wsparte relacjami o charakterze dziedzinowym i eksperckim
- Grupuje słownictwo języka za pomocą podstawowej relacji (synset)
- Relacje dziedzinowe i eksperckie pochodzą z tezaurósów, systemów klasyfikacyjnych, ontologii dziedzinowych, grona ekspertów
- pełni rolę model dziedzinowego (domain model)
- Przykład: Princeton WordNet

Objaśnienie pojęć
synset - Zestaw jednego lub kilku synonimów, które w pewnym kontekście są wymienne, nie zmieniając prawdziwości danej propozycji.
Tezaurus - słownik odzwierciedlający strukturę pola semantycznego danego języka, obejmujący deskryptory, ich relacje oraz reguły stosowania. Przykład: Getty AAT
System klasyfikacyjny - język informacyjny o strukturze hierarchicznej. Jest on tworzony przez ekspertów w celu jednoznacznego opisu i logicznego podziału pojęć. W tych aspektach charakteryzuje się wyższą skutecznością od popularnego tagowania. Jego słownikiem są tablice klasyfikacyjne a wyrażeniami symbole klasyfikacyjne.
Cel pracy
Celem pracy jest próba zmapowania ontologii dziedzinowej (eksperckiej) na ontologię typu wordnet.
Taki zabieg mógłby zapewnić wyższą skuteczność definicji i ustalania relacji pomiędzy pojęciami. Co więcej, pozwoliłby na zachowanie swobody i elastyczności znanej z tagowania.
Obecnie prace nad ujednoliceniem ontologii przebiegają w bardzo wolnym tempie.
Wykorzystane narzędzia
- Ontologia WordNet PMAH (Protection and Management of Archaeological Heritage) - ontologia zbudowana na potrzeby indeksowania zasobów e-learningowych zgromadzonych w repozytorium treści e-learningowych z zakresu ochrony i zarządzania dziedzictwem archeologicznym. Nie istnieją dla niego odpowiednie tezaurusy czy systemy klasyfikacyjne. Ontologia zawiera (stan marzec 2012) ok. 1800 słów i wyrażeń, 1589 synsetów i 93 kategorie dziedzinowe

- Ontologia dziedzinowa z projektu Seshat - opisuje ludzką historię jako zbiór ponad 1500 szeregowych pojęć. Ontologia została opracowana w celu przejścia od tradycyjnych metod zbierania i przechowywania danych w nauce społecznej na podejście oparte na RDF. RDF obsługuje automatyczne generowanie narzędzi do wprowadzania danych i sprawdzania poprawności użyteczności publicznej, zarządzania jakością danych, włączania faktów z sieci danych i zarządzania cyklem życia danych.
Potencjalne problemy
- odpowiednia narzędzia i algorytmy do mapowania
- błędy lub niedomówienia w ontologii dziedzinowej
- błędy w translacji
- uogólnienie lub uszczegółowienie niektórych pojęć
- brak odpowiednich narzędzi do obsługi ontologii typu wordnet
- spory ekspertów
- inny poziom komplikacji struktury pomiędzy tymi dwiema ontologiami
- uzyskanie wysokiej skuteczności mapowania
Źródła
"Inteligentne systemy e-learningowe wykorzystujące ontologie typu word.net", Jacek Marciniak, 2015
https://wordnet.princeton.edu/
"The OntoWordNet Project: extension and
axiomatization of conceptual relations in
WordNet", Aldo Gangemi, Roberto Navigli, Paola Velardi
Ontologie typu wordnet
By kko
Ontologie typu wordnet
- 579