Shallow Parsing comparision
Zadanie
Dla celów przetestowania różnych Shallow Parserów przetestowane zostaną zdania zawierające: liczbę, godzinę, adres email, skrót, nazwisko, jednostki, ułamki. Są to szczególnie problematyczne elementy dla Shallow Parserów.
Zdanie testowe
This text has more than 5 sentences.
Mr Jones asked me to send him the answer to mrjones@gmail.com until 11:00 PM.
Mr Jones is the boss of IBM company.
He likes to drink 1/2 l milk.
Legenda
noun NP - rzeczownik
verb VP - czasownik
prepositional PP - przyimek
adverb ADVP - przysłówek
cogcomp.cs.illinois.edu

Parser ten nie poradził sobie z rozpoznaniem maila, podzielił go na części, przez co błędnie rozpoznał części zdania i tak znak '@' potraktował jako przyimek. Poza tym Parser ten poradził sobie z godziną, nazwą firmy, nazwiskiem czy jednostką.
Parser ten prezentuje dane w kolorowej przejrzystej formie i to jest jego główna zaleta.
clips.ua.
ac.be

Parser w przeciwieńswie do poprzedzniego poradził sobie także z mailem.
Parser poza podziałem, uszczegóławia opis poprzez etykiety i kolejny stopień podziału
nlp.stanford.edu

Parser ten również poradził sobie z mailem jak i całą resztą. Ponadto dokonuje on podziału w wyszczególnionych częsciach zdania i tak dla 11:00 PM dzieli to na 11:00 (CD) oraz PM (NN).
Parser ten stworzy strukturę zagnieżdzenia części zdania.
Podsumowanie
Parsery różnią się miedzy sobą sposobem prezentacji danych oraz co najważniejsze podziałem zdania. Jedne dzielą zdania na podstawowe 4, 5 części mowy, a niektóre poza tym podziałem dokonują jeszcze bardziej szczegółowego podziału w obrębie danej części mowy. Przy wyborze parsera należy się przede wszystkim kierować poprawnością jego działania, a w drugiej kolejności szczegółem dalszego podziału (chyba, że wymaga tego problem).
Shallow Parsing comparision
By madjer22
Shallow Parsing comparision
- 737