Shallow Parsing comparision

Zadanie

Dla celów przetestowania różnych Shallow Parserów przetestowane zostaną zdania zawierające: liczbę, godzinę, adres email, skrót, nazwisko, jednostki, ułamki. Są to szczególnie problematyczne elementy dla Shallow Parserów.

Zdanie testowe

This text has more than 5 sentences. 
Mr Jones asked me to send him the answer to mrjones@gmail.com until 11:00 PM. 
Mr Jones is the boss of IBM company. 
He likes to drink 1/2 l milk.

 

Legenda

noun NP - rzeczownik
verb VP - czasownik
prepositional PP - przyimek
adverb ADVP - przysłówek

 

cogcomp.cs.illinois.edu

Parser ten nie poradził sobie z rozpoznaniem maila, podzielił go na części, przez co błędnie rozpoznał części zdania i tak znak '@' potraktował jako przyimek. Poza tym Parser ten poradził sobie z godziną, nazwą firmy, nazwiskiem czy jednostką.

 

Parser ten prezentuje dane w kolorowej przejrzystej formie i to jest jego główna zaleta.

clips.ua.

ac.be

Parser w przeciwieńswie do poprzedzniego poradził sobie także z mailem.

 

Parser poza podziałem, uszczegóławia opis poprzez etykiety i kolejny stopień podziału

nlp.stanford.edu

Parser ten również poradził sobie z mailem jak i całą resztą. Ponadto dokonuje on podziału w wyszczególnionych częsciach zdania i tak dla 11:00 PM dzieli to na 11:00 (CD) oraz PM (NN).

 

Parser ten stworzy strukturę zagnieżdzenia części zdania.

Podsumowanie

Parsery różnią się miedzy sobą sposobem prezentacji danych oraz co najważniejsze podziałem zdania. Jedne dzielą zdania na podstawowe 4, 5 części mowy, a niektóre poza tym podziałem dokonują jeszcze bardziej szczegółowego podziału w obrębie danej części mowy. Przy wyborze parsera należy się przede wszystkim kierować poprawnością jego działania, a w drugiej kolejności szczegółem dalszego podziału (chyba, że wymaga tego problem).

Shallow Parsing comparision

By madjer22

Shallow Parsing comparision

  • 737