Systemy tłumaczenia metodami symbolicznymi i statystycznymi – na przykładzie tłumaczenia polsko-rosyjskiego
Autor: Sergey Bolshov
Promotor: Prof. UAM dr hab. Krzysztof Jassem
Teza
Czy podejście symboliczne ma szanse na dalszy rozwój i wykorzystanie?
Czy tłumaczenie symboliczne dla języków polskiego i rosyjskiego umożliwia uzyskanie wyższej jakości niż tłumaczenie statystyczne?
Zadania
- rozbudowanie narzędzia PSI-Toolkit o nowy tłumacz symboliczny polsko-rosyjski - PLRU-Transferer,
- stworzenie statystycznego systemu tłumaczenia polsko-rosyjskiego opartego o Moses - PLRU-StatTrans,
- ewaluacja tłumaczenia metodami METEOR i BLEU wraz z porównaniem do znanych systemów tłumaczenia statystycznego - Trans2Eval.
PLRU-Transferer
System tłumaczenia symbolicznego oparty o narzędzie PSI-Toolkit.
Zasoby:
- Rosyjsko-polski słownik wyrazów udostępniony przez firmę Poleng. Zawiera 77 105 wyrazów.
- Reguły transferu z języka polskiego na język rojsyjski.
PLRU-StatTrans
System tłumaczenia statystycznego jest oparty o Moses.
Zasoby:
- OpenSubtitles2013 - 2 718 041 zdań.
- Rosyjsko-polski słownik firmy Poleng.
- Otwarty słownik polsko-rosyjski V.02.2010.
- Otwarty słownik frazjelogiczny polsko-rosyjski V.02.2009.
- Polimorf - otwarty słownik morfologiczny języka polskiego.
v1
v2
v3
v4
Obiad
Wpisać
Wsiadłem na pociąg
To word nie jest polskie
I'm going to buy a book
Po polsku
Polska
Błąd programu
Przykłady tłumaczenia
Wyniki ewaluacji metodą METEOR
Wyniki ewaluacji metodą BLEU
Podsumowanie
Dla metod METEOR i BLEU systemy statystyczne pokazują ogólnie lepsze wyniki dla tłumaczenia polsko-rosyjskiego niż systemy tłumaczenia symbolicznego.
Koszt zbudowania systemu tłumaczenia symbolicznego jest zbyt wysoki. Wady przewyższają zalety.
Dziękuję za uwagę.
Master’s thesis
By Sergey Bolshov
Master’s thesis
- 707