Systemy tłumaczenia metodami symbolicznymi i statystycznymi – na przykładzie tłumaczenia polsko-rosyjskiego

Autor: Sergey Bolshov

Promotor: Prof. UAM dr hab. Krzysztof Jassem

Teza

Czy podejście symboliczne ma szanse na dalszy rozwój i wykorzystanie?

Czy tłumaczenie symboliczne dla języków polskiego i rosyjskiego umożliwia uzyskanie wyższej jakości niż tłumaczenie statystyczne?

Zadania

  • rozbudowanie narzędzia PSI-Toolkit o nowy tłumacz symboliczny polsko-rosyjski - PLRU-Transferer,
  • stworzenie statystycznego systemu tłumaczenia polsko-rosyjskiego opartego o Moses - PLRU-StatTrans,
  • ewaluacja tłumaczenia metodami METEOR i BLEU wraz z porównaniem do znanych systemów tłumaczenia statystycznego - Trans2Eval.

PLRU-Transferer

System tłumaczenia symbolicznego oparty o narzędzie PSI-Toolkit.

Zasoby:

  • Rosyjsko-polski słownik wyrazów udostępniony przez firmę Poleng. Zawiera 77 105 wyrazów.
  • Reguły transferu z języka polskiego na język rojsyjski.

PLRU-StatTrans

System tłumaczenia statystycznego jest oparty o Moses.

Zasoby:

  • OpenSubtitles2013 - 2 718 041 zdań.
  • Rosyjsko-polski słownik firmy Poleng.
  • Otwarty słownik polsko-rosyjski V.02.2010.
  • Otwarty słownik frazjelogiczny polsko-rosyjski V.02.2009.
  • Polimorf - otwarty słownik morfologiczny języka polskiego.

v1

v2

v3

v4

Obiad

Wpisać

Wsiadłem na pociąg

To word nie jest polskie

I'm going to buy a book

Po polsku

Polska

Błąd programu

Przykłady tłumaczenia

Wyniki ewaluacji metodą METEOR

Wyniki ewaluacji metodą BLEU

Podsumowanie

Dla metod METEOR i BLEU systemy statystyczne pokazują ogólnie lepsze wyniki dla tłumaczenia polsko-rosyjskiego niż systemy tłumaczenia symbolicznego.

Koszt zbudowania systemu tłumaczenia symbolicznego jest zbyt wysoki. Wady przewyższają zalety.

Dziękuję za uwagę.

Master’s thesis

By Sergey Bolshov

Master’s thesis

  • 707