Poszukiwania optymalnego alfabetu fonetycznego

Piotr Żelasko

Zespół Przetwarzania Sygnałów
 AGH

15 czerwca 2016, Kraków

Cel badań

Znalezienie alfabetu, który maksymalizuje skuteczność działania systemu ASR

Kilka słów o obecnie stosowane przez nas alfabetach

Alfabet Corpora

  • "mały alfabet"
  • autor: prof. S. Grocholewski
  • 37 symboli fonetycznych
  • wariacja/klon SAMPA dla języka polskiego?
  • użyty do anotacji w korpusie Corpora

Alfabet IPA

  • "duży alfabet"
  • ang. International Phonetic Alphabet
  • autorzy: International Phonetic Association
  • 86 symboli
  • część symboli niemalże
    nie występuje w języku polskim

Krótka historia OrtFona

OrtFon v1

  • transkrypcje na bazie tabelek z artykułu prof. Steffen-Batóg z 1975...
  • ... adaptowanych z IPA do alfabetu Grocholewskiego.

Przykładowa tabelka

OrtFon v2

  • Również oparty na tych samych tabelkach 
  • Transkrybuje bezpośrednio do IPA
  • Transformuje transkrypcję IPA wedle zadanych reguł do pożądanego alfabetu (może być dowolny, jeśli znane są reguły)

Motywacja

Prawdopodobnie istnieje optymalny alfabet, "gdzieś pomiędzy" alfabetami IPA i Corpora. 

... i posiadamy narzędzia, żeby go odkryć i stosować.

Skuteczność rozpoznawania  systemu ASR

Kryterium "jakości" alfabetu fonetycznego:

Accuracy, Word Error Rate, Phone Error Rate

Jak sformułować nowy alfabet?

  • Reguły (np. 'scalmy nosowe')
  • Automatyczne scalanie
  • Automatyczne rozbijanie?

Jak wybrać fonemy do scalania?

  • Metryki oparte o prawdopodobieństwo fonemu
  • Metryki oparte o macierz konfuzji
  • Metryki oparte o model trifonowy (drzewo decyzyjne)
Made with Slides.com