Kiss Anna
Témavezetők:
Bodó Zalán és Sulyok Csaba
Babeș-Bolyai Tudományegyetem
A népdal öntudatlanul működő természeti erő átalakító munkájának eredménye: minden tanultságtól ment embertömeg ösztönszerű alkotása. Ép olyan természeti tünemény, mint pl. az állat- vagy növényvilág különféle megnyilvánuló formái.
Bartók Béla, A magyar népdal (1924)
Bartók Béla és Kodály Zoltán
⇒ a kutatás célja: erdélyi népzenei régiók felismerése a gépi tanulás módszereivel
A felhasznált felvételek többsége Kallós Zoltán gyűjtéseinek része (MTA Zenetudományi Intézet Online Adatbázisai)
a) STFT
b) Mel-háromszögszűrők
koboz
furulya és ütőgardon
! az utolsó két réteg minden esetben teljesen összekapcsolt (fully-connected)
A három legnépesebb osztályon: Mezőség, Székelyföld, Moldva
réteg típusa | kernel alakja | réteg mélysége |
---|---|---|
conv | 1 × 16 | 33 |
mp | 1 × 4 | |
conv | 1 × 16 | 33 |
mp | 1 × 5 | |
conv | 1 × 4 | 66 |
mp | 1 × 8 | |
conv | 1 × 4 | 66 |
mp | 1 × 8 | |
fc + dropout 0.5 | 400 | |
fc + dropout 0.5 | 400 |
réteg típusa | kernel alakja | réteg mélysége |
---|---|---|
2 × conv | 3 × 3 | 33 |
mp | 2 × 2 | |
2 × conv | 3 × 3 | 33 |
mp | 3 × 3 | |
2 × conv | 3 × 3 | 66 |
mp | 4 × 4 | |
2 × conv | 3 × 3 | 66 |
mp | 4 × 4 | |
LSTM + dropout 0.1 | 60 | |
LSTM + dropout 0.1 | 60 |
Modell | F1-mérték |
---|---|
TCA | 0.6 |
CRNN | 0.54 |
TFA | 0.52 |
BBA | 0.47 |
FCA | 0.45 |
4-szeres keresztvalidáció a teljes adathalmazon
TCA
CRNN
⇒ a konvolúciós neurális hálók képesek lényeges népzenei jellemzők felismerésére