Kiss Anna
Témavezetők:
Bodó Zalán és Sulyok Csaba
Babeș-Bolyai Tudományegyetem
A népdal öntudatlanul működő természeti erő átalakító munkájának eredménye: minden tanultságtól ment embertömeg ösztönszerű alkotása. Ép olyan természeti tünemény, mint pl. az állat- vagy növényvilág különféle megnyilvánuló formái.
Bartók Béla, A magyar népdal (1924)
Bartók Béla és Kodály Zoltán
⇒ a kutatás célja: erdélyi népzenei régiók felismerése a gépi tanulás módszereivel
A felhasznált felvételek többsége Kallós Zoltán gyűjtéseinek része (MTA Zenetudományi Intézet Online Adatbázisai)
a) STFT
b) Mel-háromszögszűrők
koboz
furulya és ütőgardon
! az utolsó két réteg minden esetben teljesen összekapcsolt (fully-connected)
A három legnépesebb osztályon: Mezőség, Székelyföld, Moldva
| réteg típusa | kernel alakja | réteg mélysége |
|---|---|---|
| conv | 1 × 16 | 33 |
| mp | 1 × 4 | |
| conv | 1 × 16 | 33 |
| mp | 1 × 5 | |
| conv | 1 × 4 | 66 |
| mp | 1 × 8 | |
| conv | 1 × 4 | 66 |
| mp | 1 × 8 | |
| fc + dropout 0.5 | 400 | |
| fc + dropout 0.5 | 400 |
| réteg típusa | kernel alakja | réteg mélysége |
|---|---|---|
| 2 × conv | 3 × 3 | 33 |
| mp | 2 × 2 | |
| 2 × conv | 3 × 3 | 33 |
| mp | 3 × 3 | |
| 2 × conv | 3 × 3 | 66 |
| mp | 4 × 4 | |
| 2 × conv | 3 × 3 | 66 |
| mp | 4 × 4 | |
| LSTM + dropout 0.1 | 60 | |
| LSTM + dropout 0.1 | 60 |
| Modell | F1-mérték |
|---|---|
| TCA | 0.6 |
| CRNN | 0.54 |
| TFA | 0.52 |
| BBA | 0.47 |
| FCA | 0.45 |
4-szeres keresztvalidáció a teljes adathalmazon
TCA
CRNN
⇒ a konvolúciós neurális hálók képesek lényeges népzenei jellemzők felismerésére