Generation of ASMR
Florian CHAPPAZ - Valentin DE OLIVEIRA
Index
ASMR
Autonomous Sensory Meridian Response
Sensation de bien-être, de picotements et de frissons au niveau du crâne, du cuir chevelu ou des zones périphériques du corps.
Provoquée par des stimulus auditifs, visuels, olfactifs ou cognitifs.
La nature et la classification du phénomène reste controversée au sein de la communauté scientifique.
More than a feeling: Autonomous sensory meridian response (ASMR) is characterized by reliable changes in affect and physiology - G.-L. Poerio, E. Blakey, T. J. Hostler, T. Veltri - Anglia Ruskin University, U.-K.
L'ASMR change notre affect
1ère expérience en ligne
→ Augmentation des frissons
→ Augmentation du calme
→ Réduction du stress et de la tristesse ?
2ème expérience en labo
→ Confirmations des critères précédents
→ Réponses physiologiques (BPM et conduction cutanée)
→ Beaucoup de stimulus différents
Le marché de l'ASMR
streaming
Vidéos YouTube
Playlists ASMR Spotify/Deezer
Publicité
Attirer l'attention
Se démarquer
Association plaisir/produit
Produits asmr
Micros binauraux
Accessoires de tapping
Objets multimatières
L'asmr pour le streaming
Matériel coûteux : micro binaural coûteux, accessoires diversifiés.
JUSqu'à 400€
Faible retour sur investissement : beaucoup de concurrence, difficile de sortir du lot.
L'ASMR dans la publicité
Utilisation récente
Se démarquer des autres
Donner un plaisir aux clients
© Reese The Movie: An ASMR Experience
Chih-Chin Liang & Chao-Hui Li
Applying ASMR on The Advertising of Towel Sound: A Pilot Study
Marché des serviettes à Taïwan
→ Permet de sortir de lot
Utilisation et évaluation de l'ASMR dans le marketing
→ Difficile de se démarquer
→ Innondation de pubs en ligne
→ Capte l'attention
→ Intérêt et désir grandissant
→ Potentiel achat futur
Génération d'ASMR avec du deep learning
DATASET
Entraînement d'un modèle
Dataset lié à l'ASMR
MIDI
Format de notes et de durée pour la musique
Un fichier audio ne peut pas être convertit directement
Transformer
Réseau neuronal
Auto-attention
Magenta
Open Source Project
Développé par l'équipe Google Brain.
Objectif : explorer le rôle que le ML peut avoir dans l'art et la musique.
Nombreuses librairies et modèles pour générer images, musiques et autres médias.
Possibilité d'entraîner notre propre modèle
→ OnsetsAndFrames & MusicTransformer
Rappel : Réseaux de neurones
-
Les neurones d'une couche prennent les signaux en entrée et envoient des signaux en sortie à la couche suivante en utilisant une fonction d'activation.
- Entraînement avec exemples d'entrées et de sorties souhaitées
- Modification des poids entre les connexions de neurones
Onsets and frames
- Retranscription d'un audio en MIDI
- Notes, durées, intensités...
- Extractions des notes et des durées
- Musique de piano
- En général efficace sur les autres instruments à large gamme de notes.
- CNN acoustic model + RNN
Partie Onsets : classification de note
CNN Acoustic Model
Bidirectionnal LSTM
128 units
Fully connected sigmoid layer
88 outputs
Prédiction de chaque note de l'audio parmi les 88 notes d'un piano
Partie Frames : Durées des notes
CNN Acoustic Model
Bidirectionnal LSTM
128 units
Fully connected sigmoid layer
88 outputs
Les notes ainsi que leurs durées
Concatenate with Onsets results
FC Sigmoid
88 out.
Music Transformer
- Besoin : réferencer le passé
- Remplace les LSTM
- Auto-attention relative : trouver la différence relative entre 2 notes
- Différence relative : influe sur le timing et la hauteur de la note généré en fonction de la note précédente
Démonstration
Avec notre propre jeu de données
-
Spotify
-
19 titres
-
2h11 minutes
-
Musique binaurale avec différents stimulis ASMR
Le jeu de données
Conversion En MIDI
Utilisation de Onsets and Frames via:
Magenta.js + Tensorflow.js
Attention : Le modèle est chargé dans le navigateur et cela est gourmand en ressource matérielle.
Résultats obtenus
- Beaucoup de vide
- Perte d'information
- Stimulis souvent perdus
Quelques passages plus riches :
Entrainement du modèle
- Plusieurs tentatives non fructueuses en local
- Tentative sur Colab
- Sur CPU: RAM remplie
- Sur GPU:
- Echantillons trop long : nous aurions du les découper
Pas de modèle entraîné avec nos données.
Mais...
DATASET de l'équipe pachyderm
- 165 titres
- 20 heures
- Mais moins de stimulis ASMR différents
Musique générée
- Presque aucun silence
- Beaucoup de notes répétées
- Bonne musique de concentration
Conclusion
- Modèle très performant pour la musique
- Pas pour les stimuli
- Dataset plutôt musical qu'orienté stimulis
Merci
Vos questions ?
Generation of ASMR
By Florian Chappaz
Generation of ASMR
- 104