Papa, dessine moi un mouton 🐑 !
Vincent Ogloblinsky - @vogloblinsky
Vincent Ogloblinsky
Compodoc maintainer



Architecte logiciel web / Référent Open-Source
Indie hacker on personal side-projects

Side projects récents



Disclaimer
La suite n'est qu'une vision "technique" du point de vue d'un développeur.
Je n'ai pas une formation de data-scientist. 😉
Certains sujets ne sont pas traités.
Agenda
1.
AI image generation - Késako ?
2.
Sous le capot
3.
Et l'open-source dans tout ça
4.
Produits B2B & B2C
5.
Impacts business & sociaux
6.
Perspectives
AI image generation - Késako ?
AI image generation - Késako ?
L'art créé par intelligence artificielle est toute œuvre d'art créée par une personne avec l'interventionnisme d'une intelligence artificielle.
1973 - AARON par Harold Cohen
2014 - GANs (Generative Adversarial Networks)
2015 - DeepDream / Google
2021 - DALL-E / Open AI, etc
2009 - Imagenet dataset avec 14 millions d'images annotées

AI image generation - Késako ?

AI image generation - Késako ?

Sous le capot
Sous le capot
L'idée simple et magique : à partir d'un texte, obtenir une image
a skateboarder doing a trick in the air, skatepark in the background, wide angle, ultra photoreal, photography style, 85mm bookeh detailed, high resolution...

Boîte noire
Sous le capot

Sous le capot

Mots encodés en vecteurs : relations entre ces mots
Sous le capot - Text encoder
Text encoding
Choix du modèle très important
Stable diffusion utilise OpenClip ( GPT based model - 354M paramètres)

Modèle entrainé sur plus de 400 millions d'images annotées
Sous le capot - Text encoder
Training simplifié - image et légende sont encodées

Sous le capot - Text encoder
Training simplifié - Comparaison

Sous le capot - Text encoder
Training simplifié - Renforcement

Sous le capot

Sous le capot - Image generator
Modèles génératifs

Sous le capot - Image generator
Modèles de diffusion

Sous le capot - Image generator
Modèles de diffusion : entraîner à enlever du bruit sur une image

Sous le capot - Image generator

Modèle de diffusion
Sous le capot - Image generator
Création du dataset

Sous le capot - Image generator
Création du dataset

Sous le capot - Image generator
Création du dataset

Sous le capot - Image generator
Entrainement du modèle de diffusion (forward diffusion)

Sous le capot - Image generator
Création d'une image (reverse diffusion)

Sous le capot - Image generator
Création d'une image (reverse diffusion)

Aucun contrôle sur l'image produite
Sous le capot - Image generator
Création d'une image avec contrôle
Aucun contrôle sur l'image produite

Sous le capot - Image generator
Mise à jour du dataset avec les légendes tokenisées
Aucun contrôle sur l'image produite

Sous le capot - Image generator
Aucun contrôle sur l'image produite

Sous le capot - Image generator
Aucun contrôle sur l'image produite

Extensions : ControlNet
Aucun contrôle sur l'image produite
En plus d'un contrôle textuel, la génération d'image peut être guidée



Extensions : ControlNet
Aucun contrôle sur l'image produite
"Les bons artistes copient, les grands artistes volent..." - Steve Jobs 1984



Et l'open-source dans tout ça
Et l'open-source dans tout ça

Beaucoup de modèles OSS :
- Stable Diffusion (+ Dreambooth)
- Craiyon
- modèles Hugging Face
Et l'open-source dans tout ça
Beaucoup de dérivés de Stable Diffusion (training custom)
https://dataconomy.com/2023/08/28/best-stable-diffusion-models-how-to-use/
Modèles fermés
DALL-E 3 - OpenAI
Et plus encore ...
Produits B2B & B2C
Produits B2B & B2C

Produits B2B & B2C
Paint !!!
Windows 11 22H2 Update

Produits B2B & B2C

Produits B2B & B2C

Produits B2B & B2C


Projet artistique
Projet artistique

Cet appareil photo IA vous déshabille en quelques secondes
Impacts business & sociaux

Impacts business & sociaux
Industrie de l'information :
- fake news
- photo d'illustration en DR
Gros problème de confiance et à la fois d'évangélisation du public
Impacts business & sociaux
Industrie du jeu vidéo :
- hyperscaling - creation d'assets ou texturing - 3D models
- évolution de certains métiers et processus créatif

Impacts business & sociaux
Industrie de la photo de masse :
- plateformes l'intègre mais ne sont qu'intermédiaires
- mais à terme ce sont les créateurs qui pourraient en patire

Impacts business & sociaux
Industrie publicitaire :
- problème de confiance

Impacts business & sociaux
Réseaux sociaux :
Deep fakes
Porn revenge
Problèmes actuels amplifiés (dépression, anxiété, narcissisme, comportements anti-socials)

Impacts business & sociaux
Perspectives
Perspectives

Big bubble ?
NFT (& Web3 ?) are dead
Perspectives

Perspectives
Les IAs générative sont des accélérateurs ouvrant des opportunités encore jamais atteintes à cause de contraintes technologiques.
Ça bouscule pas mal d'industrie qui généralement doivent s'adapter avec hélas pertes et fracas.
Certains métiers se ré-inventent, d'autres disparaissent, et d'autres apparaissent.
Les métiers créatifs resteront pré-dominants : les IAs doivent être entrainées ou renforcées par de nouvelles données.
Perspectives
Outils puissants disponibles pour le grand public.
Un processus créatif reste un processus créatif : le meilleur prompt engineer du monde ne sera jamais meilleur qu'un photographe avec un vrai style et une vraie "patte".
Aucune AI ne remplacera l'authenticité et les expériences réelles.
Ressources

Ressources

Ressources

Ressources

Ressources

Merci pour votre attention !
Des questions ?
Slides : https://bit.ly/48rOF3j

Crédit photos - Unsplash.com
Un feedback ? 👉🏻 C'est par ici
Papa, dessine moi un mouton 🐑 !
By Vincent Ogloblinsky
Papa, dessine moi un mouton 🐑 !
Les IA génératives d'images font le buzz depuis plusieurs mois, elles fascinent autant qu’elles inquiètent. N’importe quel internaute est maintenant capable de générer des images extrêmement complexes en quelques secondes. Au-delà du bouleversement des milieux créatifs et des implications politico-sociétales, l'envers du décor est tout aussi intéressant pour nous les curieux développeurs. Je vous propose un voyage dans les profondeurs de ces modèles de diffusion, entre encodeurs, datasets et réseaux de neurones. En sortant de ce talk, vous ne regarderez plus une photo de cowboy à dos de T-Rex 🦖 de la même manière 😉
- 1,529