GAN 生成對抗神經網路

陳信嘉

GAN及其變形是近十年最有趣的想法

Facebook AI 大師 Yann LeCun 在接受Quora專訪時說『This, and the variations that are now being proposed is the most interesting idea in the last 10 years in ML, in my opinion.』

GAN 論文成長量

歷史發展

GANs 發展歷程中的重要里程碑:

 

  • 2014年Ian Goodfellow 提出了GANs的基本架構。
  • 2015年:引入條件生成對抗網絡(Conditional GANs, cGANs),允許模型根據條件信息生成特定類型的輸出。
  • 2016年:深度卷積生成對抗網絡(Deep Convolutional GANs, DCGANs)的提出,進一步改進了生成圖像的質量和穩定性。
  • 2017年:Wasserstein GAN(WGAN)解決了傳統GANs訓練難以穩定和模式崩潰的問題。
  • 2018年及之後:生成對抗網絡的研究和應用不斷深入,GANs被應用於更多領域,如文本生成、音頻合成、藝術創作等。

真的是好傢伙!

應用

GANs的強大能力使其在多個領域都有應用:

  • 圖像合成:生成高質量、高解析度的圖像。
  • 數據增強:為小數據集生成額外的訓練樣本。
  • 風格轉換:將圖像從一種風格轉換到另一種風格,例如將日常照片轉換成藝術畫作的風格。
  • 超分辨率:從低分辨率的圖像生成高分辨率版本。
  • 臉部生成與編輯:生成人臉圖像或對現有人臉圖像
  • ………

好比一個遊戲有兩個角色,一個是偽造者,他不斷製造假鈔,另一個角色是警察,不斷從偽造者那邊拿到假鈔,判斷是真或假,然後,偽造者就根據警察判斷結果的回饋,不斷改良,最後假鈔變成真假難辨

GAN 的想法

2014 年蒙特婁大學博士生 Ian Goodfellow 提出來的

天啊! 這是甚麼電影情節啊!

包括兩個神經網路:生成器(Generator)和鑑別器(Discriminator),這兩個神經網路在訓練過程中相互對抗,從而不斷提升性能。

概念介紹

GANs 的核心概念基於博弈論中的零和遊戲,其中一方的獲益必然導致另一方的損失。

  • 生成器(Generator)的目標是生成足夠真實的數據,以至於鑑別器無法區分其生成的數據和真實數據之間的差異。換言之,生成器試圖「欺騙」鑑別器。
  • 鑑別器(Discriminator)的任務是區分輸入數據是來自於真實數據集還是生成器產生的假數據。它的目標是盡可能準確地進行這種區分。

概念介紹

  • 鑑別器 (Discriminator) 的目標是最大化其準確率
    (識別真實與生成數據)
  • 生成器的目標是最小化鑑別器的準確率
    (使生成數據看起來越真實越好)

最小到 0.5

GAN 原理 (1/4)

GAN 原理 (2/4)

GAN 原理 (3/4)

GAN 原理 (4/4)

生成模型

鑑別模型

GAN Architecture

其他的 GAN

風格轉換(Style Transfer)

透過不斷的生成與判別,模型最後可以訓練出比原圖更高解析度的圖像。

高解析度影像生成

DCGAN

Deep Convolutional Generative Adversarial Networks

DCGAN demo

DCGAN demo

DCGAN demo

More models

  • PGGAN (半漸進式 GAN)
  • SGAN (半監督式 GAN)
  • CGAN (條件式 GAN)
  • CycleGAN

............

Made with Slides.com