深度學習於灰階正射影像中色彩修復的應用
使用GAN與U-net等模型
— 建國中學 賴昱錡
此研究旨在為日治時期~民國初年的台北地區古街景影像上色,並探討各模型還原的效果,利用深度學習中GAN和U-Net的模型,以中研院台北歷史古地圖的黑白影像集作為資料庫,來訓練這些神經網路,進而達到街景影像上色的效果。這項研究對於歷史影像的鑑識、比對會有不錯的幫助,且能夠讓我們對於古照片的認知不再是抽象、黑白的,進而對歷史文獻中的描述、當時的地理環境可以有更精確的見解。
摘要
一、文獻探討
二、訓練模型之資料收集及處理,比較訓練各類型樣本
不同城市、時期、灰階的對比度)帶來的影響。
三、模型的建構及訓練
四、照片上色效果的分析(評分)
五、成果的優化及整合(開源、使用者介面?)
未來的研究歷程
一、常見用於照片色彩還原的模型之比較及優化
二、對於基隆(或大台北地區)日治~民初之灰階街景(俯瞰圖)進行色彩的還原,並分析/評分其上色的效果
三、了解使用不同樣本(訓練資料)帶來的影響
研究目的
NABC
Need
影像色彩之還原,並探討各角度下所拍攝之照片的呈現效果
1
各預訓練模型生成效果之比較
EX:GAN、U-net、pix2pix、GPT-2
2
此研究旨在為日治時期~民國初年的台北地區古街景影像上色,並探討各模型還原的效果。
3
不崇高的理想
除了希望在此項研究中,能探討各種變因帶來的影響、模型之間的比較外,也希望能將此研究的成果進行推廣,古街景的色彩還原可應用於臺灣史上的相關研究,或許之後對古時人們的生活狀況、建築、自然環境的理解也不會再如以往抽象
- 黑白照片不方便歷史學家調查與比對
- 網路提供之影像修復API對於空拍影像的還原效果頗差
歷史鑑識
- 能更確切了解當時的地理環境、建築特色、土地分配等資訊
- 降低調查地形時,以數位人工上色造成之誤差
地理研究
生成對抗網路
GAN
Autoencoder 的一種變形(Variant)
U-net
GPT-2
經常用於不完整文本或影像的還原
Approach
Open data
- GIS(地理資訊系統)
- 有關於正射影像,內政部國土測繪中心有發佈WMTS、臺北歷史古地圖、歷史航照等服務
- 搭配QGIS的使用選取適當的圖層、向量資料
- 以爬蟲取得彩色影像(轉為灰階作為訓練集)、灰階影像(作為驗證集)
Benefits
- 這項研究對於歷史影像的鑑識、比對會有不錯的幫助,且能夠讓我們對於古照片的認知不再是抽象、黑白的,進而對歷史文獻中的描述、當時的地理環境可以有更精確的見解。
- 歷史文化的永續性: 找回臺灣記憶中的顏色。
- 對於古照片的修復,許多科技公司如OpenAI、IBM均有提供色彩還原的功能,但對於黑白空拍影像的上色效果普遍不佳,而且這項研究除了可以讓黑白照片的還原範疇更加廣泛,也頗具能應用於過去地理環境及歷史人文之探查,相當實用。
- 減少人工數位上色所造成的誤差,也讓歷史資料的統整更加迅速、簡潔。
Competition
End of the lecture
That brings me to the end of my presentation, thanks for your attention.
Any question is welcomed. :D
introduction
By Richard Lai
introduction
- 34