資訊專題

三步驟

辨認文字所在
逐字辨認
語言學分析

I. 辨認文字所在

處理過後的圖片

濾鏡

找到文字的Bounding Box

大概會用到的工具

  • 人工的標示工具
  • 一個可以支援訓練 Bounding Box 的套件
  • 很多的 Training Data

II. 單獨辨認文字

想要的結果

給定一個單個字的圖片,得到他有是各個字的可能性

會用到的工具

  • Training Data & Labels
  • 一個支援Multiclass Picture Classification的框架(Ex. Tensorflow)
  • 強大的 GPU Cluster —— 可能會去跟大學等借用

III. 語言學分析

III (1) 閱讀順序

古埃及文獨特的閱讀順序

Auto Complete

需要的東西

  • Python ?????
  • 古埃及文詞典

初步成果

單字辨識(50 個 class)

deck

By CasperWang

deck

  • 315