雲端資料庫的檔案管理與未來

Wikimedia Taiwan

Wikidata Taiwan

Allen Wang

檔案管理

未來展望

檔案管理

  • 社群共編

  • FAIR 原則

社群共編

那誰要來編輯?

中文維基百科

註冊者 315 萬

活躍使用者 8 千

活躍率千分之 2.5

英文維基百科

註冊者 4261 萬

活躍使用者 12.6 萬

活躍率千分之 2.9

en 每日平均瀏覽量 2.2 億次

zh 每日平均瀏覽量 1700 萬次

我還沒有算上不是人的點閱次數

社群共編

那編輯完算誰的?

任何人都能編輯必須建立在著作權共識下

維基百科基本遵循 CC-BY-SA 或更開放的授權條款

簡單來說

為什麼我要去貢獻一個成果我還不能自由使用的專案?

社群共編

那規則怎麼跑?

編輯的規則與共識隨時都在滾動修正

與此同時的也是累積出了非常多篇的規章

事實上文件數量之多

已經幾乎達到新手不友善的程度了

然而這卻是社群傳承的必經之路

F.A.I.R 原則

  • Findable(可查/可查找)
  • Accessible(可取/可取用)
  • Interoperable(可換/可交換)
  • Reusable(可再用)

Findable 可查/可查找 :

  • F1 (後設)資料被附予一個全球唯一且永久不變的識別碼
  • F2 資料被豐富的後設資料所描述
  • F3 後設資料指定資料識別碼
  • F4 (後設)資料在可搜索的資源中註冊或索引

Accessible(可取/可取用):

  • A1 (後設)資料使用標準化的通信協議,以通過其識別碼檢索
    • A1.1通信協議是開放,免費且可通用實施的
    • A1.2通信協議允許在必要時進行驗證與授權程續
  • A2 即使資料本身不再可取得,後設資料也仍可取用

Interoperable(可換/可交換):

  • I1 (後設)資料使用正規化、可取用、可共享和廣泛適用的語言進行知識再現
  • I2 (後設)資料使用符合FAIR原則的語彙
  • I3 (後設)資料包括對其他(後設)資料的合適參照

Reusable(可再用):

  • R1(後設)資料具有多重準確且相關的屬性
    • R1.1(後設)資料借由清晰易讀的資料使用授權進行發布
    • R1.2(後設)資料具備資料溯源
    • R1.3(後設)資料符合領域相關的社群標準

未來展望

從資料庫角度出發

未來應該怎麼思考資料庫的設計?

規劃使用情境

將非人使用者/終端使用者的使用情境納入

別再設計 B2C 的資料庫

事實上根本就打不贏現有的商業資料庫與內容

如何創造 B2B 甚至 B2B2C 的使用可能

才有機會為資料庫創造更多的使用情境

en 機器人每日平均瀏覽量 4400 萬次

zh 機器人每日平均瀏覽量 741 萬次

透過 API 創造的再應用次數尚未計入

小結

資料庫做為產品

在做產品、專案經理時我們都知道

只先解決一個需求

在這裡沒有全都要的

資料庫想解決什麼問題?

謝謝您的聆聽