基於 Wikidata 的資料對照/交換應用機制

Allen Wang

Wikimedia Taiwan

Wikidata Taiwan

Why Wikidata ?

2012 年才成立的 Wikidata 為我們解決了什麼問題?

  • 導入唯一識別碼

  • 不提供檢索演算法

  • 三元組結構

  • 權威詞彙機制

  • 降低書寫與參考文獻要求門檻

  • CC0授權與全資料匯出

機讀友善

在達到這目的時

順便提供了很多維基百科沒有的功能

  • 權威詞彙對照

  • 跨資料庫對照

  • 官方名稱與在地稱呼有大量不同
    • 鶯歌溪 vs 兔子坑溪排水
  • 不同主管機關稱呼異同
    • 排水 vs 溪 vs 幹線
  • 英文對照不統一
    • River vs Creek vs Xi vs Hsi
  • 河川資料不只有技術或工程需求

語言欄位連結各語言與各通同名稱

並使用唯一識別碼互相溝通

A資料庫

B資料庫

資料Z-B

資料Z-A

要確定兩者的通同性

就需要進行對照工作

當只有兩個資料庫時

對照工作或許是可行的

但是當有數十個甚至更多的資料庫時...

同時對照工作還會牽涉到組織權責問題

大量增加成本跟可能的阻礙

A資料庫

B資料庫

資料Z-B

資料Z-A

加入 Wikidata 做為第三方

各資料庫之間對照只需要滿足與 Wikidata 之間的對照

就能在與其他資料庫進行對照

資料Z-W

QNNNNNNN

Wikidata

B資料庫

在維基媒體計畫內部

Wikidata 也扮演著多語言/多計畫資料整合對照

國際虛擬權威檔VIAF近年也轉為與 Wikidata進行對照

近期工作成果

透過 Wikidata 也能將文本資料庫化

應用可能

使用 wikidata 做為關鍵字檢索依據

謝謝大家

基於 Wikidata 的資料對照/交換工作模型

By allenwang6212

基於 Wikidata 的資料對照/交換工作模型

  • 419