Allen Wang
Wikimedia Taiwan
Wikidata Taiwan
2012 年才成立的 Wikidata 為我們解決了什麼問題?
日益倍增的機器讀取需求
傳統的 Wikipedia 已經無法處理
Wikidata 透過結構化、鏈結資料的方式達到機讀友善
維基百科基於人類閱讀的需求
使得部分瑣碎資料無法被獨立紀錄與分述
機讀對於關聯的需求更甚
Wikidata 得以收錄更細節更多元的內容
為了達到機讀需求,Wikidata 像是一本純數位編目書
重要的是讓資料在整個架構裡面可以被索引到
而 Wikipedia 就是一本數位百科全書
透過各式的文獻,呈現出人類知識的結晶
做為一個結構化資料、鏈結資料庫
使用方式是比較不一樣的
Property
屬性
Lexeme
詞意/詞位
Item
物件
國家人權博物館(Q10926902)
該筆資料的統一編號
多語言說明欄
只要有填入對應語言就會依照填入值翻譯
目前支援 300+ 種語言
描述
用於分別其他同名資料
供編輯者辨別用
亦稱為
可用於辭彙對照用
描述非常重要可以迅速分別不同的同名物件
性質(P31):他是什麼東西?
圖片(P18):代表的圖片是?
成立或建立時間(P571)
國家(P17)
每一種P都有不同的用法
詳見每一條屬性的說明
但是主要分三類
Q199374
Q33506
EX:性質(P31)、國家(P17)
所在行政領土實體(P131)、輪椅使用性(P2846)
20180315
EX:官方名稱(P1448)、母語標籤(P1705)、地上層數(P1101)
Q199374
EX:官方網站(P856)、360°環景圖 (P5282)、
GeoNames編號 (P1566)、VIAF ID(P214)
Q199374
隨著資料增長,對資料詮釋的面相越多
自然我們會有更多的資料庫/集
在維基媒體計畫內部
Wikidata 也扮演著多語言/多計畫資料整合對照
A 資料庫
B 資料庫
Wikidata
Item
隨著資料的快速擴展
串聯多元資料庫/集將會是資料整合的關鍵
透過一致的識別碼
能夠避免語言之間的誤差以及書寫差異
導致的檢索困難
圖書館可以各自使用不同的,
唯一的或選擇的標識符和權限控制方法來消除歧義。
Wikidata越來越成為一種重要的工具,可用於跨標識符進行同步。
整合對 Wikidata 及其用於增強 metadata 和鏈結開放資料用途的認識將有助於推進更加互聯的研究網路。
-- Opportunities for Academic and Research Libraries and Wikipedia
2016 IFLA
Wikidata 可以有效降低打造 LoD 平台的成本
並擴展相關的應用
--ARL White Paper on Wikidata
2019
河川社群
新樂園藝術空間
李梅樹紀念館官網中
提供有 Wikidataqid 對照
越來越多資料庫導入機讀特性
在提高閱覽次數的同時
也是改善後續維護的方式
除了與人協作以外
更是與機器人協作
縱使在機器人有能力自編自維護的狀態下
我們人反而有更加重要的角色。
只有透過人的文獻整理與細讀轉譯後,封存在類比文獻中的資料,才得以在數位鏈結的世界中,具有參與。