數位典藏與鏈結資料
Wikidata 的博物館應用與機制
Allen Wang
Wikimedia Taiwan
Wikidata Taiwan
維基營運與 Wikidata 簡介
Wikidata 用於資料識別與交換
Wikidata 館聯應用案例與想像
Why Wikidata?
2012 年才成立的 Wikidata 為我們解決了什麼問題?
日益倍增的機器讀取需求
傳統的 Wikipedia 已經無法處理
Wikidata 透過結構化、鏈結資料的方式達到機讀友善
維基百科基於人類閱讀的需求
使得部分瑣碎資料無法被獨立紀錄與分述
機讀對於關聯的需求更甚
Wikidata 得以收錄更細節更多元的內容
為了達到機讀需求,Wikidata 像是一本純數位編目書
重要的是讓資料在整個架構裡面可以被索引到
而 Wikipedia 就是一本數位百科全書
透過各式的文獻,呈現出人類知識的結晶
Wikidata 與一般資料庫的編輯差異
做為一個結構化資料、鏈結資料庫
使用方式是比較不一樣的
Wikidata 內容有三種
分別是
P
L
Q
Property
屬性
Lexeme
詞意/詞位
Item
物件
國家人權博物館(Q10926902)
該筆資料的統一編號
多語言說明欄
只要有填入對應語言就會依照填入值翻譯
目前支援 300+ 種語言
描述
用於分別其他同名資料
供編輯者辨別用
亦稱為
可用於辭彙對照用
描述非常重要可以迅速分別不同的同名物件
性質(P31):他是什麼東西?
圖片(P18):代表的圖片是?
成立或建立時間(P571)
國家(P17)
每一種P都有不同的用法
詳見每一條屬性的說明
但是主要分三類
P
國家人權館
Q199374
性質P31
博物館
Q33506
透過屬性連結兩個物件
EX:性質(P31)、國家(P17)
所在行政領土實體(P131)、輪椅使用性(P2846)
成立或建立時間P571
20180315
連結實際數值/內容
EX:官方名稱(P1448)、母語標籤(P1705)、地上層數(P1101)
國家人權館
Q199374
官方網站P856
連結外部連結與資料庫
EX:官方網站(P856)、360°環景圖 (P5282)、
GeoNames編號 (P1566)、VIAF ID(P214)
WorldCat Identities ID P2326
國家人權館
Q199374
Wikidata 除了是機讀百科
更是資料庫的資料庫
隨著資料增長,對資料詮釋的面相越多
自然我們會有更多的資料庫/集
在維基媒體計畫內部
Wikidata 也扮演著多語言/多計畫資料整合對照
A 資料庫
B 資料庫
Wikidata
Item
導出
應用
對照
跨域檢索
隨著資料的快速擴展
串聯多元資料庫/集將會是資料整合的關鍵
VIAF 成員內部對照與交互索引
透過一致的識別碼
能夠避免語言之間的誤差以及書寫差異
導致的檢索困難
Wikidata 館聯應用案例
圖書館可以各自使用不同的,
唯一的或選擇的標識符和權限控制方法來消除歧義。
Wikidata越來越成為一種重要的工具,可用於跨標識符進行同步。
整合對 Wikidata 及其用於增強 metadata 和鏈結開放資料用途的認識將有助於推進更加互聯的研究網路。
-- Opportunities for Academic and Research Libraries and Wikipedia
2016 IFLA
Wikidata 可以有效降低打造 LoD 平台的成本
並擴展相關的應用
--ARL White Paper on Wikidata
2019
河川社群
新樂園藝術空間
李梅樹紀念館官網中
提供有 Wikidataqid 對照
資料庫不再只服務人
服務機器的資料庫將是趨勢
越來越多資料庫導入機讀特性
在提高閱覽次數的同時
也是改善後續維護的方式
同時機讀友善可創造
更多轉譯的可能性
除了與人協作以外
更是與機器人協作
縱使在機器人有能力自編自維護的狀態下
我們人反而有更加重要的角色。
只有透過人的文獻整理與細讀轉譯後,封存在類比文獻中的資料,才得以在數位鏈結的世界中,具有參與。
從外部的跨資料庫連結
能夠用更低成本、低介入的方式來進行資料庫/集整合
謝謝大家
數位典藏與鏈結資料 Wikidata 的博物館應用與機制
By allenwang6212
數位典藏與鏈結資料 Wikidata 的博物館應用與機制
- 574