Wikidata Taiwan

Allen Wang

王文岳

資料庫的資料庫?

聯合資料庫的困難

Wikidata 真的能收錄全部的資料嗎?

王文岳

  • Wikidata Taiwan 共同發起人
  • 立法院開放國會第一屆委員
  • 前台灣維基媒體協會秘書長
  • 李梅樹紀念館資訊組召集人

Wikidata 作為 LoD 平台

COSCUP

Q10846717

國家 P17

中華民國

Q865

Wikidata 以三元組的結構

透過相互連結的方式

將資料以鏈結資料的方式提供

並完全以 CC0 向世界公開

Q

Q

P

P

P

Q

P

P

P

在 Wikidata 結構中

陳述主要是透過屬性(property)串聯Q或P來完成詮釋

當然也有對應字串的屬性

但那多是用於陳述純數值或是特定內容

Wikidata 同時透過「亦稱為」一欄

以及多語言欄位

提供跨語言對照以及權威詞彙對照的功能

Wikidata 透過 P279 這類型的屬性

來達成類似索引典的特性

來擴大與不同層級物件的互動可能性

Wikidata 可以有效降低打造 LoD 平台的成本

並擴展相關的應用

--ARL White Paper on Wikidata

2019

Wikidata 作為聯合目錄

在單一物件的陳述

可以對照不同資料庫

同一筆資料的ID

圖書館可以各自使用不同的,

唯一的或選擇的識別碼和權威控制方法來消除歧義。

Wikidata逐漸一種重要的工具,可用於跨識別碼進行同步。

整合對 Wikidata 及其用於增強 metadata 和鏈結開放資料用途的認識將有助於推進研究網路的互聯。

-- Opportunities for Academic and Research Libraries and Wikipedia

2016 IFLA

A資料庫

B資料庫

資料Z-B

資料Z-A

要確定兩者的通同性

就需要進行對照工作

在許多時候我們都可能需要進行資料庫對照

像是資料庫匯入、多資料庫整合等等

A資料庫

B資料庫

資料Z-B

資料Z-A

加入 Wikidata 做為第三方

各資料庫之間對照只需要滿足與 Wikidata 之間的對照

就能在與其他資料庫進行對照

資料Z-W

QNNNNNNN

Wikidata

B資料庫

在維基媒體計畫內部

Wikidata 也扮演著多語言/多計畫資料整合對照

而事實上這也是他成立的主因之一

但是?

真的有那麼划算的嗎?

聯合目錄的困難

A資料庫

B資料庫

資料Z-B

資料Z-A

要確定兩者的通同性

就需要進行對照工作

如果兩者的對照有歧義或是不精準的問題

做資料整合就會出現問題

維基媒體計畫內容的整合困難

跨語言、語境的整合困難

詞語在地化的概念轉向

索引典概念涵蓋的差異

以及基礎索引典資訊/概念建構的不足

A 資料庫

B 資料庫

Wikidata

Item

雖然 Wikidata 作為聯合目錄

本來就不會涵蓋各資料庫的完整收錄範圍

但如果同一實體在不同資料庫有指射不同實體的狀態

反而導致 Wikidata會有不精準對照的問題

可能的思考點跟解方

謝謝您的聆聽

資料庫的資料庫?聯合資料庫的困難,Wikidata 真的能收錄全部的資料嗎?

By allenwang6212

資料庫的資料庫?聯合資料庫的困難,Wikidata 真的能收錄全部的資料嗎?

COSCUP 2022 2022 / 07 / 30 10:30 ~ 11:00 TR212 OpenStreetMap x Wikidata 開放內容議程軌 by 王文岳 Allen Wang

  • 368