河川資料的多元想像

Wikidata 全球最大跨語言知識庫

維基營運與 Wikidata 簡介

河川資料建置經驗分享:Open Data Day Taiwan 2020

Wikidata 再應用案例與想像

Why Wikidata?

我們可能常常忘了 Wikipedia 終究是百科全書

與 Wikipedia 相比,Wikidata 像是一本純數位編目書

重要的是讓資料在整個架構裡面可以被索引到

而 Wikipedia 就是一本數位百科全書

透過各式的文獻,重新書寫出事件的脈絡與原貌

Wikipedia 強調敘事Wikidata 強調關聯

基於對於關聯的需求

Wikidata 期待更細節更多元的內容

因此對於關注度等資料需求就更低了

部分因為文獻不足的資訊就得以放入

河川與水域資料的基礎資訊

由於過於瑣碎或是文獻不足

常導致 Wikipedia 難以收錄

Wikidata 與一般資料庫的編輯差異

做為一個結構化資料、鏈結資料庫

使用方式是比較不一樣的

Wikidata內容有三種

主要有三種,現在慢慢有越來越多了...

分別是

P

L

Q

Property

屬性

Lexeme

詞意/詞位

 

Item

物件

這是一筆典型的 Wikidata 項目(item)

大漢溪(Q199374)

該筆資料的統一編號

多語言說明欄

只要有填入對應語言就會依照填入值翻譯

描述

用於分別其他同名資料

供編輯者辨別用

亦稱為

就是別稱

大家怎麼叫他

描述非常重要可以迅速分別不同的同名物件

性質(P31):他是什麼東西?

圖片(P18):代表的圖片是?

注入河流(P403):下游注入的河流?

支流(P974):上游的支流?

每一種P都有不同的用法

詳見每一條屬性的說明

但是主要分三類

P

大漢溪

Q199374

性質P31

河流

Q4022

透過屬性連結兩個物件

EX:性質(P31)、上級分類(P279)

支流(P974)、分流(P5998)、注入河流(P403)

流量P2225

59.62

(立方公尺/秒)

連結實際數值/內容

EX:流量(P2225)、海拔(P2044)、長度(P2043)

街道地址(P6375)、圖片(P18)、集水面積(P2053)

 

長度 P2043

135

(公里)

 

大漢溪

Q199374

GeoNames編號P1566

連結外部連結與資料庫

EX:官方網站(P856)360°環景圖 (P5282)、

GeoNames編號 (P1566),GNS ID(P2326)

GNS ID P2326

10164524

大漢溪

Q199374

寫的很完整就會變成這樣

大漢溪

Q199374

河流

Q4022

P31

P31

三峽河

Q199374

支流

P974

注入河流P403

大安圳

Q4022

注入河流P403

分流 P5998

人造水道

Q12284

橫溪

Q11122285

支流

P974

注入河流P403

P31

P31

支流

P974

湳仔溝

Q10395799

支流

P974

注入河流P403

這種結構有什麼優勢?

同時機讀友善可創造

更多轉譯的可能性

除了與人協作以外

更是與機器人協作

縱使在機器人有能力自編自維護的狀態下,我們人反而有更加重要的角色。

只有透過人的文獻整理與細讀轉譯後,封存在類比文獻中的資料,才得以在數位鏈結的世界中,具有參與。

資料經過轉譯後能有更多檢索或應用的可能

從外部的跨資料庫連結

能夠用更低成本、低介入的方式來進行資料庫/集整合

謝謝大家