河川資料的多元想像
Wikidata 全球最大跨語言知識庫
維基營運與 Wikidata 簡介
河川資料建置經驗分享:Open Data Day Taiwan 2020
Wikidata 再應用案例與想像
Why Wikidata?
我們可能常常忘了 Wikipedia 終究是百科全書
與 Wikipedia 相比,Wikidata 像是一本純數位編目書
重要的是讓資料在整個架構裡面可以被索引到
而 Wikipedia 就是一本數位百科全書
透過各式的文獻,重新書寫出事件的脈絡與原貌
Wikipedia 強調敘事Wikidata 強調關聯
基於對於關聯的需求
Wikidata 期待更細節更多元的內容
因此對於關注度等資料需求就更低了
部分因為文獻不足的資訊就得以放入
河川與水域資料的基礎資訊
由於過於瑣碎或是文獻不足
常導致 Wikipedia 難以收錄
Wikidata 與一般資料庫的編輯差異
做為一個結構化資料、鏈結資料庫
使用方式是比較不一樣的
Wikidata內容有三種
主要有三種,現在慢慢有越來越多了...
分別是
P
L
Q
Property
屬性
Lexeme
詞意/詞位
Item
物件
這是一筆典型的 Wikidata 項目(item)
大漢溪(Q199374)
該筆資料的統一編號
多語言說明欄
只要有填入對應語言就會依照填入值翻譯
描述
用於分別其他同名資料
供編輯者辨別用
亦稱為
就是別稱
大家怎麼叫他
描述非常重要可以迅速分別不同的同名物件
性質(P31):他是什麼東西?
圖片(P18):代表的圖片是?
注入河流(P403):下游注入的河流?
支流(P974):上游的支流?
每一種P都有不同的用法
詳見每一條屬性的說明
但是主要分三類
P
大漢溪
Q199374
性質P31
河流
Q4022
透過屬性連結兩個物件
EX:性質(P31)、上級分類(P279)
支流(P974)、分流(P5998)、注入河流(P403)
流量P2225
59.62
(立方公尺/秒)
連結實際數值/內容
EX:流量(P2225)、海拔(P2044)、長度(P2043)、
街道地址(P6375)、圖片(P18)、集水面積(P2053)
長度 P2043
135
(公里)
大漢溪
Q199374
GeoNames編號P1566
連結外部連結與資料庫
EX:官方網站(P856)、360°環景圖 (P5282)、
GeoNames編號 (P1566),GNS ID(P2326)
GNS ID P2326
10164524
大漢溪
Q199374
寫的很完整就會變成這樣
大漢溪
Q199374
河流
Q4022
P31
P31
三峽河
Q199374
支流
P974
注入河流P403
大安圳
Q4022
注入河流P403
分流 P5998
人造水道
Q12284
橫溪
Q11122285
支流
P974
注入河流P403
P31
P31
支流
P974
湳仔溝
Q10395799
支流
P974
注入河流P403
這種結構有什麼優勢?
同時機讀友善可創造
更多轉譯的可能性
除了與人協作以外
更是與機器人協作
縱使在機器人有能力自編自維護的狀態下,我們人反而有更加重要的角色。
只有透過人的文獻整理與細讀轉譯後,封存在類比文獻中的資料,才得以在數位鏈結的世界中,具有參與。
資料經過轉譯後能有更多檢索或應用的可能
從外部的跨資料庫連結
能夠用更低成本、低介入的方式來進行資料庫/集整合
謝謝大家
河川資料的多元想像
By allenwang6212
河川資料的多元想像
- 560