開放資料與 Wikidata
Wikidata Taiwan 共同主持人
王文岳
資料不是很多了嗎?
為什麼還要用維基的平台
雖然有資料
但是檢索卻成了最大問題
維基百科不是很棒嗎?
為什麼我們還需要Wikidata?
我來自新北市三峽區所以就用三峽河舉例
可以看到三峽河的支流,僅橫溪、大豹溪有紀錄
不見得是因為沒有人編輯
而是大部份河川都有
關注度不足的問題
這是目前維基百科主要記載的河川
我相信數量一定遠小於各位所知道的河川
所以我們需要Wikidata
三峽河(Q7419001)
Wikidata.org
使用維基帳號就可以登入
還沒有維基帳號的朋友
可以到維基百科等等的地方註冊
那平常要怎麼到Wikidata呢?
在左邊喔!
在這邊
有看到嗎?
就會變成這樣子,對吧?!
這邊將用大家熟悉的河川來說明
Wikidata內容有三種
分別是
P
L
Q
Property
屬性
Lexeme
詞意/詞位
今天不會談到
這是一筆典型的 Wikidata 資料(item)
大漢溪(Q199374)
該筆資料的統一編號
多語言說明欄
只要有填入對應語言就會依照填入值翻譯
描述
用於分別其他同名資料
供編輯者辨別用
亦稱為
就是別稱
大家怎麼叫他
描述非常重要可以迅速分別不同的同名物件
性質(P31):他是什麼東西?
圖片(P18):代表的圖片是?
注入河流(P403):下游注入的河流?
支流(P974):上游的支流?
每一種P都有不同的用法
詳見每一條屬性的說明
但是主要分三類
P
大漢溪
Q199374
性質P31
河流
Q4022
透過屬性連結兩個物件
EX:性質(P31)、上級分類(P279)
支流(P974)、分流(P5998)、注入河流(P403)
流量P2225
59.62
(立方公尺/秒)
連結實際數值/內容
EX:流量(P2225)、海拔(P2044)、長度(P2043)、
街道地址(P6375)、圖片(P18)、集水面積(P2053)
長度 P2043
135
(公里)
大漢溪
Q199374
GeoNames編號P1566
連結外部連結與資料庫
EX:官方網站(P856)、360°環景圖 (P5282)、
GeoNames編號 (P1566),GNS ID(P2326)
GNS ID P2326
10164524
大漢溪
Q199374
寫的很完整就會變成這樣
大漢溪
Q199374
河流
Q4022
P31
P31
三峽河
Q199374
支流
P974
注入河流P403
大安圳
Q4022
注入河流P403
分流 P5998
人造水道
Q12284
橫溪
Q11122285
支流
P974
注入河流P403
P31
P31
支流
P974
湳仔溝
Q10395799
支流
P974
注入河流P403
由於 Wikidata 的資料是互相連結而成
因此都是接到外部或是沒有連結的item
在Wikidata內幾乎等於不存在
因為查不到
而第一個要新增的屬性
通常是P31或是P279
不然不會有人知道那是什麼
那為什麼Wikidata會是這樣的結構?
Wikidata
是一種機讀資料
三峽河,又名三峽溪,位於台灣北部,是大漢溪的支流,全長約28.5公里,流域面積約200平方公里,流域幾乎涵蓋新北市三峽區全境,以及土城區、樹林區、桃園市大溪區的一小部分。另外,三峽河是台灣少數以「河」為名的河川。
人讀
機讀
人讀
機讀
提供完善的機讀資料
才是對未來真正全面的基礎建設
都花這麼多心力了一次到位且都能通用
這些資料才經得起時間的考驗
Wikidata資料都能夠直接免費下載與使用
要開發其他新的平台都能直接轉用
需要創建新的河川資料平台
現有的河川資訊都能當作現成資料直接用
大量且方便的機獨資料
使得Wikidata成為Google知識圖譜的主要來源
最後,談談授權
Wikidata上的連結資料
為CC-0釋出
外部資料則不在此限
Q&A
FB: @WikidataTW
就可以找到我們
開放資料與 Wikidata
By allenwang6212
開放資料與 Wikidata
- 899