開放資料與 Wikidata

Wikidata Taiwan 共同主持人

王文岳

資料不是很多了嗎?

為什麼還要用維基的平台

雖然有資料

但是檢索卻成了最大問題

維基百科不是很棒嗎?

為什麼我們還需要Wikidata?

我來自新北市三峽區所以就用三峽河舉例

可以看到三峽河的支流,僅橫溪、大豹溪有紀錄

不見得是因為沒有人編輯

而是大部份河川都有

關注度不足的問題

這是目前維基百科主要記載的河川

我相信數量一定遠小於各位所知道的河川

所以我們需要Wikidata

三峽河(Q7419001)

Wikidata.org

使用維基帳號就可以登入

還沒有維基帳號的朋友

可以到維基百科等等的地方註冊

那平常要怎麼到Wikidata呢?

在左邊喔!

在這邊

有看到嗎?

就會變成這樣子,對吧?!

這邊將用大家熟悉的河川來說明

Wikidata內容有三種

分別是

P

L

Q

Property

屬性

Lexeme

詞意/詞位

今天不會談到

不要問我為什麼是Q

這是wikidata未解之謎

詳見Q61768970

這是一筆典型的 Wikidata 資料(item)

大漢溪(Q199374)

該筆資料的統一編號

多語言說明欄

只要有填入對應語言就會依照填入值翻譯

描述

用於分別其他同名資料

供編輯者辨別用

亦稱為

就是別稱

大家怎麼叫他

描述非常重要可以迅速分別不同的同名物件

性質(P31):他是什麼東西?

圖片(P18):代表的圖片是?

注入河流(P403):下游注入的河流?

支流(P974):上游的支流?

每一種P都有不同的用法

詳見每一條屬性的說明

但是主要分三類

P

大漢溪

Q199374

性質P31

河流

Q4022

透過屬性連結兩個物件

EX:性質(P31)、上級分類(P279)

支流(P974)、分流(P5998)、注入河流(P403)

流量P2225

59.62

(立方公尺/秒)

連結實際數值/內容

EX:流量(P2225)、海拔(P2044)、長度(P2043)

街道地址(P6375)、圖片(P18)、集水面積(P2053)

 

長度 P2043

135

(公里)

 

大漢溪

Q199374

GeoNames編號P1566

連結外部連結與資料庫

EX:官方網站(P856)360°環景圖 (P5282)、

GeoNames編號 (P1566),GNS ID(P2326)

GNS ID P2326

10164524

大漢溪

Q199374

寫的很完整就會變成這樣

大漢溪

Q199374

河流

Q4022

P31

P31

三峽河

Q199374

支流

P974

注入河流P403

大安圳

Q4022

注入河流P403

分流 P5998

人造水道

Q12284

橫溪

Q11122285

支流

P974

注入河流P403

P31

P31

支流

P974

湳仔溝

Q10395799

支流

P974

注入河流P403

由於 Wikidata 的資料是互相連結而成

因此都是接到外部或是沒有連結的item

在Wikidata內幾乎等於不存在

因為查不到

而第一個要新增的屬性

通常是P31或是P279

不然不會有人知道那是什麼

那為什麼Wikidata會是這樣的結構?

Wikidata

是一種機讀資料

三峽河,又名三峽溪,位於台灣北部,是大漢溪的支流,全長約28.5公里,流域面積約200平方公里,流域幾乎涵蓋新北市三峽區全境,以及土城區、樹林區、桃園市大溪區的一小部分。另外,三峽河是台灣少數以「河」為名的河川。

人讀

機讀

人讀

機讀

提供完善的機讀資料

才是對未來真正全面的基礎建設

都花這麼多心力了一次到位且都能通用

這些資料才經得起時間的考驗

Wikidata資料都能夠直接免費下載與使用

要開發其他新的平台都能直接轉用

需要創建新的河川資料平台

現有的河川資訊都能當作現成資料直接用

大量且方便的機獨資料

使得Wikidata成為Google知識圖譜的主要來源

最後,談談授權

Wikidata上的連結資料

為CC-0釋出

外部資料則不在此限

Q&A

FB: @WikidataTW

就可以找到我們