維基知多少?

兼論維基百科、共享資源與維基數據

王文岳

Allen Wang

  • Wikidata Taiwan 社群共同發起人
  • 2018 維基館聯計畫共同主持人
  • 李梅樹紀念館資訊組召集人
  • 電腦硬體講師

你知道維基百科嗎?

你知道維基嗎?

維基

維基

百科

維基

解密

雖然名字都有維基啦

但是最後面那個跟前兩個完全沒關係喔

維基不只有百科全書而已

今天帶大家深入了解維基

沒有錯

其實今天是維基澄清大會

礙於篇幅

大部分專案都是帶過啦

2005

2001

2001

2002

2003

2003

2003

2004

2004

2004

2005

2006

2006

2012

2012

2003

今天的三個主角

Wikipedia

Wikimedia Comons

Wikidata

維基

這邊補一下什麼是維基

Wiki 維基

是在全球資訊網上開放

可供多人協同創作的超文字系統

 

-- 引自 維基百科【Wiki】條目

這些是臺灣比較多人知道使用 wiki 技術的平台

當然不只這些

許多自由軟硬體的技術文件網站也常使用 wiki

如: Mozillawiki、Ubuntu wiki、WikiChip

BTW 現在 Wiki 技術 主要由 MediaWiki 負責

以下標誌圖樣均為合理使用

正篇開始

這是我們看到的中文維基百科首頁

維基百科

  • 2001年1月15日推出
  • 2002年10月24日推出中文維基
  • 2004年進入前十大瀏覽量網站
  • 2007年成為全球史上最大百科全書
  • 英文維基百科目前有 595 萬條目
  • 第二多條目數量的是宿霧語
    • 有 537 萬條目
  • 中文維基百科目前有 107 萬條目
    • 排行全球第 14 名
    • 所有中文都共用中文維基百科

為了提供更好的瀏覽體驗與檔案使用效率

維基也有許多的專業分工

維基共享資源

  • 2004年9月7日推出
  • 用於收錄開放授權媒體作為素材之用
    • 收錄資料可在維基中跨計畫使用
  • 全球大型開放授權媒體庫之一
  • 除檔案授權外亦僅收錄開放檔案格式
  • 目前已收錄 5600 個可開放使用檔案
  • 屬於跨語言維基計畫
  • 具有圖床功能
  • 接受開放授權的檔案
  • 提供完整的多語言詮釋資料與結構化資料
  • 提供圖片特定範圍標註的功能
別問我為啥放營火
挺溫暖的啊

Dirk Beyer [CC BY-SA 3.0]

BTW 這份簡報大部分的圖

都是直接從維基共享資源那邊叫過來的

完全開放授權

不用占我 Slides 的雲端空間 讚讚

而且還免費 隔壁 Fli_kr 目前要收費

?

維基數據

  • 2012年10月30日推出
  • 目前最年輕的維基媒體計畫
  • 目前最大的維基跨語言計畫
  • 2019年9月21日達到十億編輯
    • 目前擁有最多編輯次數
    • 英文維基百科僅有 9.1 億次編輯
  • 收錄有最多條目
    • 目前擁有 6373 萬條
    • 每日新增 5 - 10 萬條
    • 全語言維基百科僅 5128 萬條
  • 機讀的維基百科
  • 全球擁有最多資料的知識庫
  • 可直接生成 Graph
  • 完全 CC0 釋出
  • 完全符合開放資料五顆星的規範
  • 提供跨語言、跨資料庫的唯一值資料
  • 橫跨所有維基計畫做資料串連
  • 多種 API 可以提供完整使用權限

要取用六千多萬條知識有很多種方式

  • 可以直接全部下載
  • 使用 Query Srevice

如何應用?

擁有大量的專有名詞詞彙

可以用於中文專有名詞斷詞的訓練

搜尋引擎也常拿來最為搜尋結果的依據與參考

大量權威控制資料

可供研究者迅速尋找資料

跨域應用?

Crotos

  • 搜尋可自由使用的藝術作品
  • 高度結構化的藝術作品資料
  • 藝術作品的權威控制資訊
  • 藝術作品圖片由維基共享資源提供

Wikishootme

連結維基共享資源的圖片

維基數據上條目的座標

可以透過維基建立線上導覽

 

Q6975161 就是 金門大學的 UID

高度結構化並跨語言

即使在中文同名同姓也不用擔心搞錯

2019年 蔡英文過世

UID 與 專用屬性結構能夠妥善區別同名實體

公館連儂牆之三

藝術家陳斌華與攝影圖書室聯合拍攝的攝影作品

以 CC0 釋出在維基共享資源上

並搭配 Wikidata 完成結構化資料

超高解析度與大型檔案

在維基共享資源上都可以妥善展示與收錄

透過將詮釋資料結構化並連結 wikidata

能夠迅速進行詮釋資料的翻譯

並且可以由機器直接代勞

當然還有很多很多...

你也可以在你的資料庫中

幫資料上等效的 wikidataqid 與 屬性ID

你馬上就會擁有全世界

能夠串連更多資訊提高資料庫的效度

不過 這些是誰做的?

社團法人台灣維基媒體協會

  • 成立於 2007 年
  • 2007 曾舉辦 維基媒體國際會議
  • 為亞洲第一個受美國基金會認證的地方分會

維基不是一個資料庫

wiki is not a database

also not an archive

維基提供了一個自由開放的平台

從文獻、媒體到鏈結資料

無論作為資料提供者亦或是資料應用者

都提供一個可以合法存放與取用資料的平台

下一次找不到素材

或許到維基晃晃呀

總之就是介紹了那麼好用的東西

還不趕快去用用看!

謝謝大家

本簡報以 CC-BY-SA 4.0 釋出

有另外標註者不在此限

維基知多少

By allenwang6212

維基知多少

  • 700