今天我不教你做 Open Data

以新樂園藝術空間、李梅樹紀念館做為案例

談數位開放的成本與效益

Wikidata Taiwan

Allen Wang

王文岳

王文岳

  • Wikidata Taiwan 共同發起人
  • 立法院開放國會第一屆委員
  • 前台灣維基媒體協會秘書長
  • 李梅樹紀念館資訊組召集人

夢回 2019

2019 年以 2018 年李梅樹紀念館的開放資料經驗

成功拐騙了開啟了新樂園藝術空間的開放資料之旅

「在數位化的時代,我們發現共享是促進發現、創新和協作的基礎。」

Creative Commons CEO Ryan Merkley

李梅樹紀念館與新樂園藝術空間的維基操作經驗

李梅樹紀念館維基館藏開放計畫(2018-2019)

藝術資料的結構化想像:

新樂園藝術空間歷史資料為例(2020-2021)

作法已經談過太多了

今天來算算成本跟效益

先談成本

藏品數位開放的工作流程

入藏

權利盤點

編目與建立後設資料(Metadata)

進行物件修復

數位化工作

(掃描、拍照)

數位資料編目與建立後設資料

權利確定

上傳與公開

摘錄【國家文化記憶庫 數位化工作、檔案規格及授權規範說明手冊】
  • 人力成本:授權處理、資料內容分析及轉譯、技術轉置執行。初估需3位人力。
  • 資金成本:資訊設備維護(含URI等資料內容)、領域專家諮詢等費用。
  • 時間成本:LOD 資料集建立時間端看資料結構複雜程度而定。
    平均3個資料集(或10萬筆),約1年時間(應用系統開發另計)建置。

中央研究院數位文化中心鏈結資料開放實驗室

提出的鏈結開放資料製作成本

工作策略比較

畫作物件CC開放至維基共享資源

展訊與藝術家資訊彙整至 Wikidata

同步完成畫作物件的 Wikidata 註錄

彙整資料收錄於Wikidata 方法論

籌備公開工作坊與公開演講展示工作成果

以內部工作人員工作坊為主進行內部資料彙整與公開

李梅樹紀念館

新樂園藝術空間

看看兩案在成本比較

李梅樹紀念館

新樂園藝術空間

投入人力

約 3 人

約 16 人

投入工時

約 25 小時/人次

約 56 小時/人次

工作項目

籌辦工作坊、

彙整與上傳資料

原始資料彙整、

彙整與上傳資料

投入時程

2018 - 2019

2020 - 2021

效益量化評估

抱歉我世俗一點

但我打算用瀏覽量來做最簡易的評估

看看資料是否被使用/訪問

先看看兩案在資料面的成果

李梅樹紀念館

新樂園藝術空間

約 700 筆

檔案CC開放

約 1000 筆

檔案主題

畫作與活動照片

活動照片為主

Wikidata 建置

約 1000 筆

約 300 筆

Wikidata 主題

藝術家與展覽

畫作為主

建置時間

2018 - 2019

2020 - 2021

量化方法

當然可以去調出所有資料的總閱覽量

但那個看了可能沒有什麼感覺

而且其實這些資料還是有一些不同的特性

開放的檔案跟 Wikidata 分為數種來探討

檔案

Wikidata

有被維基媒體計畫內部引用-A

未被維基媒體計畫內部引用-B

檔案為外部資料源轉載-C

條目位元組 1 萬以上-a

條目位元組 1萬以下 -b

每個類別各取十筆資料取每日平均瀏覽量

以 Pageview 這項工具統計 起訖時間為 2018 - 2022/7/30

李梅樹紀念館

新樂園藝術空間

A群

B群

C群

a群

b群

總瀏覽數/每日平均

可以看到是否為維基媒體計畫引用

是檔案在維基平台上是否能獲得大量取用有關

皆為取樣 10 筆資料

2022 Google 關鍵字藝術類

每次點擊平均出價為 1.6 美金

如果對於這些點閱次數沒有概念的話

可以給一個參考數值

開放資料能帶來的機會

「開放資料(Open Data)為 Web 3.0 的首要步驟」

「Web 3.0,除了能讀、能寫之外,

提供可重複利用的結構化資料集,將資料互相連接,

並能依瀏覽經驗自動提供使用者感興趣的資訊。」

摘自檔案季刊第14卷第4期

蔡政威【以鏈結資料觀點運用於文書檔案之初探】

雖然這邊的 Web 3.0 跟現在可能不太一樣就是

備份、交叉持有與交叉檢索

演算法、使用者習慣等問題

都使得資料穀倉與資料孤島的狀態越來越深

如何去打破?

資料的流通與「霧化」

過去資料庫才流行過一段「雲端」風潮

如何在設計上讓資料在多個伺服器中流通

才能確保資料持續「活著」

Web 3.0 的思考

從過去的單一中心伺服器與社群"內容"參與

到了 Web 3.0 思考的是多中心、更有韌性的資料

開放資料不是只有開放

過去藝術圈我們只做到披露與公開

如何走向真正的開放與串聯

做到資料與資料之間的互連

從藝術開放資料

開放資料

謝謝您的聆聽