Wikidata Taiwan
Allen Wang
王文岳
夢回 2019
2019 年以 2018 年李梅樹紀念館的開放資料經驗
成功拐騙了開啟了新樂園藝術空間的開放資料之旅
李梅樹紀念館維基館藏開放計畫(2018-2019)
藝術資料的結構化想像:
以新樂園藝術空間歷史資料為例(2020-2021)
今天來算算成本跟效益
藏品數位開放的工作流程
入藏
權利盤點
編目與建立後設資料(Metadata)
進行物件修復
數位化工作
(掃描、拍照)
數位資料編目與建立後設資料
權利確定
上傳與公開
摘錄【國家文化記憶庫 數位化工作、檔案規格及授權規範說明手冊】
中央研究院數位文化中心鏈結資料開放實驗室
提出的鏈結開放資料製作成本
畫作物件CC開放至維基共享資源
展訊與藝術家資訊彙整至 Wikidata
同步完成畫作物件的 Wikidata 註錄
彙整資料收錄於Wikidata 方法論
籌備公開工作坊與公開演講展示工作成果
以內部工作人員工作坊為主進行內部資料彙整與公開
投入人力
約 3 人
約 16 人
投入工時
約 25 小時/人次
約 56 小時/人次
工作項目
籌辦工作坊、
彙整與上傳資料
原始資料彙整、
彙整與上傳資料
投入時程
2018 - 2019
2020 - 2021
抱歉我世俗一點
但我打算用瀏覽量來做最簡易的評估
看看資料是否被使用/訪問
約 700 筆
檔案CC開放
約 1000 筆
檔案主題
畫作與活動照片
活動照片為主
Wikidata 建置
約 1000 筆
約 300 筆
Wikidata 主題
藝術家與展覽
畫作為主
建置時間
2018 - 2019
2020 - 2021
當然可以去調出所有資料的總閱覽量
但那個看了可能沒有什麼感覺
而且其實這些資料還是有一些不同的特性
有被維基媒體計畫內部引用-A
未被維基媒體計畫內部引用-B
檔案為外部資料源轉載-C
條目位元組 1 萬以上-a
條目位元組 1萬以下 -b
每個類別各取十筆資料取每日平均瀏覽量
以 Pageview 這項工具統計 起訖時間為 2018 - 2022/7/30
A群
B群
C群
a群
b群
總瀏覽數/每日平均
可以看到是否為維基媒體計畫引用
是檔案在維基平台上是否能獲得大量取用有關
皆為取樣 10 筆資料
2022 Google 關鍵字藝術類
每次點擊平均出價為 1.6 美金
如果對於這些點閱次數沒有概念的話
可以給一個參考數值
「開放資料(Open Data)為 Web 3.0 的首要步驟」
「Web 3.0,除了能讀、能寫之外,
提供可重複利用的結構化資料集,將資料互相連接,
並能依瀏覽經驗自動提供使用者感興趣的資訊。」
摘自檔案季刊第14卷第4期
蔡政威【以鏈結資料觀點運用於文書檔案之初探】
雖然這邊的 Web 3.0 跟現在可能不太一樣就是
演算法、使用者習慣等問題
都使得資料穀倉與資料孤島的狀態越來越深
如何去打破?
過去資料庫才流行過一段「雲端」風潮
如何在設計上讓資料在多個伺服器中流通
才能確保資料持續「活著」
從過去的單一中心伺服器與社群"內容"參與
到了 Web 3.0 思考的是多中心、更有韌性的資料
過去藝術圈我們只做到披露與公開
如何走向真正的開放與串聯
做到資料與資料之間的互連