原住民語遇上鏈結化資料

王文岳 Allen Wang

Wikidata Taiwan

Wikidata 中各南島主題現況

Wikidata 簡介

台灣原住民族專案簡介

工作坊、講座經驗

小結

王文岳

  • Wikidata Taiwan 共同發起人
  • 立法院開放國會第一屆委員
  • 前台灣維基媒體協會秘書長
  • 李梅樹紀念館資訊組召集人
  • 國家文化記憶庫社群經營研究:資訊技術協力

Wikidata 扮演著串連全球網路各平台資料的角色

在維基媒體計畫內部

Wikidata 也扮演著多語言/多計畫資料整合對照

Wikidata 同時是 VIAF 的一份子
提供全球尺度的資料對照與串聯

P

L

Q

Property

屬性

Lexeme

詞意/詞位

 

Item

物件

Wikidata 的主要內容架構

Q

Q

P

P

P

Q

P

P

P

在 Wikidata 裡面我們不再用散文的方式在紀錄資料
而是改變成為單字、片語的方式進行

讓跨語言的資料只需要翻譯單詞或片語
就能用最低的成本做到多語言呈現

trv

tay

szy

中華民國

教育部

教育部

性質

Q697093

P31

Q2269756

Ciyaw-i-pu 

性質

教育部

Kyo’ikbu

性質

教育部

ami

tay

en

Ministry of Education (R.O.C)

instance of

ministry of education

Wikidata 同時透過「亦稱為」一欄

以及多語言欄位

提供跨語言對照以及權威詞彙對照的功能

樂信·瓦旦

  • 音界號?
    • 樂信·瓦旦? 樂信‧瓦旦?
  • 拼寫不同或是各不同語言
    • Losing Watan 、樂信·瓦旦
  • 不同時期的姓名
    • 渡井三郎、日野三郎

語言欄位連結各語言與各通同名稱

並使用唯一識別碼互相溝通

提供權威對照的功能

亦稱為 欄位同時也可以處理單一語言代碼下

多語言、多部落稱呼不同的問題

台灣原住民語維基百科孵育計畫簡介

先於族語維基百科之前

在 16 族的架構下
其實還有各語言別
當然還有平埔語

這時期的核心工作....

  • 維基介面操作教學

  • 維基介面翻譯

  • 基礎條目編輯

  • 開始建立社群工作模式

2021 年首次開設
Wikipedia 模板工作坊與 Wikidata 翻譯工作坊

Wikidata 屬性與物件
翻譯

2021 年同時也針對已經上線的維基百科管理員
推出管理員課程

工作坊、講座經驗

主要以 2022 年後 Wikidata 社群主推工作坊

2023 年賽德克 Wikidata 講座與文獻工作坊 

2024 萬山魯凱(下三社) Wikidata 詞位與錄音工作坊

2025 首次與噶哈巫語合作推出詞位工作坊

2025 賽德克工作坊
同時與三語別社群
推動屬性翻譯

Wikidata 中的現況

Wikidata 目前可用語言
條目、屬性、介面翻譯可用

Wikidata 目前母語標籤可用語言
僅詞位、部分屬性可用

目前 Wikidata 無法使用的語言

目前條目資料數量
(2024)

維基媒體政策頁面、教學頁面翻譯

語言代碼共用
可以分開標註

多語言橫向對照詞義

earthquake L31985-S1

zh

Toda

Truku

Tgdaya

小結

  • 目前族語社群有能量做 Wikidata 與部分內容的更新

  • 包含 Wikidata 等軟體還沒有辦法對細部方言別或是部落用語做並列

  • 軟體要包含原住民族語翻譯

    • 社群溝通優先

    • 社群 Review 需要花點時間處理

謝謝大家

原住民語遇上鏈結化資料:Wikidata 中各南島主題現況

By allenwang6212

原住民語遇上鏈結化資料:Wikidata 中各南島主題現況

  • 59