臺灣本土語言的 Wikidata
條目與詞位建構
王文岳 Allen Wang
Wikidata Taiwan
王文岳
- Wikidata Taiwan 共同發起人
- 立法院開放國會第一屆委員
- 前台灣維基媒體協會秘書長
- 李梅樹紀念館資訊組召集人
- 國家文化記憶庫社群經營研究:資訊技術協力

Wikidata 扮演著船連全球網路個平台資料的角色

在維基媒體計畫內部
Wikidata 也扮演著多語言/多計畫資料整合對照

Wikidata 同時是 VIAF 的一份子
提供全球尺度的資料對照與串聯
P
L
Q
Property
屬性
Lexeme
詞意/詞位
Item
物件
Wikidata 的主要內容架構
Q
Q
P
P
P
Q
P
P
P
在 Wikidata 裡面我們不再用散文的方式在紀錄資料
而是改變成為單字、片語的方式進行
讓跨語言的資料只需要翻譯單詞或片語
就能用最低的成本做到多語言呈現


trv
tay

szy
中華民國
教育部
教育部
性質
Q697093
P31
Q2269756
Mklawa ttgsa klwaan Cunghwu Minkwo
性質
教育部
Kyo’ikbu
性質
教育部
trv
tay
en
Ministry of Education (R.O.C)
instance of
ministry of education


Wikidata 同時透過「亦稱為」一欄
以及多語言欄位
提供跨語言對照以及權威詞彙對照的功能
樂信·瓦旦
- 音界號?
- 樂信·瓦旦? 樂信‧瓦旦?
- 拼寫不同或是各不同語言
- Losing Watan 、樂信·瓦旦
- 不同時期的姓名
- 渡井三郎、日野三郎
語言欄位連結各語言與各通同名稱
並使用唯一識別碼互相溝通
提供權威對照的功能

亦稱為 欄位同時也可以處理單一語言代碼下
多語言、多部落稱呼不同的問題


Wikidata 目前可用語言
條目、屬性、介面翻譯可用

Wikidata 目前母語標籤可用語言
僅詞位、部分屬性可用

目前 Wikidata 無法使用的語言


目前條目資料數量
(2024)

目前法定原住民 16 族
有 15 個語言代碼(ISO639-3)
42 個語言
寒溪泰雅語(2007-2010)曾被納入
條目或是屬性翻譯
可參閱政府機關提供各本土語言翻譯或是找使用者協助翻譯
詞位 Lexeme
可參照學習詞表對照國際基礎詞表




目前臺灣語言裡面詞位收錄數量前四名

語言代碼共用
可以分開標註



zh
Toda
Truku
Tgdaya


詞位編輯示範


國際可參考 Lexeme Party 推薦詞表
謝謝大家
臺灣本土語言的 Wikidata 條目與詞位建構
By allenwang6212
臺灣本土語言的 Wikidata 條目與詞位建構
- 63