項潔、翁稷安
問題意識
*延伸: 大數據的傲慢與偏見:一個「圈內數學家」對演算法霸權的警告與揭發: 例如,貧窮學生在申請學貸時,可能因自家的郵遞區號,被審核貸款的數學模型視為還款高風險者,因而無法獲得貸款
Bai, Ying and James Kung. 2011. “Climate Shocks and Sino-nomadic Conflict.”(氣候變遷對中國與游牧民族之間的影響)
(from https://goo.gl/Qx12Ke) (中文導讀)
《漢學研究》歷史類論文計量分析(史學史)
計量史學(cliometrics)(計量經濟史?)
the study of historical data by the use of statistical, often computerized, techniques. ( https://goo.gl/XsiyGe )
……但我猜測,計量史學在歷史史料的應用上會弱於傳統史學研究。關於某一歷史問題的相關數據雖然可以得到,但史料的分析可能會不足。而且還有一個問題,計量史學會把某些歷史現象簡化為某幾個具體的指標以方便分析,這在一些使用傳統定性研究方法的人看來會覺得缺乏依據,無法反映真正的歷史。這其實也是社會學科引入量化方法後普遍會遇到的問題,所以我認為定量研究和定性研究不可偏廢,數據分析和史料分析都要重視。
計量史學(cliometrics)
論文架構
金觀濤〈數位人文研究的理論基礎〉:闡述人文科學的研究流程,是將過去的文本,轉為當下的認知(抽象→具體)。而透過數位科技的協助,能加快從文本中提取資訊的速度。
金觀濤、劉青峰〈簡答張仲民先生對拙作的評論〉:強調數位人文與計量史學的不同,且前者並非完全倚賴統計資料,而是僅將之作為輔助工具。
→論文作者同時指出計量史學的失敗在於過度迷信統計
文獻回顧
舉一個例子,1789年7月14日是法國民眾攻佔巴士底監獄的重要日子……但是,路易十六在那一天的日記中寫下「今日,無事」……並不特別重視這一重大歷史事件……只是頻頻發生的政治騷亂之一……今日歷史研究者不會從這條當事人的記錄來寫法國革命史,而要去參看有關那一天的其他大量歷史記錄……
顯然……我們應做的不是將事件當作和支配(或記錄)它的觀念無關之存在,反而是去準確地發現支配該歷史事件的觀念和記錄者之所之認為該事件值得記錄的理由。例如去「理解」為何路易十六在1789年7月14日日記中寫下「今日,無事」的原因等。這裡所謂「理解」就是韋伯提出的理解方法。
普通的典藏系統:重視保存的資料是否正確及全面(不將資料做切割)
→影響系統的好壞→保全資料的重要的基礎
數位人文資料庫的建立:不能單從保全檔案的角度思考,會對數位人文的理解造成限制,同時因為資料特性的關係,系統本身也要重視
數位人文資料庫:與傳統的數位典藏系統不同,可以算是一種關聯式資料庫(Relational Database),但又相對於後者靈活
例子:上一次的演講、商業上的訂單管理系統
研究方法
兩個層面:技術(功能的開發)、人文與科技的互動(應用)
應用的例子:透過文獻中的同源詞、借詞,為文化交流的研究提供幫助、透過詞頻分析,可知某些本應提到但卻未提的事情(郭百年事件)
研究方法
尚待更多的人前來此領域,除了改進系統外,也因人多,才有更多發展的可能。
數位人文不是為方法而方法,而是人文研究的重要輔助工具,眾人應該嘗試新科技所帶來的效益,同時恪守人文的訓練與素養。
結論