社會科學研究往往都以抽樣和個案研究去進行,做起來有一定限制。李中清認為,大數據的出現,並將它應用在社科以至歷史研究中,可令研究變得更科學,所有人都可憑這些客觀數據,去再現(Reproduce)一樣的結果,令社科研究亦能像物理或化學的實驗一樣,「大數據有荅u正的『現象』。」李中清解釋說,以往社會科學一些較大規模的研究會以抽樣為主,但當中包含很多複雜問題,「抽樣首先要社會人口比較一致,而且分母、分子的比例性樣本要有代表性。」他進一步說,抽樣不易之處,還要考慮現象、分布和可行性的問題,「例如貴州的情況就和江蘇的很不一樣,中國那麼多個省、那麼多個縣,跑一躺也不容易,除非是國家級單位幫忙,否則很難。」
李中清:中國為最佳實驗地
用大數據去做研究則開闢另一種嶄新渠道。李中清表示,大數據是根據資料檔案去做,而中國更是進行此類研究的最佳地方,「中國很早以前就有很多檔案,像科舉資料亦保留很多年,由漢朝的選拔制度起已有記錄,而且保存得很好,有些適合用大數據方式去做。」他又指,用大數據做研究不需統計專業背景、不需電腦培訓,「但對史料的保存要下很大工夫,後人才可根據他們的基礎去做研究。」
出身自理科家庭、父親為諾貝爾物理學獎得主李政道的李中清形容,這是很科學、很前沿的研究方法,「我的家庭就常常說,大自然比我們聰明得多。要做研究,就要尊敬現象。先收集材料,承認自己的理解和看法不一定對,再找現象,讓現象決定結論。」在李中清看來,大數據所呈現的就是真正現象,「現在有社交媒體、網絡,發展的速度也很快,創造了很多訊息可以分析,而且這很科學,任何人都可以再現,學界也認可。」
欠個體代表性 須有相同想法
不過,大數據用作社科研究亦有其缺點,就是欠缺個體代表性,而研究速度亦比較慢,怎樣利用、怎樣計算,都很看重研究人員有沒有相同想法,「但它在時間上有厚度,對理解轉變和延續十分有用。」 ■歐陽文倩
|