當前位置:論文網 > 畢業論文 > 正文

計算社會科學:社會科學與信息科學的共同機遇

來源:UC論文網2019-05-17 10:32

摘要:

  摘要:隨著以互聯網為代表的現代信息科學技術的飛速發展,社會科學研究也迎來新的學術機遇。作為社會科學和信息科學的交叉學科,計算社會科學主要采用信息科學技術及其工具獲取和分析互聯網絡等媒介中蘊含的海量人類行為數據,探索社會科學范疇問題。計算社會心理學是計算社會科學的重要分支之一,且已有一些優秀成果誕生。信息科學和社會科學的彼此融合、相互促進,必將是未來社會科學的主要發展方向之一,但它同時也面臨諸多...

  摘要:隨著以互聯網為代表的現代信息科學技術的飛速發展,社會科學研究也迎來新的學術機遇。作為社會科學和信息科學的交叉學科,計算社會科學主要采用信息科學技術及其工具獲取和分析互聯網絡等媒介中蘊含的海量人類行為數據,探索社會科學范疇問題。計算社會心理學是計算社會科學的重要分支之一,且已有一些優秀成果誕生。信息科學和社會科學的彼此融合、相互促進,必將是未來社會科學的主要發展方向之一,但它同時也面臨諸多挑戰。社會科學家,尤其是社會心理學家,應抓住機遇積極投身到計算社會科學的研究中去。


  作者:陳浩,樂國安,李萌,董穎紅


  關鍵詞:計算社會科學;社會網絡分析;社會建模;計算社會心理學


  中圖分類號:B849文獻標識碼:A文章編號:1673-9841(2013)03-0087-07


  互聯網絡的誕生和發展改變了人類生活,同時也改變了人類觀察自身的方式。尤其是隨著互聯網Web2.0時代的到來,人們的網絡生活形態從被動接收信息向主動生產、交流信息轉變。社交網絡(socialnetworkservices,SNS)、博客(blog)、微博客(micro-blog)、微信等新興網絡社交媒體平臺以及各類移動互聯網工具興起之后,每時每刻都有海量用戶在使用它們記錄著自己當下的感受、思想和情緒。這些信息大多會以文本、圖像、視頻、音頻的形式在互聯網空間中留存下來。而由眾多個體不斷生產并被實時存儲下來的海量網絡數據,恰好可成為研究者們觀察人類個體和群體心理行為特征與規律的寶貴資源。同時,計算科學、數據挖掘等信息分析技術的迅速發展,也使得高效處理和分析海量數據成為可能。上述兩大條件的漸次成熟,促成了社會科學與信息科學的交叉學科“計算社會科學(computationalsocialscience)”的誕生。該學科有望為社會科學和信息科學的進一步發展帶來新機遇,而計算社會心理學作為計算社會科學的重要分支,理應引起社會心理學家群體的注意。


  一、從社會物理學、社會計算到計算社會科學


  計算社會科學并非是社會科學與自然科學技術的首次“聯姻”,其現代努力可追溯至社會物理學。19世紀時,社會學創始人、實證主義哲學大師AugusteComte指出社會科學的發展大致會經歷三個階段:神學、形而上學和現代實證階段。他認為在現代實證階段,社會科學研究應采用物理學方法,追求發現各類現象之間的規律性聯系,從而使社會科學成為能夠接受科學檢驗的學科,即社會物理學[1],其核心思想是借助物理學中的一些概念和方法研究社會現象及其規律[2]。社會物理學的誕生為社會科學的現代發展奠定了基礎,對社會科學研究擺脫哲學思辨起到了重要作用。20世紀40、50年代之后,社會物理學獲得進發式發展,諸如哈佛學派、劍橋學派、瑞典學派、MIT學派如是等等,他們不斷努力嘗試用物理世界的規則描述和解釋人類社會的種種現象,并產生了眾多有影響力的理論。


  與此同時,信息科學也開始在西方萌芽,信息科學以信息為主要研究對象,以信息的運動規律和應用方法為主要研究內容,以計算機與計算科學技術作為主要的研究工具與技術手段。半個多世紀以來,信息科學領域取得了舉世矚目、眾所周知的巨大成就,深深地改變了人類社會的技術生態。


  信息科學開始嘗試與社會科學交叉融合,最初體現在“社會計算(socialcomputing)”這個信息科學分支領域。社會計算概念最早于1994年出現在英文文獻中,由信息科學家提出,當時主要指社會軟件,即電子郵件等計算機支持協同工作軟件[3]。但隨著現代信息網絡的興起和信息科學技術的快速發展,社會計算被不斷賦予新的內涵和意義。


  中國科學院自動化研究所的王飛躍研究員從2004年開始系統提出社會計算的學科體系,他認為社會計算主要關注兩大塊內容:(1)關注信息技術在社會活動中的應用,主要目的在于利用先進的信息技術達成高度有效的人際交流;(2)關注將社會人文知識嵌入在信息技術中,目的在于提高社會活動的效益和水平[4]。國際上一些知名IT企業,如IBM、微軟等,先后成立了社會計算研究小組,探索如何利用社會科學等人文知識,開發有利于社會成員之間溝通協作的社交軟件[5]。此時,社會計算的主旨在于強調以信息技術和社會人文知識為指導,目的在于開發有利于人們之間高效協作與交往的交流平臺。劉挺進一步發展了社會計算的學科內涵,指出社會計算研究的目的在于如何利用計算系統幫助人們進行溝通與協作,以及如何利用計算技術研究社會運行的規律與發展趨勢[6]。這里,社會計算已不僅僅局限于信息技術在社會活動中的應用,還包括使用信息科學技術研究社會科學問題。


  為與內涵不斷流變的社會計算概念相區隔,進一步明確研究范疇、方法和原則,并強調社會科學理論思想在其間的地位,同時呼應Web互聯網、移動互聯網背景下人類社會行為信息“大數據(BigData)”時代的到來,2009年2月,由哈佛大學學者DavidLazer牽頭的來自信息科學、社會科學和物理學界的十余名國際學者在《科學》雜志上發表了名為《計算社會科學》的文章。在這篇綱領性文章中,這些世界一流學者共同勾畫了利用Web互聯網、移動互聯數據,研究人類社會行為和社會運行規律等社會科學問題的學科思想框架,標志著計算社會科學正式成為一個獨立的學科[7]。


  主要由信息科學一方主動向社會科學拋出橄欖而催生出的計算社會科學,在分析工具上偏重計算科學為代表的信息科學技術工具,分析對象上倚重人類個體和群體在Web互聯網、移動互聯網及無線移動設備上留下的各類行為和互動信息,著重探索個體行為偏好、動態人際互動、集群行為、社會演化、社會網絡等問題。計算社會科學使用信息科學技術研究社會科學問題,這與社會物理學方法論理念相類似,但又不拘泥于借用物理學體系框架去解讀社會現象。計算社會科學使AugusteComte提出的社會科學“科學化”理想具備了新的可能性與可行性。“計算社會科學”的學科概念已提出四年多,但國內信息科學界的很多學者仍習慣沿用“社會計算”這一術語。他們認為計算社會科學基本等同于社會計算,或者干脆將計算社會科學看作社會計算的一部分,比如劉挺就提出,社會計算包括計算社會科學和社會計算應用兩大部分[8]。而本文作者認為計算社會科學與社會計算之間確有交叉,但兩者同時也有不同的側重面向。社會計算關注的重點有兩個,其一是關注信息技術在社會活動中的應用,關注在信息技術中如何嵌入人文知識使之更好地服務于社會活動;其二是為社會科學領域研究提供研究工具,重點關注信息技術的使用和發展。而計算社會科學關注的重點主要是使用信息存儲、分析技術研究社會科學領域中的各種問題,發現社會運行規律。


  短短幾年時間里,計算社會科學就已成為國際科學共同體中眾所矚目的熱點領域。信息科學和社會科學界諸多學者投身于計算社會科學研究之中,《科學》、《自然》、《美國國家科學院院刊》等國際頂尖科學刊物上,不斷刊登計算社會科學研究成果,國內外眾多學術刊物出版專刊介紹計算社會科學相關研究。與此同時,美國還成立了“計算社會科學學會(ComputationalSocialScienceSo―ciety,CSSS)”;美國GeorgeMason大學甚至成立了計算社會科學系,同時也是世界上第一個正式授予計算社會科學博士學位的系所。


  二、計算社會科學的主要研究范式


  計算社會科學以計算機等現代計算科學技術工具獲取和分析海量社會化數據,數據形式主要包括文本、圖像、視頻和音頻等,其大部分來源于Web網絡信息(如新聞網站、網絡論壇、博客、社交網站、微博客等),還有一部分來源于現實空間中各種移動傳感設備,如全球定位系統(GlobalPosi―tioningSystem,GPS)、智能手機等工具感知的個體活動信息數據[9-10]。除了數據挖掘、機器學習等信息科學通用分析技術之外,就目前已有研究而言,社會網絡分析(socialnetworkanalysis)和社會建模是計算社會科學的兩大主要且具有特色的研究范式。


  Wellman和Berkowitz認為,社會網絡是指由某些特定社會群體間的社會關系構成的相對穩定的關系網絡[11]。近幾年,隨著信息科學技術的發展和普及,這種關系已經延伸到網絡虛擬環境中。通過基于社交網絡服務,如討論組、即時通訊、實時消息、博客、微博客等,用戶可以彼此分享和交流信息[13]。這種虛擬社會網絡的迅猛發展正深刻影響人們的生活和工作方式[12]。社會網絡分析是社會學大師C.WrightMills在研究人類關系網絡時提出的研究范式,社會網絡分析依網絡視角看待社會,把社會個體當作節點,將社會關系當作邊,社會網絡即由節點和邊構成[14]。社會學家們最早開展了社會網絡分析的研究,主要集中于小規模群體的人際關系、群體行為和社會結構等問題。發展至今,社會網絡分析已廣泛地應用到社會學、經濟學、心理學、物理學、信息科學等研究之中[16]。


  目前,計算社會科學領域研究者眼中的社會網絡分析對象,主要包括對虛擬社會網絡下的人物節點分析、社群挖掘和社會信息網絡分析等,具體包含以下研究內容:(1)對人物節點的分析,主要通過個體的一系列網絡行為(評論、轉發、收藏等)分析其主要特征,根據用戶之間的互動(關注、回復、跟帖等)分析人物節點的影響力,從而按照影響力大小將人物節點分為意見領袖、橋節點等;(2)社群挖掘是社會網絡分析的另一研究重點,社群通常由性質相似或功能相近的人物節點構成,在一定程度上反映了個體自發、無序行為背后的局部弱規則性和全局有序性[17]。因此,發現虛擬網絡中有意義的、相對穩定的社群對網絡信息的搜索與挖掘、信息的推薦以及網絡演化與擴散的預測具有重要價值;(3)社會信息的網絡化分析,從宏觀角度對社會信息進行量化分析,加強信息梳理,提升信息服務能力[18]。


  社會建模技術由信息科學家和數學家提出并發展完善起來,是指對社會空間中個體或群體的心理和行為、交互模式、人際關系、社群結構等復雜社會性問題,進行抽象描述并建立仿真模型。通過仿真模型,研究者可以模擬社會演化進程、社會現象的發展、人類社會行為及其變化過程,可進一步結合實驗分析或為現實提供決策支持[19]。20世紀60年代早期,社會建模方法開始應用于社會科學領域,至20世紀90年代社會建模才真正為社會科學領域學者所接受。時至今日,社會建模已廣泛應用于社會學、心理學、經濟學、公共政策研究等領域。


  目前,在社會科學領域應用最廣泛的仿真模型是基于智能主體的社會仿真模型(agent―basedmodels,ABMs),ABMs模型可以很好地模擬信息傳播、社會規范的出現、集群行為等人類現象。ABMs模型的建立是自下而上的,采用Agent(智能主體)概念研究社會問題,Agent是一段特殊的程序,代表著現實中的社會個體模型。Agent具有能動性,即可以根據程序中的運行環境和規則自主地反應決策,學習并適應環境,還可與周邊網絡中的其它Agent彼此聯系、相互影響[20]。基于ABMs模型,研究人員發展出在計算機上建立“人工社會(artificialsociety)”的構想。人類社會是由大量真實社會個體構成的復雜系統,人工社會則是在計算機上模擬出的由大量虛擬社會個體模型構成的復雜系統。其研究思路是在計算機中建立多個Agent模型,對不同特性的Agent設定不同的運行規則,讓這些Agent相互作用并遵循一定規則運行,最后通過觀察大量Agent相互作用的涌現屬性,找到人工社會的規律,并用這些規律理解和解釋現實人類社會中的宏觀現象[21]。目前,利用社會建模技術對社會演化過程進行實驗分析和評估,是計算社會科學熱點方向之一,譬如通過社會建模測試和驗證社會經濟政策的效果,已被應用到社會公共管理與控制之中。社會心理學家AndrzejNowak等人在1998年時曾提出對社會人際關系建立仿真模型的研究構想,并由此拋出“計算社會心理學”(computationalsocialpsychology)的學科概念。AndrzejNowak等人分析指出,人際關系就如同神經元之間互相連接和影響,因此可以將動態的人際過程類比為神經網絡模型,從而進行社會仿真建模。社會學家Macy和Willer于2002年向社會學界詳細介紹了ABMs模型,倡導使用ABMs模型進行社會學研究[23]。之后,Goldstone和Janssen將ABMs模型用于集群行為研究之中[24]。Smith和Conrey提出ABMs模型適合社會心理學研究,并通過實驗證明ABMs模型比其它模型更適用于群體人際互動建模[25]


  三、作為重要分支的計算社會心理學


  社會心理學作為社會科學的重要分支之一,諸多研究者已開始關注和嘗試采用計算社會科學研究范式和工具,專門探討社會心理學領域的相關問題,同時社會心理學中也蘊含著豐富的理論假設,可源源不斷地激發信息學家們的實證研究靈感。


  上文已有提及,計算社會心理學作為一個學科概念,早在1998年就已經由社會心理學家An―drzejNowak等人提出,當時的內涵是利用計算機社會模擬技術對社會群體心理及行為進行仿真、建模,屬于信息科學與心理學的交叉學科。如今隨著研究的不斷推進、分析技術的不斷發展,計算社會心理學的內涵也在不斷演化。計算社會心理學已不局限于最初的社會仿真模擬,也開始關注使用信息科學技術作為存儲和計算的工具,獲得、存儲與分析現代網絡生活中海量人群的各種行為和互動數據,揭示人類心理特征和社會認知的形成機制及其發展規律。縱觀近幾年計算社會心理學領域的研究,大致可分為以下幾個方向。


  (一)大眾情緒分析及其規律發現


  互聯網絡空間中的大眾情緒表達是計算社會心理學關注的重要問題之一。從事在線文本信息分析的傳統信息學者一般只對文本情緒做簡單分類,比如以“積極一消極”、“支持一反對”、“支持一中立一反對”這種簡單二元或三元分類方式,劃分分析對象的情感態度,而依據心理學的情緒結構理論,我們可將人類情緒劃分為5~6類基本情緒,以及多種復合情緒,并對每一種情緒的效價和喚醒程度進行客觀評級,繼而獲得更為豐富和精準的人類情感信息。前者簡單的情感劃分框架可稱為“傾向性分析”,后者可稱為“情緒分析”,兩種分析可合稱為“情感傾向性分析”[26]。已有研究證明,依據情緒心理學理論成果或成型情緒量表擴充構建的網絡情感傾向性分析指標工具,能夠有效地預測實際的社會經濟現象,如對產品市場份額、影視票房、疾病或信息傳播狀況、政治選舉結果、宏觀經濟形勢的預測,以及對突發事件的預警等[27]。這類網絡情感分析工具能夠實時地測量網絡大眾情緒,不僅為傳統情緒心理學理論研究注入活力,增強了社會科學的實用價值,而且還支撐擴展了信息科學中傳統的文本情感分析技術。譬如,同時兼具信息科學和心理學背景的學者JohanBollen等人,基于心境量表(ProfileofMoodStates,POMS)開發了網絡情緒分類標準及其測量工具,并分析了2008年美國微博客網站Twitter.tom上高達幾百萬條微博條目(tweets)中情緒表達信息,發現Twitter微博條目中的“鎮定(calm)”類情緒詞匯量的每日變化趨勢,可以成功預測2~6天后美國道瓊斯工業指數的升降,預測準確率達到87%[28]。目前針對網絡論壇、博客、社交網絡的情感傾向性研究已有很多,而由于微博客應用的快速發展,基于微博客平臺的情感傾向性研究有快速增長乃至爆發的趨勢。研究者可基于微博客平臺,針對某些重大社會事件,進行網民情感傾向監測和分析,從而準確把握社會大眾態度和情緒的變化過程,這對民意問詢、公共管理決策等都具有重要應用價值。


  (二)經典心理學假設在網絡大數據層面上的驗證


  心理學是研究人類心理和行為的科學,自誕生以來已建立和發展起龐大的理論假設庫。這些假設通常要經過問卷調查、實驗設計、統計分析等一系列研究程序和方法進行驗證,其中往往存在非代表性取樣、研究情境不真實等問題,因此傳統心理學研究方法論存在一定缺陷。然而,計算社會心理學研究能收集和分析實時更新的海量人類信息數據,這些數據具有大范圍、真實和完全描述的特征,能夠顯著有效地解決非代表性取樣問題,并避免實驗條件真實性的拷問。因此,在大數據技術時代背景下,可采用信息科學技術或計算社會科學新研究范式,對已有的可計算心理學理論假設進行逐一檢驗和發展。譬如,美國心理學家Markey夫婦通過分析美國大選期間搜索引擎網站Google.com上各州的色情類詞匯搜索量波動趨勢,發現如果某政黨“票倉州”所支持的參選者最終確實獲勝,選舉之后該州的色情類詞匯搜索量會快速上升,并顯著高于其它州。該搜索行為現象驗證了進化心理學中經典的“挑戰假說(challengehypothesis)”[29]。Golder和Macy則通過分析2008年2月至2010年1月之間Twitter.com上正向情緒類詞匯和負向情緒類詞匯出現頻率的波動趨勢,結果發現正向情緒隨季節變化而變化,未發現支持日照絕對時長與正向情緒之間存在顯著相關的證據,但驗證了情緒心理學中有關情緒與季節、生物節律問關聯的“階段轉換假說(phase―shifthypothesis)”[30]。


  (三)海量信息中的社會心理新規律發現


  現代互聯網絡技術的迅速發展給人類活動帶來了深遠影響,用戶可以使用BBS、博客、社交網絡、微博客等多種工具或方式將自己當下的觀點、狀態和情緒表達出來;同時隨著信息科學技術的不斷成熟,使研究者可輕松獲得這些海量的網上信息,并從中發現隱藏的、有價值的人類社會心理新知識。譬如,美國心理學家曾發現,利用谷歌網站應用軟件“谷歌趨勢(GoogleTrends)”記錄的網民對于自殺、自殘、抑郁類詞匯的搜索量數據,發現其與現實中的大眾自殺、自殘數據呈顯著統計相關關系:在成人群體中呈顯著負相關,在青少年群體中呈顯著正相關[31]。再比如,通過對新浪微博海量信息的分析,中國社會心理學家周欣悅教授及其團隊初步發現,自然災害之后公眾對于“公平”的關注會下降,具體表現在公平類詞匯的每日詞頻變化趨勢:在地震后的5~6天會有一個詞頻低谷,而在大約20天后會有一個高峰。值得注意的是,以上這些可被歸類為計算社會心理學研究的成果,有很多是由信息科學家與社會學家、經濟學家甚至政治學家合作發起,計算社會心理學的巨大學術價值還未被廣大社會心理學家充分意識。在未來,信息科學與社會心理學的相互交流和促進,將是計算社會科學的重要發展方向。


  四、問題與挑戰


  隨著互聯網絡的迅速普及以及隨之而來的信息數字化、生活網絡化浪潮,給社會科學研究帶來了新的挑戰。同時,互聯網絡海量數據提取、挖掘和分析技術的相對成熟,也給社會科學帶來了方法論革新機遇。計算社會科學或社會計算已逐步獲得國內外學術界的重視。我國學者于2004年提出開展社會計算研究的倡議[32-33],之后許多學者紛紛投身其中,目前,開展相關研究的單位主要包括中科院自動化所、中科院計算技術研究所、天津大學、哈爾濱工業大學和中國人民大學等。計算社會科學正在以前所未有的廣度、深度和尺度影響著我們收集、整理、分析海量人類行為數據的能力,為社會科學研究提供了全新的工具和視角。與此同時,它在發展過程中也面臨著一些亟待解決的問題。


  第一,數據收集和存儲中的問題。首先,計算社會科學在數據收集上存在著隱私權隱患。在互聯網絡中,用戶存放了大量個人隱私,如個人信息、人際關系、共享信息等。不合理地使用這些隱私數據將會給公眾生活帶來不良影響,因此,部分網絡數據是無法公開提供給學術界使用的[34]。另外。當今的信息技術雖然能實現對大規模人類行為的全面實時記錄,但在數據存儲方面卻仍然面臨著巨大數據如何存儲和管理的技術難題,當前的計算機系統還無法完全滿足這一需求。


  第二,傳統社會科學研究思維不適用于大數據時代。計算社會科學的主要研究對象是互聯網新興計算平臺下實時收集、更新的海量人類數據,傳統社會科學研究方法和理論不再適用于這些數據的分析和規律總結工作。無論是相關關系亦或是因果關系,經典的社會科學研究都要求在實證之前明確相應理論假設,實證操作才能以此作為指導原則,去證實或證偽假設。但是在茫茫大數據之中,基于先期有限的前提假設尋找特定變量間的關系,無異于大海撈針。因此,計算社會科學領域亟需新的適于大數據分析的方法論思想及其具體技術。計算社會科學方法論研究者們也在不斷努力,譬如Reshef等人于2011年在《科學》雜志上發表文章,介紹了一種在海量數據集中發現潛在重要關系的新統計方法“最大信息熵非參探索”(maximalinformation―basednonparametricexplo―ration,MINE)。這種方法能對變量間不同類型關系進行快速評估,發現大尺度網絡范圍內的關系類型,利用這種方法研究者無需對其尋找的關系有所了解或設立前期假設,就可以檢測由多種因素驅動的復雜模式。作者還將MINE方法與其它方法進行了比較,結果發現MINE更適合于做快速的數據關系探索,這將有助于計算社會科學領域的大幅發展[35]。


  第三,學術復合型人才缺乏。計算社會科學是信息科學和社會科學的交叉學科,現在明顯缺乏具備跨學科思維與實踐能力的研究人才。針對于此,需要信息技術界和社會科學界兩者學術培養資源的有效整合,但由于學術隊伍組織背景各異,學科認同傳統不同,如何使信息科學學者和社會科學學者之間彼此配合,共同培養跨學科的學術復合型人才,也是亟待探索的問題。另外,國內的教育培養體系里文理科之間區隔非常明顯,學生偏科現象嚴重,計算社會科學人才的成功培養也將遇到國內教育培養體制沉疴的阻礙。


  計算社會科學為社會科學基礎研究提供了新的發展契機,同時還可為社會、經濟、安全等重要應用領域提供決策支撐。作為一門新興交叉學科,計算社會科學的發展需要信息科學和社會科學領域學者之間更為密切的聯系與交流。本文作者在此吁請廣大社會科學學者,尤其是社會心理學者,積極與信息科學家展開合作,貢獻自身專業知識,主動投身于已然到來的計算社會科學研究大潮之中。

核心期刊推薦

河北时时彩一定牛推荐号