時間: 分類:經濟論文 瀏覽次數(shù):
摘要:文章從微博情感分析視角出發(fā),通過網絡爬蟲抓取新浪微博評論數(shù)據(jù),研究公眾對中國經濟高質量發(fā)展的社會評價。結果表明:從微博數(shù)據(jù)的情感值來看,公眾對經濟高質量發(fā)展持積極態(tài)度,對產業(yè)結構的評價最高,對空氣質量的評價最低,對GDP和創(chuàng)業(yè)持理性態(tài)度,而對社保和房價的滿意度有待提高;從詞云圖分析來看,高質量發(fā)展、GDP增速、結構調整、房價上漲、社;稹⒖諝赓|量指數(shù)、創(chuàng)業(yè)平臺等是公眾關注的熱門議題。據(jù)此,通過把互聯(lián)網的社情民意與政府的施政努力相結合,有針對性地改進和提升社會公眾的滿意度,對政府制定相應的政策具有重要作用。
關鍵詞:情感分析;經濟高質量發(fā)展;社會評價;詞云圖
0引言
我國經濟已由高速增長階段轉向高質量發(fā)展階段,探尋經濟高質量發(fā)展的實現(xiàn)路徑成為當前重要的議題。從理論上來看,研究經濟高質量發(fā)展應當遵循兩條思路,第一條思路是通過經濟發(fā)展的宏觀數(shù)據(jù)來考察經濟發(fā)展質量,第二條思路是通過微觀個體對于經濟發(fā)展質量的反饋評價來考察經濟發(fā)展質量。從實踐上來看,經濟高質量發(fā)展歸根結底要落實到社會公眾中去,那么社會公眾對經濟高質量發(fā)展的評價如何?微博作為公眾發(fā)表觀點、表達情緒、闡明態(tài)度的重要輿論場,經濟發(fā)展質量的諸多問題均在微博評論中得以反映。
因此,本文從微博情感分析視角出發(fā),通過網絡爬蟲抓取新浪微博評論數(shù)據(jù)并進行情感分析和詞云圖分析,以探尋當前公眾對經濟高質量發(fā)展的社會評價,這對于建立公眾反饋機制、提高經濟發(fā)展質量具有重要的理論價值與現(xiàn)實意義。對于經濟高質量發(fā)展的研究,現(xiàn)有文獻主要從經濟高質量發(fā)展的內涵[1—8]和測度[9—15]兩個方面展開。本文在此基礎上從三個方面進行拓展和完善:
第一,從研究內容來看,已有文獻多是針對經濟高質量發(fā)展內涵和測度的研究,較少涉及經濟高質量發(fā)展的社會評價;第二,從研究視角來看,已有文獻多是利用統(tǒng)計年鑒的客觀經濟指標來考察經濟發(fā)展質量,缺少站在公眾立場上利用微博評論數(shù)據(jù)對經濟高質量發(fā)展的社會評價;第三,從研究方法來看,已有研究多采用熵權法、層次分析法、模糊數(shù)學法、主成分分析法或計量經濟學方法等,少有運用大數(shù)據(jù)爬取和Python語言將微博輿情文本分析用于經濟高質量發(fā)展的有益實踐。
鑒于社會公眾對經濟發(fā)展質量有著切膚體驗并深刻影響著經濟高質量發(fā)展,本文利用新浪微博評論數(shù)據(jù),采用情感分析和詞云圖分析方法歸納公眾對經濟高質量發(fā)展的社會評價,這有助于豐富經濟發(fā)展質量的微觀研究,為探尋我國經濟高質量發(fā)展的實現(xiàn)路徑提供理論借鑒與實踐參考。
1研究設計
本文以新浪微博平臺數(shù)據(jù)為基礎,借鑒任保平等(2019)[14]的研究,從經濟效率、經濟結構、經濟穩(wěn)定性、福利變化與成果分配、資源利用與生態(tài)環(huán)境和國民經濟素質六個維度來考察經濟高質量發(fā)展的評價指標體系,研究社會公眾對經濟高質量發(fā)展分維度的情感態(tài)度。
1.1數(shù)據(jù)搜集
數(shù)據(jù)搜集分為關鍵詞選取和數(shù)據(jù)爬取,具體步驟如下:
第一,關鍵詞選取。本文數(shù)據(jù)來源于新浪微博用戶發(fā)表的微文,首先要確定微文話題,即關鍵詞。關鍵詞的選擇應確保其準確反映經濟增長質量不同維度的特點,與每個維度相關的可選取關鍵詞。
發(fā)現(xiàn)部分關鍵詞存在學術門檻,如“勞動效率”“城鄉(xiāng)二元結構”等,導致話題討論度不高、發(fā)言用戶群體分布不均勻,不能保證樣本的充足性;部分關鍵詞囊括的范圍過廣,如搜索“環(huán)境”一詞會出現(xiàn)“園區(qū)環(huán)境”或“小區(qū)環(huán)境”等景點或住宅的廣告,搜索“霧霾”一詞會出現(xiàn)“霧霾藍”等淘寶商品的廣告,導致樣本純度不高,不具有針對性;還有部分關鍵詞囊括的范圍過窄,如“第三產業(yè)”“環(huán)保”等詞不能全面反映對應的評價維度,不具有代表性。綜合來看,關于“GDP”“產業(yè)結構”“房價”“社保”“空氣質量”和“創(chuàng)業(yè)”的微文相對于其他關鍵詞的質量和切題度更高,故選取其作為六個評價維度的關鍵詞,選取“經濟質量”作為經濟高質量發(fā)展整體評價的關鍵詞。
第二,數(shù)據(jù)的爬取。本文利用后羿采集器對微博網頁數(shù)據(jù)進行爬取,具體爬取方法如下:在新浪微博上進行高級搜索,輸入關鍵詞,時間定為2019年1月1日,復制網址到后羿采集器,按日期批量生成網址,得到2019年1月1日至2019年12月31日的所有網址,添加爬取字段并設置采集范圍。采集的字段包含用戶名、用戶鏈接、微文、發(fā)表時間、轉發(fā)量、評論量和點贊量。
1.2數(shù)據(jù)預處理
數(shù)據(jù)預處理具體步驟如下:第一,將爬取的數(shù)據(jù)從網頁采集器導入Excel表格;第二,數(shù)據(jù)清洗,包括刪除重復項和刪除無效微文,刪除重復項是指只保留同一用戶在同一天多次發(fā)表或轉發(fā)同一微文的唯一樣本,刪除無效微文是指刪除廣告等無關內容;第三,依照停用詞表對停用詞進行刪除;第四,中文分詞,由于中文沒有空格分隔的特征,因此當前自然語言庫中針對中文分詞的較少,本文使用的是以Character-BasedGenerativeModel算法進行中文分詞的SnowNLP文本分析庫;第五,刪除多余字段,最后統(tǒng)一保留150個字段。
1.3情感分類
情感分類是針對非結構化的網絡評論,判斷評論內容為正面態(tài)度或負面態(tài)度,進而得到整體的情感傾向。本文采用基于統(tǒng)計自然語言處理的方法,將文本信息表示成向量后通過機器學習來判斷情感類型,具體步驟包括特征選取、特征權重計算和文本情感分類。第一,特征選取。即選取語義單位作為特征項,用以反映文本信息。特征選取直接影響文本分類結果,所以要選取既能真實反映文本信息,又能區(qū)分不同文本特征的語義單位。第二步,特征權重計算。特征權重代表對應特征對文本類型的影響程度,常用的計算方法有布爾權重、TF-IDF等。
第三步,文本情感分類。將以向量形式表示的文本信息,利用機器學習的方法按照不同的情感類別進行分類。本文采用Python中的一個自然語言處理庫——SnowNLP庫,它可以快速且高效地處理中文文本內容,并且自帶訓練語料,可以直接使用SnowNLP庫預測文本情感分類。SnowNLP庫通過樸素貝葉斯分類器將文本分為積極和消極兩類,返回值越接近于1則表示文本內容越積極,而越接近于0則表示文本內容越消極。
1.4詞云圖分析
詞云圖是數(shù)據(jù)可視化的表達方式,是在分詞基礎上設計并實現(xiàn)的將文本數(shù)據(jù)中的高頻詞匯提取并以有趣、高效、新穎的方式呈現(xiàn)給閱讀者的一種數(shù)據(jù)可視化工具。詞云圖中文字的大小反映該詞組的詞頻,間接說明公眾所關注的熱點和主題,是數(shù)據(jù)展示的重要方式。
2結果分析
本文利用后羿采集器爬取新浪微博用戶的微文數(shù)據(jù),數(shù)據(jù)預處理后得到關于“經濟質量”話題的微文28623條、關于“GDP”話題的微文30089條、關于“產業(yè)結構”話題的微文30865條、關于“房價”話題的微文32154條、關于“社保”話題的微文33991條、關于“空氣質量”話題的微文34080條、關于“創(chuàng)業(yè)”話題的微文32274條,共計222076條。為了從情感值上更直觀地展示出正負情感類型,本文將SnowNLP算法計算出來的情感值減去0.5,這樣處理后的情感值就落在[-0.5,0.5]的對稱區(qū)間內。
(1)經濟質量,公眾對于中國經濟質量的社會評價情感均值為0.4645,是非常積極的,中位數(shù)高達0.4787,說明一半以上的發(fā)言用戶對經濟質量都持積極的態(tài)度,同時方差僅為0.0017,說明整體變化幅度不大。
(2)GDP,公眾對GDP的情感均值為0.2748,表現(xiàn)為積極的態(tài)度,中位數(shù)為0.2873,說明一半以上的發(fā)言用戶都是積極的態(tài)度,最小值為-0.1817,說明仍存在消極情感傾向,方差為0.0081,表明情感傾向波動較大。
(3)產業(yè)結構,公眾對于產業(yè)結構的情感均值為0.4108,是非常積極的,中位數(shù)為0.4182,說明一半以上的發(fā)言用戶持非常積極的態(tài)度,方差為0.0016,說明公眾對產業(yè)結構的情感傾向變化較小。
(4)房價,公眾對于房價的情感均值為0.1884,持積極態(tài)度,最大值為0.4089,最小值為-0.1831,方差為0.0052,說明情感值波動幅度較大。(5)社保,公眾對于社保的情感均值為0.0364,屬于中性的情感類型,最大值為0.2632,最小值為-0.2731,25%分位數(shù)處的情感值為-0.0166,說明超過25%的用戶對于社保的評價是消極的。
(6)空氣質量,公眾對空氣質量的情感均值是-0.1331,表現(xiàn)為消極情緒,是所有維度中最低的,最小值為-0.4572,最大值僅為0.2166,而中位數(shù)為-0.1000,說明有一半以上的用戶的評論是消極的。空氣質量情感值的方差為0.0258,是所有關鍵詞中最大的,主要是受季節(jié)變化和地區(qū)差異的影響。
(7)創(chuàng)業(yè),公眾對于創(chuàng)業(yè)的情感均值為0.3591,屬于積極的情感類型,方差為0.0025,最小值為0.1577,說明公眾對創(chuàng)業(yè)不存在消極的評論?傮w來看,微博用戶對于產業(yè)結構的評價最高,而對于空氣質量的評價最低,對GDP和創(chuàng)業(yè)持理性態(tài)度,而對社保和房價的滿意度有待提高。且六個經濟維度的評價差異十分明顯,存在著很大的進步空間。為了更直觀地顯示情感值的變化趨勢,繪制“經濟質量”總體及不同維度的日情感均值變化圖,并結合代表性微文分析各個關鍵詞的情感趨勢及詞云圖。
公眾對“經濟質量”的日情感均值一直維持在一個很高的水平,且整體變化幅度不大,說明微博用戶對于我國經濟質量持積極態(tài)度。當然,也存在一定數(shù)量的負面評價,但是日情感均值都屬于積極評價。具體來看,公眾對于我國經濟質量的積極評價集中表現(xiàn)在對經濟迅猛增長的喜悅以及對經濟轉向高質量發(fā)展的支持,消極評價集中表現(xiàn)在對我國經濟現(xiàn)存問題的擔憂。情感均值在10月的變化相對劇烈,在10月中旬和11月初的兩次短暫驟跌均是受健康貓“龐式詐騙”事件的影響,除了幾次劇烈波動以外,情感值還是相對穩(wěn)定的。
具體來看,持積極情緒的微博用戶表達了對GDP快速增長的贊嘆,對國家繁榮的自豪。持消極情緒的微博用戶表達了以下幾個方面的觀點:一是對用GDP總值反映區(qū)域經濟增長表示懷疑,認為人均GDP能更好地說明真實國民收入水平;二是對城鄉(xiāng)差異和地區(qū)差異的不滿;三是對地方政府一味地追求經濟增長率而忽視增長質量的不滿,呼吁在追求經濟增長的同時,也要關注經濟與社會、城市與農村、發(fā)展與資源、投資與消費的平衡。
3結論與啟示
隨著中國特色社會主義進入新時代,社會公眾對于經濟高質量發(fā)展的訴求和愿望與日俱增,為了讓人民群眾擁有更多的獲得感,就要搜集好人民群眾對經濟高質量發(fā)展的需求和反饋,更好地了解社會公眾對經濟高質量發(fā)展的所想、所需及困惑,從而有利于發(fā)現(xiàn)經濟高質量發(fā)展存在的問題和不足,有針對性地改進和提升社會公眾的滿意度。因此,本文從微博情感分析視角出發(fā),從經濟效率、經濟結構、經濟穩(wěn)定性、福利變化與成果分配、資源利用與生態(tài)環(huán)境、國民經濟素質六個方面通過網絡爬蟲抓取新浪微博評論數(shù)據(jù)并進行情感分析和詞云圖分析,歸納當前社會公眾對經濟高質量發(fā)展的情感傾向與話題關注度,主要結論如下:
(1)從微博數(shù)據(jù)的情感值來看,整體上微博用戶對我國經濟高質量發(fā)展持積極態(tài)度,且波動幅度不大;從六個評價維度來看,微博用戶對產業(yè)結構的評價最高,對空氣質量的評價最低,對GDP和創(chuàng)業(yè)持理性態(tài)度,而對社保和房價的滿意度有待提高;空氣質量受季節(jié)變化和地區(qū)差異的影響,情感值波動最大,而產業(yè)結構的情感值波動最小。
(2)從微博數(shù)據(jù)的微文分析來看,微博用戶類型主要分為個人用戶、政府用戶和媒體用戶,其中關于“產業(yè)結構”話題的政府用戶和媒體用戶發(fā)言較多,而關于“創(chuàng)業(yè)話題”的個人用戶發(fā)言較多;從詞云圖分析來看,高質量發(fā)展、GDP增速、結構調整、房價上漲、社保基金、空氣質量指數(shù)、創(chuàng)業(yè)平臺等都是微博關注的熱門議題;從微文內容來看,正面情緒的微文主要是新聞報道、公眾對政策的回應及積極情緒的個人經歷或感悟,負面情緒的微文主要是對現(xiàn)存問題的反映,如城鄉(xiāng)差異、買房難、社保體系不完善、空氣污染和創(chuàng)業(yè)艱辛等。
以上研究結論對于我國經濟高質量發(fā)展具有如下政策啟示:
(1)對于社會公眾的正面評價,要積極主動地推進政務公開,凈化網絡環(huán)境,傳播正能量;對于社會公眾的負面評價,特別是涉及群眾切身利益和實際困難的事情,堅持第一時間、公開透明、尊重事實、正面應對、積極處置的原則,有針對性地改進和提升社會公眾的滿意度,使廣大群眾切實感受到社會的公平正義。
具體來說,在經濟效率方面,要通過改革和創(chuàng)新不斷挖掘增長潛力,實現(xiàn)經濟數(shù)量增長和質量提升的統(tǒng)一;在經濟結構方面,進一步積極推動供給側改革,促進產業(yè)結構優(yōu)化升級,培育戰(zhàn)略性新興產業(yè),統(tǒng)籌城鄉(xiāng)協(xié)調發(fā)展;在經濟穩(wěn)定性方面,要整治房地產市場秩序,建立促進房地產市場平穩(wěn)健康發(fā)展的長效機制,保證物價總水平處于合理區(qū)間;在福利變化與成果分配方面,要加大對教育醫(yī)療衛(wèi)生事業(yè)的投入,穩(wěn)步提高社會保障統(tǒng)籌層次和水平;在資源利用與生態(tài)環(huán)境方面,要鼓勵采用無污染能源,加大綠化建設和環(huán)境治理力度,改善群眾居住環(huán)境和生態(tài)環(huán)境質量;在國民經濟素質方面,要深入實施創(chuàng)新驅動發(fā)展戰(zhàn)略,協(xié)同推進管理創(chuàng)新、模式創(chuàng)新、制度創(chuàng)新等各領域的全面創(chuàng)新。
(2)重視對網絡平臺熱點詞的監(jiān)控預警,深入分析熱點議題的發(fā)展趨勢、輿論傾向和情感態(tài)度,利用傳播中的首因效應、關聯(lián)效應和共振效應,抓住改變輿情意見流向和正負態(tài)勢的良好時機,從而避免刻板效應和暈輪效應。同時,政府部門要傾聽民聲、關注民情,適當以輿情研判數(shù)據(jù)為依據(jù)、以公眾需求為導向提高執(zhí)政能力,將互聯(lián)網上的社情民意與政府的施政努力相結合,把百姓的關切作為實現(xiàn)經濟高質量發(fā)展的工作重點,科學利用輿情數(shù)據(jù)為政府深入了解民情、制定順應民意的政策作鋪墊,不斷提升人民群眾的獲得感、幸福感和安全感。
參考文獻:
[1]DeakinM,ReidA.SustainableUrbanDevelopment:UseoftheEnvi⁃ronmentalAssessmentMethods[J].SustainableCitiesandSociety,2014,(10).
[2]FritzM,KochM.EconomicDevelopmentandProsperityPatternsAroundtheWorld:StructuralChallengesforaGlobalSteady-stateEconomy[J].GlobalEnvironmentalChange,2016,(38).
[3]任保平,文豐安.新時代中國高質量發(fā)展的判斷標準、決定因素與實現(xiàn)途徑[J].改革,2018,(4).
[4]金碚.關于“高質量發(fā)展”的經濟學研究[J].中國工業(yè)經濟,2018(4).
[5]張永恒,郝壽義.高質量發(fā)展階段新舊動力轉換的產業(yè)優(yōu)化升級路徑[J].改革,2018,(11).
[6]任保平,李禹墨.新時代我國高質量發(fā)展評判體系的構建及其轉型路徑[J].陜西師范大學學報(哲學社會科學版),2018,47(3).
[7]趙劍波,史丹,鄧洲.高質量發(fā)展的內涵研究[J].經濟與管理研究,2019,40(11).
[8]馬茹,羅暉,王宏偉,等.中國區(qū)域經濟高質量發(fā)展評價指標體系及測度研究[J].中國軟科學,2019(7).
[9]JeffersonG,HuAGZ.Ownership,PerformanceandInnovationinChina’sLargeandMedium-sizeIndustrialEnterpriseSector[J].Chi⁃naEconomicReview,2003,14(1).
作者:師榮蓉a,b,張教萌
級別:北大核心,CSSCI,AMI擴展
ISSN:1002-6487
刊期:進入查看
格式:咨詢顧問
級別:北大核心,JST,CSSCI,WJCI,AMI權威
ISSN:1002-4565
刊期:進入查看
格式:咨詢顧問
級別:北大核心,JST,CSCD,CSSCI,WJCI
ISSN:1002-2104
刊期:進入查看
格式:咨詢顧問
數(shù)據(jù)庫:SCI
ISSN:2045-2322
刊期:進入查看
格式:咨詢顧問
數(shù)據(jù)庫:SCI
ISSN:0284-1851
刊期:進入查看
格式:咨詢顧問
數(shù)據(jù)庫:SCI
ISSN:2352-4928
刊期:進入查看
格式:咨詢顧問
數(shù)據(jù)庫:SCI
ISSN:0169-4332
刊期:進入查看
格式:咨詢顧問
數(shù)據(jù)庫:SCI
ISSN:0960-7412
刊期:進入查看
格式:咨詢顧問