基于文本挖掘的大學生心理健康相關語義網絡模型分析
來源:用戶上傳
作者:王冬燕,張秀琴,周?d
摘要:在疫情的大環境下,大學生的心理健康狀況需要更多的關注。本文通過文本采集及分析工具和技術,對大學生較為關注的幾個心理健康方面進行了文本收集、預處理與文本挖掘分析。從語義網絡模型,可以看出大學生目前最關心的是情緒問題,其次是與他人的交往。高校教育者需要更多地關注大學生的情緒,在疫情期間,盡可能幫助他們創造更多的機會與他人交往。
關鍵詞:文本挖掘;語義網絡模型;心理健康
中圖分類號:TP311 文獻標識碼:A
文章編號:1009-3044(2022)32-0020-02
1 問題提出
疫情背景下,大學生心理健康問題尤為受到關注。國家也多次出臺《高等學校學生心理健康教育指導綱要》等文件,旨在強調心理健康教育在高校中的重要地位?,F在心理健康課程和心理咨詢都在高校中發揮重要作用,可是隨著疫情的發生,很多課程改為線上形式,這樣就不能讓學生體驗面對面的情感交流,因此在課程形式上也是不斷改進,希望能給予學生盡可能多的幫助。有研究表明,社會環境的變化會對人的心理產生巨大而深刻的影響[1]。因此為了彌補不能當面交流的情況,也為了能在疫情環境下更好地掌握學生當下的心態,同時順應“互聯網 + ”時代的課改要求,教師可以利用課余時間,讓學生以文字的方式寫下困惑或煩惱,以便在課程中有針對性地討論。而這些文本一方面可以作為課上討論的參考,另一方面,可以進行整體的分析,從而了解學生目前集中的心理問題點。
在心理現象的研究中,大多采用數據的形式,以及有關數據的統計分析方法,較少采用純文本的分析方法,除了質性研究。因此,想了解學生關注的問題有什么特點,如果用傳統的統計方法,很難對這種文本的描述方式進行分析,需要借助數據挖掘方法中的文本挖掘方法。文本挖掘(Text Mining)是從非結構化文本中獲取有用信息的[2]。文本挖掘也是機器學習的一種方法,可以幫助我們找到隱藏的相互關系。文本挖掘不強調文本的計算和定量分析,而是通過理論揭露隱藏的觀點和真相。文本挖掘的應用非常廣泛,尤其在輿情[3-4]、用羝蘭鄣確矯嬗τ媒隙[5-6],在心理學的研究中應用較少。一般會與網絡爬蟲技術結合使用,爬取文本信息后,再進行相關語義分析。文本挖掘過程需要從海量的文本信息中提取重要可用的信息,因此要經過文本整理、文本的分詞、提取高頻詞等一系列預處理過程,才能最終建立語義模型。而對文本進行預處理,詞的分割、單詞去除和特征提取等過程都十分重要[7]。本研究則利用ROSTCM6 軟件,對采集的學生問題文本進行分詞處理、高頻詞匯統計以及語義網絡模型的分析,使繁雜的文本內容得到提煉與簡化,從而了解學生較為關注的問題焦點在哪里。
2 研究方法
?。?)研究對象
南京中醫藥大學大一新生349名,在整學期課程中圍繞:自我意識、人際關系、戀愛與性、壓力與情緒四個主題,讓學生分別寫出自己的困惑,共收集有效問題490條。
?。?)分詞與詞頻整理
首先,需要進行數據的預處理。對于文本而言,就是將文本格式同一,并對內容進行過濾,例如將一些無意義詞或者出現次數較多的單字詞刪除。利用ROSTCM6 軟件的“分詞”功能對文本進行分詞[6]。分詞后,將與研究內容關聯程度較弱的詞,例如“怎么辦” “什么”等無意義詞刪除,并另存為新的分詞文件。
其次,對過濾過的分詞文件進行詞頻統計,得到一個較長的詞頻統計表,由于篇幅太大,詞頻頻數也逐漸遞減,因此只列舉前12個關鍵詞頻表,見表1。從表中可以看出,用于分析大學生關注的心理健康問題的高頻詞匯中,名詞主要有情緒、戀愛、自我、關系、朋友、他人和異性;而動詞則有認知、影響、交往、相處和控制??梢姶髮W生比較關注情緒、自我,以及交往中的各種問題。
?。?)建立語義網絡模型
從語義網絡模型看,有點類似神經網絡的樣子,都是由一個個節點組成。而詞語就是這網絡中的一個個節點,詞語之間的聯系(也就是節點之間的聯系)則表明了它們之間的相互關系。由于詞語是否共現,以及共現頻次的高低,也預示著節點不同的地位和角色。一般情況下,關鍵詞都反映了話題的討論熱點。有些詞與詞聯系緊密,有些則相對比較疏遠。因此通過語義網絡分析,可以發現隱藏的很多關系,對分析學生討論的話題熱點有一定的幫助。
利用分詞后刪除整理過的語句表建立語義網絡模型,經過分析,得到核心詞語義網絡分析圖,從網絡圖中可以看出數據內容的核心是圍繞“情緒”“自我”“戀愛”和“朋友”等關鍵詞展開,說明了大學生很關心的核心問題大概集中在這些方面。從語義模型分析圖中的箭頭指向,可以看出“情緒”和“自我”是學生困惑的主要來源,見圖1。
3 討論
從各個大學不斷完善心理健康課程與咨詢服務,可見大學生的心理健康狀況是很受重視的。在疫情背景下,大學生的心理健康更是需要更多關注。從語義模型中可以看出,首先,大學生最關心的就是情緒問題。包括從情緒節點出發的情緒認識、調節和控制等,以及回到情緒節點的他人的情緒、時常的情緒,負面的情緒怎樣去面對。其次,大學生很迫切地想要了解自己,從而能更好地投入友誼與愛情的關系中去。全面、完善、影響、偏差等詞都與自我緊密相關,而朋友與戀愛也都是從自我的發展中引出的。朋友和戀愛之間的關系也是十分微妙,較多的學生會糾結在是友誼還是愛情的困惑里。最后,本研究是在課程上,圍繞情緒、人際關系、自我和戀愛幾個主題來討論的,可是我們通常認為的最主要的人際問題,在語義網絡中都被分散到了其他主題中,比如他人的情緒的認識,自我與交友的關系,朋友和戀愛中的表達與聯系等,無不隱藏著人際關系的問題。再看學生的具體問題,比如“在別人面前表現負面情緒是不是不好”“很害怕拒絕他人,該怎么調整”“戀愛中能不能表現真實的自己”……大多數的問題都不僅僅是一個維度,里面都包含著自我的認知與成長,以及怎樣處理現在的關系,如何讓關系變得更好。因此,從語義模型中,會發現自我是學生關注的一個焦點,而在表1的詞頻中,大多高頻詞匯與交往有關,可見學生對良好的人際關系的重視與渴望。情緒與交往也是疫情環境下,比較容易出現困惑的方面,需要高校的管理者以及心理健康老師格外要關心,主動幫助學生去面對和解決的問題。
nlc202301131453
在大數據時代,每時每刻都會產生大量的數據。用人工或者傳統的心理統計方法,往往已經滿足不了研究者的需要,也會在處理復雜數據中產生更多的困難。心理學的研究也是會涉及更多跨學科的內容,比如說人工智能,如果還用傳統的實驗和測量也是不夠的,而且不能全面地反映問題。文本提取,為心理學研究提供了新的思路,在條件允許的情況下,我們可以做更多的主觀研究來代替客觀數據。對被試來說,有更大的發揮空間和自由,不必拘泥于固定的實驗范式或問卷描述。而研究者要做的,就是如何從主觀文本中獲得更多的相關信息與結論。雖然沒有了統計學的p值,準確性略有下降,但可以有效地提取大量信息,仍然可以給研究者帶來啟發和思考??傊?,文本挖掘技術易于理解且具有良好的可操作性,可重復性,便于心理學領域廣泛使用。
4 建議與結論
?。?)大學生關注的心理健康問題主要集中在情緒的管理和與他人的交往方面。另外,學生對這種能給予解答的課堂充滿興趣,而且可以得到同輩人的建議,對學生來說參與性十分高。大多數學生認為通過這種討論的方式,可以讓他們發現很多問題都是這個年齡共有的問題,因此更容易自我開導,反而使一些困惑很輕松地被解決,至少能被自己接受。
?。?)文本挖掘的方法可以很好地用于分析心理問題。文本挖掘和大多數據挖掘方法一樣,對數據的形式不是很嚴格,且能挖掘出一些意想不到的信息,這對在繁雜的心理現象中發現更多的關系,是十分有幫助的。
參考文獻:
[1] 俞國良,王浩.文化潮流與社會轉型:影響我國青少年心理健康狀況的重要因素及現實策略[J].西南民族大學學報(人文社會科學版),2020,41(9):213-219.
[2] 薛為民,陸玉昌.文本挖掘技術研究[J].北京聯合大學學報(自然科學版),2005,19(4):59-63.
[3] 姚麗梅,楊秋娜,繆林.基于新媒體文本挖掘的高校在線教學輿情事件分析[J].呼倫貝爾學院學報,2020,28(5):114-119.
[4] 楊單,程鍵,姚怡琦,等.基于文本挖掘的高校網絡輿情用戶情感分析研究[J].武漢紡織大學學報,2020,33(5):74-80.
[5] 孟令爽.基于文本挖掘技術的用戶產品評論研究[D].石家莊:河北經貿大學,2022.
[6] 劉音.基于文本挖掘的網購產品評論穩健情感分類研究[D].南昌:江西財經大學,2021.
[7] 張幸芝,雷潤玲,楊超.文本挖掘――基于ROSTCM和NetDraw的內容分析[J].科技文獻信息管理,2017,31(1):17-21,33.
【通編輯:李雅琪】
nlc202301131453
轉載注明來源:http://www.hailuomaifang.com/8/view-15444098.htm