您好, 訪客   登錄/注冊

基于熵和神經網絡的世界語言人數預測模型

來源:用戶上傳      作者:

  摘 要:隨著時代的進步,全球的語言正發生著巨大的變化。語言的交流與人數增長趨勢將對經濟全球化的發展帶來影響?;谝陨蠁栴},我們用建立模型的方法,利用熵權法初步處理不同語言各個維度信息,再利用神經網絡來預測未來各語言人數的發展趨勢。
  關鍵詞:世界語言人數;熵權法;神經網絡
  近年來隨著科技的進步與世界文化的融合與交流,隨之而來的是語言的問題。目前地球上大約有6900種語言。說某種語言的人口總數受到多種因素的影響,比如移民政策,國際交流等。在學校、遷移的文化團體和移民國等地的人們很有可能會說第二語言。此外,在我們經濟全球化發展的的世界中,還有一些額外的因素使得地理上相距遙遠的語言可以相互作用。這些因素包括國際貿易的興起,世界旅行的增加,社交媒體與電子通訊的發達,以及技術的進步可以實現快速和簡單的語言翻譯。因此研究語言分布人口總數就有著重要的意義。
  1 研究方法概述
 ?。?)熵目前在工程與經濟等領域得到了非常廣泛的應用。根據信息論基本原理,信息用來度量系統有序程度,熵是用來度量系統無序程度;如果指標的信息熵很小,表明該指標擁有的信息量很大,在綜合評價中起著更大的作用,權重就會更高。[3]因此,我們可利用信息熵這個工具,得到每個指標的權重。
  (2)神經網絡。人工神經網絡是在現代神經科學的基礎上提出和發展起來的,旨在反映人腦結構及功能的一種抽象數學模型。[1]人工神經網絡基本神經元模型包括一組連接,一個求和單元和一個非線性激活函數還有一個閾值。連接中的強度用權值表示,權值為正表示激活,反之表示抑制。
  J(w)=12‖t-y‖
  J是輸出均方誤差,w是權值,t是期望輸出,y是實際輸出。
  通過訓練,我們不斷改變網絡權重,使輸出均方差最小化。[2]
  2 研究過程
  首先,我們收集關于每年說一種語言的人數的數據,以及使用該語言作為官方語言的主要國家的得分。我們希望根據人口增長和各種因素對增長率的影響來預測語言的人口分布。在此基礎上,我們構建模型。我們清楚地知道,每種語言的人口分布都與文化交流,經濟發展和國家政策等有關。我們的模型將考慮這些因素,以便能夠全面分析每個因素的變化對結果的影響。
  我們的觀點是,要預測每種語言中母語人口數量的變化,實際上要研究他們的增長率。事實上,有許多因素直接或間接地影響了人口的增長。因此,我們將這些因素分為兩大類:正面和負面。從這個角度來看,我們指的是影響增長率的以下因素:
  積極因素:國家收支平衡;對生活指數的滿意度;人類發展指數;智能手機普及率排名。
  消極因素:全球恐怖主義指數;脆弱國家指數。
  對于上述因素,我們需要知道影響程度,即每個影響因子的具體權重,為此我們引入了熵權法來評估這些因素。基于熵方法,我們計算每個影響因子的權重,通過上述權重,我們可以得到人口變化率的實際表達:
  r1=k1w1+k2w2
  r1是語言人口增長率,k是影響因子,w是權重。
  為了綜合考慮多種因素對語言數量變化的影響,我們用BP神經網絡對權重不斷的優化。我們使用BP神經網絡模型進行不斷的訓練,并獲得正確的權重,以便我們可以預測各種語言的人口增長模型。我們分析了前十名的語言并預測了人口的分布。
  3 結果分析
  在實際情況中,可以隨機獲得值矩陣中的值,并且根本沒有特定的順序。因此,我們使用數學軟件來模擬隨機過程并將數據帶入預測。根據結果顯示每種語言都是一個波浪上升的過程。除了比其他語言具有更大基距的中文外,其他語言相對接近。由于影響因素的影響,語言將有不同的增長趨勢,因此此時發生的變化將改變原始排名。
  第二語言人口預測,與我們處理母語人群的方式相同,我們還提到了兩個影響因素來預測每種語言的外語人口變化。以下是影響因素:世界旅游排名;世界移民排名同樣使用熵權法與神經網絡預測,我們得到了這些語言人數的發展趨勢通過收集前幾年的數據,收集的數據將在一定程度上與現有數據四舍五入。以中文為例,將數據引入神經網絡進行訓練,得到了預測結果。因此,由于諸多因素,雖然未來幾年會有一些增長,但人口增長將在2020年后逐漸放緩,最終趨于飽和。最后,基于神經網絡預測方法,我們得到了50年后每種語言的人口(總數)變化。我們通過預測預測后面沒有超過前10種語言,但內部排名已發生變化。例如,印度排名更高,而馬來西亞排名更低。
  4 結語
  在接下來的五十年中,特別是在2020年之后,每種語言的用戶數量將逐漸增加甚至變得飽和。前十種語言尚未被其他語言取代,但內部順序已發生變化。通過BP神經網絡算法對熵方法模型進行改進,預測各種語言用戶的發展趨勢,得到更加合理的結果在預測人數時,我們通過熵方法得到所有研究影響因子的權重,以便更準確地衡量每個因素對增長率的影響。并且通過神經網絡優化,預測結果可以更符合實際增長模型。此外我們的模型也有很多需要改進的地方:我們在假設我們收集的數據是正確的情況下構建模型,并且在數據收集和處理過程中可能存在一些主觀因素。而且當我們預測人口時,我們忽略了一些快速變化的因素,如國家政策和該地區的熱點。真正的體重變化會更復雜,考慮到這些因素需要進一步研究。
  參考文獻:
  [1]司守奎.數學建模算法與程序[M].第二版.海軍航空工程學院.
  [2]屈楨深.人工神經網絡理論及應用.哈爾濱工業大學.
  [3]倪九派,李萍,魏朝富,等.基于AHP和熵權法賦權的區域土地開發整理潛力評價[J].農業工程學報,2009,25(5):202-209.
轉載注明來源:http://www.hailuomaifang.com/1/view-14913011.htm

?
99久久国产综合精麻豆