淺談機器學習與深度學習的概要及應用
來源:用戶上傳
作者:
摘 要:在20世紀五六十年代,“人工智能”這個術語就早已被正式提出。經歷了幾十個年代的發展,在AlphaGo擊敗李世乭時,人工智能(Artificial Intelligence)又受到了學者們的廣泛關注和研究,同時機器學習(Machine Learning)和深度學習(deep learning)也相應的被提及到,甚至作為了人工智能其中的一個發展方向去拓展。本文對機器學習和深度學習的概念進行了解釋與區分,從實際應用出發闡述了機器學習和深度學習的方向與應用,以及機器學習算法的分類。鑒于沒有系統的學習過,可能在許多地方會有出入,還望更多的人能夠有自己的思考。
關鍵詞:機器學習;深度學習;算法
1 定義與區分
隨著愈來愈多的學者對機器學習領域的深入探索,機器學習這個詞的不同解釋也出現了很多。其中,Arthur Samuel對機器學習的定義是指在沒有明確的設定情況下,使計算機具有學習能力的研究領域。計算機程序從經驗E中學習,為了解決某一任務T進行某一性能度量P,通過P測定在T上的表現因經驗E而提高,這是Tom Mitchell對機器學習的定義。[1]其實簡單來說,它是對數據分布進行建模,然后從大量看似無規律的數據中抽象出共性的模式。而深度學習是機器學習的一個子類,可以把它看作一種特殊的機器學習。深度學習的概念源于人工神經網絡的研究。深度學習是機器學習中一種基于對數據進行表征學習的方法,是一種能夠模擬出人腦的神經結構的機器學習方法。
先舉個例子來區分機器學習和深度學習,比如在識別貓和狗時,機器學習需要人工的將區別貓、狗的一些特征進行提取,而深度學習則自動找出分類問題的特征。因此,對于大量數據,使用深度學習較好,數據量少時,傳統機器學習更適用。機器學習在解決問題時需把問題的步驟分解,而深度學習直接得到結果,可以實現實時的效果。當然,深度學習在具備高效能的優點時,它對硬件的要求也很高,尤其對GPU的要求。
2 機器學習算法分類
機器學習算法分為監督學習、無監督學習、強化學習以及推薦系統四大類。監督學習(Supervised Learning)是給出帶有正確答案的數據集,通過算法得出更多的正確答案;無監督學習(Unsupervised Learning)是不提前告知算法,只給出一堆數據集。監督學習主要用于解決回歸問題(預測連續的數據值)和分類問題(預測離散值輸出)。如預測房價是回歸問題,根據某些已有的數據可以得出直線、二次函數或二階多項式。預測腫瘤的良性、惡性,只有兩種結果,是離散值的輸出,所以是分類問題。無監督學習中的聚類算法是將數據分簇,比如谷歌的新聞推送。
除了以上介紹的兩種分類,還有半監督學習,也就是強化學習。所謂的半監督學習其實就是在其算法中可能會有一些Y值,剛開始你的訓練模型可能訓練的結果并不好,但是如果訓練樣本增多,模型的結果也會更好。
3 機器學習應用領域
機器學習是當前的熱門話題,它應用于各個領域,同時也具有著巨大的潛力。在工業和基礎科學等很多領域都涉及了它的相關內容。
3.1 數據挖掘
數據挖掘是在大型數據庫中自動發現有用信息的過程,并將這些處理過的數據加以分析。數據挖掘是一門用數據發現問題,再去解決問題的學科。大部分數據挖掘中的算法是機器學習的算法在數據庫中的優化。數據挖掘中用到了大量的機器學習提供的數據分析技術和數據庫界提供的數據管理技術。[2]在醫療方面,通過數據挖掘處理患者的醫療記錄,得到重要的數據;在生物學研究中,通過對DNA序列數據的挖掘,找到相應的基因;能對信用卡風控進行評估,實行用戶流失的干預等。
3.2 自然語言處理(NLP)
自然語言處理,即是通過將用戶自然語言輸入計算機,再內部進行算法的加工和計算等步驟,來模擬人類對自然語言的理解,最后將接近人類所實現的結果呈現給用戶,其目的是用計算機來代替人工處理大規模的自然語言信息。自然語言處理技術在語音識別中有非常重要的作用,現在,不論是電腦還是手機都配有語音識別的功能,將機器學習中深層神經網絡(DNNs)技術引入語音識別,極大地降低了錯誤率、提高了可靠性。
3.3 圖像識別處理
將機器學習運用于圖像處理,通過分類并提取重要特征而排除多余的信息從圖像中識別出相關的模式,例如百度識圖、手寫字符識別、車牌識別等等應用。通過這種用深度卷積神經網絡CNN用來識別圖像中物體的方法可以實現將圖像中的對象轉換成對圖像場景進行描述的語句。[3]
4 總述
機器學習應用的領域很多,像大型互聯網公司的推薦類功能、人臉識別相關功能、以及無人駕駛等都是利用機器學習技術實現的,我們的生活也在隨著這些相關技術而改變。機器學習和深度學習的發展也帶動著人工智能的進步,深度學習模擬了人腦構造,采用了現在應用廣泛的神經網絡技術。深度學習真正實現了人工智能的突破,在機器中融入了神經網絡的思想,讓機器人時代更有可能到來。在其他各個行業,也將更需要機器學習和深度學習的相關技術。
參考文獻:
[1]機器學習[M].機械工業出版社,2003.
[2]蘇磊.數據挖掘在院校信息資源管理中的應用[J].電腦知識與技術,2016,(5):224-225.
[3]黃毅晟.基于移動端圖像識別的題庫采集模型實踐研究[J].中國信息技術教育,2016,(12):75-78.
轉載注明來源:http://www.hailuomaifang.com/1/view-14813452.htm