關于支持向量機應用精確診斷乳腺癌診斷
來源:用戶上傳
作者:
摘 要:相關研究表示,在社會經濟不斷發展的過程中,人們的飲食習慣及生活節奏也在不斷的變化,因此提高了乳腺癌的發病幾率。乳腺癌是否能夠治愈的重點為早發現、早診斷和早治療,現代醫學無法治愈晚期乳腺癌,所以在對乳腺癌治療過程中對預防重視。目前,一般都是使用超聲波顯像檢查、X分析診斷、臨床觸診、CT掃描及核磁共振成像對乳腺癌進行診斷,不同診斷方法都具有不同的優點和缺點。以此,該文就分析乳腺癌診斷中的支持向量機使用。
關鍵詞:支持向量機 乳腺癌 精準診斷
中圖分類號:TP391.4 文獻標識碼:A 文章編號:1672-3791(2019)03(b)-0169-02
該文對支持向量機在乳腺癌診斷中的使用進行分析。支持向量機的算法設計
假設具有訓練樣本數據集為:
其中的n指的是樣本數,m指的是χn維數??梢允褂贸矫妫?
w指的是法向量,b指的是偏置。如果得到最優wo及bo,那么就能夠得出支持向量機分類模型,使其作為線性判別函數通過以下公式表示:
以此預測未知樣本分類值,sgn指的是符號函數。
算法詳細步驟為:
其一,對樣本數據進行歸一化的處理,從而避免大數據覆蓋小數值。
其二,實現標簽數據值的規范化,兩個分類一般為1和-1。
其三,創建新函數K及懲罰參數C。在實驗過程中,先利用常用基本核函數訓練模型對測試精準率及訓練精度最優核函數的尋找。然后,通過核函數對最優新核函數進行尋找。以此,對基本核函數最好的性能充分考慮,最新創建的函數利用經驗風險和泛化能力綜合性能方面比較優,從而實現最佳分類效果,創建凸二次規劃問題。
其四,通過五折參數尋優,實現支持向量機分類模型的創建,通過模型在訓練集及測試集中對分類效果進行驗證,求總體樣本精準率。
其五,為了能夠提高模型分類效果的直觀性,將訓練集和測試集作為基礎繪制模型分類的效果圖[1]。
2 使用分析
2.1 實驗方案設計
該文實驗過程中的數據均為某院病理部數據,此數據共有692個樣本,惡性腫瘤有235個,作為正樣本,良性腫瘤共有457個,作為負樣本,利用活組織切片對全部樣本進行檢查并且確診,所有樣本中都有年齡和10個細胞病理特征。
在進行實驗的過程中,利用5次交叉驗證方法分組數據集并且對其測試,簡單來說就是隨機劃分數據為5組,每組循環作為測試集,其他都是訓練集。對每次分組利用的測試集及訓練集分類器進行測試和實驗。
2.2 分類結果和討論
使用總精準率Q、靈敏度sen及特異度SPE對分類器性能進行評價,其計算公式為:
TP指的是測試集中判斷準確正樣本數量,FN指的是測試集中判斷錯誤負樣本數量,TN指的是測試集中精準判斷負樣本的數量,FP指的是測試集中判斷錯誤的正樣本數量。Sen指的是測試集中正樣本靈敏度,Spe指的是負樣本特異度。Sen越大,說明正樣本識別具有較強的能力,能夠良好判別負樣本[2]。
對于SVM,在實驗過程中使用多項式核函數等,并且通過5次交叉驗證法進行測試和訓練。表1為SVM使用不同核函數測試結果,通過表1可以看出來,使用以上核函數分類對于數據集具有良好的精準度,Sigmoid核函數精準度是最高的。所以,對一定分類樣本來說,要想得到最優分類效果,優選核函數具有重要的作用,并且也表示SVM最佳核函數依賴樣本數據分布的情況。另外,通過表1還可以看出來,使用Sigmoid核函數的過程中,具有較高的分類靈敏度,多項式核函數時候的特異度是最高的,表示Sigmoidhe函數對于正樣本具有較高的識別率。
另外,對SVM和PNN、K-NN識別能力進行了對比,表示只有使用Sigmoid核函數的支持向量機精準度比較高,為96.24%。以此表示,使用Sigmoid核函數的支持向量機不急能夠提高正樣本識別率,還能夠良好地對乳腺癌患者和非乳腺癌病例進行識別,使人為導致漏診及誤診的幾率得到降低。
3 結語
該文根據臨床乳腺癌數據集,利用實驗表示該文的診斷特異度、精準率及靈敏值都比較高,說明使用該文方法能夠良好地診斷乳腺癌,從而提高乳腺癌的診斷效率,并且還能夠為醫生提供數據支持。
參考文獻
[1] 呂萍麗.基于支持向量機的乳腺癌診斷模型的設計[J].福建電腦,2015(8):17-18.
[2] 章永來,史海波,尚文利,等.面向乳腺癌輔助診斷的改進支持向量機方法[J].計算機應用研究,2013,30(8):2373-2376.
?、倩痦椖浚?018年度湖北省教育廳科學技術研究項目“支持向量機分類在乳腺癌電阻抗特性診斷中的應用研究”(項目編號:B2018488;項目負責人:汪慧玲)。
轉載注明來源:http://www.hailuomaifang.com/8/view-14835241.htm