語音合成技術應用的安全風險分析
來源:用戶上傳
作者:
國家計算機網絡應急技術處理協調中心廣東分中心 廣東 廣州 510000
摘 要 語音合成技術是人工智能實現語音交互的關鍵技術之一。目前語音合成技術已經越來越成熟并得到廣泛應用,但語音合成技術在應用上仍存在諸多問題,例如數據安全風險、網絡安全風險、信息安全風險等,尤其被應用于詐騙、不良輿論導向、反動宣傳等領域,這些黑灰產業或將阻礙其健康發展及產出,因此對語音合成行業進行監管已經勢在必行。
關鍵詞 語音合成;網絡安全;人工智能
現階段語音合成技術已經發展到能夠模仿人類的聲音、語氣和情感,其輸出的音頻明顯更接近自然真實人聲。這意味著,以往人類聲音特有的強生物特征將被弱化,機器通過模仿便能發出以假亂真的聲音,這種進步或將人類帶進一個真假難辨的境遇。
1 語音合成技術發展迭代迅速
語音合成技術(下簡稱“語音合成”)是人工智能時代實現人機交互[1]的關鍵技術之一,使機器能夠實時地將任意文本轉換成連續可懂的自然語句輸出,從而實現與人對話。從2016年下半年語音交互市場突然爆發,語音合成的技術手段和解決方案不斷更新迭代,幾乎每隔一個多月,語音交互的效果都會出現較大的提升[2]。
2 語音合成技術的廣泛應用
目前國內外市場上,語音合成技術已經成功應用在很多領域,包括語音導航、信息播報、有聲閱讀、廣告促銷、游戲娛樂等。語音合成以貼近場景需求的合成效果,主要在語音交互、閱讀教育、泛娛樂化三大場景中得以應用。
語音交互方面,隨著人工智能的發展,語音合成扮演著人工智能與人對話的自然語言輸出的重要角色。閱讀教育方面,語音合成通過將文本轉換成語音,解放了人們的眼睛,為人們提供了一種可以并行輸入的方式,在開車時、散步時、鍛煉時,都可以輕松獲取信息。在泛娛樂化場景中,以社交游戲為例,利用語音合成技術,可以實時轉換音色音調進行變聲,增加社交游戲的趣味性。
3 語音合成技術的黑灰產業應用
任何技術都是一把雙刃劍,語音合成廣泛應用于人們生活的各個領域,為人們提供高效、便利的生活方式,具備巨大發展效益的同時,一種不安分的情緒也蠢蠢欲動,語音合成的大量黑灰應用逐漸被曝光出來。
?。?)語音合成應用于詐騙。騙子通過盜取微信號和外掛軟件,制作“克隆微信”,不僅能夠完全盜取并復制用戶在微信平臺留存的語音信息,通過語音合成軟件加以處理實施詐騙,通過熟人的聲音進行詐騙的成功率更高一些。
?。?)語音合成應用于造假信息傳播。個人聲紋是一種強生物特征,能夠在一定程度上區分不同人物,因此也同個人指紋一樣被應用于加密領域。曾有人利用美國前總統奧巴馬的聲音,合成出一段批評特朗普總統的虛假視頻,引起軒然大波。這意味著音頻可以偽造的,音視頻已經不再能夠成為直接證據。
4 語音合成的安全風險
語音合成技術在實際應用中,確實存在著諸多安全風險,包括數據安全風險、網絡安全風險、信息安全風險、社會安全風險和國家安全風險。
?。?)數據安全方面,部分語音合成服務由境外企業提供,個人聲紋數據存儲于境外,數據安全難以監管,導致數據泄露而無法控制;同時,逆向攻擊等黑客技術可導致重要的內部數據泄露,個人聲紋作為個人信息數據同樣面臨著泄露的風險。
(2)網絡安全方面,與人臉識別一樣,聲紋特征也同樣被應用于加密、解鎖領域。不法分子或可利用聲紋復刻技術破解聲音鎖等加密機制,窺探個人隱私或盜取個人財產。
?。?)信息安全方面,語音合成可制作不良信息音頻進行傳播,制作虛假信息內容用以實施詐騙等非法活動。2017年,我國浙江、湖北等地發生多起犯罪分子利用語音合成技術假扮受害人親屬實施詐騙的案件[3]。
?。?)社會安全方面,語音合成技術可被應用于制造不良導向輿論,利用有影響力的公眾人物的聲紋制作虛假負面的音視頻,制造社會混亂,對社會安定造成威脅。
?。?)國家安全方面,目前我國正面臨著復雜的國內、國際形勢,各個地區、各個層面上的競爭對手們或單獨或聯合地對我國進行包圍,試圖破壞我國民族團結。語音合成技術通過聲紋采集的方式模擬他人聲音,過給國家領導人音視頻等配上不當言論,煽動民眾情緒,誤導輿論導向,威脅國家安全[4]。
5 語音合成技術亟須監管
語音合成實現走出實驗室,一方面加速了智能語音交互應用的發展,為科技進步和人工智能時代的發展提供了巨大支持;另一方面可拓展出持續發展的智能語音交互市場空間,推動人工智能的產業化進程,同時形成帶動力,促進新型產業的衍生和發展。
毫無疑問,這將更大化地改善人類的生活方式。但隨著語音合成不斷創新突破,應用場景日益增多,其安全風險也將動態演進,將越發具有廣泛化、場景化、融合化的特點,對人類生產生活、國家政治經濟等方面產生深遠影響。因此,在發展洪流中提前對安全風險有意識地規避,是明智之舉。
從國家和社會層面上看,任何技術和行業都需要標準規范,才能實現可持續發展的目標。語音合成在應用的時候,應注意加強防護個人信息數據安全,嚴審行業準入資質,對涉嫌違法亂紀的企業或程序嚴格查處;另外,密切跟蹤顛覆性的技術研究,組織科學家及時研判隱含的技術風險,完善學術規范和監管框架,為科技創新發展提供先進的技術指導和良好的發展環境,是促進社會向智能化快速發展。
參考文獻
[1] 白林豐,杜恩龍.語音交互技術重構出版[J].科技與出版,2018, (2):49-53.
[2] 陳孝良.語音交互為何迭代如此之快[J].科技導報,2017,35(3):92.
[3] Mehri S,Kumar K,Gulrajani I,et al. SampleRNN: An Unconditional End-to-End Neural Audio Generation Model[J].arXiv preprint arXiv,2016,16(12):78.
[4] 崔鑫彤.語音合成技術專利分析[J].電子技術與軟件工程,2018, (4):142.
轉載注明來源:http://www.hailuomaifang.com/1/view-14900336.htm