生物識別技術作為新一代人工智能的重要領域,借助人體生理特征或行為特征進行身份識別。近年來得益于云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)、深度學習等信息技術的快速發(fā)展,生物識別技術在基礎理論、算法模型、創(chuàng)新應用、軟件支持等方面不斷取得突破。
目前,指紋識別、人臉識別已經(jīng)被大眾所熟知,但同樣作為生物識別的聲紋識別,還處于技術挑戰(zhàn)的前沿地帶。
據(jù)前瞻產(chǎn)業(yè)研究院分析,當下全球生物識別產(chǎn)業(yè)規(guī)模龐大,僅語音生物識別(注:即聲紋識別)這一細分方向的市場規(guī)模就將近百億美元,預計2020 年更是有望超過 200 億美元(合 1346 億元人民幣),占整個生物識別市場的 22.4%。
從網(wǎng)絡身份認證應用領域來看,據(jù)國外權威調(diào)研機構 MarketsandMarkets數(shù)據(jù)顯示,2019 年網(wǎng)絡安全市場預計增長至 1557.4 億美元,其中,身份認證信息安全市場規(guī)模將超過300億美元。聲紋識別在其中也將扮演重要角色。
根據(jù)公開資料統(tǒng)計出國內(nèi)20家聲紋識別企業(yè)。這些企業(yè)幾乎可以分為三大類,一是成立于2000年左右的以科大訊飛為代表的老牌語音廠商;二是成立于2000年~2010年的深耕聲紋技術的廠商;三是2012年之后借著AI東風成立的初創(chuàng)企業(yè)。這些老牌企業(yè)往往掌握有深厚的技術積累和核心專利,特別是少數(shù)幾家有高校和科研機構背景的企業(yè)。從融資進度來看,AI初創(chuàng)企業(yè)步調(diào)更快,也從一定程度上反映出行業(yè)風口機會的來臨。
國內(nèi)主要聲紋企業(yè)
聲紋識別主要應用領域及場景
聲紋識別技術分支-應用場景分布圖(圓圈越大代表成熟度越高)
(來源:中國首份聲紋識別產(chǎn)業(yè)發(fā)展白皮書)
國家公共安全
聲紋辨認技術首先在針對特定人群的國防安全、公安技偵、司法矯正等領域投入使用,有力保障了國家和公共安全。
泛金融
為防止盜刷等案件發(fā)生,將聲紋確認技術加入到交易支付中,通過動態(tài)聲紋密碼的方式進行客戶端身份認證,可有效提高個人資金和交易支付的安全。 2016到2018 年間,中國建設銀行、貴陽銀行、蘭州銀行、西安銀行、中國銀聯(lián)、中國互金協(xié)會等多家單位上線了聲紋識別身份認證服務,用于賬戶登錄、大額轉(zhuǎn)賬、無卡取款、密碼找回等業(yè)務場景。微信和支付寶也已上線基于聲紋動態(tài)口令的登錄方式。此外,在信貸業(yè)務中引入聲紋識別技術作為反欺詐手段,還可有效降低冒用他人身份進行騙貸以及多頭貸款等事件的發(fā)生率。
社會保險
城鄉(xiāng)養(yǎng)老保險是社會保障體系的重要組成部分,目前我國社保面臨三個問題: 加速進入老齡化社會,社保金管理存在冒領問題,現(xiàn)有解決冒領問題的方法成本高、效率低。利用聲紋識別技術有效解決參保人員的遠程和現(xiàn)場的身份認證問題,避免了指紋和人臉等需現(xiàn)場辦理、不易采集、易偽造等問題。
智能安防及個性化語音交互
利用聲紋確認技術,可完成個人日常生活中的各種事物訪問控制的授權,比如智能手機鎖屏、各類網(wǎng)絡賬號的聲控密碼鎖、電腦聲控鎖、聲控安全門、汽車聲控鎖等; 利用聲紋辨認技術,可支持智能音箱、智能語音助手等,針對不同年齡段的用戶提供個性化服務以及開放特定的功能權限等;通過語音識別和聲紋識別技術的結合,完成多人會議記錄。
目前這些新興需求大部分還處在探索階段。
5G將催生聲紋識別全新應用場景
在可預見的未來,身份識別將會有以下趨勢:多生物識別手段融合;能夠在自然情況下采集的非接觸式;能夠在互聯(lián)網(wǎng)上實現(xiàn)遠程識別且不易造假的方式。每一種生物識別技術都有其優(yōu)勢和劣勢,對于沒有屏幕和鍵盤或是屏幕非常小的智能硬件,語音是較為合理的操作方式,聲紋識別適用于這樣的驗證方式和服務入口。
不過,由于聲音信號的復雜性,聲紋識別在實際應用時仍然面對很多挑戰(zhàn),根據(jù)清華大學人工智能研究院所撰寫的《中國首份聲紋識別產(chǎn)業(yè)發(fā)展白皮書》,所提到的技術挑戰(zhàn)包括:
身份認證(聲紋確認):假冒攻擊、真實意圖檢測、低語識別等; 反欺詐(聲紋辨認):多說話人、短語音、語音掩蓋等; 文本無關:(錄音重放的)假冒攻擊、短語音; 文本相關:(錄音重放的)假冒攻擊; 文本提示:(錄音拼接重放)假冒攻擊; 共性:背景噪音、跨信道、時變(年齡變化)、身體狀況、(語速、音量、情感等)發(fā)音方式。
不過,隨著5G 催生全新應用場景,連接能力將增強至百億級,帶來海量的機器類通信及連接的深度融合。同時,網(wǎng)絡向云化、軟件化演進,加上高可靠、低時延、大容量的網(wǎng)絡能力,將使車聯(lián)網(wǎng)、物聯(lián)網(wǎng)、工業(yè)互聯(lián)網(wǎng)等領域獲得全新的技術賦能。語音作為最自然的人機交互方式,將迎來更多成長機會和更大的發(fā)展空間。