久久99国产精品久久99_日韩在线第二页_日韩人妻无码一区二区三区久久_久久亚洲私人国产精品

咨詢(xún)熱線(xiàn):021-80392549

 QQ在線(xiàn)  企業(yè)微信
 資訊 > 人工智能 > 正文

人工智能讓手機(jī)語(yǔ)音輸入法快速增長(zhǎng)

2020/03/27386

人工智能讓手機(jī)語(yǔ)音輸入法快速增長(zhǎng)

大家都知道,在每個(gè)人每天高頻使用的手機(jī)應(yīng)用清單中,有一個(gè)低調(diào)而重要的存在:手機(jī)輸入法。賽諾不久前發(fā)布的《2018上半年中國(guó)手機(jī)輸入法分析報(bào)告》顯示:2018年手機(jī)輸入法市場(chǎng)規(guī)模將突破9.8億,環(huán)比增長(zhǎng)22.5%,其中活躍用戶(hù)占比超過(guò)54%,用戶(hù)規(guī)模和數(shù)量都保持持續(xù)增長(zhǎng)。

這并不難理解,輸入法是目前人機(jī)交互最重要的入口之一。而經(jīng)過(guò)二十余年發(fā)展,手機(jī)輸入法在“文字鍵入”這條單一路徑上,已幾乎抵達(dá)技術(shù)演化的盡頭——頗為欣喜的是,如今,在智能語(yǔ)音等AI技術(shù)的加持下,手機(jī)輸入法這個(gè)最接地氣的入口,正在擺脫文字鍵入的單一束縛,開(kāi)拓新的發(fā)展路徑,甚至在一定程度上擔(dān)當(dāng)著新技術(shù)“橋頭堡”的使命。

譬如百度8月1日公布的2018年第二季度未經(jīng)審計(jì)的財(cái)務(wù)報(bào)告顯示,百度營(yíng)收260億元人民幣(約合39.3億美元),同比增長(zhǎng)32%,凈利潤(rùn)64億元(約合9.67億美元),同比增長(zhǎng)45%。其中AI對(duì)百度業(yè)務(wù)的驅(qū)動(dòng)力顯著,除了DuerOS和Apollo,百度AI也為百度APP、信息流、手機(jī)輸入法等移動(dòng)端業(yè)務(wù)帶來(lái)了高效增長(zhǎng),李彥宏表示,百度輸入法語(yǔ)音輸入請(qǐng)求量短短一年時(shí)間內(nèi)成長(zhǎng)到日均3.35億次。相比于去年3月百度AI技術(shù)平臺(tái)體系(AIG)成立時(shí),日均語(yǔ)音請(qǐng)求量增長(zhǎng)5倍。在我看來(lái),這種迅猛上揚(yáng),一方面受益于百度語(yǔ)音識(shí)別自身體驗(yàn)的日趨完善;另一方面則受益于語(yǔ)音輸入已渡過(guò)市場(chǎng)教育階段,正在處于大規(guī)模爆發(fā)的風(fēng)口。

而通過(guò)百度輸入法的不斷迭代可以發(fā)現(xiàn),作為一款具備入口意義的應(yīng)用,手機(jī)輸入法早已不再是一個(gè)簡(jiǎn)單的“插件”,而是AI時(shí)代一款需要不斷打磨用戶(hù)體驗(yàn)的服務(wù)型產(chǎn)品。

效率至上

如你所知,在最新一版百度輸入法中,除了支持拼音、筆畫(huà)、五筆、手寫(xiě)和智能英文等基礎(chǔ)功能,最關(guān)鍵的技術(shù)躍遷,是智能語(yǔ)音輸入和AR表情兩大全新功能的上線(xiàn),這極大豐富了用戶(hù)的輸入體驗(yàn)。

先說(shuō)語(yǔ)音。

從諾基亞到iPhone,從功能機(jī)到智能機(jī),整個(gè)移動(dòng)時(shí)代,就是一部人機(jī)交互難度不斷下降,交互方式不斷豐富的歷史。而誠(chéng)如“互聯(lián)網(wǎng)女皇”米克爾所言:在最近數(shù)十年,人機(jī)交互每隔十年就會(huì)發(fā)生一次重大創(chuàng)新,語(yǔ)音則是當(dāng)下最高效的輸入方式。

在如今所有語(yǔ)音場(chǎng)景之中,大多數(shù)人最先接觸到的,就是手機(jī)輸入法的語(yǔ)音輸入功能。相較于手寫(xiě)和拼音等傳統(tǒng)方式,語(yǔ)音輸入效率更高,交互方式更自然,無(wú)論是主動(dòng)的技術(shù)嘗鮮者,還是快節(jié)奏生活下的被動(dòng)選擇,這種巨大的便捷性,都讓輸入法從文字向語(yǔ)音的大規(guī)模遷徙(至少在不方便打字的情景下),成為不可逆的演化趨勢(shì)。

數(shù)據(jù)也證明這一點(diǎn):《2018上半年中國(guó)手機(jī)輸入法分析報(bào)告》就顯示,在輸入方式選擇上,語(yǔ)音輸入占比已提升至41%,用戶(hù)習(xí)慣日趨養(yǎng)成;此外,更像是某種交叉印證,最近搜狗發(fā)布的第二季度財(cái)報(bào)顯示,其日均語(yǔ)音請(qǐng)求量也超3億次(頗值得玩味的是,作為一家“非專(zhuān)門(mén)”做輸入法的公司,百度輸入法官方公布的日均語(yǔ)音請(qǐng)求量是超過(guò)3.35億次,和搜狗不相上下)。

總之,一切都指向一點(diǎn):語(yǔ)音正在成為更多人輸入方式的必選項(xiàng),且他們一旦開(kāi)始用上語(yǔ)音,產(chǎn)生的黏性往往非常高,屬于典型的“一旦用上就離不開(kāi)”系列。

不過(guò),語(yǔ)音輸入的順暢,必須拜深厚的技術(shù)功底所賜,倘若準(zhǔn)確率不堪重用,反而會(huì)造成效率下降——所以說(shuō),“準(zhǔn)”是語(yǔ)音輸入最基本的素養(yǎng)。

令人欣喜的是,依托“百度大腦”的進(jìn)化,作為百度AI技術(shù)率先落地的產(chǎn)品之一,百度輸入法凝聚了百度深耕多年的語(yǔ)音、圖像、NLP和知識(shí)圖譜等AI能力——尤其是AI語(yǔ)音技術(shù),業(yè)內(nèi)皆知,目前識(shí)別率高達(dá)97%的百度語(yǔ)音曾入選MIT“全球十大突破技術(shù)”,并且在手機(jī)百度和百度地圖等產(chǎn)品中早已廣泛應(yīng)用,而隨著DuerOS朋友圈的持續(xù)擴(kuò)張,也會(huì)不斷“反哺”百度的語(yǔ)音技術(shù),這種得天獨(dú)厚的技術(shù)和生態(tài)優(yōu)勢(shì),是其他公司不具備的,也勢(shì)必會(huì)夯實(shí)百度輸入法語(yǔ)音請(qǐng)求量的領(lǐng)先地位。

當(dāng)然,在提高識(shí)別準(zhǔn)確率方面,百度輸入法并未停止進(jìn)化腳步,最近一次重大突破,就是其搭載了百度第二代深度尖峰技術(shù)(Deep Peak2)?!癉eepPeak2模型”的全稱(chēng)是基于LSTM和CTC的上下文無(wú)關(guān)音素組合建模,它最大的技術(shù)蛻變,就是將高頻出現(xiàn)的音素聯(lián)合在一起,形成一個(gè)音素組合體,然后將這個(gè)音素組合體視作一個(gè)基本建模單元。

這意味著,與在過(guò)往數(shù)十年業(yè)界常用的上下文相關(guān)建模方式相比,DeepPeak2能最大程度發(fā)揮神經(jīng)網(wǎng)絡(luò)模型的參數(shù)優(yōu)勢(shì),大幅提升中英文,多種口音和多種風(fēng)格(譬如朗讀,聊天,輕聲)混合輸入的穩(wěn)定性和準(zhǔn)確度,目前其相對(duì)正確率較行業(yè)領(lǐng)先水平提升20%。另外,難能可貴的一點(diǎn)是,不同于一些輸入法遇上“中英混輸”后瞬間變成“車(chē)禍現(xiàn)場(chǎng)”,DeepPeak2同時(shí)支持中英文混合建模,讓百度輸入法具備了非常強(qiáng)大的中英文混合識(shí)別能力。

事實(shí)上,此次百度輸入法的技術(shù)突破,并不令人意外。百度是中國(guó)最早通過(guò)深度學(xué)習(xí)技術(shù)在語(yǔ)音識(shí)別領(lǐng)域取得突破的公司之一,早在2012年就率先上線(xiàn)了基于DNN的語(yǔ)音識(shí)別模型。過(guò)去6年,百度語(yǔ)音一直沒(méi)有停止進(jìn)化,幾乎每年都會(huì)上線(xiàn)新的語(yǔ)音識(shí)別技術(shù)——如今DeepPeak2的上線(xiàn),亦是語(yǔ)音科技史上的一次巨大躍遷,要知道,之前國(guó)際上也曾有過(guò)類(lèi)似建模方式,但卻沒(méi)法避免建模時(shí)出現(xiàn)的過(guò)擬合問(wèn)題,而百度通過(guò)聲學(xué)模型學(xué)習(xí)和語(yǔ)言信息學(xué)習(xí)相分離的特殊訓(xùn)練方法,將建模單元數(shù)目減少了10倍,從本質(zhì)上解決過(guò)渡擬合的問(wèn)題,極大提升了識(shí)別準(zhǔn)確率,殊為不易。

而除了準(zhǔn)確率上的不斷精益,百度輸入法在語(yǔ)音輸入功能上,也不斷產(chǎn)生驚喜。譬如,百度輸入法具備輕聲識(shí)別能力,無(wú)論會(huì)場(chǎng)還是課堂,都能降低語(yǔ)音輸入的尷尬;它還具備語(yǔ)音速記功能,在這一功能的“多人模式”場(chǎng)景下,聲紋識(shí)別技術(shù)可以自動(dòng)區(qū)分發(fā)言人,大幅降低工作者后期處理的成本;除此之外,百度輸入法支持中文普通話(huà),中文粵語(yǔ),英語(yǔ)和日語(yǔ)等多語(yǔ)種識(shí)別;且能讓用戶(hù)通過(guò)語(yǔ)音完成語(yǔ)音撥號(hào)和語(yǔ)音搜索等功能,后者尤為重要,企業(yè)基因所致,百度輸入法擁有很強(qiáng)的搜索元素,你知道,聊天時(shí)突然出現(xiàn)搜索需求,是很常見(jiàn)的交叉應(yīng)用場(chǎng)景,通過(guò)百度輸入法自帶的搜索功能,可免去切換應(yīng)用帶來(lái)的時(shí)間折損。

總之不難發(fā)現(xiàn),在效率維度,百度正不斷推陳出新,讓輸入法成為人們?nèi)粘W钪档醚稣痰墓ぞ?,通過(guò)不斷夯實(shí)用戶(hù)的語(yǔ)音輸入習(xí)慣,延續(xù)著移動(dòng)時(shí)代人機(jī)交互難度不斷下降,交互方式不斷豐富的歷史脈絡(luò)。

打磨用戶(hù)體驗(yàn)

如果說(shuō)“效率至上”是一款輸入法的基本素養(yǎng),那么“可玩性”——或者說(shuō)愉悅感,則能進(jìn)一步豐富用戶(hù)體驗(yàn)的維度。而考慮到社交是手機(jī)輸入法應(yīng)用最多的場(chǎng)景(數(shù)據(jù)顯示,社交類(lèi)APP中輸入法占比高達(dá)74%),百度輸入法也一直在提升用戶(hù)在社交場(chǎng)景下的愉悅感。

舉個(gè)例子,百度輸入法中有70%是90后,其中60%的人經(jīng)常玩“斗圖”。針對(duì)于此,百度手機(jī)輸入法開(kāi)發(fā)了AR表情功能,基于百度多模態(tài)人臉識(shí)別系統(tǒng)(支持104點(diǎn)基礎(chǔ)模型加眼睛、嘴部、眉毛單例模型;全臉識(shí)別278點(diǎn)),能準(zhǔn)確識(shí)別面部輪廓和表情,用戶(hù)可制作出只屬于自己的表情、感覺(jué)和動(dòng)作,并直接通過(guò)輸入法搜索,語(yǔ)音輸入和鍵盤(pán)輸入時(shí)展示出來(lái)。且受益于AR表情功能識(shí)別速度快,表情文件小等特點(diǎn),用戶(hù)可在聊天中輕松使用,刻畫(huà)出自己在虛擬世界中的獨(dú)特形象。

百度AR趣味表情

AR表情功能的上線(xiàn)也意味著,百度輸入法是首家同時(shí)支持2D、3D表情以及通過(guò)人臉控制虛擬形象制作表情。而我相信,在可預(yù)見(jiàn)的未來(lái),AI和AR等新技術(shù)對(duì)輸入法產(chǎn)品的作用會(huì)越來(lái)越大,將會(huì)有更多新技術(shù)被添置到輸入法中。在百度的帶領(lǐng)下,作為新技術(shù)“橋頭堡”的輸入法,有可能進(jìn)入一個(gè)更靈動(dòng)的全感官輸入時(shí)代。

未來(lái)由現(xiàn)在筑造。不難發(fā)現(xiàn),依托百度強(qiáng)大的AI基礎(chǔ),無(wú)論是在“準(zhǔn)”這個(gè)基本面上的不斷深耕,輸入功能的不斷完善,還是可玩性和愉悅感的不斷提升,都是百度在輸入領(lǐng)域全方位了解用戶(hù)需求,不斷打磨用戶(hù)體驗(yàn)的體現(xiàn)。這種對(duì)用戶(hù)體驗(yàn)的打磨,也讓昔日功能單一的手機(jī)輸入法,具備了“語(yǔ)音助手”,“效率工具”和“聊天伴侶”等多重身份,并在不同用戶(hù)手上,得到不同程度的釋放。

正如百度高級(jí)副總裁、AI技術(shù)平臺(tái)體系(AIG)總負(fù)責(zé)人王海峰所言:“AI的發(fā)展最終還是要回到‘服務(wù)用戶(hù)需求’的本質(zhì),這是我們每一位人工智能從業(yè)者都需要銘記在心的。利用好人工智能來(lái)服務(wù)好我們的用戶(hù)和客戶(hù),以及更好地打磨AI能力來(lái)推動(dòng)各行各業(yè)的效率提升,是每一位人工智能領(lǐng)域從業(yè)者的期望。”

作為你我最重要的工具伴侶,手機(jī)輸入法本身正在變得“復(fù)雜”,卻讓生活和工作變得更為簡(jiǎn)單。在我看來(lái),這才是技術(shù)的本分。

關(guān)鍵詞:




AI人工智能網(wǎng)聲明:

凡資訊來(lái)源注明為其他媒體來(lái)源的信息,均為轉(zhuǎn)載自其他媒體,并不代表本網(wǎng)站贊同其觀點(diǎn),也不代表本網(wǎng)站對(duì)其真實(shí)性負(fù)責(zé)。您若對(duì)該文章內(nèi)容有任何疑問(wèn)或質(zhì)疑,請(qǐng)立即與網(wǎng)站(m.gzlyhb.com)聯(lián)系,本網(wǎng)站將迅速給您回應(yīng)并做處理。


聯(lián)系電話(huà):021-31666777   新聞、技術(shù)文章投稿QQ:3267146135   投稿郵箱:syy@gongboshi.com

工博士人工智能網(wǎng)
商城
服務(wù)機(jī)器人
智能設(shè)備
協(xié)作機(jī)器人
智慧場(chǎng)景
AI資訊
人工智能
智能機(jī)器人
智慧城市
智慧農(nóng)業(yè)
視頻
工業(yè)機(jī)器人
教育機(jī)器人
清潔機(jī)器人
迎賓機(jī)器人
資料下載
服務(wù)機(jī)器人
工博士方案
品牌匯
引導(dǎo)接待機(jī)器人
配送機(jī)器人
酒店服務(wù)機(jī)器人
教育教學(xué)機(jī)器人
產(chǎn)品/服務(wù)
服務(wù)機(jī)器人
工業(yè)機(jī)器人
機(jī)器人零部件
智能解決方案
掃描二維碼關(guān)注微信
?掃碼反饋

掃一掃,反饋當(dāng)前頁(yè)面

咨詢(xún)反饋
掃碼關(guān)注

微信公眾號(hào)

返回頂部