近日,阿里巴巴公開一項“語音識別方法及裝置”相關專利,該專利于2019年7月4日申請,2021年1月22日公開,公開號為CN112259089A。
根據(jù)專利摘要,本申請實施例提供了一種語音識別方法及裝置,涉及人工智能領域。其中,所述方法包括:獲取第一音頻樣本的音頻數(shù)據(jù)幀與第一音頻樣本對應的文本標注數(shù)據(jù)的上下文相關音素的第一強制對齊結果;基于第一強制對齊結果,確定第一音頻樣本的音頻數(shù)據(jù)幀關于待訓練的喚醒聲學模型的音素標注數(shù)據(jù);基于音素標注數(shù)據(jù),對待訓練的喚醒聲學模型進行訓練,其中,喚醒聲學模型的輸出層中設置有針對喚醒詞的喚醒詞相關輸出部分和喚醒詞無關輸出部分。
通過本申請實施例,使得訓練后的喚醒聲學模型在兼顧語音喚醒性能的同時,能夠有效降低對設備端的計算資源的使用。
阿里巴巴的這項專利很有可能用在智能設備上,如智能音響。2017年7月5日,阿里巴巴集團阿里云智能事業(yè)群推出AI智能終端品牌——天貓精靈,讓用戶以自然語言對話的交互方式,實現(xiàn)影音娛樂、購物、信息查詢、生活服務等功能操作,成為作為消費者的家庭助手。
去年5月,在天貓精靈發(fā)布會上,提出了“雙百計劃”,即將投入 100億元進行生態(tài)建設,與合作伙伴共同推出 100 款千萬級智能產品。