電商行業(yè)作為互聯(lián)網(wǎng)領(lǐng)域的重頭領(lǐng)域,早已深入人們的日常生活中。隨著人工智能技術(shù)的不斷突破,越來越多的行業(yè)正在被改造和顛覆。電商領(lǐng)域的海量數(shù)據(jù)與虛擬場景成為人工智能發(fā)展的天然土壤。目前,人工智能技術(shù)已經(jīng)逐步滲入到電商行業(yè)當中。隨著深度學(xué)習(xí)技術(shù)和語音識別技術(shù)的成熟,智能客服和智能商品推薦等應(yīng)用已在相關(guān)行業(yè)中得到了廣泛的應(yīng)用。
然而,人工智能技術(shù)能做的遠不僅僅是商品推薦和客服機器人。目前自然語言理解技術(shù)在整個人工智能領(lǐng)域中依然是一個有待探索的領(lǐng)域。電商行業(yè)或?qū)⒊蔀樽匀徽Z言理解技術(shù)最大的突破口,實現(xiàn)技術(shù)的成功落地。在技術(shù)實現(xiàn)應(yīng)該的過程中,人們針對電商中的不同場景進行了探索,并展開了豐富的事件嘗試。
一、電商行業(yè)的市場規(guī)模與發(fā)展趨勢
數(shù)據(jù)顯示,電商行業(yè)是一個快速發(fā)展的行業(yè),2017年,全球零售電子商務(wù)銷售額達到2.3萬億美元,電子零售收入預(yù)計將在2021年增長至4.88萬億美元。網(wǎng)上購物是全球最受歡迎的在線活動之一,但使用情況因地區(qū)而異。2016年,估計中國所有零售額的19%來自互聯(lián)網(wǎng),但在日本,這一比例為6.7%。隨著世界不斷的數(shù)字化和信息化演進,未來電商行業(yè)依然有很大的發(fā)展空間。
二、自然語音處理技術(shù)在電商行業(yè)中的最新應(yīng)用
文本聚類:可以通過文本聚類的技術(shù)對電商平臺網(wǎng)頁上產(chǎn)品信息內(nèi)容中的文本數(shù)據(jù)進行理解,從而為產(chǎn)品進行自動分類。經(jīng)過分類和整理的產(chǎn)品列表可以更好的為消費者提供產(chǎn)品信息,并進行有效的產(chǎn)品推薦服務(wù)。
機器閱讀理解:可以通過機器人閱讀理解技術(shù)對電商平臺上的產(chǎn)品描述內(nèi)容進行理解,找到文本內(nèi)容中的核心信息,并將解析出來的文本信息通過自然語言生成技術(shù)展現(xiàn)出來,從而實現(xiàn)自動化商品摘要介紹撰寫的工作。
自動化表單填寫:可以通過讀取電商客戶在網(wǎng)站上所留下的文字信息,將信息由價值的實體內(nèi)容識別并提取出來。通過這可以的技術(shù),電商平臺可以自動的從文本內(nèi)容中提取用戶的基本信息,并制作成便于應(yīng)用的表單。
情感引擎: 可以通過解析對消費者在電商平臺中的留言內(nèi)容,對消費者的情感和行為進行分析,對積極的情緒加以引導(dǎo),對消極的情緒及時安撫,從而更有效的服務(wù)對消費者。
命名實體識別: 可以通過解析電商平臺中產(chǎn)的文本內(nèi)容,快速的找到各種產(chǎn)品的名稱和實體信息,并未實體信息打標簽。這樣做可以有效的提升產(chǎn)品內(nèi)容信息檢索的速度和準確性。
三、自然語言處理技術(shù)在電商行業(yè)中的應(yīng)用分布
四、電商行業(yè)中自然語音處理技術(shù)落地案例
北京中科匯聯(lián):依托自主知識產(chǎn)權(quán)的智能質(zhì)檢系統(tǒng),構(gòu)建企業(yè)智能質(zhì)檢解決方案。中科匯聯(lián)智能質(zhì)量檢測系統(tǒng)涵蓋了在線手動客戶服務(wù)與客戶之間的每一次對話。 采用智能自動質(zhì)量檢測+人工審核,以提高在線手動客戶服務(wù)系統(tǒng)的服務(wù)質(zhì)量和工作效率。 在線客服智能質(zhì)量檢測系統(tǒng)涵蓋了手動客戶服務(wù)質(zhì)量和服務(wù)態(tài)度兩個質(zhì)量檢測維度,挖掘客戶服務(wù)對話數(shù)據(jù),并采用智能自動質(zhì)量檢測和人工審核相結(jié)合的方式自動生成質(zhì)量檢測報告。
京東與薄言科技:在其合作的POC項目中通過情感計算和意圖識別,實現(xiàn)用戶情緒識別和投訴行為預(yù)測。通過結(jié)合了深度神經(jīng)網(wǎng)絡(luò)和傳統(tǒng)特征工程方法。廣泛使用的深度神經(jīng)網(wǎng)絡(luò)模型依賴于深層次的網(wǎng)絡(luò)結(jié)構(gòu)。傳統(tǒng)特征學(xué)習(xí)對高頻特征敏感,可以避免過度擬合;而深層神經(jīng)網(wǎng)絡(luò)可以探索到深層語義,對數(shù)據(jù)處理過程和特征的依賴較少。
Weardex:Weardex是一家專注于深度學(xué)習(xí)應(yīng)用研發(fā)的初創(chuàng)公司。該公司的核心產(chǎn)品ViSenze能夠通過計算機視覺技術(shù)識別服飾圖片,以幫助用戶通過照片在網(wǎng)上找到自己所喜歡衣服。目前,Weardex正試圖把其視覺識別的應(yīng)用的與自然語言處理技術(shù)相結(jié)合,通過商品的照片自動撰寫出商品的描述。
eBay:eBay每天都有數(shù)億的新商品上架和數(shù)億次的搜索,產(chǎn)生的文字數(shù)據(jù)是海量的。eBay通過自然語言理解技術(shù)對數(shù)據(jù)進行處理和解析,通過實體識別和文本聚類的應(yīng)用對eBay網(wǎng)站上商品從不同的特征角度進行分類。分類和識別的技術(shù)可以使商品的檢索更加準確,同時也可以實現(xiàn)更有效的商品推薦服務(wù)。
Drift:整合文本相似度計算和自然語言生成技術(shù),通過垂直領(lǐng)域的知識庫加成熟的互聯(lián)網(wǎng)營銷方案,幫助各種中小型企業(yè)快速構(gòu)建定制化的智能客服助手。電商平臺可以快速的訓(xùn)練出一個垂直領(lǐng)域的知識問答引擎,支持近義詞和相似問句的匹配功能,能夠自動的拓展問答引擎的語料庫。
五、自然語言處理技術(shù)在電商行業(yè)中的局限性
自然語言解析技術(shù)有效的為電商平臺提升了運營的效率,同時提升了消費者的服務(wù)體驗。然而目前自然語言處理技術(shù)還尚未成熟,當中還存在一些局限。其局限主要體現(xiàn)在兩個方面,首先是數(shù)據(jù)的瓶頸。雖然每天都有海量的數(shù)據(jù)在電商領(lǐng)域中產(chǎn)生,但是這些數(shù)據(jù)很少可以直接拿來用于機器學(xué)習(xí)模型訓(xùn)練。第二是技術(shù)的瓶頸。目前人工智能只能輔助人類進行商品描述的撰寫,其內(nèi)容缺乏創(chuàng)造力和煽動性,對于商品廣告類的文字撰寫來說,這顯然是不夠的。
六、自然語言處理在電商行業(yè)中的發(fā)展趨勢
目前自然語言處理技術(shù)已經(jīng)在智能客服,商品分類,商品搜索這些領(lǐng)域中起到了舉足輕重的作用。但是對于整個電商領(lǐng)域,自然語言處理所能解決的問題還非常有限,更多的是輔助人類,幫助人類更好的完成工作。未來,電商領(lǐng)域會不斷產(chǎn)生更多的,結(jié)構(gòu)化的數(shù)據(jù),自然語言解析技術(shù)將會在電商領(lǐng)域中找到更多的落腳點,為商家?guī)砀捎^的價值,為用戶帶來更便捷的體驗。