在全球抗擊新冠肺炎(Covid-19)疫情方面,各種各樣的高新科技都有望“大顯身手”,其中最突出的是自然語言處理技術。無論是在抗疫一線,還是在社區(qū)管控、疫苗研發(fā)等大后方,自然語言處理技術發(fā)揮的作用都不可忽視。目前世界上有多個研究團隊使用該技術抗擊新冠疫情,并取得了可喜的成果。
在新冠疫情中,最早正式發(fā)出疫情警告的并不是世界衛(wèi)生組織或美國疾控中心,而是加拿大一家名為“藍點”(BlueDot)的健康監(jiān)測平臺;它早在2019年12月31日就向其客戶發(fā)出了提前疫情警告,避開危險區(qū)域。該平臺設計了疾病監(jiān)測分析程序,使用自然語言處理技術來篩選65種語言的新聞報道,以及航空公司數(shù)據(jù)和動物疾病暴發(fā)的報道,在疫情暴發(fā)之初發(fā)揮了監(jiān)測功能。
前不久,美國艾倫人工智能研究所發(fā)布了“新冠肺炎開放研究數(shù)據(jù)集”(CORD-19)的資源管理器以及全文本搜索引擎,并表示希望它可以幫助人們探索數(shù)據(jù)集并確定潛在的研究成果。該機構語言學家道格·雷蒙德博士說:“過去幾年,我們在自然語言處理方面取得了長足進步,CORD-19這類數(shù)據(jù)集的實用性可能會比幾年前更大,因為現(xiàn)在我們有了更多可用的工具?!?/span>
美國政府曾經(jīng)宣布聯(lián)合艾倫人工智能研究所、微軟研究院、美國國立衛(wèi)生研究院等機構共同發(fā)布有關新冠疫情的學術文獻的開放研究數(shù)據(jù)集CORD-19,并呼吁世界各地的人工智能專家采取行動,開發(fā)新的文本和數(shù)據(jù)挖掘技術,以幫助科學界回答與新冠疫情相關的高優(yōu)先級科學問題。其目的是為醫(yī)學和自然語言處理研究人員發(fā)布疫情數(shù)據(jù)集,以獲得有助于對抗此次疫情的真知灼見。
美國哈佛大學醫(yī)學院的研究人員借助自然語言處理技術最近開發(fā)出了一種工具,可以評估新冠患者的病例、社交媒體和健康衛(wèi)生數(shù)據(jù)。他們率先努力通過使用機器學習和大數(shù)據(jù)分析查看來自各種來源的數(shù)據(jù)和信息來尋找新冠病毒的解決方案。借助自然語言處理工具,他們還可以搜索有關新冠病毒的在線信息,并了解爆發(fā)的當前位置。
中國疾病預防控制中心的研究人員最近在使用科技巨頭阿里巴巴達摩院的自然語言處理技術開展病歷文本分析和流行病學調(diào)查工作,并取得了階段性成果。達摩院的研究團隊通過自然語言處理回顧性數(shù)據(jù)、使用卷積神經(jīng)網(wǎng)絡訓練CT影像的識別系統(tǒng),它可以快速鑒別新冠影像與普通病毒性肺炎影像的區(qū)別,最終識別準確率高達 96%。
智能問診系統(tǒng)能夠在線為病患提供問診服務,其使用應用語義理解、情感分析等自然語言處理技術,通過問題預判、意圖反問、分類識別、相似度匹配等方法,不僅能夠解答何種情況需要就醫(yī),還能實現(xiàn)疫情防控動態(tài)進展、科學防護知識、謠言鑒別等問題精準解答,并支持人機協(xié)作、自主學習、會話引導等功能。
在疫情防控期間,中國百度靈醫(yī)智惠推出的“智能咨詢助手”,包含新冠問題解答、標準化預問診路徑、在線醫(yī)生咨詢輔助三大模塊;它通過自然語言處理技術賦能在線健康咨詢平臺、政府疫情防控平臺、互聯(lián)網(wǎng)醫(yī)院等第三方平臺,助力其直接為公眾提供有關新冠的在線科普、在線咨詢,倍數(shù)級提升效率。
疫情發(fā)生至今,情況愈演愈烈,人們一邊要提防新冠肺炎的傳染,一邊又要不斷接受著海量的真假難辨的信息的轟炸。但對于后者,自然語言處理技術能夠幫助人們提取信息的主要觀點,識別文章情緒甚至分析文章的可信度;這在抗疫信息戰(zhàn)中將“謠言”粉碎,促進輿論生態(tài)良性循環(huán),從而為抗疫工作提供一份助力。
自然語言處理技術在對抗新冠疫情中發(fā)揮了重大作用。雖然自然語言處理技術不是萬能神藥,但可以幫助研究人員更快地從醫(yī)療數(shù)據(jù)中提取更有用的信息,挖掘其中的規(guī)律,從而加快疫苗研發(fā)進程,也有助于進行更有效的治療。自然語言處理技術在本次疫情中的應用證明其在分析醫(yī)療和臨床數(shù)據(jù)中大有可為。
由上可知,自然語言處理可以在抗擊新冠疫情中大顯身手,為打贏這場疫情攻堅戰(zhàn)提供了極為有效的技術支撐。有了自然語言處理技術相助,抗疫工作將變得更安全、更高效。正如中國著名學者周海中教授曾經(jīng)所言:“自然語言處理是極有吸引力的研究領域,它具有重大的理論意義和實用價值?!?/span>
文/李言(作者單位:德國人工智能研究中心[DFKI])