AI熱潮不減。過去一周,“雙馬對(duì)話”拉開世界人工智能大會(huì)的討論熱潮,同一時(shí)間, 百度在北京舉辦“百度云智峰會(huì)”喊出“AI工業(yè)化”的口號(hào)。京東云發(fā)布智能城市戰(zhàn)略。僅一個(gè)周末,由陌陌推出的AI換臉APP,一夜“ZAO”熱……
放眼國內(nèi),AI技術(shù)正展現(xiàn)大變革潛力,AI賽道也日益擁擠。站在今天回看,2017年或許是中國人工智能發(fā)展的一個(gè)重要節(jié)點(diǎn)。從那一年開始,人工智能風(fēng)起云涌。一夜之間,仿佛所有的公司都變成了人工智能公司,資本、人才向人工智能領(lǐng)域快速涌入?!叭斯ぶ悄堋背蔀榭萍冀?、學(xué)界、企業(yè)界最熱門、最受追捧的詞匯之一。而彼時(shí),科技巨頭Google、IBM等對(duì)人工智能的研究已逾十年,近幾年部分研究成果已經(jīng)進(jìn)入商業(yè)應(yīng)用。
從這些維度來看,人工智能可謂已經(jīng)迎來一個(gè)非常好的時(shí)代,但是熱鬧背后一些問題也浮現(xiàn)出來。在釋放巨大應(yīng)用價(jià)值和商業(yè)價(jià)值的同時(shí),人工智能的推廣使用也產(chǎn)生了一些“副作用”。個(gè)人隱私信息被非法采集、利用大數(shù)據(jù)實(shí)施精準(zhǔn)詐騙等,已開始露出苗頭;“人工智能可能拉大數(shù)字鴻溝、取代工作崗位”的猜測,也引發(fā)了一些擔(dān)憂。
人工智能需要“交通法規(guī)”
回應(yīng)社會(huì)上對(duì)人工智能的種種擔(dān)憂,又為這一技術(shù)保留了足夠的創(chuàng)新空間。前不久,國家新一代人工智能治理專業(yè)委員會(huì)發(fā)布了《新一代人工智能治理原則——發(fā)展負(fù)責(zé)任的人工智能》,明確了人工智能治理的框架和行動(dòng)指南。
這意味著,正在快車道上飛奔的中國人工智能多了一部“交通法規(guī)”。 作為一項(xiàng)影響深遠(yuǎn)的顛覆性技術(shù),人工智能技術(shù)可能帶來的“副作用”不可小覷。特別是在人工智能進(jìn)入實(shí)用的新階段,鼓勵(lì)創(chuàng)新和規(guī)范應(yīng)用必須雙管齊下。我國已是人工智能發(fā)展大國,盡早立下“包容共享、敏捷治理”等規(guī)矩,將為人工智能的健康發(fā)展保駕護(hù)航。
消除偏見,打造負(fù)責(zé)任的人工智能
在探討人工智能可能帶來的偏見和歧視問題時(shí),微軟的研究團(tuán)隊(duì),正在從稱為“單詞嵌入”的自然語言處理工具做起,試圖解決文本搜索中的性別偏見的問題。
所謂單詞嵌入,是一種用來將單詞轉(zhuǎn)換為向量數(shù)字的算法,它能夠以來自新聞數(shù)據(jù)或者網(wǎng)頁數(shù)據(jù)的海量文本數(shù)據(jù)為依據(jù),為每個(gè)單詞賦予一個(gè)對(duì)應(yīng)的向量數(shù)字。通過在向量坐標(biāo)系中,比對(duì)常見詞匯與“他”、“她”這兩個(gè)性別代詞之間的關(guān)聯(lián)度,研究人員發(fā)現(xiàn)了一些明顯的特征,例如“sassy(刁蠻)”、“knitting(編織)”這樣的詞更靠近女性,而“hero(英雄)”、“genius(天才)”更靠近男性。
算法之所以會(huì)為這些詞匯賦予性別特征,原因在于訓(xùn)練算法用的基準(zhǔn)數(shù)據(jù)集——通常是來自新聞和網(wǎng)頁的數(shù)據(jù)——本身就存在著由語言習(xí)慣造成的“性別偏見”,算法也自然“繼承”了人類對(duì)這些詞匯理解的性別差異。其結(jié)果就是,當(dāng)微軟用試驗(yàn)算法,根據(jù)梅林達(dá)·蓋茨的 linkedIn 信息推測其職業(yè)時(shí),得到了“教師”的判斷,但只要將人稱代詞換成“他”,蓋茨夫人的職業(yè)就會(huì)變?yōu)椤奥蓭煛?。為了解決這個(gè)問題,微軟的研究員提出了一個(gè)簡單易行的方案:在單詞嵌入中,刪除區(qū)分“他”和“她”的判斷維度,從基準(zhǔn)數(shù)據(jù)集中消除偏見。
AI芯片喧囂背后市場痛點(diǎn)猶存
AI芯片已成為中外科技企業(yè)競爭的焦點(diǎn)之一,以至于清華大學(xué)微電子所所長魏少軍用“無產(chǎn)業(yè)不AI,無應(yīng)用不AI,無芯片不AI”這樣的話語描述當(dāng)下的人工智能熱潮。
“我們離人工智能還有多遠(yuǎn)?目前很多企業(yè)所做的只是增強(qiáng)智能而不是真正的人工智能,離真正的人工智能還差得很遠(yuǎn)”。魏少軍表示,人工智能網(wǎng)絡(luò)能夠崛起取決于三個(gè)因素,算法、數(shù)據(jù)和算力。當(dāng)前,AI芯片面臨兩個(gè)現(xiàn)實(shí)問題:其一,算法仍在不斷演進(jìn),新算法層出不窮,每隔幾個(gè)月算法就發(fā)生新的變化;其二,一種算法對(duì)應(yīng)一種應(yīng)用,沒有統(tǒng)一的算法,而讓芯片處理不同的算法十分困難。
在魏少軍看來,AI芯片應(yīng)該具備的要素包括可編程性、架構(gòu)的動(dòng)態(tài)可變性、高效的架構(gòu)變換能力、高計(jì)算效率、高能耗效率、低成本等。按照這些要求,目前業(yè)界流行的一些做法均不是理想的架構(gòu)。過去幾年,AI芯片領(lǐng)域一個(gè)重要變化就是架構(gòu)的變化。人工智能芯片不在于追求算力,而在于架構(gòu)創(chuàng)新。業(yè)界也需要找到一種針對(duì)人工智能計(jì)算的全新計(jì)算引擎。
云從科技副總裁張立認(rèn)為,傳統(tǒng)芯片企業(yè)通常更關(guān)注是如何把芯片做成通用化,以支持各種不同應(yīng)用場景。但這樣的通用化,在AI場景落地時(shí)會(huì)遇到問題,比如公司對(duì)AI芯片考慮較多的是單位功耗,而芯片企業(yè)對(duì)功耗要求可能不是首要優(yōu)先級(jí)。公司在將AI場景落地的過程中,發(fā)現(xiàn)通用芯片完全滿足不了需求。這給從事AI解決方案和核心算法的企業(yè)帶來了難題——公司的算法是統(tǒng)一的,但需要在不同的場景適配不同的芯片和模組。
“目前,AI芯片發(fā)展還處在嬰兒期”。張立表示,現(xiàn)在企業(yè)使用的很多AI芯片因?yàn)楣に囈筝^高,很難在大陸流片,都是在臺(tái)積電進(jìn)行流片。同時(shí),也正因這工藝復(fù)雜度較高,導(dǎo)致芯片價(jià)格較高,使得下游很多使用其模組的產(chǎn)品無法量產(chǎn)。
AI+教育的變革與反思
日前,某人臉識(shí)別系統(tǒng)在課堂上的應(yīng)用在筆者朋友圈引起熱議。圖中顯示,兩名在教室中的女生身邊,顯示出了相應(yīng)的課堂行為數(shù)據(jù),比如趴桌子、玩手機(jī)、睡覺、聽講、閱讀、舉手等等。業(yè)內(nèi)某名嘴犀利點(diǎn)評(píng):非常反感這種應(yīng)用,且毫無意義!教育,跟養(yǎng)豬的區(qū)別還是蠻大的!
聯(lián)合國教科文組織在2019年3月份發(fā)布過《教育中的人工智能:可持續(xù)發(fā)展的挑戰(zhàn)和機(jī)遇》報(bào)告,比較系統(tǒng)綜合了各國人工智能和教育相結(jié)合的做法。報(bào)告的愿景是促進(jìn)人工智能教育可持續(xù)發(fā)展,但更重要的目標(biāo)是怎么樣體現(xiàn)教育個(gè)性化、包容化、公平性,驅(qū)動(dòng)教育管理步入全新的軌道,以及幫助學(xué)生為“就業(yè)革命”做好準(zhǔn)備。
上海市人工智能學(xué)會(huì)理事長、同濟(jì)大學(xué)企業(yè)數(shù)字化技術(shù)教育部工程中心主任、同濟(jì)大學(xué)教授張浩就曾指出,數(shù)據(jù)驅(qū)動(dòng)的智能教育主要考慮幾個(gè)因素:一方面是個(gè)性化“教”,作為教師,應(yīng)該體現(xiàn)教學(xué)中的個(gè)性化。過去老師都是猜,現(xiàn)在可以通過數(shù)據(jù)輔助。另一方面是個(gè)性化的“學(xué)”,以前的學(xué)生總是聽,現(xiàn)在可以通過個(gè)性化數(shù)據(jù)輔助,可以學(xué)得更有序,從此建立個(gè)性化學(xué)習(xí)模式。目前,大數(shù)據(jù)主要還是推動(dòng)個(gè)性化教育”。
未來學(xué)校的功能是轉(zhuǎn)變的,教育的內(nèi)容是轉(zhuǎn)變的,教育的環(huán)境也是轉(zhuǎn)變的。教育是永恒的話題,AI結(jié)合教育剛剛開始?!吨袊逃F(xiàn)代化2035》中提到“智能”為先驅(qū),以人才培養(yǎng)為核心,有四大方面的考量:提升校園智能化、新型教學(xué)模式、教育服務(wù)新業(yè)態(tài)、推進(jìn)教學(xué)治理方式變革。人臉識(shí)別在課堂上的應(yīng)用,相信只是AI落地教育領(lǐng)域的最初嘗試,經(jīng)過不斷的試錯(cuò)、調(diào)整,最終真正地輔助教育的目的。
人工智能要做高產(chǎn)值關(guān)鍵要以人為本
人工智能要做高產(chǎn)值不是什么難事,關(guān)鍵是要以人為本?!鄙虾H斯ぶ悄馨踩珜N瘯?huì)主任、中科院院士、計(jì)算機(jī)軟件專家何積豐表示:“上海人工智能的發(fā)展取得了很大的進(jìn)步,政府投入了大量的資源,給予了高度重視,但是在全面性方面仍然有待完善。
何積豐院士所說的全面性,是指要關(guān)注科研創(chuàng)新體制改革,以及關(guān)注新技術(shù)帶來的新挑戰(zhàn),包括人工智能的安全性、人工智能的人才培養(yǎng)、核心基礎(chǔ)研究的投入以及相應(yīng)的配套設(shè)施的建設(shè)。
以安全為例,何積豐院士援引數(shù)據(jù)稱,上海人工智能三年的產(chǎn)值規(guī)模要達(dá)到500億人民幣,五年產(chǎn)值規(guī)模要達(dá)到1000億人民幣。“要做高產(chǎn)值很容易,理論上一部分信息通信技術(shù)(ICT)行業(yè)的產(chǎn)值也可以算到人工智能領(lǐng)域。但要真正打造人工智能高地,讓人工智能服務(wù)于我們的社會(huì)經(jīng)濟(jì),還有很多工作要做。”何積豐院士表示。
他強(qiáng)調(diào),人工智能要解決的是基礎(chǔ)的算法問題,因此數(shù)學(xué)基礎(chǔ)研究很重要。他認(rèn)為,由于中國基礎(chǔ)研究長時(shí)間地被邊緣化,要鼓動(dòng)基礎(chǔ)研究人員參與其中需要更大的努力。此外,何積豐院士還強(qiáng)調(diào)應(yīng)讓人工智能技術(shù)與5G技術(shù)充分結(jié)合,盡快建設(shè)完善各類網(wǎng)聯(lián)基礎(chǔ)設(shè)施,讓城市完成智慧協(xié)同,實(shí)現(xiàn)精細(xì)化的治理。
無數(shù)據(jù),不AI
2018年,全球人工智能市場突破2700億元,其中中國超過360億元,相比2015年的203億元復(fù)合增長率為21%。飛速上揚(yáng)的曲線背后是科技發(fā)展的日新月異,于互聯(lián)網(wǎng)下半場,AI已經(jīng)成為很多公司、企業(yè)面向未來的武器和底氣。
與之對(duì)應(yīng)的是另外一組數(shù)字,據(jù)We Are Social公司統(tǒng)計(jì),全球獨(dú)立移動(dòng)設(shè)備用戶滲透率超過了總?cè)丝诘?5%,活躍互聯(lián)網(wǎng)用戶突破了40億人,接入互聯(lián)網(wǎng)的活躍移動(dòng)設(shè)備超過了50億臺(tái)。根據(jù)IDC預(yù)測,2020年,全球?qū)⒖偣矒碛?5ZB的數(shù)據(jù)量。
這是一組每天都處于千萬億次增長的數(shù)據(jù)曲線。
人工智能,算法是發(fā)動(dòng)機(jī),數(shù)據(jù)是燃料。對(duì)于大部分公司的AI業(yè)務(wù)來說,獲取海量而優(yōu)質(zhì)的標(biāo)注數(shù)據(jù)是進(jìn)行人工智能的先決條件。算法模型是計(jì)算機(jī)基于大規(guī)模的訓(xùn)練數(shù)據(jù)集,歸納出的識(shí)別邏輯,以實(shí)現(xiàn)精準(zhǔn)的物體和場景識(shí)別??梢哉f,實(shí)現(xiàn)機(jī)器精準(zhǔn)識(shí)別的重要一步,就是獲取海量而優(yōu)質(zhì)的標(biāo)注數(shù)據(jù)。
但在現(xiàn)階段工業(yè)界的AI應(yīng)用研發(fā),標(biāo)數(shù)據(jù)是一定跳不過去的,可能10年之內(nèi)都要依賴于標(biāo)數(shù)據(jù)?!币晃粯I(yè)內(nèi)人士表示。
就當(dāng)下而言,從最基本的構(gòu)建模式來看,數(shù)據(jù)是人工智能的原料;但如果將數(shù)據(jù)與人工智能技術(shù)的整體發(fā)展相比,如今數(shù)據(jù)的采集和標(biāo)注方式卻是后者發(fā)展的“木桶短板”。
這門生意正在進(jìn)步。從粗放型到如今的精細(xì)化運(yùn)作,數(shù)據(jù)的生意模式正在不斷升級(jí)。身處這個(gè)賽道的玩家們,則是給它做了最佳注腳。可以預(yù)測,“無數(shù)據(jù),不AI”將會(huì)成為常態(tài)。
結(jié)語
經(jīng)歷了這個(gè)夏天,AI熱度有增無減。但是相比最初由產(chǎn)業(yè)界、投資界所推動(dòng)的熱潮,現(xiàn)在學(xué)界和基礎(chǔ)研究領(lǐng)域也在逐漸產(chǎn)生一些革命性變革,人才缺口問題也越來越受到重視,有望從根源上得到解決。
用一麻袋的錢買書,書看完了,賣了書卻發(fā)現(xiàn)錢不夠買麻袋。生活中很多事情往往會(huì)落入這個(gè)套路。
無意于用這個(gè)邏輯來暗諷AI創(chuàng)業(yè)的某些亂象。只是希望熱潮退卻時(shí),不只是燒掉了投資人的錢,還有許多落在實(shí)處的有意義的應(yīng)用。
退一萬步說,讀書也好,投資也好,最重要的意義不在于是否能夠回收麻袋成本,而是在這個(gè)過程中明白,自己是否真的需要麻袋,以及在這個(gè)過程中,那些無法用金錢來衡量的收獲。