"新基建"持續(xù)升溫,人工智能作為其中的重要一環(huán),正在高速發(fā)展。4月7日,36氪"超級沙龍"直播欄目舉辦"新基建"專場,百度集團副總裁、深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程實驗室副主任吳甜以"智能時代的AI基礎(chǔ)設(shè)施建設(shè)與應(yīng)用"為題,結(jié)合百度在人工智能領(lǐng)域的技術(shù)成果和落地案例,對"AI新基建"進行了解讀。吳甜還在直播中"劇透", WAVE Summit深度學(xué)習(xí)開發(fā)者峰會將在五月舉辦,屆時會有一系列的核心能力發(fā)布。
吳甜在直播中表示,AI新基建是一項全方位工作,AI基礎(chǔ)設(shè)施則是其中的一個大型技術(shù)系統(tǒng)和工程系統(tǒng)?;贏I基礎(chǔ)設(shè)施的持續(xù)應(yīng)用和創(chuàng)新,將反哺AI基礎(chǔ)平臺,促進整個AI系統(tǒng)進一步進化。目前百度大腦已經(jīng)成為軟硬一體AI大生產(chǎn)平臺,在語音識別、視覺理解、語義理解、深度學(xué)習(xí)平臺等領(lǐng)域取得了重大突破進展,并在工業(yè)制造、能源電力等領(lǐng)域落地應(yīng)用,疫情期間,百度AI測溫、智能外呼、AI算法、CT影像分析模型等技術(shù)和產(chǎn)品,也在疫情防控過程中發(fā)揮了巨大的應(yīng)用價值。 AI產(chǎn)業(yè)化需要社會全方位多方整合力量創(chuàng)新,共生共贏的生態(tài)系統(tǒng)應(yīng)運而生,同時還要重視人才培養(yǎng),加大力度培養(yǎng)既懂應(yīng)用場景,又懂AI技術(shù)的復(fù)合型新型人才,促成應(yīng)用更加繁榮。
吳甜直播分享包含AI基礎(chǔ)設(shè)施、AI應(yīng)用價值、AI生態(tài)系統(tǒng)、AI人才培養(yǎng)四個方面,全文整理內(nèi)容如下:
大家晚上好!最近這段時間隨著加快新基建的要求提出,新基建的建設(shè)已經(jīng)成為非常重要的話題,我今天帶來的是關(guān)于人工智能新型基礎(chǔ)設(shè)施建的理解,后面我會簡稱為AI 新基建。新型基礎(chǔ)設(shè)施建設(shè)簡稱新基建,是以5G、人工智能、工業(yè)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)為代表的新型基礎(chǔ)設(shè)施,本質(zhì)上來說,它是信息數(shù)字化的基礎(chǔ)設(shè)施。AI新基建是非常新的概念,今天我分四個部分來介紹我對AI新基建的理解。
一、AI基礎(chǔ)設(shè)施
首先介紹的是AI新基建中最基礎(chǔ)、最重要的硬核部分——技術(shù)平臺。以百度為例,我們以AI技術(shù)平臺為核心構(gòu)建了一套AI基礎(chǔ)設(shè)施。
AI技術(shù)涵蓋的子領(lǐng)域非常廣,整個AI技術(shù)系統(tǒng)本身開放性很強,它和應(yīng)用場景也有非常多的結(jié)合,和應(yīng)用緊密相關(guān),而且會隨著應(yīng)用持續(xù)進化,所以它也并不是一成不變的,而是一個不斷演進、演化的系統(tǒng)。
百度大腦是百度AI技術(shù)的集大成,簡單的回溯一下百度大腦發(fā)展歷程。
在百度成立之初就已經(jīng)在大量使用AI技術(shù)了,比如在搜索引擎中使用自然語言處理、知識圖譜等技術(shù)。2010年開始,百度開始進行基礎(chǔ)能力的積累,AI布局也自此開始初具雛形。2016年,百度大腦完成基礎(chǔ)能力積累,AI能力開始逐步開放。2017年,百度大腦構(gòu)建了完整的技術(shù)體系,AI能力進入了全面開放的階段。2018年,百度大腦的核心技術(shù)進入到"多模態(tài)與深度語義理解"階段,"多模態(tài)"就是綜合語音、視覺、文本理解能力,并且是深度、多層次的語義理解,AI在這個時候開始多維度、多層次的開放。2019年,百度大腦進一步升級為軟硬一體AI大生產(chǎn)平臺,進入到AI能力和應(yīng)用場景的融合創(chuàng)新階段,廣泛的和各行各業(yè)場景結(jié)合,成為了AI時代的生產(chǎn)平臺。
先看一看AI大生產(chǎn)平臺是一個什么樣的平臺。這個名字大家可能會覺得有些黑盒,打開黑盒看,它的組成部分中,最基礎(chǔ)的是算力和數(shù)據(jù)平臺。在整個生產(chǎn)平臺上,深度學(xué)習(xí)平臺是底座基礎(chǔ),開發(fā)者可以在這個平臺進行自己AI應(yīng)用的開發(fā);這里也會有通用的AI能力,像語音、視覺、自然語言處理、知識圖譜一系列AI能力的調(diào)用;再結(jié)合到場景當中,有大量應(yīng)場景需要進行定制訓(xùn)練的需求,所以開放了定制訓(xùn)練平臺;最終整個平臺上積累的能力需要和業(yè)務(wù)系統(tǒng)進行部署和集成,所以也提供了部署與集成的工具與平臺,在此基礎(chǔ)上形成技術(shù)解決方案。整個大生產(chǎn)平臺有AI安全保駕護航,AI應(yīng)用中安全也是重要的話題。
從平臺底層向上,我們逐層看看各部分的含義以及現(xiàn)在的進展。最底層是AI基礎(chǔ)架構(gòu),這是整個AI大生產(chǎn)平臺的計算底層。隨著AI算法能力的提升,對于算力的要求是越來越高的,有這些算力的基礎(chǔ)資源,才有可能對大數(shù)據(jù)進行計算,最后產(chǎn)生AI算法模型。AI+5G的時代即將到來,未來計算將會無處不在,它會從云擴展到端、邊緣,在我們身邊就能夠時刻進行各種各樣的計算。在百度大腦上全新的AI計算架構(gòu)通過芯片層、互聯(lián)層、系統(tǒng)層、調(diào)度層,能夠進行協(xié)同設(shè)計和技術(shù)創(chuàng)新,最終可以提供百萬TOPS量級強大的計算力。與此同時芯片、系統(tǒng)、設(shè)備都能夠進行互相連接,將不同場景中的計算連接在一起,產(chǎn)生更大的計算能力。
百度在使用經(jīng)典的芯片基礎(chǔ)上,也有自研芯片,一個是云端通用AI處理器"百度昆侖",針對語音、自然語言處理還有圖像進行專項優(yōu)化,性能可以更加提升,同時百度昆侖和飛槳深度學(xué)習(xí)平臺進行了深度適配,使編程靈活度更高,能夠靈活支持訓(xùn)練和預(yù)測。同等性能下使用"百度昆侖",成本上可以降低10倍。這是云上的處理器,還有一款在端上的"百度鴻鵠",是專用于遠場語音交互的芯片,這款芯片采用新的設(shè)計理念,遵循軟件定義芯片全新設(shè)計思路,這里面也有相應(yīng)的核心參數(shù),能夠在100毫瓦功耗情況下,支持遠場語音交互核心的陣列信號處理和語音喚醒能力。這些會用于車載語音交互和智能家居產(chǎn)品場景,帶來低功耗、高性能的產(chǎn)品,也帶來更大的想象空間。鴻鵠芯片已經(jīng)實現(xiàn)了量產(chǎn),現(xiàn)在已經(jīng)在百度相應(yīng)產(chǎn)品當中使用了。
向下連接芯片,向上連接了應(yīng)用場景的就是深度學(xué)習(xí)框架及平臺,在AI時代幫助開發(fā)者快速便捷完成深度學(xué)習(xí)技術(shù)研發(fā),這是深度學(xué)習(xí)平臺的使命。深度學(xué)習(xí)平臺是智能時代的操作系統(tǒng)。
飛槳深度學(xué)習(xí)開源開放平臺上已經(jīng)構(gòu)建起了全方位、全功能的一套平臺,從飛槳的全景圖可以看出,飛槳在核心框架層能夠支持開發(fā)者進行開發(fā)、訓(xùn)練、預(yù)測,整個全流程的研發(fā)工作。百度在飛槳上還發(fā)布了自己以及百度行業(yè)伙伴一起打磨驗證的一系列工業(yè)級模型,建立了覆蓋自然語言處理、視覺、推薦、語音等主流AI算法的官方模型庫。
真實在場景當中應(yīng)用的時候,往往還需要端到端配套的開發(fā)套件,讓整個開發(fā)過程更加便捷、便利,并且能夠復(fù)用以前做好的各種各樣的積累。飛槳在語義理解、目標檢測、圖像分割、點擊率預(yù)估四大場景都有配套的套件,可以非常便捷的使用。
在深度學(xué)習(xí)各個方向上,飛槳平臺上也提供了相應(yīng)的工具組件,從平臺層使用的時候提供了服務(wù)平臺。這樣一個全方位的、全功能的平臺,其實是針對在眾多應(yīng)用過程當中不斷發(fā)現(xiàn)的應(yīng)用難題和挑戰(zhàn)建設(shè)起來的。飛槳平臺在開發(fā)的過程中,提供了便捷的框架,在訓(xùn)練過程當中提供了超大規(guī)模深度學(xué)習(xí)模型訓(xùn)練技術(shù),在部署上也是針對多端、多平臺全面部署的高性能的推理引擎,還有開源模型庫,綜合提供出來供產(chǎn)業(yè)使用。
介紹了算力、開發(fā)框架和平臺,再看幾大AI算法方向上目前為止最新的進展。
首先看一看語音識別方向,語音識別在AI算法當中是發(fā)展歷史比較悠久,目前也是可用性非常高的技術(shù),當然它也還持續(xù)有技術(shù)上的突破。百度上線了首個基于流式注意力的語音識別線上服務(wù),這也是在國際上首次實現(xiàn)在線語音識別中大規(guī)模使用注意力模型。這個技術(shù)使用以后,在語音輸入法場景下相對準確率有50%的提升,在音箱這類產(chǎn)品準確率提升到20%。隨著端側(cè)智能設(shè)備不斷廣泛使用,離線語音識別在無網(wǎng)、弱網(wǎng)狀態(tài)有越來越多的需求,百度語音技術(shù)團隊通過系統(tǒng)性優(yōu)化,解決了語言模型裁減性能損失問題,使離線模型有非常高的識別率。
語音合成方面,如果合成出來的聲音偏重于機械感,缺少情感,聽者在長時間聽的情況下會產(chǎn)生疲憊,所以音色模擬、情感模擬等,都會是語音合成技術(shù)需要突破的挑戰(zhàn)。百度推出的語音合成技術(shù),可以用20句話制作專屬的定制語音,將聲音當中的音色、風(fēng)格、情感等要素映射到不同的子空間,使用的時候不同要素進行任意的組合。在百度地圖上已經(jīng)推出了全球首個地圖語音定制功能,只需要錄制20句話就可以做成一個個人專屬的語音包。
視覺理解方面,這些年在OCR物體檢測、視頻理解、目標跟蹤等業(yè)界領(lǐng)先的圖像視頻技術(shù),百度多次在國內(nèi)外頂級賽事中取得佳績,并且在機械制造、金融、醫(yī)療、教育等領(lǐng)域得到非常廣泛的使用。
虛擬形象合成方面,在對大量語音、視覺以及文本的理解能力達到了非常好的水平之后,AI算法也在推進做虛擬形象合成,盡可能形成更加自然、更像真人、更加具有豐富情感的虛擬形象。百度虛擬形象合成技術(shù)其實結(jié)合了多模態(tài)識別和理解,語音識別、視頻理解等等,再加上面部、肢體、嘴形的生成能力,還有語音合成TTS的技術(shù),實現(xiàn)了業(yè)界首個可以進行量產(chǎn)視頻的真人形象的虛擬主播,在多個場景當中應(yīng)用,央視和百度合作打造過AI虛擬主持人小靈,在央視去年的五四晚會亮相;澎湃新聞和百度打造了第一個虛擬真人形象的主播,用在早晚新聞欄目上;浦發(fā)銀行和百度合作打造了業(yè)界首個金融數(shù)字人,有情感有專業(yè)的銀行知識,能夠提升銀行的客服體驗。
語音、視覺等技術(shù)在人工智能技術(shù)中屬于感知層技術(shù),類比于人的感知能力。人還有非常強的認知能力,對人工智能而言,認知能力主要體現(xiàn)在自然語言處理、知識圖譜等語言和知識類技術(shù)上。百度構(gòu)建了超大規(guī)模多元異構(gòu)知識圖譜,包括實體圖譜、事件圖譜、行業(yè)圖譜、關(guān)注點圖譜、POI圖譜,這些圖譜都會根據(jù)需求場景需要,不斷擴充和延展。
舉一個例子,基于知識圖譜視頻語義理解,從視覺視角上提取特征,通過語音識別對視頻當中人物的對話、言論等等進行語音的識別和提取特征,還可以對視頻標題以及周邊文本進行文本理解。這些基礎(chǔ)理解之后,再結(jié)合知識圖譜中的視頻理解子圖,在知識圖譜中進行計算和推理,對剛剛產(chǎn)生的理解的標簽、理解的特征進行補全、關(guān)聯(lián)等等一系列操作,最終用在產(chǎn)品上,將會對整個視頻內(nèi)容有更深度的理解。這是用感知技術(shù)和認知技術(shù)進行多模態(tài)融合的典型例子。
AI技術(shù)如果能夠完全、充分理解人的語言,將會是邁向通用人工智能技術(shù)非常重要的突破。這方面百度也持續(xù)有新的突破。百度推出的ERNIE是持續(xù)學(xué)習(xí)的語義理解框架,可以進行增強的語義理解。比如我們想讓AI算法理解實體,我們會用百科的內(nèi)容、網(wǎng)頁內(nèi)容進行實體識別任務(wù)的構(gòu)造,然后由預(yù)訓(xùn)練模型進行學(xué)習(xí),再對場景上進行針對性的fine-tuning,這樣可以得到實體學(xué)習(xí)更強的語義理解模型。再復(fù)雜一點的任務(wù),比如構(gòu)建因果關(guān)系的識別任務(wù),也是通過技術(shù)方式,構(gòu)造大量因果的知識,然后由大的預(yù)訓(xùn)練模型進行學(xué)習(xí),再進行任務(wù)上的調(diào)優(yōu)學(xué)習(xí)。百度ERNIE模型已經(jīng)學(xué)習(xí)了13億以上的知識,在NLP任務(wù)上全面刷新了任務(wù)效果,目前在共計16個中英文效果上超過了BERT、XLNet,取得了SOTA效果。這張圖展示出來的就是不斷加以新的知識,讓ERNIE在持續(xù)學(xué)習(xí)過程中,推動自然語言推斷、自動問答、文本相似度、情感分析任務(wù)上等等有持續(xù)不斷的效果提升。
以上是AI技術(shù)方向最新的進展概覽,百度大腦也打造了完整的AI安全體系,從基礎(chǔ)開源技術(shù)矩陣到開放行業(yè)解決方案,到與學(xué)術(shù)界、企業(yè)、政府、機構(gòu)等開放協(xié)作,整個技術(shù)產(chǎn)品已經(jīng)覆蓋到了云管端,以及大數(shù)據(jù)、云計算一系列風(fēng)險問題,這樣的安全體系也是為AI技術(shù)產(chǎn)業(yè)應(yīng)用有一個保駕護航的作用,可以推動AI時代安全生態(tài)的建設(shè),讓大家在使用AI技術(shù)開展各種各樣應(yīng)用創(chuàng)新的時候,沒有安全的后顧之憂。
剛剛以百度工作為例,詳細說明了AI新基建當中最基礎(chǔ)的技術(shù)平臺現(xiàn)在的狀態(tài),新基建不僅僅是技術(shù)平臺,所以接下來進入今天要分享的第二部分,AI應(yīng)用價值的創(chuàng)造。
二、AI應(yīng)用價值
百度AI技術(shù)應(yīng)用在互聯(lián)網(wǎng)產(chǎn)品當中,也已經(jīng)有大量的實踐,比如說AI賦能的智能搜索、信息流推薦、新一代人工智能地圖等等,以及AI為核心能力的智能家居小度系列產(chǎn)品,還有自動駕駛阿波羅等等,這些百度已有的產(chǎn)品上, AI已經(jīng)帶來了非常多的價值。另一方面,AI技術(shù)其實也已經(jīng)體現(xiàn)在面向各行各業(yè)的應(yīng)用價值了,我今天還想重點分享一下AI+云賦能產(chǎn)業(yè)變革與創(chuàng)新。
先看看這樣一個過程。首先我們需要先面對大量數(shù)據(jù)的生產(chǎn)和數(shù)據(jù)的應(yīng)用,所以我們在百度智能云上有推出數(shù)據(jù)工廠,在數(shù)據(jù)工廠當中通過數(shù)據(jù)眾包、加工、標注等一系列工作進行數(shù)據(jù)處理,也結(jié)合百度提供的數(shù)據(jù)集,以及整理的第三方行業(yè)數(shù)據(jù)資源,形成基本的數(shù)據(jù)集,在應(yīng)用當中通過數(shù)據(jù)管理、數(shù)據(jù)評測的平臺等等,使得整個數(shù)據(jù)能夠形成一個閉環(huán)效應(yīng)。完整的閉環(huán)數(shù)據(jù)會充分幫助算法達到最佳效果。數(shù)據(jù)生產(chǎn)之后會進入到模型工廠,在AI技術(shù)平臺支撐下,可以融合算力、數(shù)據(jù)、算法,結(jié)合場景產(chǎn)生模型,最終應(yīng)用到業(yè)務(wù)系統(tǒng)當中。
我分享一些應(yīng)用場景的案例。
智能工業(yè)巡檢。AI應(yīng)用于智能工業(yè)巡檢,在針對場景定義的問題上,主要是應(yīng)用圖像的分類、分割、檢測的方法,實現(xiàn)快速準確的識別。比如安全帽佩戴的檢測,尤其是礦井里的安全帽佩戴檢測,煙火的警報,儀器表的讀數(shù)識別等等,這其中應(yīng)用了AI的算法,相當于訓(xùn)練除了有經(jīng)驗的巡檢員,可以大幅減少人工投入,也降低了人工學(xué)習(xí)的成本。
智能質(zhì)檢。一線質(zhì)檢里面工人要進行很長時間工作進行零件質(zhì)檢,尤其是精密零件質(zhì)檢,零件非常小,這些質(zhì)檢工作需要在強光下進行,長時間在強光下看微小的瑕疵,容易造成工人眼睛的疲勞。案例里的工廠需要每天對出廠的2000多萬的產(chǎn)品進行檢測工作,質(zhì)檢員每天要檢測多達1萬多個零件,每分鐘每個工人需要檢測19個,還需要對零件從多個不同的角度的多個缺陷進行分類。用AI賦能的表面缺陷視覺檢測識別設(shè)備,它通過百度AI技術(shù)和云技術(shù),自動對物體表面缺陷進行大小、位置、形狀的檢測,并按照品質(zhì)分門別類分好,它總體上可以幫助節(jié)省90%的人員成本,整個設(shè)備相比起原來的工作桌,占地面積減少80%,漏檢率也大幅度降低。
這兩個都是感知層,視覺技術(shù)為主的應(yīng)用案例。感知層技術(shù)加上認知層技術(shù),就可以在智能媒體上發(fā)揮作用,通過熱點發(fā)現(xiàn)、智能寫作、智能勘誤,以及智能發(fā)布整個全流程,可以助力新聞的生產(chǎn)全流程。
今天還帶來了幾個在最近的抗疫過程當中,給疫情的篩查、管理帶來幫助的解決方案。首先是AI測溫,AI測溫是一套可以非接觸進行遠距離多人測溫的設(shè)備,現(xiàn)在也已經(jīng)在數(shù)百個場所部署,幫助全國各地完成了700萬人次的初篩工作。AI測溫的過程分為幾個方面,首先在行人路過的時候,通過紅外熱像儀能夠捕獲溫度,通過光學(xué)相機,攝像頭能夠不間斷地對戴口罩的多人進行遠距離的人臉檢測。這套方案也在企業(yè)內(nèi)部署,形成企業(yè)入場方案,測溫之后還可以進行人臉識別、智能監(jiān)控,并且如果同企業(yè)報備系統(tǒng)打通之后,可以自動識別員工是否符合復(fù)工入廠的要求。這里面采用的AI技術(shù)就是人臉檢測、跟蹤算法等,可以精準實現(xiàn)人臉定位,即使戴上口罩,現(xiàn)在也可以進行人臉識別。
在過去的兩個月大家已經(jīng)感受到了,社區(qū)工作者在整個抗疫管理中做了非常多的一線工作,百度推出的基于智能對話技術(shù)的外呼系統(tǒng)幫助進行人員的隨訪,能夠進行批量的外呼,人工智能語音隨訪通過自動的外呼系統(tǒng),觸達到人群,并和他們交流,進行防疫信息采集和疫情防控相關(guān)的提醒。這些信息也可以立即形成結(jié)構(gòu)化數(shù)據(jù)分析報告,支撐后續(xù)一系列的決策或者管理。整個外呼系統(tǒng)應(yīng)用了語音、自然語言處理、知識圖譜等等技術(shù)。
在醫(yī)護人員最忙碌的時候,護理信息數(shù)據(jù)采集、登記、錄入等等也是他們每天非常重要的工作,百度和相關(guān)的伙伴一起打造了語音臨床護理數(shù)據(jù)采集系統(tǒng),讓護理人員通過這樣的設(shè)備進行語音錄入。醫(yī)護人員不用摘掉手套、口罩,不用脫下防護服,可以非常輕松的手持設(shè)備進行語音錄入,很快就可以輸入大量護理信息,并將信息自動上傳至醫(yī)院的電子病歷系統(tǒng)。新冠肺炎相對應(yīng)的臨床數(shù)據(jù)中,有非常多的醫(yī)療專用詞匯、專業(yè)醫(yī)療符號等,我們語音系統(tǒng)也快速進行了定制訓(xùn)練,在醫(yī)護語音錄入場景中語音錄入準確率可以達到92%以上,這套系統(tǒng)已經(jīng)在煙臺市傳染病醫(yī)院多個科室部署使用。
病毒分析和疫苗研發(fā)也是抗疫工作當中非常重要的一個工作,在2019年百度曾提出了Linearfold算法,這個算法可以將病毒全基因組RNA二級結(jié)構(gòu)分析的時間從55分鐘縮短到27秒,大幅度提升RNA二級結(jié)構(gòu)分析的速度。我們知道RNA結(jié)構(gòu)分析在病毒分析和疫苗研發(fā)當中是非常重要的,這項工作發(fā)表了之后,受到了諸多業(yè)內(nèi)專家高度的評價,目前也是在和很多機構(gòu)進行合作,希望AI算法能夠助力醫(yī)學(xué)科技。
最后我還想分享的一個是飛槳和連心醫(yī)療開源肺炎CT影像分析模型,能夠提升在肺炎CT影像篩查當中醫(yī)護人員的工作效率,這個模型本身病灶檢測精度可以達到92%,召回率97%,湘南學(xué)院附屬醫(yī)院在應(yīng)用當中了。
這些都是AI技術(shù)和場景結(jié)合之后所帶來一系列的價值,這也是我今天分享的第二部分,就是技術(shù)不斷的在產(chǎn)生應(yīng)用價值,而這些應(yīng)用價值恰恰是作為新基建非常重要的。
三、AI生態(tài)系統(tǒng)
在我們與廣大的行業(yè)伙伴進行合作過程當中,我們也看到,對于大量企業(yè)來說,業(yè)務(wù)創(chuàng)新和應(yīng)用落地過程中存在著一系列的挑戰(zhàn)。比如說研發(fā)方面,AI技術(shù)的應(yīng)用門檻挺高的,開發(fā)周期往往不太可控,有經(jīng)驗的技術(shù)人員可以開發(fā)周期比較短,但是經(jīng)驗比較缺乏的研發(fā)團隊可能經(jīng)過較長的時間才能驗證、得到最佳的效果。很多企業(yè)在進行了AI加持的產(chǎn)品和解決方案研發(fā)之后,也需要有市場營銷以及相應(yīng)的整個過程需要大量的資金投入。我們希望AI技術(shù)能夠更便利的、方便的被廣大企業(yè)所使用。
所以百度大腦開放平臺構(gòu)建了多層次開放能力的結(jié)構(gòu),最基礎(chǔ)的有飛槳深度學(xué)習(xí)平臺,面向場景還有定制開發(fā)平臺以及開放的能力,以及最后的部署集成的一套過程。現(xiàn)在在百度大腦開放平臺上已經(jīng)開放了248項能力,整個百度大腦的日調(diào)用量超過萬億,在百度大腦開放平臺和飛槳平臺上進行開發(fā)的開發(fā)者超過180萬,發(fā)布模型10多萬以上,這些模型都在大量場景中使用。AI產(chǎn)業(yè)化落地整個鏈條比較長、比較復(fù)雜、角色很多,整個生態(tài)系統(tǒng)中從硬件供應(yīng)商到技術(shù)平臺、到軟件供應(yīng)、到應(yīng)用開發(fā)、到最后的終端場景,也是多層、完整的生態(tài)系統(tǒng),這樣一套AI生態(tài)系統(tǒng)也已經(jīng)形成了,并在基礎(chǔ)設(shè)施上不斷發(fā)揮作用。
剛才我介紹的應(yīng)用場景落地的方案,很多都是在百度大腦生態(tài)系統(tǒng)中研發(fā)落地的。
四、AI人才培養(yǎng)
有了技術(shù)平臺、終端場景以及生態(tài)角色,其實貫穿始終的還有非常重要的人工智能產(chǎn)業(yè)智能化相應(yīng)所需要的人才。AI人才中需要基礎(chǔ)的理論人才、算法人才,在應(yīng)用落地當中既懂應(yīng)用場景,又懂AI技術(shù)的復(fù)合型人才,這類人才更加重要。大的技術(shù)平臺型公司中有這類人才,但是想讓AI技術(shù)和產(chǎn)業(yè)廣泛結(jié)合時,我們會發(fā)現(xiàn)這類復(fù)合型人才更需要各個終端場景以及我們生態(tài)中的各個生態(tài)企業(yè)不斷培養(yǎng)和積累。技術(shù)邊界和業(yè)務(wù)理解本身是存在鴻溝的,怎么彌補鴻溝?就需要復(fù)合型人才來做。
所以百度推出了一系列對AI人才、應(yīng)用型人才的培養(yǎng)計劃,我今天介紹其中一個項目,"首席AI架構(gòu)師培養(yǎng)計劃"。怎么定義首席AI架構(gòu)師?我們認為在企業(yè)當中,懂自己的業(yè)務(wù)場景、懂應(yīng)用當中的挑戰(zhàn)與難題,又懂AI技術(shù)和算法,又同時能夠落地實施的綜合性人才,是企業(yè)當中的首席AI架構(gòu)師。對希望應(yīng)用AI技術(shù)進行智能化轉(zhuǎn)型的企業(yè),這類架構(gòu)師非常重要。所以我們推出了"黃埔學(xué)院"項目,在這個項目當中有深度學(xué)習(xí)技術(shù)專家進行面對面深度交流,會有深度學(xué)習(xí)技術(shù)落地的關(guān)鍵認知傳承,會和學(xué)員們一起剖析場景需求和AI技術(shù)學(xué)習(xí)的典型案例,最后總結(jié)AI思維、學(xué)習(xí)、工作方案解決實際場景問題,在實際場景當中產(chǎn)生應(yīng)用價值。
今天分享的主要是四個部分內(nèi)容,最后用一頁進行一個小結(jié)。
1. AI基礎(chǔ)設(shè)施是構(gòu)建于云平臺基礎(chǔ)上,以算力平臺和數(shù)據(jù)平臺支撐形成的AI技術(shù)開發(fā)平臺、能力平臺、場景技術(shù)方案綜合的、具備AI安全保障能力的大型技術(shù)系統(tǒng)和工程系統(tǒng)。
2.在基礎(chǔ)設(shè)施之上,要不斷在應(yīng)用場景當中發(fā)揮應(yīng)用價值,以此形成正向的循環(huán),能夠促進基礎(chǔ)平臺進一步發(fā)展,促進整個AI系統(tǒng)進一步進化。
3. 在AI產(chǎn)業(yè)化過程當中,因為其過程鏈條長、決策復(fù)雜,需要社會全方位多方整合力量進行積木式創(chuàng)新,因此共生共贏的生態(tài)系統(tǒng)就應(yīng)運而生了。
4.還要重視人才培養(yǎng),加大力度培養(yǎng)既懂應(yīng)用場景,又懂AI技術(shù)的復(fù)合型新型人才,通過構(gòu)建相應(yīng)的教育、培訓(xùn)體系以及職業(yè)體系保障,多方位培養(yǎng)AI技術(shù)及應(yīng)用人才。
綜合四方面,是基于AI新型基礎(chǔ)設(shè)施加速產(chǎn)業(yè)智能化需發(fā)展的幾個重要方向。