對(duì)話黃仁勛:5年革命機(jī)器人產(chǎn)業(yè),AI芯片將會(huì)無處不在
昨天,英偉達(dá)2017 GTC China(GPU技術(shù)大會(huì)中國分會(huì)場)在北京舉行,智東西作為特邀媒體,從Keynote大廳第一排發(fā)來CEO黃仁勛主題演講的重磅報(bào)道。
演講后,黃仁勛又接受了智東西等媒體的專訪,這位粉絲愛稱“老黃/黃教主”的CEO幽默且健談,不僅談及計(jì)算力、機(jī)器人、AI醫(yī)療、自動(dòng)駕駛等問題、還與智東西交流探討了關(guān)于“英偉達(dá)云”以及最近大火的“AI芯片”。
(智東西記者與老黃的合影)
一、“AI芯片”將無所不在
從最近的華為麒麟970、到蘋果的A11,AI芯片/端智能似乎已經(jīng)越來越成為趨勢所在,AI在終端的落地也已經(jīng)從軟件層步入硬件層。那么這是否意味著未來我們將從云智能走向端智能呢?
面對(duì)智東西的這個(gè)問題,黃仁勛首先回答——未來是“云智能+端智能”的時(shí)代,AI將無處不在。
未來,像咖啡機(jī)、保溫杯、麥克風(fēng)、甚至耳環(huán)、鞋子這些小物件都會(huì)智能化,但是它們的處理芯片并不需要特別強(qiáng)大的通用智能,而是針對(duì)非常窄的專門領(lǐng)域進(jìn)行智能化,比如一個(gè)麥克風(fēng),只需要聲音方面的AI處理能力。
而云智能將會(huì)是通用智能,視覺、聲音、數(shù)據(jù)等等,需要擁有一切AI處理的能力。而英偉達(dá)這些高性能、大功耗的GPU在云數(shù)據(jù)中心上有著切實(shí)的用武之地(比如老黃在上午的演講中就特別提到了與BAT三朵云的合作,以及又宣傳了一下基于新GPU Tesla V100推出的HGX云計(jì)算服務(wù)器)
不過,目前英偉達(dá)主打終端的GPU板卡是Jetson TX2,這塊搭載4核CPU的Pascal架構(gòu)GPU標(biāo)準(zhǔn)功耗為7.5W,遠(yuǎn)小于英偉達(dá)其他動(dòng)輒幾十上百W的GPU,但對(duì)于功耗極為敏感的超小型設(shè)備,這個(gè)功率還是太大。
為了解決這一問題,英偉達(dá)于昨天正式開源了DLA(深度學(xué)習(xí)加速器)架構(gòu),廠商可以免費(fèi)下載這個(gè)專為IoT設(shè)備設(shè)計(jì)的AI架構(gòu),自己打造低功耗的AI芯片。
二、“英偉達(dá)云”在十月第一周推出
在今年5月時(shí),英偉達(dá)曾在美國主會(huì)場舉辦2017 GTC,并且推出了“英偉達(dá)GPU云(NVIDIA GPU Cloud)”。
先別誤會(huì),英偉達(dá)并不是在和亞馬遜AWS、微軟Azure搶生意的,這個(gè)“英偉達(dá)云”是在這些云上運(yùn)行的,并不為用戶提供儲(chǔ)存、計(jì)算等能力,而是可以理解成一套線上深度學(xué)習(xí)軟件集合。
這個(gè)英偉達(dá)云能讓人輕易地從零開始搭建一個(gè)深度學(xué)習(xí)的項(xiàng)目,不用買GPU、也不用搭環(huán)境,控制中心還是可視化的,可以看到你的賬號(hào)之前的項(xiàng)目和正在運(yùn)行中的項(xiàng)目,非常方便。
從當(dāng)時(shí)的DEMO中可以看出,用戶登錄了英偉達(dá)云之后,只需要3步就可以創(chuàng)建自己的深度學(xué)習(xí)項(xiàng)目:
1、選擇計(jì)算環(huán)境(既可以選擇英偉達(dá)云、亞馬遜云等,也選擇本地GPU計(jì)算)
2、接入數(shù)據(jù)庫(可以選擇現(xiàn)有數(shù)據(jù)庫如ImageNet,或者自己上傳)
3、選擇框架(如Caffe、TensorFlow等)
在本次GTC China上,黃仁勛并沒有宣布關(guān)于這個(gè)英偉達(dá)云的新進(jìn)展,智東西專門就這個(gè)問題詢問了黃仁勛。老黃表示,英偉達(dá)云項(xiàng)目進(jìn)展很順利,如無意外今年十月的第一周就能正式跟大家見面了。
三、5-10年內(nèi)革命機(jī)器人產(chǎn)業(yè)
同樣是在昨天上午的Keynote演講里,黃仁勛再次介紹了ISSAC機(jī)器人訓(xùn)練平臺(tái),并且正式宣布推出了世界第一款用于自動(dòng)機(jī)器人的處理器(芯片)Xavier,為機(jī)器人提供從軟件到硬件的全方位支持。
Xavier芯片已經(jīng)用在京東的倉儲(chǔ)機(jī)器人jROVER+京東送貨無人機(jī)jDRONE等一系列自主機(jī)器當(dāng)中。它集成了8核CPU、Volta TensorCore &CUDA GPU、傳感器、8K HDR VP、以及CVA。
可以應(yīng)用在30TOPS的計(jì)算機(jī)視覺、深度學(xué)習(xí)等機(jī)器人所需要的技能領(lǐng)域,有著超高計(jì)算力與超高能效比。這款處理器將于2018年第一季度提供給早期合作伙伴,2018年第四季度全面推出。
ISSAC則是今年5月英偉達(dá)推出的用于訓(xùn)練機(jī)器人的增強(qiáng)學(xué)習(xí)世界模擬器(ISAAC Robot Simulator)模擬真實(shí)世界的邏輯、原理、物理定律等,然后再將機(jī)器放進(jìn)這個(gè)世界里不斷訓(xùn)練,并且不用遵循物理時(shí)間規(guī)律,將原本需要幾年的訓(xùn)練壓縮到幾天甚至幾個(gè)小時(shí)。
老黃認(rèn)為,現(xiàn)在再看機(jī)器人,需要忽略傳感器、電氣化、自動(dòng)化等等傳統(tǒng)機(jī)械問題,轉(zhuǎn)而關(guān)注于AI及自主機(jī)器(Autonomous Machine)。而想要打造自主機(jī)器人,則需要解決三個(gè):
1)創(chuàng)造一個(gè)用于自主機(jī)器的AI平臺(tái),比如增強(qiáng)學(xué)習(xí)。
2)創(chuàng)造一個(gè)虛擬環(huán)境,讓這些機(jī)器人在其中自己學(xué)會(huì)”怎么當(dāng)一個(gè)機(jī)器人(learn to be a robot)”。
3)當(dāng)這些機(jī)器人學(xué)會(huì)怎么當(dāng)機(jī)器人之后,我們海需要把AI大腦拿出來,放進(jìn)一個(gè)專用的自主機(jī)器處理器中。
目前的這三個(gè)問題還沒有完全解決,但是老黃表示,我們已經(jīng)在努力啦!AI引擎、ISSAC虛擬機(jī)器人訓(xùn)練平臺(tái)、還有Xavier處理器,英偉達(dá)的這三項(xiàng)工作正在并行推進(jìn)中,屬于一個(gè)打造產(chǎn)業(yè)基礎(chǔ)架構(gòu)的“打地基”過程。預(yù)計(jì)到了明天,這些“地基”就能打好了。
基礎(chǔ)都打好后,產(chǎn)業(yè)界就可以在這些基礎(chǔ)架構(gòu)上快速推動(dòng)生產(chǎn)。老黃預(yù)測,在未來5-10年間,這些將會(huì)為機(jī)器人產(chǎn)業(yè)帶來難以置信的進(jìn)步。
智東西隨后也針對(duì)Xavier、ISSAC等話題跟英偉達(dá)智能機(jī)器副總裁Deepu Talla進(jìn)行了專訪,后續(xù)將會(huì)有詳細(xì)報(bào)道,敬請(qǐng)期待~
四、GPU、CPU、ASIC之爭
1)GPU不會(huì)取代CPU
首先是CPU,雖然在昨天上午的主題演講中,老黃拿CPU開了不少涮,但是他認(rèn)為歸根到底,GPU永遠(yuǎn)不會(huì)取代CPU。CPU擅長處理所有問題,是通用處理器,而GPU則更適合處理專用問題,有時(shí)甚至能有著數(shù)十上百倍的性能優(yōu)勢。
因此,CPU+GPU的架構(gòu)才是合理的。
2)比ASIC更靈活,市場更大、生態(tài)系統(tǒng)更豐富
正如前文所說,隨著谷歌TPU、蘋果A11等產(chǎn)品的推出,各公司打造自己定制化的AI芯片似乎已經(jīng)越來越成為趨勢所在。這種定制化AI芯片屬于ASIC(專用集成電路,Application Specific Integrated Circuit),是根據(jù)特定的需求而專門設(shè)計(jì)并制造出的板卡。
由于是針對(duì)某種AI功能打造的,ASIC較之GPU,在某些單點(diǎn)性能上會(huì)有著明顯的優(yōu)勢。比如谷歌的TPU,在TensorFlow框架下的計(jì)算性能比GPU更有優(yōu)勢,而一些IoT的定制AI板卡也會(huì)比GPU功耗更小。
老黃認(rèn)為,GPU的通用性使得它不僅支持TensorFlow框架,還支持Caffe2、mxnet、PaddlePaddle等市面上所有深度學(xué)習(xí)開源框架,而且能做視頻編解碼、圖像處理、語音等一系列AI應(yīng)用,更加靈活。而更靈活則意味著市場機(jī)會(huì)更多、市場更大,研發(fā)預(yù)算更多,生態(tài)系統(tǒng)更豐富。
三年前,英偉達(dá)選擇將GPU打造成一個(gè)專注于Tensor架構(gòu)的執(zhí)行處理器(如果覺得這個(gè)概念太生澀,那就大概理解成AI網(wǎng)絡(luò)架構(gòu)處理器吧),隨后又衍生出TensorRT、TensorCore等輔助軟件平臺(tái)/加速器,使得GPU現(xiàn)在成為世界上最好的通用Tensor處理器。
其實(shí),關(guān)于GPU和ASIC板卡的爭論早已有之,尤其是谷歌的TPU,從項(xiàng)目宣布的那一刻起就有無數(shù)人拿TPU去跟GPU比較,比性能、比功耗、比延時(shí)等等,本次采訪中也有不少人就此問題向老黃提問。
但也許,這個(gè)問題不應(yīng)該這么比較。
現(xiàn)在市面上需要AI計(jì)算能力的公司成千上萬,類似谷歌這樣的科技巨頭們,有技術(shù)、有資源、同時(shí)也有強(qiáng)烈的需求(公司的大體量決定了,只要每塊板卡功耗降低一點(diǎn),總體功耗就能降低許多)打造一塊更加適合自己業(yè)務(wù)的AI板卡。
他們可以選擇和芯片公司合作打造專用AI芯片,但是英偉達(dá)似乎更希望做一個(gè)通用的AI計(jì)算平臺(tái),瞄準(zhǔn)更大的市場,這也是為什么老黃一再強(qiáng)調(diào),往上看英偉達(dá)的GPU支持所有深度學(xué)習(xí)開源框架,往下看它支持所有AI應(yīng)用。
從這兩天傳言特斯拉要“拋棄英偉達(dá)”聯(lián)合AMD開發(fā)專用自動(dòng)駕駛芯片的新聞中也可見,英偉達(dá)似乎并沒有為哪家巨頭獨(dú)立打造專屬AI芯片的意思。
至于谷歌或是特斯拉是否會(huì)靠售賣這些芯片盈利呢?短期內(nèi)應(yīng)該不會(huì)。兩者產(chǎn)業(yè)鏈構(gòu)成完全不同,賣芯片并不是谷歌或是特斯拉擅長的領(lǐng)域。
而對(duì)于更為廣闊的市場而言,其他中小型公司并不具備這樣的技術(shù)與資源,他們需要購買AI計(jì)算能力,而一塊通用的、支持所有AI網(wǎng)絡(luò)架構(gòu)、支持所有、并且計(jì)算性能非常強(qiáng)大的GPU自然成了首選。當(dāng)使用GPU的AI公司數(shù)量達(dá)到一定水平后,生態(tài)的力量也就顯露了出來。
這也是為什么,在人工智能時(shí)代,英偉達(dá)的股價(jià)能夠一路飆升,成為AI屆的“當(dāng)紅辣子雞”。
如果真要說對(duì)英偉達(dá)可能造成的影響,那大概就是谷歌會(huì)減少對(duì)GPU的購買吧。
當(dāng)然從長期來看,英偉達(dá)也可能面臨著AI計(jì)算能力云端化,AI芯片專業(yè)化并且平價(jià)化的趨勢。對(duì)于前者而言,現(xiàn)在英偉達(dá)正努力推進(jìn)云數(shù)據(jù)中心業(yè)務(wù),而對(duì)于后者而言,英偉達(dá)也開源了DLA框架,暫時(shí)讓廠家免費(fèi)使用,打造自己的低功耗AI芯片。至于未來是否會(huì)靠DLA框架來收取專利費(fèi),成為新型商業(yè)變現(xiàn)模式,那就是另一個(gè)故事了。
2017-09-28 來源:界面智東西
文章關(guān)鍵詞: 韋爾半導(dǎo)體 香港華清電子(集團(tuán))有限公司 黃仁勛 AI芯片