云計算從業(yè)者李杰在圣誕節(jié)第二天收到了英偉達顯卡的一則消息,稱英偉達規(guī)定,游戲顯卡只能打游戲,不能放在數(shù)據(jù)中心跑深度學習。李杰難得爆了個粗口。“真是霸王條款!我買了把刷子,你難道還要管我是刷鞋還是刷馬桶?”
這則消息迅速在國內人工智能圈炸了。“影響不小,因為不少人用英偉達游戲顯卡跑深度學習。” 李杰對《財經天下》周刊說。以后要做深度學習,只能買英偉達的Tesla產品了,最高價格是普通顯卡的10多倍。
李杰身邊搞AI創(chuàng)業(yè)的人幾乎全在使用英偉達的GPU和平臺。有人對《財經天下》周刊算過一筆帳,“一個小型AI創(chuàng)業(yè)團隊在英偉達芯片上花費幾十萬元是很正常的。”
這跟美國硅谷類似。“我們投資了一大串各個領域做深度學習的創(chuàng)業(yè)公司,每一個都跑在英偉達的平臺上。”硅谷明星投資人Andreessen Horowitz 說,“這就像上世紀90年代,人們都基于Windows創(chuàng)業(yè),或者在上個十年人們都在iPhone上創(chuàng)業(yè)一樣。”
英偉達的高端顯卡性能強勁,發(fā)熱量感人,因此其創(chuàng)始人黃仁勛被冠以“兩彈元勛”、“核武狂魔”的稱號。圖片來源于網絡
為什么人們都用顯卡(GPU)做深度學習?因為深度學習對計算速度的要求是“暴力”的,英偉達GPU芯片可以讓大量處理器并行做運算,這下它的速度比CPU快十倍甚至幾十倍,因而成為絕大部分人工智能研究者和開發(fā)者的必備”核彈“。有人戲稱英偉達創(chuàng)始人黃仁勛為"核武狂魔”。
受益于這波深度學習熱潮,英偉達股價從2015年7月的20美元一路飆升到如今的200美元上下,市值已超過IBM和麥當勞,這大大出乎人們的意料。
有業(yè)者對《財經天下》周刊預計,英偉達數(shù)據(jù)中心業(yè)務2018財年(你沒看錯,英偉達財年比一般公司提早一年)的銷售額會達到20億美元,增長率在100%以上。更讓人眼饞的是它的毛利率高達60%。
不過,在高增長高股價下,英偉達這次的顯卡禁令也好像在告訴大家,它的業(yè)績增長遇到了難題。
所有人都虎視眈眈
英偉達的瘋狂漲勢,推醒了巨頭和創(chuàng)業(yè)者,AI芯片成了大家爭相搶奪的蛋糕。這種爭搶甚至讓它的客戶變成對手。
谷歌是英偉達GPU目前的最大客戶,據(jù)說占到英偉達1/3的市場。但現(xiàn)在,谷歌成為英偉達最大的潛在對手。
谷歌2016年對外開源了自己的深度學習框架TensorFlow,這個框架跑在芯片之上,就像一套積木,各個組件就是一個個模型或算法的一部分,用戶可以使用這些積木去搭自己的深度學習系統(tǒng),這降低了深度學習的門檻。
TensorFlow開源后大受歡迎,已占據(jù)人工智能框架的半壁江山。關鍵是谷歌還為TensorFlow設計了專用芯片TPU。2017年春天,谷歌發(fā)布TPU論文稱,“TPU 處理速度比當前 GPU 和 CPU 要快 15 到 30 倍。”
這下,英偉達急了。黃仁勛在博客上回應谷歌的對比數(shù)據(jù),稱英偉達GPU相關芯片速度是TPU的 2倍。但這似乎已經不重要了。
“用戶要跑AI應用,是跑在芯片上,還是跑在人工智能框架上?從谷歌的觀點來看,底層跑的是英偉達、英特爾還是TPU都沒關系,重要的是用戶跑在它的TensorFlow上。”一位資深業(yè)者對《財經天下》周刊分析,“谷歌說,你不用關心我下面用的是什么芯片,谷歌就這樣把英偉達屏蔽掉了。這對英偉達來說是比較可怕的。”
雖然谷歌TPU芯片僅供自己使用,部署在谷歌云環(huán)境下,“但也不排除谷歌有一天把TensorFlow和TPU打包,賣給亞馬遜、阿里或者微軟。對于使用者來說,他們其實不關注深度學習跑在什么上面”。這位資深業(yè)者進一步說。
▲阿爾法狗擊敗五位中國棋手,背后只用了一顆谷歌研發(fā)的的芯片。圖@視覺中國
除了谷歌,芯片行業(yè)老大英特爾也醒悟了,在2015年結束了對AI市場的觀望。一位英特爾相關負責人對《財經天下》周刊透露,正是由于人工智能技術在過去40年中起起伏伏,始終沒有突破性進展,英特爾才疏忽大意了。確實,2012年,當深度學習技術悄然興起時,英特爾還在與高通扳手腕——爭奪移動芯片市場。
在發(fā)現(xiàn)AI市場躥紅后,如夢方醒的英特爾啟動了全方位的AI戰(zhàn)略。首先是設法讓自己的X86與英偉達跑得一樣快。這樣,英偉達不就沒戲了嗎?然后是并購專用芯片,這些芯片完全為深度學習而生,像神經網絡處理器Nervana、計算機視覺Movidius、自動駕駛技術方案Mobileye等。接下來,就是做生態(tài),這是英特爾最擅長的事。
“我們在戰(zhàn)略上的廣度和深度都超過我們的對手。” 英特爾人工智能產品事業(yè)部業(yè)務拓展總經理 Fiaz Mohamed對《財經天下》周刊強調說。
為了狙擊英偉達,英特爾甚至還聯(lián)合它的老冤家AMD,因為AMD也生產GPU芯片。這是20世紀80年代以來英特爾與AMD的首次合作,AMD的GPU將裝入英特爾的系統(tǒng)芯片中,在2018 年第一季度交付給客戶。
“實際上,英偉達是在英特爾X86生態(tài)沃土里,長出的一顆奇葩,這完全超乎英特爾的想象。”資深業(yè)者說。在過去20年中,整個IT基礎設施生態(tài)完全由英特爾架構起來,它建立了成員的分工合作,離開英特爾,英偉達的GPU也玩不轉。英偉達得承認,英特爾是它現(xiàn)實中最大的對手。
新競爭者還在源源不斷入場。深度學習分兩大場景,先是訓練深度學習模型,后是部署到實際生產環(huán)境中,這叫AI的推理和識別(AI inference)。過去兩年,英偉達在訓練市場占據(jù)了絕對份額,但隨著AI部署到實際生產環(huán)境中,另一件讓英偉達害怕的事情正在發(fā)生。在實際生產中,比拼的不僅是速度,還有性價比、性能功耗比和低延遲。
2014年,微軟在自己的云端加入了一張FPGA卡進行計算,在相同算力情況下,成本降低了一倍。FPGA是現(xiàn)場可編程門陣列芯片,此前多用于通信基站等產品。此后,亞馬遜AWS也把FPGA應用到了自己的數(shù)據(jù)中心上。2016年,AWS首席布道者Jeff Barr 在一個開發(fā)者預告中公布了AWS 實例,稱在基因組排序、地震分析、金融風險分析等應用,采用FPGA解決方案能帶來30倍的速度提升。
“FPGA還能這么用。”FPGA第一大廠商賽靈思的數(shù)據(jù)中心專家王曉群博士對《財經天下》周刊說。此后,中國的超大型云企業(yè)聞風而動,騰訊云、阿里云、百度云、華為云相繼發(fā)布基于FPGA的加速云服務。 除了云, 在邊緣計算領域,F(xiàn)PGA也應用于人工智能創(chuàng)業(yè)公司深鑒科技、曠視,瑞為等的機器學習場景中。
相對GPU,F(xiàn)PGA有低延時、低能耗和架構靈活的特性,這讓企業(yè)在實際生產中考慮選擇它。比如,亞馬遜的智能語音助手Alexa與人對話,GPU的反應速度是幾十毫秒,消耗75瓦到100瓦功耗,而FPGA的響應時間是幾個毫秒,功耗為幾十瓦。“對指標有硬性要求時,你會選誰?”
在AWS數(shù)據(jù)中心里,白天FPGA上可以跑語音識別、圖片分類,晚上就能跑Netflix視頻文件轉碼。“FPGA可以實現(xiàn)不同應用的切換,提升數(shù)據(jù)中心的使用效率。”王曉群說。
在自動駕駛領域,明星公司特斯拉從去年Model S開始一直內置英偉達Drive PX 2自動駕駛芯片,但在2017年11月的NIPS大會,埃隆·馬斯克宣布,“特斯拉正在開發(fā)專門的人工智能硬件,而且將是全球最好的”。
▲特斯拉與黃仁勛的親密關系還能維持多久?圖片來源于網絡
一些創(chuàng)業(yè)公司也加入AI芯片的戰(zhàn)爭。DeepMind聯(lián)合創(chuàng)始人哈薩比斯投資的AI芯片公司 Graphcore稱,自己的IPU芯片相比同類產品性能提升10~100倍,并且在訓練和推理兩方面都同樣出色。
國內深鑒科技、比特大陸也扎進AI芯片市場。如做比特幣礦機起家的比特大陸,去年發(fā)布了與谷歌TPU對標的專用芯片,適用于深度學習的訓練和推理。
深鑒科技CEO姚頌認為,單從成本來考量就能理解玩家為何前仆后繼奔赴AI芯片戰(zhàn)場。“GPU行業(yè)的毛利率達到60%以上,這是非常恐怖的。但服務器特別講究性價比,谷歌如果有1000萬臺服務器,每年一臺的運行費用是1萬美元,哪怕運營節(jié)省10%,100億美元就能省出來。他們因此特別愿意為之買單。”
所有人都虎視眈眈
巨頭和創(chuàng)業(yè)公司在輪番轟炸。不過,大家不得不承認,英偉達的地位目前仍難撼動。
英特爾一位員工對《財經天下》周刊說,8年前,英特爾曾想收購英偉達,但就收購后英偉達創(chuàng)始人黃仁勛的任職上沒有達成一致意見而不了了之。“誰知道深度學習現(xiàn)在會這么火。早知道,把它收購了就好了。”
人們都認為,做游戲顯卡起家的英偉達,是被天上掉下來的深度學習大餡餅砸中了。不過,浪潮集團AI與高性能產品總經理劉軍認為,這是英偉達在10年前布局生態(tài),遇到深度學習節(jié)點水到渠成的事。
浪潮劉軍表示,英偉達在AI時代躥紅,不是天上掉餡餅,而是因為早在十年前的布局。受訪者供圖
AI芯片創(chuàng)業(yè)公司深鑒科技CEO姚頌聽過一個段子。2007年,英偉達CEO黃仁勛在華爾街看到一些做高頻交易和金融量化的人,在用英偉達GPU跑交易,但這些人覺得GPU編程太麻煩了。彼時,英偉達的主業(yè)還在游戲市場。黃仁勛意識到市場對通用編程環(huán)境的需求,他行動了。
在英偉達發(fā)布通用開發(fā)環(huán)境CUDA之前,GPU編程是個非常痛苦的事。程序員不得不編寫大量低級機器代碼。英偉達推出CUDA,GPU逐漸從游戲領域擴展到了更為通用的計算場景。在國內,浪潮劉軍見證了這個過程,浪潮當時有一個團隊專門與英偉達一起將客戶的應用遷移到GPU上。
英偉達支持的人工智能系統(tǒng),能夠利用城市里超過十億個攝像頭來幫助管理交通擁堵。圖片來源于網絡
一些石油、氣象和生命科學的客戶受益于GPU的計算力。劉軍記得,當時中石油在海外找油用勘探軟件分析地塊數(shù)據(jù)時經常犯難。要一兩周時間,沒有國內那么大的機房,數(shù)據(jù)還傳不回來。
“我們和英偉達合作,將應用遷移到GPU上。原來一兩百臺CPU服務器,后來用十幾臺GPU服務器就解決了。在委內瑞拉賓館里租一個房間,就能放下全部機器了。”劉軍回憶說。
從無到有做GPU的生態(tài)很具挑戰(zhàn)性。懂GPU應用開發(fā)的人不多,能源、生命等不同項目間的可復制性不強,每個項目都要從頭開始。從2008年起,浪潮也開始做GPU開發(fā)培訓,近10年培訓了幾千名工程師。
轉機發(fā)生在2012年,深度學習來了。在ImageNet大賽中,多倫多大學提交了一個名為 AlexNet 的深度卷積神經網絡架構,使用了兩個 GPU,實現(xiàn)了準確率 10.8% 的大幅提升。這樣,到2013年,比賽上所有參賽者都采用深度學習算法,也都跑在英偉達的GPU和CUDA上。
深鑒科技CEO姚頌也是因為這次大賽了解到深度學習和GPU的優(yōu)勢的。“我們很快跟進神經網絡的硬件結構設計,當時國內只有我們和社科院計算所在做這個。”姚頌的深鑒科技的芯片明年流片,切入安防的端智能市場。
“英偉達一直在做生態(tài)。當開發(fā)者越來越大,軟件生態(tài)越來越成熟,硬件性能不斷迭代提升時,就到了這么一個時間點——很多前沿做深度學習的人,就會發(fā)現(xiàn)這個生態(tài),會把實驗、開發(fā)轉到GPU上。”劉軍補充說。
在原來的云計算環(huán)境下,計算的主力是英特爾CPU,F(xiàn)在到了AI計算場景,計算主力變成了GPU和其他專用加速器。英偉達迎來了屬于它的時代。
劉軍回憶,百度、阿里、科大訊飛、奇虎、搜狗后來也把語音識別、網絡安全、搜索這些深度學習算法放到GPU上。“互聯(lián)網客戶看到了GPU的潛力,再結合上深度學習算法,一下子就變成了一個特別大的機會。”浪潮也順理成章開啟了AI服務器市場。
英偉達用十年才建成了護城河,這是競爭對手難以簡單模仿和復制的東西,它靠的是時間。
英偉達還能繼續(xù)增長嗎
業(yè)者說,現(xiàn)在的英偉達有點像20年前的英特爾。
“那時,在著名CEO安迪格魯夫的帶領下,英特爾創(chuàng)造出一個PC市場,又進軍服務器市場,把原來IBM、惠普的小型機用X86系統(tǒng)替代掉。英特爾推動的是整個技術架構的進步,包括生態(tài)的升級。”業(yè)內資深業(yè)者對《財經天下》周刊說,“現(xiàn)在,英偉達正用GPU技術,去升級AI時代。“
當年,安迪格魯夫那句著名的話:只有偏執(zhí)狂才能生存。“15年來我說的差不多是同樣的事,所以幾乎不怎么改我的Slide。”黃仁勛對《財富》透露。這位華人CEO個性鮮明,喜歡冒險,他的經典裝扮黑色皮夾克在硅谷幾乎與喬布斯的牛仔T恤一樣有名。“他是安迪·格魯夫所說的那種偏執(zhí)狂。精力旺盛,侵略性強,非常有個性。”接觸黃仁勛的人說。
當英偉達股票漲到100美元時,黃仁勛兌現(xiàn)諾言,去紋了身。圖片來源于網絡
在抓到人工智能這個潛力市場后,黃仁勛變得更為激進。“過去,整個行業(yè)都是依賴摩爾定律來推動,但它太老了,太慢了,GPU才是全新的‘超級摩爾定律’,這也是整個行業(yè)一次千載難逢的機遇。” 黃仁勛在2017年全球GTC大會北京站一字一頓地說。
不過,英特爾一位負責人對此不以為然。“我們會用全方位戰(zhàn)略,我們有CPU、GPU、FPGA和各種專用芯片,我們有完整的體系。”他對《財經天下》周刊分析,“你知道,當年互聯(lián)網剛起來時,SUN公司CEO也曾宣稱,SUN就是.com時代‘com’之前的那個點,哪一家都缺不了它。但是,后來英特爾把不可能的事情做成了,F(xiàn)在在數(shù)據(jù)中心中,你再也看不到SUN了。”
在2017年底舉辦的英特爾人工智能會議上,百度、?低、科大訊飛以及人工智能AI創(chuàng)業(yè)公司展示與英特爾的合作。”我們一直用英特爾和英偉達跑深度學習。英特爾管理團隊與我們的老大更熟,技術員工給的支持更大。我們現(xiàn)在用英特爾平臺跑應用。“一家AI醫(yī)療創(chuàng)業(yè)公司對《財經天下》周刊說。雙方的商戰(zhàn)很激烈,另一家創(chuàng)業(yè)公司產品手冊上因有英偉達幾個字,而不能在這次會議上露臉。
黃仁勛被稱為“偏執(zhí)狂”,面對各大廠商的圍剿,他顯得更加激進。圖片來源于網絡
FPGA對市場的爭奪剛剛開始,它要像10年前的英偉達,培養(yǎng)一個龐大生態(tài)。“未來賽靈思會把80%的基礎開發(fā)做完,讓應用開發(fā)者們專注于自己那部分定制開發(fā)的20%。”
從2017年開始,賽靈思打算每年召開一次開發(fā)者大會,期望5年內讓FPGA使用者從5萬人提升到25萬人。
一位不愿具名的AI芯片從業(yè)者認為,過往股價漲幅已讓黃仁勛在業(yè)績表現(xiàn)上面臨極大壓力。“游戲卡不能用于數(shù)據(jù)中心,但在挖礦上卻不限制,這條禁令就是壓力的表現(xiàn)。” 深度學習訓練市場的需求并不會減弱,這是英偉達的優(yōu)勢領域,但在正在發(fā)展的推理領域,隨著人工智能普及,這個市場難以估量。
深鑒科技姚頌則不確定GPU在訓練市場的增速。“前些年加速卡已經賣得很多了,市場可能會增速減緩甚至保持平緩狀態(tài)。”
變數(shù)還存在于技術的突破性變革中,F(xiàn)在不排除有某種革新式硬件出來,完全為深度學習而生。如果新硬件性能的提升超出英偉達很多時,可能會引發(fā)整個生態(tài)系統(tǒng)的變遷。
“挑戰(zhàn)一定會存在,你看時代的變化發(fā)生得非常迅速。幾年前誰也沒料到深度學習會崛起。不能及時跟進或提供最合適的技術選擇,很快就落伍。即便是深度學習的發(fā)展也不代表英偉達可以高枕無憂。”浪潮劉軍分析說。
免責聲明:本文僅代表作者個人觀點,與C114中國通信網無關。其原創(chuàng)性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。
新聞熱點
新聞爆料