• 深度
  • 行業
  • 行業
  • 互動

最強AI算力哪里來?三個時代的阿里疊影

腦極體 2019-09-26

原標題:最強AI算力哪里來?三個時代的阿里疊影

又是一年云棲時。

阿里的云棲大會,堪稱科技眾的年度狂歡之一。而今年似乎格外特殊,阿里云十歲生日,阿里巴巴集團20周年,似乎都讓今年的云棲有點不同。而從技術從業者的角度來看,或許另一個不同更加引人注目:被廣泛認知為互聯網公司的阿里,今年云棲上唱主角的居然是一款AI芯片。

9月25日,達摩院院長張建鋒現發布了“全球最強的AI芯片”——含光800。在AI行業目前被廣泛作為標準化測試的ResNet-50中,含光800推理性能達到78563IPS,刷新了AI推理芯片的世界紀錄。

如果站在大眾輿論中看,或許我們很難把阿里和“最強AI芯片”這兩件事聯系在一起。也許會認為其中充滿了反常識和突如其來。

但如果站在計算與智能產業的時間迭序上看,或許會又對含光800抱有完全不同的看法:這枚最強AI芯,并不是阿里的轉型之作。反而阿里始終在踐行為產業提供最強AI算力的路上。平頭哥的第一次“云棲秀”,則是這條路上自然而然醞釀的結果。

從云到AI,阿里就像一位游戲玩家,再每一個版本的副本中都拿到了關鍵道具。而在快速流轉的AI時代,這些關鍵道具組成了“阿里套裝”——作為產業底座的最強AI算力,就是這個套裝的加持效果。

從云、大數據、算法到芯片,云棲的疊影凝固成了AI計算之路。

神奇AI算力在哪里?

或許我們有必要先了解這樣一個理論:AI算力的差異化供給,究竟來自于何處?

去年5月,OpenAI 發布過一份數據報告。其中提到自2012年以來全球AI算力需求在6年中擴大了30萬倍,AI產業的算力需求每3.5個月就在翻一番。

這個遠大于摩爾定律增長的需求裂變,意味著AI算力在這個產業周期里必然面對大量供不應求的局面。這也就錨定了AI算力提供的第一條規則:云是AI的最佳出口。

由于云端算力天生具有能夠裁量提供的特點,這對于AI任務從訓練、測試到部署中廣泛面對的彈性增長、大規模并行部署、極端訓練用算力等幾大特點來說,具有難以取代的價值。瞬時性、并發性、彈力性,是AI對算力需求的基本面貌。

而在從云到端、從訓練到推理、從部署到迭代的AI落地過程里,我們可以看到AI算力的運行實際上受制于非常多的條件:計算架構、訓練集群性能、框架對算法的優化程度、部署環境等等都在影的響AI算力的最終實際體驗。這個漫長的流程,決定了AI算力的第二條規則:算力性能的優越與否不取決于單純的芯片,而是由從芯片、云、數據處理能力、框架,再到算法開發基礎、部署環境等一攬子條件來決定的整體閾值。

這意味著,AI算力不是一個單純的部件性能比拼,而是一個體系化工程,是產業技術疊加與AI基礎開發部署探索的完整序列。這意味著AI算力是一條路,這條路,需要不同時間的不同饋贈。

在時代收獲所需,這正是阿里云的特點。

云計算時代,飛天的路標與饋贈

我們知道了AI算力來自哪里之后,就可以來看阿里云的收獲過程。雖然我們今天的焦點是平頭哥,但故事的開端其實早在十年前就已經發生。

2009年,草創的阿里云寫下了第一行關于飛天的代碼。當時這個“冒天下之大不韙”的團隊,就意識到大規模計算是未來互聯網的發展中軸,甚至是更多計算迭代的肇始因緣。

時至如今,這個判斷應該說已經被證明是正確的。阿里云自研的飛天云操作系統,已經成長位國內規模最大的計算平臺,可擴展至10萬臺計算集群,單日數據處理量超過600PB。2018年雙11期間,阿里云彈性計算能力累計超過1000萬核,相當于10座大型數據中心,創造了“脈沖計算”的新紀錄。雙11作為一個巨大的數據任務,某種程度上位飛天挺入智能時代,成為計算底座提供了驗證。

AI計算的本質,是對異構計算和多樣性計算的需求。為此,阿里云提供在云服務市場率先提供了異構計算服務。構筑了亞洲規模最大的GPU公共云服務,并可在短時間內實現全球最大規模的GPU服務器調用,超級GPU計算集群支持每秒10億次AI峰值計算。此外,阿里云還最早發布了FPGA云服務。

這些基于云服務提供的大規模計算和異構計算,可以看作阿里云最早投身公有云事業,在產業草莽期積累的時代饋贈。云計算的支柱能力和多元架構囊括,是產業AI所需算力的基本構成。這層疊影成為了阿里云提供AI算力的底色,是一切故事的起點。

而在AI逐漸并入產業視角時,坐擁強大多元的云,讓阿里可以更兇猛投身這個新的產業紀元。

AI探索時代,向實而生的阿里三叉戟

假如說,十年之前是公有云時代的崛起;那么從2016、2017年開始,AI時代逐漸在產業服務市場落地生根。

這個階段,早期探索同樣艱難充滿挑戰,但也給阿里的AI算力之路帶來了第二層底色:實用化。

2016年的云棲大會,阿里與杭州一同公布了城市大腦計劃。此后,隨著城市大腦計劃的陸續落地,阿里在2017年宣布成立了達摩院。此后的產業分工,是達摩院承擔AI算法的開發與升級,而技術則通過阿里云的AI解決方案與阿里生態進行應用轉化。

這一過程中,我們可以看到阿里的技術體系牽引起了AI算法、數據應用,與產業場景三個維度的走廊,構筑了一把探索AI真實價值的產業三叉戟。

達摩院的AI技術與服務體系,先后在工業、遙感、醫療、城市大腦等多個應用場景中落地。而阿里小蜜、拍立淘、支付寶、天貓精靈則成為了阿里內部生態的AI出口。根據阿里巴巴在杭州云棲大會上公布的人工智能調用規模:每天調用超1萬億次,服務全球10億人,日處理圖像10億張、視頻120萬小時、語音55萬小時及自然語言5千億句,阿里已經成為中國最大的人工智能公司。

在AI應用時代早期,阿里通過一系列技術和組織部署,形成了技術先鋒營、數據轉化引擎,與場景實驗室的三個新角色,為AI算力走向實用化探索了落地入口。

AI芯片時代,平頭哥的萬里長征

如果對比CPU在70年代的歷史,可以發現AI從探索期走向實用化和成熟期,關鍵標志就是核心芯片的大規模商用。

這個時代才剛剛開始,我們或許還無法代替計算史為它命名,但毫無疑問AI的芯片級基礎設施,是這個周期的關鍵開端。

曾幾何時,IBM從打印機走向了芯片讓美國人莫名其妙;而去年,阿里宣布成立面向AI時代的平頭哥,確實也讓中國人大吃了一驚。

氣質獨特,生死看淡的平頭哥,在計劃中將為產業提供最全芯片產品形態,涵蓋處理器IP、SoC平臺以及芯片。

不久之前,我們見到了平頭哥發布了面向端側的無劍平臺和玄鐵處理器IP。而當含光800面世時,則意味著平頭哥第一次挺進云端,與阿里云的計算、數據、算法體系連為一體,構成了云端最強推理算力的萌芽。

含光800性能突破,得益于達摩院的軟硬件協同創新:硬件層面采用自研芯片架構,通過推理加速等技術解決芯片性能瓶頸問題;軟件層面集成了先進AI算法,針對CNN及視覺類算法深度優化計算、存儲密度,可實現大網絡模型在一顆NPU上完成計算。

根據云棲大會的現場演示,在城市大腦中實時處理杭州主城區交通視頻,需要40顆傳統GPU,延時為300ms,使用含光800僅需4顆,延時降至150ms。拍立淘商品庫每天新增10億商品圖片,使用傳統GPU算力識別需要1小時,使用含光800后可縮減至5分鐘。

雖然平頭哥的萬里長征剛剛開始,但是這第一步,確實已經跨了出來。

關于未來時代的疊影,平頭哥用含光800做了一聲怒吼,它的意思大概是,阿里將突入最底層,在計算基礎設施中完成對AI最強算力的探索。

云,AI,到芯片,三個時代的疊影,讓最強AI算力自然流淌而出,云氣萬物里。

(免責聲明:此文內容為第三方自媒體作者發布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網無關。文章僅供讀者參考,并請自行核實相關內容。投訴郵箱:editor@fromgeek.com)

標簽阿里
  • 腦極體
    郵箱:caoceng@fromgeek.com
    寫讓你腦洞大開且能看懂的人工智能、流媒體、海外科技
    分享本文到