起步
1993年,常年身披黑夾克的黃仁勛不顧分析師的勸阻,毅然決定和伙伴創立英偉達。那一年,黃仁勛剛好30歲,他面對的市場環境并不樂觀,在九十年代,圖形處理器、或者說圖形加速卡領域群雄混戰,上百家企業在場上短兵相接。
更重要的是,彼時圖形加速卡并未受到重視,聚光燈都投射在CPU上。在1993年前后,意氣風發的CPU戰場上,算力主角是老牌傳奇英特爾和AMD,雙方正在酣戰。
1991年英特爾成為當時全球最大的半導體企業,1993年英特爾又推出了80586芯片,為了與AMD芯片進行區別,又將其命名為奔騰;1991年的AMD推出了Am386微處理器系列,打破了英特爾的市場壟斷,在1993年,AMD又推出Am486微處理器。
而在英特爾和AMD為代表的x86架構的CPU之外,蘋果和Arm也已經聯手進入芯片界。1993年,蘋果推出NewtonMessagePad,就首次搭載了Arm架構處理器。與此同時,蘋果還和IBM、摩托羅拉結成聯盟,來對抗“Wintel”,三者聯合研發出芯片PowerPC,在1994年用于蘋果的臺式機上。
正如黃仁勛在近期的一場采訪中所言:“30年前,個人電腦革命才剛剛開始,微處理器CPU開始起飛,當時大家認為CPU是解決計算的最好方式。”但是,黃仁勛則一直認為需要有加速計算。
后來,大家都逐漸知道圖像處理、視頻處理、游戲處理、計算處理等等都需要GPU,不過當時英偉達仍在苦苦尋求技術的應用市場。
幸運的是,英偉達很快找到了計算機圖像和電子游戲結合的場景。在研發過程中,一家日本游戲公司世嘉向英偉達投來橄欖枝,愿意提供給700萬美元的資金。
視頻游戲的風口似乎就在眼前,當時PC和游戲是最主要的消費電子市場,英偉達趕上了班次。但是好景不長,英偉達在3D圖像技術上選擇了錯誤的路線,不能兼容微軟制定的新主流標準,初代產品NV1最終銷量慘淡,眼看著為世嘉研發的芯片也要面臨著被淘汰的局面。
蘋果、英偉達和皮克斯等巨頭成立聯盟,制定元宇宙3D圖形標準:金色財經報道,蘋果、英偉達、皮克斯、Adobe和Autodesk聯合成立了OpenUSD聯盟(AOUSD)。幾家公司在發布會上并沒有具體談論“元宇宙”,但他們正在推廣開放元宇宙的關鍵特征之一——3D工具和數據之間的互操作性。OpenUSD是皮克斯動畫工作室開發的一種開放數據格式,允許團隊能夠在大規模3D工作流程上協同工作,并共享可在AR(增強現實)和VR(虛擬現實)項目中使用的3D對象和環境的信息。OpenUSD聯盟將制定詳細說明OpenUSD特征的書面規范。(澎湃)[2023/8/2 16:13:13]
如果不能完成芯片開發,公司將陷入絕境。黃仁勛在日前的演講中也提到了創業初期的這次危機,最終他和世嘉說明實情,而世嘉竟然同意支付研發費用,拯救了在倒閉邊緣徘徊的英偉達。
經歷過此番波折后,黃仁勛在1997年提出了業界知名的“黃式定律”,其預測顯卡性能每六個月就提升一倍,遠超摩爾定律的速度。當年這更像是黃仁勛對外的一次宣言,是為自己定下的標準和目標,而現在這已經變成了現實。這也是黃仁勛在演講中多次提及的“跑得快”,他說當道路很長時,跑得快是唯一的策略。
時運
很快,英偉達迎來更大的轉機。
1997年,英偉達推出的新款圖形加速芯片RIVA129成功逆襲,開售后四個月內出貨量就超過100萬臺。1998年,英偉達又和臺積電牽手合作,在圖形加速領域更上一層樓,在競爭無比激烈的PC和游戲市場上,英偉達快跑進入了決賽圈。
1999年,英偉達順利上市,并率先提出了GPU概念,推出全球首款GPU——Geforce256。這是一款關鍵性產品,至此,GPU已經不僅僅是輔助CPU的角色,其出色的并行計算能力將提供更強勁的算力。
2000年,微軟Xbox搭載了來自英偉達的GPU,英偉達還在2002年底和索尼達成了合作,為游戲主機PlayStation3提供顯示芯片。可以說,接下來英偉達在游戲界大殺四方,當然這其中也歷經了兼并收購、大魚吃小魚,起起落落,最終才殺出重圍。
羅斯柴爾德家族減持英偉達股票:金色財經報道,羅斯柴爾德家族擁有的資管機構Edmond de Rothschild全球首席投資官(CIO) Benjamin Melman透露,該公司自2020年年底以來一直超配英偉達,但目前已經部分獲利了結,現在所持頭寸“要遠遠小得多”。另據Fintel整理Edmond de Rothschild持倉英偉達數據顯示,2018年加密貨幣市場波動導致英偉達股價下跌,2021年加密貨幣市場暴跌也導致英偉達股價腰斬,期間Edmond de Rothschild每次都能踩準節奏進行增持,分析認為該機構本次減倉英偉達獲因擔心AI市場過熱。(彭博社)[2023/6/5 21:15:59]
在游戲、PC市場上登頂的過程中,英偉達也一直在尋找新的場景,也曾在蓬勃的手機市場鎩羽而歸,也面臨著PC市場沒有那么性感的現實。然而,在2010年后,人工智能、云計算的浪潮在慢慢靠近,從自動駕駛到神經網絡深度學習,GPU展現出了強大而專一的加速計算能力。
深度學習崛起的過程中,GPU提供的卷積運算、并行運算等特性,恰好可以滿足AI計算的需求;在全球云化的趨勢之下,數據中心的計算背后都需要GPU提供算力支持。
英偉達又一次在新領域中崛起,就像是它碰巧有絕世的武功,武林江湖環境變換,它卻始終能以獨門秘籍開啟新路。誰能料想,后來的事實證明,GPU不僅能用于AI、還能用于挖礦。要知道,AI的概念在AlphaGo熱潮后陷入沉寂,恰逢區塊鏈站上風口,GPU憑借礦機需求一路走高。
眾所周知,此后區塊鏈熱度下滑,瘋狂的礦機需求回落,英偉達的股價也應聲而落,然而到了2022年末,人工智能重返科技舞臺中心,生成式AI成為英偉達市值的新動能,英偉達的產品也是生成式AI的主引擎。
潮起潮落間,黃仁勛也從外界眼中的“游戲小子”成為“AI教主”。一路以來,英偉達抓住了計算設備需求的關鍵時機,從圖形渲染、到人工智能、乃至區塊鏈領域的計算都表現得十分突出,應用場景也覆蓋了PC、數據中心、汽車等市場。到2023財年,英偉達數據中心的營收占比首次超過了游戲,達55.6%。
鴻博股份:與英偉達等共同合作成立北京AI創新賦能中心:8月14日消息,鴻博股份公告,公司與中恒文化、英偉達、英博數科就在北京市共同合作成立北京AI創新賦能中心,開展相關人工智能科技領域項目建設及運營服務事宜簽署了《合作協議》。(金十)[2022/8/14 12:25:01]
談及數據中心業務,黃仁勛說:“盡管我們需要更多算力,但是數據中心消費并沒有那么快速的增長,因為摩爾定律到現在已經發生變化,已經結束了,如果我們想要更多的算力,所有數據中心都需要加速,區別于ASIC芯片用于特定程序,英偉達是通用加速計算平臺。”
超越
英偉達最初的標簽就是GPU,但僅僅是圖像領域的應用,并不足以支撐英偉達后來高漲的市值。在練就絕技的過程中,英偉達早已超越了最初GPU的概念,進入到更廣泛的產業之中。
其中,業內人士提及最多的兩大內功是GPGPU和CUDA,它們在為人熟知的芯片之上,為產業制定了一整套軟硬件標準,強大的軟件生態也讓英偉達當前立于不敗之地。
首先,回到GPU和CPU的區別上,GPU到底有何特色?為何能從配角成為主角?
GPU和CPU是現代計算機中不可或缺的兩個組成部分,但它們在運算方式、功能等方面卻存在著明顯的差異。簡單來說,CPU主要負責執行指令集中的算術邏輯操作,而GPU則更擅長于并行計算。這是因為GPU擁有大量的核心,每個核心都可以獨立地進行計算任務,從而實現高效的計算。
做個粗糙的比喻,在電腦上繪制一張圖時,CPU的運算方式更加講究邏輯,需要按照順序去繪制像素,而GPU可以同時去繪制多個像素。而繪制背后主要是GPU在進行矩陣運算,就像一個矩陣運算界的頂尖高手。
一開始,GPU正如其名“GraphicProcessingUnit”,專供圖像顯示。一個重要跨越是在2007年,英偉達提出了GPGPU架構,即用于通用計算的GPU,將GPU從傳統的圖像處理器,廣泛普及應用到計算訓練當中。
浪潮信息宣布其元宇宙服務器將全面支持英偉達 Omniverse:金色財經消息,浪潮信息宣布元宇宙服務器MetaEngine全面支持NVIDIA Omniverse Enterprise,提供支撐大規模數字孿生場景的軟硬件一體化解決方案OVX,可以支撐大規模、高復雜、高逼真數字場景協同創建和實時渲染仿真,成為連接現實世界和數字世界的堅實底座。
浪潮元宇宙服務器MetaEngine具有領先的硬件架構,支持最新英偉達A40 GPU和ConnectX-6 Dx智能網卡,并承載大規模數字孿生構建和運行所需的技術和工具,提供對建模、渲染、仿真、AI等多元負載的算力支持。
此前報道,3月17日,浪潮信息發布元宇宙服務器MetaEngine。(美通社)[2022/3/24 14:15:56]
GPU在圖像處理、視頻編碼等領域表現優秀,而在一些特定的應用場景中,如科學計算、工程仿真等,需要更高的計算能力和更大的內存帶寬,這時就需要使用更為強大的GPGPU進行更大規模的并行運算。
這是英偉達擴大市場版圖的一個重要節點。更為重要的是,英偉達還在2006年推出了自己的CUDA平臺,構建了強大的AI算力生態。
CUDA是英偉達的并行計算平臺和編程模型,CUDA可以通過利用GPU的處理能力大幅提升計算性能,讓GPU擁有解決復雜計算問題的能力。而通過CUDA平臺,開發者們可以在編程時更方便地調度底層的GPU算力。
可以說,CUDA平臺是英偉達建立的并行運算的一整套軟硬件生態標準,所有英偉達的GPU都兼容CUDA,并且大多數AI芯片均與之匹配兼容,尤其是訓練端芯片。因此,盡管GPU或者AI的創業公司層出不窮,大多都兼容英偉達的CUDA平臺,要再創建自有生態的壁壘和成本都很高。
有產業鏈人士向21世紀經濟報道記者表示,CUDA擁有400多萬開發者,軟件生態的護城河非常高,目前要遷移到國內較為成熟的AI芯片平臺上,可能需要2、3年的時間。
當前在全球的GPU市場上,主要玩家是英偉達和AMD,英特爾近年也在發力GPU產品線,而英偉達目前仍占據主要市場份額。對標CUDA來看,AMD也在打造開放的ROCm平臺,ROCm平臺于2016年推出,AMD也在不斷優化ROCm套件。
英偉達降低三款新GPU的算力,以限制以太坊挖礦:英偉達公司5月18日表示,英偉達限制了三款新顯卡(RTX 3070,RTX 3080和RTX 3060 Ti)的挖礦能力,并將其標記為“低算力”。英偉達通過將新顯卡算力降低50%,來確保其高端GPU最終落在游戲玩家手中,而不是落到以太坊礦工手中。(U.today)[2021/5/19 22:16:53]
亞馬遜創始人杰夫·貝索斯曾在一次訪談中說道:“如果產品做得優秀,并且足夠幸運,一般會有兩年的領先優勢,在AWS業務上亞馬遜領先了七年,七年沒有勢均力敵的競爭對手。”
再看英偉達和AMD,CUDA比ROCm整整超前了10年,CUDA十年磨一劍,挑戰者們仍在追趕之中。
“通吃”
回顧GPU和AI的發展史,黃仁勛說道:“2012年,計算機視覺模型AlexNet就使用GeForceGTX580進行訓練,使用1400萬張圖像訓練了AlexNet,每秒可處理262PetaFLOPS。經過訓練的模型以壓倒性優勢贏得了ImagNet挑戰賽,并引發了AI的大爆炸。”
這時,GPU和AI的相擁就已經深埋種子,十年之后,Transformer模型面世,OpenAI基于Transformer開發了GPT-3。
此前的演講中,黃仁勛談到,GPT-3的訓練需要323ZettaFLOPS的算力,相當于AlexNet的100萬倍,從而創造了ChatGPT這個震驚全世界的AI。在他看來,嶄新的計算平臺已經誕生,AI的“iPhone時刻”已經來臨,加速計算和AI技術已經走進現實。
今年的GTC大會上,黃仁勛公布了諸多與生成式AI相關的進展,隨后又在臺北國際電腦展COMPUTEX上繼續放出王炸,他宣布GH200GraceHopper超級芯片正式投產,并公布由256個GH200驅動的新型DGXGH200AI超級計算機。
而此前英偉達就已經做足了功課。2022年,英偉達推出了多款重磅產品,分別是基于全新Hopper架構的H100GPU、CPU和GPU的合體GraceHopper、兩個CPU組合的GraceCPUSuperchip,CPU的產品在2023年上市。
其中,設計GPU新架構Hopper時,英偉達增添了一個Transformer引擎,專門為Transformer算法做了硬件優化,加快AI計算的效率。
一位國內芯片從業者向21世紀經濟報道記者直言:“H100出來,其實就是一個新時代了,Grace-Hopper再一個組合,加上高配的互聯,完全不給活路,英偉達贏家通吃,AMD、Intel繼續苦追。”
同時他也表示:“目前國內一些企業還是在盯著CNN做優化,英偉達已經有Transformer引擎,然后AIGC火熱,恰好能做支持。這個眼光,只能佩服他們的科學家們對這個領域深刻的認識。”
一位學術界人士也向21世紀經濟報道記者分析道:“從H100上,包括專用的Transformer引擎以及對FP8格式的支持,可以看到計算硬件在向應用定制的方向前進。GraceCPU說明了整合異構計算系統的重要性。單純的加速器優化和設計已經不能夠滿足現在對于計算系統的算力和能效比的要求,需要各個部分的協同優化和設計。”
他還表示,GraceCPU通過提高通信帶寬和在CPU和GPU之間建立一致的內存模型來解決運算中的瓶頸,這也和學界與業界一直在關注的方向是一致的。
總而言之,在GPU和CPU的各種排列組合中,英偉達又將算力提升到了新高度。正如黃仁勛所言:“我們正在重新發明計算機,加速計算和人工智能標志著計算正在被重新定義。”
黃仁勛在采訪中還提到,數據中心需要用的CPU越來越少,不再是傳統上購買數百萬個CPU,而是轉而購買數百萬個GPU。換言之,在他看來,AI算力江湖已經是GPU的主場。
野心
英偉達的布局還不止于此。
一個現實問題是,高性能的算力也意味著高昂的價格。大模型訓練成本動輒成千上百萬美元,并不是所有公司都能承受。
而英偉達同時提出了云服務的解決方案NVIDIAAIfoundations,黃仁勛表示要做“AI界的臺積電”。臺積電大大降低了芯片設計公司生產門檻,英偉達也要做代工廠的角色,通過和大模型廠商、云廠商合作提供高性價比的云服務。
前述芯片從業者對記者解析道:“賣云服務,就是聯合大模型方提供Pretraining的模型,小企業直接Finetuning就有自己的了。”
在幫助下游企業降低大模型訓練成本的同時,英偉達還在逐步參與到上游的產業鏈升級中。今年,英偉達牽手臺積電、ASML、新思,發布了計算光刻庫cuLitho。
前述學術界人士向記者介紹道,計算光刻是在芯片設計和制造領域的關鍵步驟,也是最大的計算負載之一。計算光刻庫的技術突破就在于,可以通過部署有大量GPU的DGXAI計算系統對計算光刻進行加速,使其達到原有的基于CPU的計算速度的幾十倍,同時降低計算過程的總能耗。這將有助于晶圓廠縮短原型周期時間、提高產量、減少碳排放,為2nm及更先進的工藝奠定基礎,并為曲線掩模、高數值孔徑極紫外、亞原子級光刻膠模型等新技術節點所需的新型解決方案和創新技術提供更多可能性。
新思方面向21世紀經濟報道記者表示,此次研發合作中,cuLitho集成了新思科技Proteus全芯片掩膜合成解決方案和新思科技ProteusILT反向光刻圖形技術,并進行了優化,以便在最新一代NVIDIAHopper架構GPU上運行。如今,在cuLitho平臺上運行Proteus解決方案只需要500個NVIDIADGXH100GPU,替代此前用于計算光刻的40000臺CPU服務。計算光刻過程的所有部分都可以并行運行,將電力能耗需求和運行時間從幾周減少到幾天。
在多位產業界人士看來,雖然短期內不會影響到下游的應用方面,但是這些上游的研發和升級將長期影響產業的發展,累積形成代際差。
“英偉達在GPU架構的迭代上,一直都有屬于自己的發展路徑,這幾年的發展,也讓英偉達躍居AI算力芯片領域的領導者,也因為領先,所以英偉達會思考如何做更多元的布局與行業內的深度合作,這樣更能了解行業的需求,比方和臺積電等合作便是很好的例子。”芯片行業專家姚嘉洋向21世紀經濟報道記者表示。
在2008年的電視采訪中,黃仁勛說:“希望有一天大家都認識英偉達,就像大家都認識微軟、英特爾一樣。”如今,英偉達幾乎是家喻戶曉,擁有絕世的武功,比大夢想更加重要。
2023年,英偉達30周年之際,黃仁勛在采訪中說:“直到現在才真正起飛。”生成式AI助力英偉達成為算力的新王。
當然,英特爾和AMD都已經吹響反攻的號角。7月,英特爾面向中國市場推出了AI芯片HabanaGaudi2;6月,AMD推出AI芯片InstinctMI300X,兩者都直接對標英偉達100系列。圍繞著算力、納米的權力游戲還將繼續。
SFC
本期編輯江佩佩實習生章寶怡
21君薦讀
英偉達放大招!市值飆漲至近萬億美元
英偉達“炸場”后,這些A股公司也宣布出手!
英偉達最失意收購落幕,孫正義官宣Arm尋求重新上市
Tags:CPUROC人工智能CPU幣CPU價格ROC幣ROC價格人工智能技術應用學人工智能后悔死了人工智能考研考哪些科目
三大利好!A股趨勢將起,缺散戶一次真正的大牛市!近幾日,A股出現了久違的漲勢。雖然上證指數全周僅上漲129%,但很多個股漲幅不小,而且一個好處是這樣的反彈基本上每個板塊都有機會,這對于A股市場來.
1900/1/1 0:00:00Wind數據顯示,截至7月12日記者發稿,7月份以來美元指數下跌1.92%。與此同時,在岸、離岸人民幣對美元匯率迎來反彈,在上述時間段,在岸、離岸人民幣對美元匯率累計分別上漲0.72%、1.
1900/1/1 0:00:00地球是人類共同的、唯一的家園。中國將生態文明建設視為關乎中華民族永續發展的根本大計。十年來,美麗中國建設邁出重大步伐,中國生態環境保護發生歷史性、轉折性、全局性變化.
1900/1/1 0:00:00重點關注 富力被申請破產重整,回應:正積極商談和解中7月13日,據全國企業破產重整案件信息網顯示,廣州富力新增兩條破產審查案件,申請人分別為廣豐混凝土和廣東祥正.
1900/1/1 0:00:001990年50元紙幣和1980年10元紙幣,都隸屬于“第四套人民幣”系列,它們的收藏價值與品相和版式有關。普通類型的價值也就比面值高一些,在幾十塊左右不等.
1900/1/1 0:00:0001:26中國外貿半年期中考“成績單”7月13日出爐,在全球貿易增速下滑,主要出口導向國家進出口萎縮的情況下,中國外貿在上半年繼續“穩中有進”,歷史同期首次突破20億元人民幣整數大關.
1900/1/1 0:00:00