微軟內(nèi)部遭遇AI硬件短缺 被迫實施配額制

2023-03-16 16:29:38   來源:新浪科技   評論:0   [收藏]   [評論]
導(dǎo)讀:  新浪科技訊 北京時間3月16日上午消息,據(jù)報道,知情人士透露,雖然微軟(265 44, 4 65, 1 78%)即將宣布一整套使用GPT-4人工智能(AI)軟件的Office 365工具,但該公司現(xiàn)在卻面臨內(nèi)部AI服務(wù)器硬件短缺的窘境
  新浪科技訊 北京時間3月16日上午消息,據(jù)報道,知情人士透露,雖然微軟(265.44, 4.65, 1.78%)即將宣布一整套使用GPT-4人工智能(AI)軟件的Office 365工具,但該公司現(xiàn)在卻面臨內(nèi)部AI服務(wù)器硬件短缺的窘境。

  這迫使微軟不得不對硬件資源采取配額供應(yīng)的方式,限制其他內(nèi)部AI工具開發(fā)團隊的使用量,從而確;贕PT-4的新版必應(yīng)聊天機器人和即將發(fā)布的新款Office工具獲得足夠的資源。這種硬件短缺的現(xiàn)狀還對微軟的客戶產(chǎn)生了影響:至少有一個客戶表示,需要等待很長時間,才能使用已經(jīng)通過微軟Azure云服務(wù)提供的OpenAI軟件。

  微軟表示正在加緊添置更多硬件,以便增加AI計算能力,但如果速度不夠快,就有可能限制其Azure OpenAI服務(wù)對新客戶的吸引力。這些客戶會借助此項服務(wù)將AI功能添加到自己的應(yīng)用中。微軟原本在這種新的AI工具的商業(yè)化方面已經(jīng)領(lǐng)先于谷歌(96.55, 2.30, 2.44%),但如果遲遲不能解決硬件短缺問題,這種優(yōu)勢也將難以發(fā)揮出來。

  谷歌搶在微軟之前于本周發(fā)布了自己的AI輔助寫作工具,包括能夠根據(jù)簡短的提示,在谷歌Docs和Sheets中自動編寫文本的軟件。

  服務(wù)器短缺正值OpenAI和微軟試圖快速擴大銷售范圍之際,客戶可以使用自己的數(shù)據(jù)對這種AI軟件進行微調(diào),從而開發(fā)圖片生成、文檔總結(jié)、搜索引擎和聊天機器人等定制化AI工具。

  微軟已經(jīng)向OpenAI投資了數(shù)十億美元,有權(quán)通過Azure OpenAI服務(wù)向創(chuàng)業(yè)公司銷售軟件。OpenAI也將軟件直接授權(quán)給客戶使用——而作為與微軟合作的一部分,所有OpenAI機器學(xué)習(xí)模型都必須運行在Azure服務(wù)器上。這兩項服務(wù)的定價相同,每次請求收費都不到一美分。

  這兩家公司在過去3個月推出的服務(wù)吸引了企業(yè)用戶的廣泛興趣,他們都希望將OpenAI的ChatGPT聊天機器人的底層技術(shù)整合到自家產(chǎn)品中。但是微軟Azure OpenAI服務(wù)的新客戶卻要面臨很長的等待時間。

  硬件資源短缺的核心問題在于,GPT-4等新的AI大模型需要在GPU上運行,這種服務(wù)器芯片可以一次性處理大量數(shù)據(jù)。為了處理這個模型的龐大計算需求,微軟已將數(shù)萬個GPU整合成一個個群集,分散到各個數(shù)據(jù)中心里。

  在明確用戶需求量之前,微軟目前不得不將現(xiàn)有的大量GPU資源預(yù)留給新的必應(yīng)GPT-4聊天機器人和即將推出的GPT-4 Office工具。

  知情人士表示,微軟2月剛剛推出這項必應(yīng)智能聊天功能,目前還在加緊測算平均每天有多少人愿意使用這項服務(wù)。知情人士表示,這就導(dǎo)致工程師很難預(yù)測該功能所需的計算資源。

  而即將推出的Office GPT-4工具也可能導(dǎo)致微軟客戶對OpenAI聊天機器人技術(shù)的需求大幅激增。這些新功能包括AI文檔總結(jié)、個性化寫作建議以及編輯建議等。

  其他從事AI開發(fā)的微軟團隊不得不讓位于必應(yīng)和Office,包括為各種機器學(xué)習(xí)模型的開發(fā)團隊,其中就包括微軟的圖靈自然語言生成模型,它可以理解文本,之前曾為電子郵件和Office應(yīng)用中的搜索工具提供底層技術(shù)。

  知情人士表示,當(dāng)這些團隊想要使用GPU開發(fā)新的AI工具或測試現(xiàn)有AI軟件時,必須向一位公司副總裁提交特別申請,獲批后才能使用硬件。

  知情人士稱,有些申請需要等待幾天甚至幾周才能獲批。自2022年末,微軟就一直對內(nèi)部的GPU資源實施配額供給,但1月以來的等待時間越來越長。

  微軟發(fā)言人在聲明中補充道,該公司正在為Azure等服務(wù)增加更多AI資源,并且遵循“優(yōu)先滿足客戶需求并根據(jù)需求進行調(diào)整的流程”。他們還補充道,微軟并不擔(dān)心AI資源。

  至少有一個微軟客戶透露,他們也經(jīng)歷了延遲訪問的問題。市場營銷軟件創(chuàng)業(yè)公司TouchCast創(chuàng)始人兼CEO Edo Segal說:“幾乎不可能立刻使用程序”。Edo的公司正在為多家車企開發(fā)基于GPT的互動式用戶手冊,而這項技術(shù)正是通過微軟Azure授權(quán)的。

  現(xiàn)有的AzureAI客戶幾乎未受影響。無人駕駛汽車開發(fā)商Cruise和AI搜索創(chuàng)業(yè)公司Perplexity的發(fā)言人都表示,他們在使用Azure的GPU資源時并未遇到困難。

  去年11月,微軟和GPU生產(chǎn)商英偉達共同宣布,微軟將新增數(shù)萬個處理器來擴大AI處理能力,但目前還不清楚采購進度。

  這兩家公司還在周一共同宣布,Azure的客戶很快就能搶先使用英偉達的新款H100 GPU——這款產(chǎn)品尚未廣泛發(fā)布。而知情人士稱,已經(jīng)有少部分微軟內(nèi)部團隊開始使用H100,但多數(shù)部門尚未獲得這項權(quán)限。

分享到:
責(zé)任編輯:zsz

網(wǎng)友評論