AI 大模型“淘金熱”退潮,“賣鏟者”狂歡

創投圈
2025
04/22
19:41
分享
評論

當大家都去挖金礦時,賣鏟子的最賺錢。

在 19 世紀的美國加州,無數懷揣財富夢想的人涌入金礦,卻鮮有人意識到,真正賺得盆滿缽滿的并非礦工,而是那些販賣鏟子、牛仔褲的商人。如今,大模型掀起的 " 淘金熱 " 席卷全球,在這場技術與商業的狂歡中,AI 基礎設施(AI Infra)正扮演著類似 " 賣鏟人 " 的關鍵角色。

從 GPT-3 到 PaLM,從文心一言到通義千問,大模型的參數規模以指數級增長,訓練成本動輒數千萬美元,推理所需的算力更是呈幾何倍數攀升。在這場競賽中,英偉達的 GPU 供不應求,華為昇騰芯片異軍突起,云計算巨頭紛紛加碼算力基建。

當市場聚焦于大模型本身的技術突破時,AI Infra 這個包括芯片、服務器、云計算、算法框架、數據中心等在內的底層支撐體系正成為決定勝負的關鍵戰場。中金預測,當前 AI Infra 產業正處于高速增長的發展初期,在未來 3-5 年內,其各細分賽道的市場空間有望保持 30% 的高速增長率,正成為大模型應用爆發背后 " 掘金賣鏟 " 的絕佳商業選擇。

釋放 AI 生產力的新鑰匙

回顧 ICT 產業的發展歷程,以基礎設施、平臺、應用為代表的三層架構似乎成為了其演進的必然趨勢。

在傳統的本地部署階段,操作系統、數據庫、中間件等基礎軟件發揮著不可或缺的作用,它們通過控制硬件交互、管理數據存儲、調度網絡通信等功能,有效解決了底層硬件系統的復雜性難題,讓上層應用開發者得以專注于業務邏輯的創新。

在 " 云定義一切 " 的時代,經典的基礎設施即服務(IaaS)、平臺即服務(PaaS)、軟件即服務(SaaS)協同進化架構應運而生。其中,PaaS 層提供的應用開發環境和數據分析管理等服務,為云計算的廣泛滲透奠定了堅實基礎。

在歷經漫長的蟄伏期后,AIGC 如同按下了 AI 通用化進程的快進鍵,整個產業在一片蓬勃發展的氛圍中加速重構。算力與應用無疑成為了最受矚目的焦點,但二者之間卻存在著巨大的鴻溝,這使得大模型面臨著 " 懸浮 " 無法落地或 " 踏空 " 錯失機會的風險。

如果將 AI 與云計算進行對照,算力、算法、數據可以被視作 IaaS 層級,而各類開源和閉源模型則是 SaaS 在大模型時代的全新演變形態,也就是 " 模型即服務(MaaS)"。

AI Infra 作為連接算力與應用的中間層基礎設施,聚焦企業級 AI 應用的私有化部署場景,涵蓋了硬件、軟件、工具鏈以及優化方法等多個方面,通過構建新型軟件棧及綜合服務,致力于為大模型應用開發、部署、運行和管理,打造一站式模型算力部署和基礎工具平臺,成為連接算力與應用的核心力量。

AI Infra 涵蓋了與開發部署相關的所有工具和流程。隨著云計算的持續發展,DataOps、ModelOps、DevOps、MLOps、LLMOps 等一系列以 "XOps" 為代表的概念不斷涌現。

從宏觀層面分析,所有 XOps 的本質都是為了提高開發部署生命周期的效率。例如,DataOps 旨在提升 IaaS 層的存儲和 PaaS 層的數據處理效率;DevOps、MLOps 則專注于提高 PaaS 層的開發部署效率;LLMOps 主要為 MaaS 層提供效率支持。

傳統的算力資源在使用過程中存在著利用率低、能耗高的問題。AI Infra 通過智能調度算法和異構計算技術,實現了算力資源的動態分配和高效利用。智能調度算法可以根據模型訓練任務的優先級、數據規模和計算需求,自動分配 GPU 集群資源,將算力利用率從傳統的 40% 左右提升至 75% 以上。

異構計算技術則整合了 CPU、GPU、NPU 等多種芯片的優勢,針對不同類型的計算任務進行優化,在保證計算性能的同時,降低了 30% 以上的能耗成本。例如,在圖像識別任務中,NPU 可以發揮其強大的并行計算能力,快速處理大量的圖像數據;而在數據預處理階段,CPU 則可以高效地完成數據讀取、清洗等任務。

AI Infra 提供了一套完整的算法工具鏈,涵蓋了數據預處理、模型訓練、推理優化等大模型開發的全流程。其中,AutoML(自動化機器學習)工具可以自動選擇最優的模型架構和超參數,無需開發者具備深厚的機器學習知識,即可快速搭建模型,將開發周期從數月縮短至數周。

模型壓縮技術通過剪枝、量化等手段,能夠將模型體積縮小 90% 以上,大大降低了模型的存儲和計算需求,同時不影響模型的性能,使得模型在移動端和邊緣設備上的部署更加高效。這些工具的出現,讓中小開發者和企業也能夠輕松地利用大模型進行應用開發,加速了大模型技術的普及和應用。

大模型的訓練和應用離不開高質量的數據。然而,數據的采集、清洗、標注過程往往耗時耗力,且容易出現數據質量不高、數據安全隱患等問題。AI Infra 的數據管理平臺通過自動化標注工具、數據增強算法和隱私計算技術,構建了一個高效的數據閉環。

自動化標注工具利用機器學習算法對數據進行自動標注,準確率可達 95% 以上,提高了標注效率;數據增強算法可以通過對原始數據進行變換、擴充等操作,生成更多的訓練數據,從而提高模型的泛化能力;隱私計算技術則可以在保障數據安全和隱私的前提下,實現數據的共享和協同利用,打破了數據孤島,釋放了數據的潛在價值。

在 AIGC 熱潮興起之前,關于 AI 中臺的理論研究與實踐探索就已開展得如火如荼。然而,彼時的 AI 中臺更像是 " 救火隊員 ",功能繁雜多樣,承擔了許多基礎且瑣碎的工作,卻難以獲得上下游的廣泛認可。

大模型的出現為 AI 平臺化搭建了更為廣闊的舞臺,也讓 AI Infra" 掘金賣鏟 " 的商業模式更具確定性,進而贏得了可觀的發展空間。

就如同 " 三明治 " 兩片面包之間可以有無數種夾層組合一樣,處于算力與應用之間的 AI Infra 同樣具有豐富的可能性。從廣義上講,AI Infra 涵蓋了人工智能基礎框架技術,涉及大模型訓練、部署領域的各類底層設施;狹義而言,基礎軟件棧是 AI Infra 的核心組成部分,其主要目標在于優化算力算法、推動應用落地。

對于企業級用戶來說,AI Infra 具備四大核心價值,在推動企業數字化轉型和智能化升級中起到關鍵作用。

第一,聚焦 AI 應用全生命周期管理。AI Infra 平臺不僅為企業提供了技術支持,還通過多樣化的工具幫助企業快速發現和開發符合業務需求的 AI 應用場景:簡化模型管理,無論是在本地、邊緣還是云端;快速部署與推理,無論是在虛擬機還是容器環境中;豐富的模型支持,可預置系統模型也可自定義模型;以及模型精調與優化、模型評估和性能測試等能力。

第二,加速企業級 AI 應用的落地。AI Infra 平臺不僅為企業提供了技術支持,還通過多樣化的工具幫助企業快速發現和開發符合業務需求的 AI 應用場景。這包括數據驅動的場景挖掘,支持 AI 應用構建,包括 Prompt 工程、向量檢索、知識庫管理,可靈活接入本地或線上模型;智能場景精準推薦,不僅支持通用的 AI 應用,還集成多樣化的 AI 解決方案;快速原型設計與驗證,快速構建和測試 AI 原型;行業模板與經驗支持,預構建的 AI 場景模板,無需從零開始,降低技術門檻。

第三,助力企業構建新型數字基礎設施。AI Infra 平臺不僅是一個 AI 應用開發和管理的平臺,更是企業構建新型數字基礎設施的關鍵工具。包括彈性計算與資源調度,支持異構 GPU 硬件加速,提供裸金屬、虛擬機和容器計算資源的彈性擴展;通過支持跨云和混合云架構和跨地域的部署,提供靈活的云資源調度能力;統一管理與自動化運維,集成智能運維工具,提供統一管理界面;具備邊緣計算能力,減少云端傳輸延遲和帶寬壓力,適合高實時性業務場景;增強數據治理與合規性,幫助企業遵循行業標準與法規要求,保護數據隱私與安全。

第四,推動企業數智化戰略升級。AI Infra 平臺通過數字化與智能化的雙重支持,推動企業在提升業務效率的同時,實現 AI 決策和自動化運營,進而實現數智化戰略升級,將 AI 深度融入到業務各個環節,通過加速 AI 推理應用,推動全方位的業務創新。

AI Infra 會是下一個必爭之地嗎?

相較于對模型價值的追求,投身 AI 應用領域已成為行業的普遍共識,在基礎模型之上將會誕生數以百萬計的應用,這些應用對現有業態的改造作用,遠大于從無到有的顛覆性創新。

如今,AI 應用的供給正呈現出爆發式增長。從 2024 年開始,視頻生成類模型產品密集涌現,快手的可靈、字節跳動的即夢、商湯的 Vimi 紛紛亮相,此外,AI 搜索產品、AI 陪伴類產品等也不斷推陳出新。

大模型應用的爆發趨勢已然明晰。根據 InfoQ 研究中心的數據,到 2030 年,通用人工智能(AGI)應用市場規模將達到 4543.6 億元。模型應用層所蘊含的巨大機遇,吸引了幾乎各行各業的積極參與。

當前,AI Infra 市場仍處于混沌未開的階段,國內呈現出 " 巨頭主導 " 的格局。華為、阿里、百度等科技巨頭憑借自身強大的技術實力和資源優勢,紛紛構建起相對封閉的 AI Infra 體系。

例如,華為的模型采用三層架構,底層是具備超強魯棒性和泛化性的通識性大模型,猶如一座穩固的基石,在此基礎上衍生出行業大模型以及針對具體場景和工作流程的部署模型。這種架構的優勢在于,當訓練好的大模型部署到垂直行業時,無需重復訓練,成本僅為上一層的 5%-7%,大大提高了效率,降低了成本。

阿里則為 AI 打造了統一底座,無論是計算機視覺(CV)、自然語言處理(NLP)還是文生圖大模型,都可以在這個統一底座中進行訓練。百度和騰訊也分別進行了相應的戰略布局。

百度擁有覆蓋超 50 億實體的中文知識圖譜,為其 AI 發展提供了豐富的知識支持,就像一個巨大的知識庫,為模型的訓練和應用提供了充足的養分;騰訊的熱啟動課程學習技術,則能將萬億大模型的訓練成本降低至冷啟動的八分之一,有效提升了訓練效率,降低了成本。

然而,這種封閉的生態也帶來了一些問題,中小供應商難以切入市場,導致市場缺乏專業化分工,創業公司面臨著 " 既難以依賴大廠,又難以獨立生存 " 的困境,整個生態系統的活力和創新能力受到一定的限制。

在國外,AI Infra 市場已經形成了相對成熟的產業鏈和生態系統。有的專注于數據標注,有的擅長數據質量提升,還有的在模型架構方面獨具優勢。這些企業憑借其專業性,在單一環節的效率、成本控制和質量保障上,往往比大廠親自操刀做得更出色。

以美國為例,出現了一批專注于 AI Infra 細分領域的企業。比如 Anomalo 專注于數據質量檢測,為 Google Cloud 和 Notion 等企業提供專業的數據質量評估和優化服務;Scale AI 則通過自動化標注工具,幫助企業降低數據處理成本,提高數據標注效率。

這些企業在各自的領域深耕細作,如同汽車行業的一級供應商(Tier 1),通過專業化分工,為大模型企業提供標準化、高質量的解決方案,形成了 " 大廠專注核心模型研發,供應商提供基礎設施支持 " 的良性生態。

然而,國內在這方面的發展尚不成熟。一方面,國內大模型領域的主要參與者多為大廠,它們都有自己成熟的訓練體系,外部供應商很難打入其內部。大廠就像一個個封閉的王國,擁有自己的一套完整體系,外部力量難以滲透。

另一方面,國內缺乏足夠龐大的創業生態和中小企業群體,這使得 AI 供應商在大廠之外難以找到生存和發展的空間。

以谷歌為例,谷歌愿意與數據質量供應商分享自己的訓練數據成果,助力供應商提升數據處理能力,而供應商能力提升后,又能為谷歌提供更多高質量數據,從而形成一種良性循環。

國內 AI Infra 生態的不完善,直接導致大模型創業門檻升高。如果將在中國開展大模型業務比作吃上一頓熱飯,那么創業者必須從開墾土地、種植作物等最基礎的工作做起,面臨著巨大的挑戰和困難。

目前,在 AI 2.0 的熱潮中,一個顯著特點是 " 兩極化 ":最熱門的領域集中在大模型層和應用層,而類似 AI Infra 的中間層卻存在較大的發展空白,這也可能蘊藏著下一個重大機遇。就像一座尚未被開發的寶藏,等待著探索者去發現和挖掘。

賣鏟不易,掘金更難

盡管在大模型應用爆發的當下,AI Infra 層潛藏著巨大的商業潛力,但對于從事 AI Infra 的公司而言,即便它們在專業領域實力強勁,面對市場的風云變幻,依然顯得較為脆弱。

英偉達的 CUDA 生態歷經 20 年的發展,在 AI 領域,最前沿的模型和應用通常都會率先在 CUDA 平臺上運行。

由于不同硬件之間存在各異的接口,CUDA 統一了這些接口的語言,讓使用者能夠運用一套標準語言來操作不同硬件。在模型開發過程中,開發者往往傾向于在同一語言體系下完成開發工作,這實際上構建了英偉達 CUDA 生態的深厚底蘊。

目前,CUDA 生態在 AI 算力市場占據了 90% 以上的份額。不過,隨著 AI 模型的標準化進程推進,模型之間的結構差異逐漸縮小,不再需要頻繁調度多種大小模型,英偉達 CUDA 生態的優勢在一定程度上有所削弱。即便如此,英偉達在算力市場的統治地位依然難以撼動。據業內人士預測,在未來 3-5 年,英偉達仍將是整個 AI 硬件提供商中的絕對領導者,市場占有率預計不會低于 80%。

對于 AI Infra 層的供應商來說,外部有英偉達這樣的 " 守礦人 ",如同在金礦門口售賣門票和鏟子,好不容易找到進入金礦的途徑,卻發現里面的 " 挖礦人 " 早已習慣 " 徒手 " 挖礦,對新的工具并不接受。

從商業模式看,部分 AI Infra 廠商采用訂閱制的商業模式,根據企業的算力使用量、模型調用次數或功能模塊使用情況進行收費。這種模式類似于 SaaS,企業無需一次性投入大量資金購買硬件和軟件,只需按照實際使用情況支付費用,大大降低了企業使用 AI Infra 的門檻。

例如,有些平臺推出了 " 基礎算力包 + 高級算法工具 " 的組合套餐,中小企業每月僅需支付數千元,就可以使用百萬級的算力資源和先進的算法工具,進行大模型的開發和應用。

對于大型企業和特定行業用戶來說,他們往往有著復雜的業務需求和特殊的技術要求,通用的 AI Infra 產品難以滿足他們的需求。因此,一些廠商提供定制化的 AI Infra 解決方案,從算力集群搭建、模型優化到應用部署,為企業提供全流程的服務。

為了促進技術的發展和應用的推廣,一些 AI Infra 廠商通過開源技術、開放 API 等方式,吸引開發者和企業共建生態。開源框架 PyTorch 和 TensorFlow 就是成功的案例,它們通過社區協作不斷優化性能,吸引了全球大量的開發者參與貢獻代碼,形成了龐大的開發者社群。

這種生態共建模式不僅加速了技術的迭代和創新,還通過生態影響力獲取商業價值。廠商可以通過提供技術支持、培訓服務等方式實現盈利,同時也為開發者和企業提供了一個交流和合作的平臺,促進了整個行業的發展。

在國內市場,企業對軟件和服務的付費意愿相對較低,更傾向于一次性采購硬件設備或自行研發解決方案。AI Infra 廠商需要通過實際案例和數據,向企業證明使用 AI Infra 產品和服務能夠帶來成本節約、效率提升等實際價值,從而增強企業的付費意愿。

用戶在選擇 AI Infra 產品和服務時,也面臨著 " 選擇焦慮 ",不知道如何選擇適合自己的產品。因此,構建一個開放、共享、協同的 AI Infra 生態平臺勢在必行。政府、企業和行業組織可以共同努力,推動大廠開放部分技術能力,鼓勵中小企業專注細分領域創新,為用戶提供更加便捷、高效的一站式解決方案。

此外,還需要不斷探索多元化的盈利模式,除了訂閱制服務和定制化解決方案外,還可以考慮與硬件廠商合作捆綁銷售、提供增值服務等方式,拓寬商業化路徑。

當所有人都在追逐風口時,真正決定行業格局的往往是那些默默打磨工具的人。在這個充滿變革的時代,AI Infra 恰似一片待開墾的沃土,它既是技術落地的 " 最后一公里 ",也是產業升級的 " 第一推動力 "。

盡管面臨技術、市場與生態的多重挑戰,但隨著標準的完善、技術的成熟與生態的繁榮,AI Infra 終將成為驅動智能時代的核心力量。

對于企業與開發者而言,只有構建起開放共贏的生態系統,培育專業化分工的產業格局,才能真正實現 " 讓應用更簡單,讓 AI 落地更便捷 " 的美好愿景。這場關乎未來的技術革命,不僅需要硬核的技術實力,更需要前瞻的戰略視野與生態共建的智慧。

淘金熱終會退潮,但修路的人永遠不缺機會。

來源:極智 GeeTech

THE END
廣告、內容合作請點擊這里 尋求合作
免責聲明:本文系轉載,版權歸原作者所有;旨在傳遞信息,不代表砍柴網的觀點和立場。

相關熱點

相關推薦

1
3
主站蜘蛛池模板: 亚洲一级在线观看| 噜噜噜噜噜在线观看视频| 99re九精品视频在线视频| 精品爆乳一区二区三区无码AV | 波多野结衣一区二区| 含羞草影院无限在线看| 青青草原综合网| 国产福利精品一区二区| 91麻豆最新在线人成免费观看| 好色先生视频tv下载| 中文字幕第13亚洲另类| 日韩三级电影免费| 亚洲乱码中文字幕综合| 欧美色图第三页| 人人妻人人澡人人爽曰本| 精品日韩欧美一区二区三区在线播放 | 翁公厨房嫒媛猛烈进出| 大学生日嘛批1| 久久综合狠狠综合久久97色| 欧美精品亚洲精品日韩专区| 免费在线观看一区| 精精国产xxxx视频在线播放| 国产乱码精品一区二区三区中| 国产精品亚洲综合五月天| 国产精品久久久久久搜索| 6580岁老太婆| 国产麻豆精品久久一二三| 丰满人妻熟妇乱又伦精品| 日韩人妻无码中文字幕视频 | 二区久久国产乱子伦免费精品| 精品久久亚洲中文无码| 国产91中文剧情在线观看| 1300部真实小u女视频在线| 在线视频一二三区2021不卡| jizz在线免费播放| 嫩草影院免费看| 一级毛片免费播放男男| 成人黄软件网18免费下载成人黄18免费视频| 久久久久无码国产精品一区| 日韩成人无码一区二区三区| 人人狠狠综合久久亚洲|