不知經常往舊金山城里跑的小伙伴,有沒有在路邊見過這樣的廣告:
" 按周、天或小時租用 H100 芯片。
3.2TB/s InfiniBand 高速網絡,k8s / Slurm 開源系統,就是這種東西。"
下面還寫了一排官網地址給你 " 撕 "。
作為全世界生成式人工智能的火熱據點,舊金山街道遍布的各類 AI 廣告早已成為它的 " 城市特色 "。可即便如此, 這個 " 出租算力 " 的概念仍然很酷,而且是把高高在上的英偉達 H100 變得如此接地氣,在 AI 圈內引起了一陣小波瀾。
半年多過去,這家做算力生意的初創公司「San Francisco Compute」從名不見經傳的 "Underdog" 來到臺前。上周,Sam Altman 親弟弟 Jack Altman 主理的 Alt Capital 領投其 1200 萬美元種子輪融資,讓它的估值來到約 5 億人民幣(7000 萬美元)。
AI 算力市場的 "Airbnb"
我們知道,能否及時獲取足量計算資源可能會決定一家 AI 初創公司的成敗。而通常只有規模最大、資金最充足、關系最廣的大公司才能確保獲得所需算力。高性能 AI 芯片不僅成本高昂,還需要簽訂長期合同,這對資金有限、業務需求多變的中小企業構成了巨大障礙。
SF Compute 就是為了解決這個難題而生。它專注于為早期公司提供經濟實惠、短期靈活的超級計算資源訪問權限,幫助它們更高效、更經濟地開發和訓練 AI 模型。有點類似 Airbnb 在住宿領域的做法:通過共享和按需租賃,讓用戶以較低成本獲取所需資源,短時間內使用大量計算能力。
具體是通過以下兩種服務模式:
1. 短期計算資源租賃
與需要簽訂長期合同(通常為 1-3 年)的傳統提供商不同,SF Compute 提供按周、按天、甚至按小時計費的短期算力租賃服務。同時具備可擴展的集群,讓用戶根據實際需求來動態調整其計算資源使用量,完全實現 "GPU 定制自由 "。
你可以租 768 個 H100 使用一周,也可以借 8 個 H100 運行 2 小時。SF Compute 還為 512 - 4096 個 GPU 的大規模預訂提供有競爭力的定價。例如租賃 512 個 H100 兩周只需 50 萬美元,遠低于在其它提供商那里一年 1200 萬美元的花費。
這種以實惠價格 " 爆發式 " 訪問巨大算力的靈活選項,特別適合需要高性能計算但不想承擔長期財務負擔的用戶。包括資金有限、業務可能快速變化的 AI 初創公司,以及實驗室或研究員需要強大算力支持的短期項目等。
根據 SF Compute 官網信息(下圖):當前 GPU 使用價格為 2.85 美元 / 小時,下一個可用時間段是 8 月 4 日。從現在到明年 1 月 5 日的可用容量在逐步增加,到年底達到 912 個 H100 GPU。
目前三個公共算力集群部署中:Angel Island 集群有 192 個 H100 GPU,于去年 11 月上線。Bay Bridge 和 Coit Tower 分別有 512 和 1024 個 H100 GPU,計劃明年春季上線。
2. 計算能力交易平臺
除租賃服務外,SF Compute 還在開發一個計算能力交易平臺,以使用戶更便捷地按需買賣計算資源,進一步降低算力獲取難度和成本。通過允許小型 AI 公司與大企業競爭來民主化高性能計算的訪問。
據悉,公司已經獲得了相當于 8000 個 H100 的資源來支持這一計劃。剛籌集的 1200 萬元資金也會投入平臺建設。
坐標舊金山腦谷,16 人團隊里三分之二當過創始人
SF Compute 總部位于硅谷舊金山,辦公室就設在 AI 公司扎堆密集、被稱為 " 腦谷 " 的 Hayes Valley。2023 年由Alex Gajewski(右)和Evan Conrad(左)共同創立。
Alex Gajewski任公司 CEO,畢業于哥倫比亞大學數學系。在開始舊金山計算公司之前,Alex 曾創立 Metaphor,主導訓練了一個覆蓋十億頁面的大型對比模型和一個神經搜索引擎。他還在公司加速器 AI Grant 第一批項目中發揮了重要作用。職業生涯致力于減少創建最先進 AI 模型的障礙和促進多樣化的公司生態系統。
Evan Conrad在科技行業擁有豐富的職業生涯。曾在 OpenAI 的 ChatGPT Enterprise 部門短暫工作過,擔任過八個月的 AI Grant 董事。之前聯合創立了 Quirk 和 Moder LLC 并分別工作近四年。他還擔任過 Segment 軟件工程師,有 Amazon 和 AppDetex 的實習經歷。
兩人創立 SF Compute 的淵源也很有意思。
因成為合租室友而相識后,Alex 和 Evan 本來是打算成立一家 AI 音樂初創公司。為了擴展音樂生成模型并向潛在投資者展示成果,他們聯系了當時的每一家 GPU 提供商,以尋求 1 個月的算力訪問權限。結果被所有人告知最少購買期限是一年,費用 100 萬美元起步,而他們根本就拿不出 100 萬。
" 沒人愿意只賣一個月的使用權。這很好理解:如果你運營一個大型集群,最好是以 1 到 3 年的合同出售并預先支付所有費用。這樣風險更小,利潤更高。為什么要把集群賣給 Junelark 這種幾乎沒有資金的兩人音樂初創公司,況且他們可能在合同結束前就倒閉了?" Evan 說," 不幸的是,我們就是 Junelark。我們的朋友也大多數是這種情況。"
" 如果你不是那些‘神圣的少數’之一,實際上就被市場定價排除在外。 沒有重大資金支持,你根本沒得選擇。"
尋求 GPU 受挫的兩人于是嘗試聯系其他同樣需要計算能力的創始人,認為如果有十幾家初創公司一起加入,他們就能共同負擔得起一份年度合同。
沒想到短短幾周內,就吸引來 170 家 AI 公司簽約。看到這個龐大的市場需求后,兩人果斷放棄了 AI 音樂夢想,決定成為一個專門為大規模訓練任務提供超級計算資源靈活訪問的 GPU 云供應商。
不僅是 " 淋過雨后方知給他人撐傘 ",在算力民主化、資源共享、扶持小型實體與大企業競爭這些備受硅谷科技社區推崇的理念背后,SF Compute 也正中大量 AI 公司創始人苦于拿不到算力推進項目的痛點。
五個月前 Evan Conrad 在一次演講中表示,SF Compute 每個月都在把算力賣給學術實驗室、研究人員、初創公司,這是其他人永遠不會重視的客戶。
當時他們的運營利潤約為 100 萬美元,預計在兩個新集群上線后將增加 10 倍,達到每年 1000 萬美元。公司的早期客戶中還包括哈佛大學和普林斯頓大學的研究實驗室,以及 PlayHT Inc.、Phind 和 Liquid AI Inc. 等初創公司。
目前 SF Compute 在 LinkedIn 的關聯員工為 16 個人。Evan 在 X 發文透露,其中有 10 名員工都是前創始人。他們也正在招聘核心基礎設施工程師、機器學習系統工程師和產品工程師職位(有興趣的可以關注一下)。
公司風格頗有《硅谷》電視劇里的感覺。員工們編程累了,就會解物理題目來 " 放松 "。
也用文章開頭那種樸實無華的方式打了許多本地硬廣。
再看幾個,比如路邊公告牌:
候車大廳:
以及下面這條," 為你的下一個 H100 賬單立省 2000 萬美元。"
用戶 Micheal Black 說," 唯在舊金山有這樣的 sense。做廣告的關鍵是了解你的客戶。我在想,是的,我確實想在 H100 上省 2000 萬!"
硅谷這片科技熱土,歷來盛產充滿冒險精神的創業者和想創業的人們。通常現在一場前沿 AI 活動的觀眾里,一半以上都是人工智能相關公司創始人。
這些人對訪問大量高性能 AI 計算資源有著迫切的渴求,卻總被財大氣粗的成熟企業擠到一邊,可能手握出色的想法、技術卻無法到現實世界驗證和呈現。而今 San Francisco Compute 的出現,讓雙方得以互相成就。
市場競爭與未來發展
當然,SF Compute 并不是唯一一家提供部分計算能力訪問的公司,在市場中也面對幾家頗為強大的同行對手。
例如 Lambda Inc,最初是一家面部識別公司,后來轉向為包括英特爾公司和國防部在內的頂尖機構提供按需的 GPU 工作站、服務器和云計算資源。更知名些的有 " 英偉達小弟 "CoreWeave,起初是一家加密貨幣挖礦公司,也轉型成 GPU 加速云計算服務供應商,專注于支持生成式 AI 和其他需要高性能計算的任務。最近它完成了 11 億美元融資,估值已達 190 億美元。另外還有提供低成本算力租賃服務的 Vast.ai 公司,和擁有全球分布 GPU 云及無服務器端點的 RunPod 公司等。
雖然競爭激烈,但 SF Compute 在短至小時的租賃時間和集群使用量上的靈活度、更具競爭力的價格和專注中小企業甚至個人等方面,還是拉攏了屬于自己的特定客戶群體。而未來即將推出的計算資源交易平臺,也將成為它下一大制勝優勢。
SF Compute 稱,接下來會把團隊主要工程人員翻倍至 30 人,進一步增強服務能力,提高市場地位。
作為投資人,Jack Altman 預計會有越來越多的用例出現:" 風險投資公司和其他鎖定長期 GPU 交易的公司都可以利用這個平臺來買賣訪問權。許多群體可能成為客戶。"Jack Altman 說,"San Francisco Compute 已經展開了許多合作洽談,我認為這是一個非常值得看好的方向。"
來源:硅星人