不久前,3D 大模型公司影眸科技完成了數(shù)千萬美元 A 輪融資。這一輪融資由美團(tuán)龍珠、字節(jié)跳動(dòng)領(lǐng)投,老股東紅杉中國種子基金、奇績(jī)創(chuàng)壇連續(xù)跟投,光源資本擔(dān)任獨(dú)家財(cái)務(wù)顧問。
據(jù)影眸科技創(chuàng)始人吳迪介紹,本輪融資將主要用于影眸科技在 3D 大模型的前沿探索,并加速以 3D 生成大模型 Rodin 為核心的 Hyper3D 系列產(chǎn)品在全球市場(chǎng)的商業(yè)化落地。
2024 年,資本及市場(chǎng)對(duì) AI 的關(guān)注迅速從技術(shù)前沿進(jìn)展轉(zhuǎn)向商業(yè)化收益。據(jù)了解,影眸科技推出的大模型 Rodin 自上線僅 45 天,年度經(jīng)常性收入(ARR)就已突破 100 萬美元,成為當(dāng)前 AI 創(chuàng)業(yè)公司中少有的商業(yè)化成功案例。
圖:Rodin 界面;圖片來源:企業(yè)供圖
Rodin 的快速增長(zhǎng)折射出 3D 生成市場(chǎng)的巨大潛力,尤其是隨著元宇宙、虛擬現(xiàn)實(shí)、具身智能等新興應(yīng)用場(chǎng)景的迅猛發(fā)展,3D 內(nèi)容的需求量正迎來爆發(fā)。
綜合相關(guān)行業(yè)數(shù)據(jù),游戲和娛樂、影視和動(dòng)畫、建筑與房地產(chǎn)(AEC)、制造業(yè)與產(chǎn)品設(shè)計(jì)、電商務(wù)與虛擬展示的 3D 建模外包市場(chǎng) TAM 總規(guī)模高達(dá) 149-335 億美元。
然而,傳統(tǒng)的基于幾何建模的手工創(chuàng)作 3D 模型不僅耗時(shí)費(fèi)力,還有著較高的技術(shù)門檻,極大地限制了 3D 內(nèi)容生產(chǎn)的效率和規(guī)模。在此背景下,生成式 AI 工具被視作是提高 3D 生成效率,降低 3D 內(nèi)容創(chuàng)作門檻的關(guān)鍵。
但問題在于,盡管 AIGC 的熱潮已席卷全球,目前,我們熟悉的大部分主流 AIGC 工具依然集中在圖像和視頻等 2D 內(nèi)容的生成上,屬于 3D 生成的 "ChatGPT" 時(shí)刻尚未真正到來。
這背后的原因是,受限于技術(shù),3D 大模型的生成質(zhì)量瓶頸尚未得到真正突破。
相較于圖像、視頻等形式,生產(chǎn)級(jí)的 3D 內(nèi)容需要滿足更為復(fù)雜和更嚴(yán)格的標(biāo)準(zhǔn)。除了生成速度、質(zhì)量,還要兼顧 3D 網(wǎng)格的結(jié)構(gòu)和拓?fù)滟|(zhì)量、UV 圖結(jié)構(gòu)以及紋理清晰度等。
吳迪坦言,雖然 3D 生成的質(zhì)量已經(jīng)被抬升到一個(gè)新的高度,目前的 3D 生成在材質(zhì)可用性、拓?fù)浣Y(jié)構(gòu)、UV 展開等方面還不能滿足實(shí)際應(yīng)用的需求。這些技術(shù)方面的短板,已經(jīng)成為 3D 生成行業(yè)前沿待攻克的重點(diǎn)問題。
這一背景下,全球范圍內(nèi),3D 生成技術(shù)的迭代正加速推進(jìn)。去年,影眸團(tuán)隊(duì)與上海科技大學(xué)合作提出的 " 可控 3D 原生 DiT 生成框架 CLAY" 和 "3D 服裝生成框架 DressCode",顯著提升了 3D 生成的質(zhì)量,被認(rèn)為是新一代 3D 生成的基礎(chǔ)框架。
與此同時(shí),海內(nèi)外已經(jīng)集中爆發(fā)了一批 AI 生成 3D 產(chǎn)品。
在海外,Meta 推出文生 3D 模型 Meta 3D Gen,可 1 秒生成 3D 素材;谷歌發(fā)布基礎(chǔ)世界模型 Genie2,根據(jù)一張圖片生成可供人類或 AI 智能體控制動(dòng)作、可玩的 3D 環(huán)境;英偉達(dá)發(fā)布 Edify 3D,支持從文本提示或圖像直接生成 4K 級(jí)別的 3D 實(shí)體與場(chǎng)景。
在國內(nèi),除了影眸科技上線了 AI 3D 模型生成產(chǎn)品 Rodin,騰訊也發(fā)布了 3D 生成開源模型 Hunyuan3D-1.0,可同時(shí)支持文字、圖像轉(zhuǎn) 3D 資產(chǎn),最快 10 秒完成端到端生成。
可以說,全球 3D 大模型選手們都在暗中較量、默默發(fā)力,從 a16z 押注的 Yellow、Kaedim、BackFlip,到李飛飛的 World Labs,AI 3D 生成的技術(shù)迭代正在加速逼近質(zhì)變的臨界點(diǎn)。
不過,從市場(chǎng)層面看,3D 生成現(xiàn)階段所輻射的用戶群體仍集中于游戲、視頻制作、電商、工業(yè)設(shè)計(jì)等 B 端領(lǐng)域,C 端市場(chǎng)的滲透率相對(duì)較低。
吳迪在和 36 氪的對(duì)談中對(duì)這一現(xiàn)象分析稱,與視頻、圖像以及音樂不同,3D 資產(chǎn)現(xiàn)階段還無法輕松地通過社交媒體進(jìn)行分享和傳播。
尤其是在當(dāng)前以二維為主的設(shè)備環(huán)境下,普通用戶對(duì) 3D 資產(chǎn)的需求尚未成熟,消費(fèi)場(chǎng)景也較為有限,這一現(xiàn)狀很大程度上影響了 3D 生成技術(shù)在 C 端市場(chǎng)的普及與推廣。
" 但隨著 3D 打印、AR 和 VR 等消費(fèi)級(jí)產(chǎn)品的不斷發(fā)展和普及,3D 生成有望在 C 端市場(chǎng)迎來爆發(fā)式增長(zhǎng)。" 在吳迪看來,隨著技術(shù)的成熟,3D 生成一定可以運(yùn)用在越來越多的領(lǐng)域,甚至像文字、圖像和視頻一樣成為普通用戶日常創(chuàng)作和分享的一部分。
圖:影眸團(tuán)隊(duì)在 SIGGRAPH Real-time Live! 環(huán)節(jié)展示 Rodin 3D 生成;圖源:企業(yè)供圖
正是基于對(duì)商業(yè)化的洞察,影眸在研發(fā)階段便以落地為目標(biāo),比如公司專注的 " 生產(chǎn)就緒(Production-Ready)" 標(biāo)準(zhǔn)。
這個(gè)標(biāo)準(zhǔn)指的是生成的 3D 模型可以直接適配后期制作管線,進(jìn)入實(shí)際生產(chǎn)流程,從而將用戶的興趣轉(zhuǎn)化為真正的生產(chǎn)力工具,并產(chǎn)生實(shí)際商業(yè)價(jià)值。
" 在更加遙遠(yuǎn)的未來,當(dāng)元宇宙、機(jī)器人成為生活中的一部分時(shí),3D 生成必然會(huì)迎來真正的爆發(fā)。" 吳迪表示。
近期 36 氪和影眸科技創(chuàng)始人吳迪進(jìn)行了對(duì)談,以下為采訪精編:
36 氪:作為一家由高校孵化的企業(yè),影眸的商業(yè)化進(jìn)展很多都基于學(xué)術(shù)研發(fā),可以簡(jiǎn)單介紹一下嗎?
吳迪:影眸孵化于上海科技大學(xué),2016 年起就在三維建模領(lǐng)域進(jìn)行研發(fā)。2024 年,我們有兩篇和 3D 生成大模型相關(guān)的文章獲得 SIGGRAPH 最佳論文榮譽(yù)提名,兩次入選 SIGGRAPH Real-time Live!,是該項(xiàng)目 50 年來首次入選的中國大陸團(tuán)隊(duì)。
36 氪:Rodin 為什么能做到上線僅 45 天就達(dá)到了 100w 美金 ARR?
吳迪:主要得益于對(duì)市場(chǎng)的精準(zhǔn)定位以及產(chǎn)品力。在研發(fā)和產(chǎn)品開發(fā)的過程中,我們始終把 "Production- Ready" 作為研發(fā)的核心指標(biāo),我們要做的就是可直接使用的技術(shù)的研發(fā)。而且,在研發(fā)的過程中,我們對(duì)比了所有技術(shù)路線,沒有選擇當(dāng)時(shí)更被廣泛關(guān)注的 "2D 升維 " 的技術(shù)路徑,而是選擇了當(dāng)時(shí)并不被看好的 "3D 原生 " 路線,即從該模型的訓(xùn)練、監(jiān)督、生成都在三維中進(jìn)行。這雖然讓我們的產(chǎn)品比同行晚了半年發(fā)布,但也讓我們產(chǎn)品的生成效果在當(dāng)時(shí)的行業(yè)內(nèi)實(shí)現(xiàn)了代差級(jí)的領(lǐng)先。
36 氪:在技術(shù)路徑上,影眸并沒有跟隨大多數(shù)人去采用 2D 升維的技術(shù)路線,而是選擇 3D 原生,這背后的考量是什么?
吳迪:2D 升 3D 的路徑是當(dāng)時(shí)行業(yè)內(nèi)被普遍認(rèn)同,也是用的最多的,因?yàn)閺亩嘁暯堑亩S圖像來得到三維信息最符合大家直覺,同時(shí)大家普遍覺得三維資產(chǎn)不夠,需要用二維資產(chǎn)補(bǔ)足,但我們?cè)谧铋_始接觸目標(biāo)客戶的時(shí)候,我們就發(fā)現(xiàn)他們其實(shí)不只是需要能生成 3D 模型,更重要的是這個(gè) 3D 模型的可用性要足夠好。
我們當(dāng)時(shí)結(jié)合自己在圖形學(xué)領(lǐng)域數(shù)年的研究經(jīng)驗(yàn),認(rèn)識(shí)到當(dāng)三維數(shù)據(jù)被壓縮到二維時(shí),無論有多少視角,都無法完整表達(dá)物體三維結(jié)構(gòu)中的每個(gè)細(xì)節(jié),這會(huì)導(dǎo)致 2D 升 3D 的路徑很難達(dá)到客戶的使用標(biāo)準(zhǔn),同時(shí) 3D 原生能保留更多信息,生成質(zhì)量的上限會(huì)更高。
如果當(dāng)時(shí)選擇了 2D 升維這條路的話,我們可能很快就能推出產(chǎn)品,但最后還是沒這樣做,Rodin Gen-1 比別人晚發(fā)半年左右。
36 氪:但其實(shí)很多企業(yè)都會(huì)擔(dān)心自己的產(chǎn)品發(fā)布落后于同行,在做這個(gè)選擇的時(shí)候不會(huì)有顧慮嗎?
吳迪:這確實(shí)是一個(gè) " 敢為天下后 " 的決定,但在當(dāng)時(shí)我們幾乎沒有猶豫,因?yàn)槲覀儓?jiān)定認(rèn)為只有 3D 原生的技術(shù)路徑才能達(dá)到更接近商用的標(biāo)準(zhǔn),我們?cè)趦?nèi)部把他稱為 "Production- Ready",這也是影眸研發(fā)和開發(fā)產(chǎn)品的核心標(biāo)準(zhǔn)。要達(dá)到 "Production- Ready",除了建出模型,還在 3D 表達(dá)、拓?fù)洹V 展開、材質(zhì)等方面有更多要求。Rodin Gen-1 雖然比其他產(chǎn)品發(fā)出的更晚,但它是最早跨過 " 可用性 " 那條標(biāo)準(zhǔn)線的 3D 大模型產(chǎn)品。當(dāng)然即使我們現(xiàn)在這一代模型已經(jīng)提升了質(zhì)量上限,它與真正可以接入到流程還有距離。
36 氪:這種差距具體表現(xiàn)在哪里?
吳迪:由于在一些場(chǎng)景,比如游戲中要使用一個(gè)模型,他會(huì)有很嚴(yán)格的要求,比如在剛說到的拓?fù)浣Y(jié)構(gòu)、UV 展開還有一些絕對(duì)的細(xì)節(jié)量上,即使我們已經(jīng)做的非常不錯(cuò),但仍舊會(huì)有距離。客戶在使用的過程中還是需要經(jīng)過修改甚至是重新制作。
36 氪:公司的收入分布是怎樣的?
吳迪:我們有 70% 的收入來自海外,在美國、歐洲、日韓都有業(yè)務(wù)布局,其中歐美的份額占比較大,占大約 50% 以上。比如有一個(gè)來自德國的用戶,調(diào)用我們的 API 做了一個(gè)非常有吸引力的產(chǎn)品,這個(gè)產(chǎn)品甚至本身就超過了 50 萬美元的 ARR。
36 氪:影眸的核心客戶群體有哪些?
吳迪:目前還是集中在游戲、視頻制作、電商這些泛娛樂、新消費(fèi)場(chǎng)景。但 3D 生成也正在不斷地拓展使用邊界,像 3D 打印、具身智能、工業(yè)設(shè)計(jì)都是我們未來目標(biāo)的的核心用戶群。
36 氪:有沒有具體的案例可以講一下?
吳迪:以我們與拓竹的合作為例,我們之間合作實(shí)際上是拓竹基于我們的技術(shù)開發(fā)出產(chǎn)品,然后將產(chǎn)品開放給客戶。在拓竹官方的 printmo 項(xiàng)目中,用戶僅需上傳一張圖片,AI 就能把它轉(zhuǎn)換成寵物小精靈的風(fēng)格,然后由我們的技術(shù)完成 3D 生成,再由用戶的 3D 打印機(jī)打印為實(shí)體。這也是我們?cè)?3D 打印領(lǐng)域的第一次嘗試。
36 氪:這些客戶的需求對(duì)于影眸在技術(shù)上的迭代有哪些影響?
吳迪:影眸的所有技術(shù)層面的迭代幾乎都是基于客戶需求的。比如說游戲、視頻制作等領(lǐng)域需要的模型都是拓?fù)湟?guī)整且合理、UV 利用率高的模型,我們接下來的技術(shù)研發(fā)就會(huì)朝著這個(gè)目標(biāo)前進(jìn)。但當(dāng)我們橫跨到工業(yè)設(shè)計(jì)等領(lǐng)域,需求就完全不同。所以從最長(zhǎng)期的角度考慮,我們希望能夠找到一種一統(tǒng)天下的 3D 表達(dá)方式,可適配不同場(chǎng)景,對(duì)各種需求下的三維模型都能做到很好的轉(zhuǎn)換和適配。
2024 年底,我們最新上線了 Rodin Gen-1.5 版本的模型,這次升級(jí)通過新一代 3D 原生表達(dá),全面解決了行業(yè)內(nèi)長(zhǎng)期存在的薄面與邊緣銳度問題,讓生成的模型有更加銳利和平直的邊緣。這個(gè)需求在游戲,尤其是產(chǎn)品設(shè)計(jì)領(lǐng)域中尤為重要。這次升級(jí)也讓我們的產(chǎn)品領(lǐng)先幅度再次擴(kuò)大。
36 氪:影眸如何看待 3D 生成的未來發(fā)展?
吳迪:在未來 3D 生成還有很大的可供挖掘的空間。要實(shí)現(xiàn)在 AR/VR/ 虛擬世界中的個(gè)人創(chuàng)作,就要解放用戶的 3D 內(nèi)容創(chuàng)作能力。作為構(gòu)建在三維空間中的世界,未來機(jī)器對(duì)世界的理解也必然基于三維。3D 生成會(huì)實(shí)現(xiàn)空間智能的最重要組成部分。
來源:36氪