CMC 資本:AI 2.0 革命:產業視角下生成式 AI 如何落地

創投圈
2024
07/25
21:31
分享
評論

 

      生成式 AI 在過去 2 年吸引了全球目光,ChatGPT 用破紀錄的 5 天時間達到百萬用戶,2 個月破億,Sora 可生成最長 1 分鐘的模擬真實世界的視頻,Suno 創作出讓用戶驚艷的音樂作品,我們看到 AI 在文本、圖像、視頻、音頻生成等領域取得了重大突破,OpenAI 和 Anthropic 為代表的公司完成了數十億到百億美金的融資。大家在經歷 AI 技術日新月異的突破的同時,也關注生成式 AI 如何應用落地,如何產生商業價值。

CMC 資本投資了快手(1024.HK)、B 站 ( NASDAQ: BILI、9626.HK ) 、快看漫畫、網易云音樂(9899.HK)、愛奇藝(NASDAQ:IQ)等互聯網平臺,兄弟企業 " 華人文化集團公司 " 控股電視廣播有限公司(00511.HK,香港 TVB)、正午陽光、紫龍游戲、華人影業、東方夢工廠、日月星光等具有領先優勢的內容集群和綜合協同生態,以上都是生成式 AI 的天然應用和落地場景,因此在深度覆蓋技術供給端的科技公司進展的同時,也關注到產業端有強烈的 AI 需求,互聯網平臺公司在積極嘗試 AI,用 AI 制作了不錯的作品,但還在尋找好的商業模式。在產業端大規模的有效商業落地更是處于早期階段,也存在著各種挑戰。

本文由 CMC 資本管理合伙人陳弦指導,投資副總裁王鶴宇執筆,將帶著產業視角,談一談 CMC 對生成式 AI 在 B 端產業落地的思考。

1. AI2.0 時代和新型生產關系

AI1.0時代

大家過往接觸的 AI,即所謂 AI1.0,是判別式 AI,機器可以在計算機視覺、自然語言理解等領域超越人類,常見的智能內容推薦、智慧安防攝像頭、貨架識別等都是 AI1.0 時代的應用,誕生了商湯為代表的 "AI 四小龍 " 和字節這樣的超級獨角獸。

模型架構上,AI1.0 時代主要基于 RNN 等網絡,RNN 的數據處理使用的是串行,導致處理長序列數據能力有限;訓練方法上,主要使用有監督學習,需要大量的標注數據和專業的編程人員,以上都導致其 Scalability 有限,往往一個模型對應單一的任務,其自身的泛化能力也有限。模型的參數通常在百萬 - 千萬級別,因此在算力上,部分模型使用消費級顯卡即可。

AI2.0時代

模型架構上,2017 年谷歌提出了 Transformer 架構,引入自注意力機制,如在自然語言處理時,它能讓模型評估句子中各個詞的重要性,從而根據上下文鎖定關鍵信息,提高下一階段的文本預測與建模能力。Diffusion 模型,模仿物質在氣體或液體中擴散的過程(如墨水在水中的擴散過程),通過前向擴散(加噪)和反向擴散(去噪)不斷修正訓練自己,在圖像、視頻、音頻領域展現了良好的生成能力,超越了 GAN 的地位,模型本身的 Scalability 較 AI1.0 時代取得重大進步。

訓練方法上,Transformer 主要使用自監督學習,無需人工標注數據和專業編程人員,可以自動適配和執行各種任務,大幅提高了模型的 Scalability。

近些年 GPU 計算能力的進步,使得早在 2017 年就提出的 Transformer 架構成為可能,Transformer 為代表的大模型的參數量在百億以上,在當時的 GPU 能力下無法進行有效訓練。但英偉達代表的 GPU 不斷進步,其制程從 28 納米進步到 5 納米,NVLink 技術增加了 GPU 間通信的效率,GPU 的調度能力也獲得提升,千卡 GPU 集群并行計算成為可能,促進了算力能力大幅度綜合提高,為大模型的訓練提供了基礎。

以上的模型架構的突破、訓練方法的優化、GPU 能力的提升,共同驅動了生成式 AI 開啟 AI2.0 時代。基于超級海量數據訓練的大模型,可以生成文本、圖像、視頻、音頻和 3D 等各類媒介的內容,具有更強的理解、推理和創造能力,也解鎖了 AI1.0 時代(安防和智能推薦為主)以外更豐富的場景和更大的市場空間。預訓練的模型,本質集成壓縮了豐富的世界知識,在泛化性上有極大的提升,如果將 AI1.0 的模型能力類比于只能完成特定任務的學前班學生,大模型是高中生,具備可以完成多個任務的能力。

如前所述,生成式 AI 在模型架構、訓練方法上具備良好的 Scalability,展現出了 Scaling Law,即越多的訓練數據,越多的模型參數,就會獲得越強的 AI 模型能力。目前 Scaling Law 還在發揮作用,因此也有部分業界把生成式 AI 當作未來有可能實現 AGI(通用人工智能)的方法之一。

新型生產關系

我們看好生成式 AI 的新范式,不僅是其遠大于 AI1.0 的市場空間,更是看好其所代表的新型生產關系。過去的生產過程中,工廠消耗能源和基礎材料,制造出實體的產品。未來的核心生產關系將圍繞著電力、AI 模型和 token(數據)展開。數據中心作為 AI 工廠,在電力供能下,結合 AI 模型,通過 token 不斷生產信息化的內容(語言、圖形、視頻、音樂等),也即是新的成產出來的產品,圍繞 token 的新型生產關系正在形成,構筑新一輪的信息工業革命。當然以上是我們認為的遠期狀態,當前也僅僅是生成式 AI 取得大的影響力突破的第二年,該新型生產關系還在構建和發展中。

2. 生成式 AI 并非完美,也給應用落地帶來了挑戰

在語言、視覺和音頻領域,我們看到了過去一段時間生成式 AI 日新月異的發展,這離不開 Transformer 和 Diffusion 模型的突破。但與此同時,我們也看到了大語言模型存在幻覺的問題,AI 生成的視頻和圖像也并不穩定,我們在看到巨大潛力的同時,也不能忽視其不完美的現狀。

B 端對內容的精準、可控、一致性、可靠性、穩定性有著極高的要求,C 端雖然相對要求更包容,但也存在著來自合規性的監管,這些要求給尚不滿完美的生成式 AI 如何落地帶來了挑戰。

Transformer 模型,1)缺乏可解釋性,神經網絡本質上是黑箱模型,輸入和輸出之間的關系是通過訓練數據和復雜的計算學習到的,而非通過明確的規則編碼,在金融、醫療等復雜、專業或者高度監管的行業中,模型的決策過程需要符合特定的法規和標準,不可解釋性可能導致合規性問題;2)會出現幻覺,產生邏輯謬誤、捏造事實以及數據驅動的偏見,也就是通俗說的大模型 " 一本正經的胡說八道 ",客戶可能對模型的輸出結果持懷疑態度,難以建立信任,如用 AI 檢索的結果,為了保證真實,需要復查,特別是在安全性和嚴肅性要求較高的場合此問題更加突出;3)除此之外,計算和內存消耗大,特別是在處理大規模數據集時,需要大規模并行計算能力;4)優化難度大,模型的復雜性和參數量大增加了優化難度。

Diffusion 模型,1)擴散模型可以生成圖像和文本,但它們還難以同時理解和生成涉及多種類型數據的復雜多模態內容。比如目前用擴散模型生成一張 " 紅色衣服 " 的圖片較為簡單,但讓其生成一張胸前印著 " 明天總是美好的 " 紅色衣服圖像,生成的衣服上的文字往往出錯;2)擴散模型仍是隨機采樣,導致其生成內容的精準、可控、一致性等方面仍然不足,比如同樣的 prompt 下,AI 生成的 2 個漫畫男孩不是同一人,這就導致了應用前后不對應的問題,使得商業落地困難。雖然業界在積極探索,ControlNet,LoRA,Dreambooth 等技術的出現對局部內容實現了控制,如人臉、畫風、動作等,但仍有較大的進步空間;3)其基于高斯求和的方式會帶來求解難度的提高,尤其隨著維度的上升會帶來顯存占用的幾何級別的增長。這種架構下,顯卡的顯存大小限制了視頻的時長,目前最長的 AI 生成的視頻時長在 1 分鐘左右,仍無法在長視頻應用場景呈現。

雖然目前的模型能力還有不足,但我們也注意到模型架構也在迭代。工程上,如融合了 Transformer 和 Diffusion 的 DiT,使用 Transformer 替換 U-Net 主干,并在潛在空間訓練,展現出了比單純 Diffusion 更好的訓練效率和生成效果。再如 Mamba 架構,可進行 " 線性時間序列 " 建模,隨序列長度增長其計算保持線性增長,而非 Transformer 的指數級膨脹,同時改善了注意力機制,減少了處理序列數據所需的計算量,加快了數據處理速度。同時學術界也在對模型底層的數學、人腦科學做更深層次的研究,希望能找到更多樣化的實現 AGI 的通路。

3. 落地思路:"End to End" vs "Step by Step"

目前生成式 AI 的產業落地,大致分為 2 種思路,即 "End to End/ 端到端 " 和 "Step by Step/ 按步驟拆解 ",相應特點也有不同。

End to End

方法:跳過現有專業制作流程,直接一步生成最終的內容

代表產品:ChatGPT, Midjourney, Suno

落地場景:主要在 C 端大眾用戶,用于泛娛樂的場景,或者非嚴肅場景,如編程,信息檢索等

特點:1)簡單直接,通常輸入文字 prompt 描述,直接產出最終的內容;2)" 黑盒 " 狀態,過程不透明,生成的結果具備隨機性;3)生成的內容往往不精準和不可控;4)基本上通過多次生成,選擇最滿意的方式進行生產

以漫畫創作為例,漫畫工具 "AI Comic Factory",提供了簡單易用的用戶界面和使用步驟

以上可見,目前端到端的產品易于上手,但同時因為無法對過程進行控制,且目前 AI 技術又不能一步到位生成高質量的內容,所以局限了出品的作品品質,更多的還是在用在 for fun 或者專業制作 workflow 中各步驟的第一步創意環節,如動畫美工 / 畫師或影視劇導演,在創作過程中將腦中的想法迅速通過 AI 畫圖展現出來,高效呈現預覽效果,方便團隊內部溝通及靈感碰撞。

Step by Step

方法:盡量沿用現有的工作流,不追求一步到位,AI 專注于每一步工作的提效

代表產品:Adobe Firefly,ComicsMaker.AI

落地場景:主要用于 B 端的專業工作者,用在高質量工業級的生產制作流中

特點:1)對每個環節的生成內容相對更精準、更可控,2)往往和現有工作流和制作工具融合,更易于流程管理

以專業的動畫創作為例,以下是國內某 2B 定制化 AI 內容創作公司的案例,專業的動畫制作環節包括 " 人設圖 - 分鏡 - 排版 - 草稿 - 線稿 - 上色 - 動畫 ",其創作工具依照現有專業 workflow 設計,目標在創作過程中降本增效,目前在一些案例中可以得到 40% 的人力成本節省。雖然 AI 的能力看似無所不能,多方面都可以覆蓋,但實操上每個環節涉及到眾多的細節,如何反哺 AI 的產品能力,甚至進階的精簡 / 重塑專業的工作流,這都需要和產業方共建。

我們認為,雖然生成式 AI 在過去 2 年取得了快速發展,但今天行業仍在早期,長期我們確信 AI 會顛覆現有的工作流,甚至企業的管理學,但從務實的角度,B 端的 AI 落地,會經歷 1)短期先 Step by Step 在可能的環節部分落地,降本增效;2)行業公司效仿,滲透率提升;3)技術進步,更多環節可以被 AI 賦能,滲透率再次提升;4)技術迭代,workflow 開始合并縮短,甚至出現全新的成產方式;5)理論上最終極的方式可能是一步端到端。

4. 行業 know-how 和專有數據對 B 端落地不可或缺

根據上文,按照步驟拆解的思路在 B 端產業落地,需要更多的行業 know-how 和專有數據。如上文的動畫制作案例,第一步就是拆解工作流,如 " 人設圖 - 分鏡 - 排版 - 草稿 - 線稿 - 上色 - 動畫 ",本身就是 know-how。然后每個環節如何和 AI 結合,如何高質量打標簽,如何實現美學對齊(比如創作端什么內容才是 " 美 ",什么才是 " 好 " 等),哪些功能和模塊更符合使用需求,也是需要與行業 know-how 結合打磨,也是 PMF 的過程。

專業制作內容,有大量的數據 1)本身很難或者無法進行數字化沉淀,如電影 / 漫畫的分鏡設計,其構思往往在導演 / 創作者腦中,無法有效沉淀;2)在制作方手中,特別是制作環節過程中產生的高質量結構化數據,對模型訓練有巨大幫助,但往往這些數據并不是公開的。相關數據的缺乏導致了 AI 模型本身無法有效獲得訓練而不具備對應能力,這也是上文案例動畫制作環節中,分鏡設計的 AI 滲透率極低,但上色環節(公開數據較多)有較好效果和滲透率的原因。

預訓練模型的本質是歷史數據和知識的壓縮,數據的質和量極大程度決定了 AI 能力。專有數據對于提升模型能力,滿足企業的特定需求(調性風格、品牌特點、行業知識等)至關重要。

因此我們也期待產業方更開放同科技公司合作,目前雖然中國底層大模型的發展和學術研究暫時還處于追趕國外的狀態,但中國的產業更豐富,我們對應用的落地有著更強的人才和資源投入,我們在 AI2.0 的商業化應用上有機會復現中國在 AI1.0 時代的引領地位。

5. B 端需要的并非單一的AI產品和工具

對企業客戶來說,經過我們的調研,相比于底層技術和實現方式,其往往更關注交付的效果,所以生成式 AI 的落地,除了行業 know-how 和專有數據以外,我們認為需要滿足以下幾點:

首先,是多個模態的組合

生成式 AI 的落地在眾多的行業和場景,但從介質的角度來看,主要是文本 / 圖像 / 視頻 /3D/ 音頻。真的在產業落地,單一的模態往往是不充分的。其中,文本往往被廣泛用作跨模態(和圖像 / 視頻 /3D/ 音頻)交互的自然語言,連接著多模態的組合。如 AI 制作 3D 游戲,就涉及到文本、圖像和 3D 等模態,文本可用于編程和對話,以及其他模態的交互,圖像用于人物設計的美術環節,3D 用于建模環節。

其次,還會是多個模型構建的系統

大模型和小模型的組合:大模型泛化和通用性強,但對于很多 AI1.0 時代已經解決的標準化的場景,用小模型更具備經濟性(算力消耗少),因此可以組合大模型和小模型搭配,分別完成復雜和標準場景。

通用和垂直模型組合:通用模型覆蓋大部分業務,但對特定的垂直領域,調用對應的垂直模型,如法律翻譯和文學翻譯,AI 翻譯系統可以是不垂直模型的組合。

除此之外,為了實現特定的目標,還會包含眾多的嵌入的模塊來擴展模型能力的邊界,從而構成一個系統。比如會在 Stable Diffusion 模型中加入 Control Net 的神經網絡架構,通過選擇不同的輸入條件,生成滿足特定需求的圖像來實現內容控制。或者在模型中加入文本特征抽取模塊,多層映射網絡實現關鍵詞解耦,從而提升理解能力等,使得 AI 能真正落地使用。

最后,還會是 AI 能力 + 現有業務系統和管理流程的結合

很多 AI 公司都可以做到前述 2 點,但最終在企業的落地效果不佳,究其原因還是在于 1)要么沒有和現有的業務系統結合,導致雖然局部環節提效,但和現有業務系統的融合中額外增加成本,總效率更低,或者 2)目前大模型無法嵌入企業的工作體系里,也無法解決企業的管理邏輯,所以往往都是設計師 / 員工自行使用,AI 和管理體系需要協同和融合。

我們觀察到國內某新型主流全媒體集團旗下的 " 生成式人工智能媒體融合創新工作室 " 取得了不錯的落地,內部結合自身的工作管理和業務流程,疊加 AI 能力,開發了一套全棧的 AI+ 業務 + 管理系統。其 1)在 AI 制作上,涵蓋了多個功能,涉及文本、圖像、視頻、音頻等多個模態;2)現有的媒體集團的業務和管理,涉及 " 媒資庫入檢索 - 內容制作 - 內容審核 - 內容分發 - 媒資入庫 " 等環節和系統。所開發的 AI 系統和公司媒資管理系統、專屬(新聞采編等)業務系統有連接,同時也是與安全播出的多重審核機制管理權限藕合。不僅僅是單純的內容制作工具,其也集成 AI 媒資管理、安全審核結合等業務和監管環節,形成一套綜合的系統。3)同時制作全流程不需要切換系統,方便管理和流程轉移。這是我們看到的目前較好的 B 端的綜合 AI 落地,結合了多個模態,多個模型,同時和企業的業務和管理流程系統融合,具備較高的使用率,也表現出較好的提效結果。

6. AI 2B 發展路徑:Native生成式 AI 公司vs Non-native生成式 AI 公司

我們觀察到在 AI 2B 賽道有 2 類公司。一類是 Native 生成式 AI 公司,從 0-1 利用 AI 的模型能力為企業客戶提供服務。另一類是 Non-native 生成式 AI 服務公司,比如數字化時代的企業服務公司,他們通常已在一些 2B 場景里取得了不錯的結果,如今把生成式 AI 能力融合到現有場景中,謀求更好的實現效果。

第一類路徑

比如在視頻制作領域有眾多的 Native 生成式 AI 創業公司,他們致力于通過 AI 模型,輸入文字或者圖像直接產出視頻。隨著 Sora 的推出,我們觀察到眾多相關創業公司當前的努力重點還是提升模型能力,盡快復刻 Sora 展現出來的效果。我們認為如果想要將其做成一個企業級的應用產品,合理的路徑除了進一步提高模型本身之外,還需要 1)產品的功能設計和工作流相結合,如增加分鏡的順序組合搭配工具,使得生成的視頻具備故事性;2)增加編輯和控制工具,如局部內容的特定顏色,特效的編輯功能,或者關鍵幀的控制工具等。通過和產業需求和 know-how 結合,才能將模型能力變成產品,且其符合使用習慣從而取得很好的落地效果。

第二類路徑

智能化的基礎是數字化,很多場景已經在 AI1.0 時代被企業服務公司覆蓋,如智能客服、AI 營銷、翻譯等。在已經被數字化改造的行業的提供企業服務公司,其有沉淀的場景數據,有業務的落地,有現成的客戶 access,如果疊加生成式 AI 的能力,如把大模型應用到客服系統和營銷對話場景,對話效果比 AI1.0 的模型更加自然,從而獲得更高的用戶滿意度和付費轉化率。再如大模型對商業運營表現和市場商機進行分析,進一步完善 BI(商業智能)的功能,這些都可以加深對客戶的服務深度和拓寬服務邊界,增加企業客戶對產品的價值感。我們觀察到在 AI 電商營銷領域,隨著生成式 AI 技術的普及,原本處于不同環節分工的企業,都在拓寬服務邊界,彼此滲透,例如提供 AI 客服的公司,使用大模型能力,不僅提升了客戶對話能力,也拓展到 AI 蓄客、營銷文案制作、數字人、智能營銷切片等。因此我們認為以上也是一個生成式 AI 2B 有機會的發展路徑。

7. 結語

生成式 AI 技術解鎖了巨大的市場空間和可能性,但當前技術并不完美,特別在對精準性、可控性、一致性要求較高的 B 端產業落地面臨較多挑戰。End to End 思路更直接,但想要取得更好的結果更依賴底層技術的突破,Step by Step 思路在當前的技術棧下短期更加務實,追求降本增效。但無論哪種思路,行業的 know-how,專有數據,AI 與業務和管理系統的耦合,都在產業端落地中都至關重要。

此外,生成式 AI 也是設計和生產范式的變化,年輕的創作者對新技術的擁抱度更高,AI 科技公司可以參與培育新一批的 AI Native 的創作者,在大學共創課程體系,隨著相關學生畢業進入產業界,將促成新的創作范式的行業落地,同時也形成了產品的隱性的護城河。

來源:鈦媒體

THE END
廣告、內容合作請點擊這里 尋求合作
免責聲明:本文系轉載,版權歸原作者所有;旨在傳遞信息,不代表砍柴網的觀點和立場。

相關熱點

相關推薦

1
3
主站蜘蛛池模板: 摸BBB揉BBB揉BBB视频| 久久777国产线看观看精品| 精品无码一区二区三区在线 | 天天天天夜夜夜夜爱爱爱爱| 够爽影院vip破解版| 亚洲国产精品线观看不卡| 男人桶女人的肌肌30分| 四虎影视久久久免费| 香港黄页亚洲一级| 国产特级毛片aaaaaa| 91抖音在线观看| 女m羞辱调教视频网站| 中文亚洲日韩欧美| 日本护士撒尿xxxx18| 内射白浆一区二区在线观看| 韩国三级中文字幕hd久久精品| 国产精品久久国产精麻豆99网站 | 好男人资源在线观看好| 久久99国产精品视频| 最新69国产成人精品免费视频动漫| 国产乱人伦AV麻豆网| 久久国产精品女| 少妇高潮喷水久久久久久久久久| 久久只有这才是精品99| 波多野结衣69| 伊人蕉久中文字幕无码专区| 精品香蕉一区二区三区| 国产一区二区在线视频| 青青国产成人久久91网站站| 国产成人精品无码一区二区| 奇米四色77777| 国产综合久久久久鬼色| 99久久精品免费看国产免费| 好猛好紧好硬使劲好大国产| 一级午夜免费视频| 成人自拍视频网| 久久99久久99精品免观看| 日本高清色本免费现在观看| 久久精品无码一区二区三区不卡| 校服白袜男生被捆绑微博新闻| 亚洲人成网站色7799|