" 大模型作為技術,要真正被行業所用,解決行業的實際問題,才能發揮它真正的價值。" 英特爾公司市場營銷集團副總裁、英特爾中國網絡與邊緣及渠道數據中心事業部總經理郭威在與鈦媒體 APP 的交流中曾多次指出。
距 ChatGPT 問世已有快 2 年的時間,這不到 2 年的時間里,AI 大模型正在以前所未有的速度向各行各業滲透。尤其是今年以來,無論是各個大模型廠商,還是甲方企業,都將關注的焦點從模型參數大小上,轉移到了大模型如何解決行業痛點問題上,試圖尋找一個或多個大模型能在自身行業落地的場景。
從通用走向行業,場景是大模型落地的關鍵
如果將各大廠商大模型的競賽分為上下半場的話,上半場,各大廠商紛紛推出通用大模型,通過不斷地提升模型的參數,展示自身實力;下半場,當 AI 大模型受到更多行業側企業關注的時候,越來越多的小參數模型涌現,行業應用場景自然也成為了甲方企業和乙方大模型供應商關注的焦點,圍繞端側的應用落地成為這個階段大模型能否真正在行業側 " 變現 " 的關鍵。
對此,郭威告訴鈦媒體 APP,英特爾相信,隨著 AI 大模型技術逐步深入行業,模型將會逐漸從通用大模型變成行業專用型的大模型," 在這個過程中,模型的大小肯定會產生變化," 郭威指出," 與此同時,行業模型將結合更多的行業專有的知識,更聚焦某一個或幾個特定的場景。"
無獨有偶,京東集團技術委員會主席、京東云事業部總裁曹鵬近日在京東云峰會上也公開表示," 通用大模型靠算力堆起來,而產業大模型要靠業務跑出來。" 已經有超 35 萬京東自有配送員、超 20 萬商家、超 3 萬醫生、超 2 萬采銷運營、超 1 萬研發人員,在京東 100 多個 AI 場景使用以大模型驅動的應用。
《2024 全球數字經濟白皮書》顯示,全球人工智能大模型的數量已達 1328 個,這其中中國占比 36%。另一方面,IDC 數據顯示,2022 年中國生成式 AI 占 AI 市場投資總規模的 4.6%。隨著生成式 AI 技術的快速發展,2027 年生成式 AI 投資占比將達到 33.0%,投資規模超 130 億美元,五年復合增長率(CAGR)為 86.2%。
顯然,大模型就像先前的云計算時代一樣,單論技術而言,中國可能離國際一流水平仍有些許差距,但當我們將目光聚焦在場景上,中國有著豐富的應用場景,而這些場景是 AI 大模型真正 " 飛入尋常百姓家 " 的關鍵。
從云端走向邊緣,大模型如何更好用?
當大模型從通用大模型的大參數,逐步走向行業專用模型的小參數的過程中,大模型也呈現出從云端走向端側的趨勢。IDC 數據顯示,到 2026 年,80% 的全球企業將使用生成式 AI,50% 的全球邊緣部署將包含 AI。
對此,英特爾公司網絡與邊緣事業部高級副總裁兼總經理 Sachin Katti 曾表示,人工智能的未來將依賴于開放的生態系統,人工智能的應用正在從數據中心向邊緣計算轉移。
不僅與此,英特爾公司副總裁兼網絡與邊緣事業部中國區總經理陳偉也告訴鈦媒體 APP,從今年的發展趨勢上看,單就英特爾的客戶而言,今年探索基于邊緣大模型落地的解決方案的客戶更多," 今年完全不一樣。今年基本上可以說一半以上的客戶都在探索基于邊緣大模型的落地解決方案,也有非常多的實際案例。" 陳偉進一步指出。
而在大模型走向邊緣的過程中,企業在部署時需要考慮很多因素,比如時延要求、可實用性、微觀數據的可調優化,以及信息安全等要求。
不過邊緣側部署大模型仍處于發展的初期階段,目前市場上可見的部署模式有很多," 通過英特爾的觀察,我們看到許多客戶正在構建硬件和軟件解決方案,并在通用的大模型基礎上進行性能優化,這是一種發展迅速的模式。" 面對鈦媒體 APP 提出的如何更好在端側應用大模型的問題時,陳偉如是說。
談及中國大模型在行業側落地的趨勢與前景時,郭威告訴鈦媒體 APP,今年以來,已經有越來越多的行業用戶落地了不少行業大模型," 去年可能更多的是講故事的多一些,今年我們看到的行業上落地的案例越來越多,而且都是能切實解決行業痛點的場景。" 郭威如是說。
從目前應用上看,在端側的模型參數要比通用大模型的參數小很多,目前在端側的模型參數大多在 7B~10B 之間,而這時候,模型的壓縮就成了一件很重要且困難的事。目前主流的模式是,在壓縮的同時,將行業專屬知識灌進去,也就是俗稱的漸進式剪枝的技術方案。
對此,京東云相關技術負責人告訴鈦媒體 APP,以無人物流車場景為例,通過量級減枝,神經網絡搜索的方式,可以壓縮兩倍左右參數量的同時,不降低模型本身的性能,還可以減少一倍左右的時延。
與此同時,郭威與鈦媒體 APP 分享了他對于中國發展行業大模型的前景的研判,他指出,中國可能在三個方面發展的更快一些。
首先,模型本身在行業應用上的發展。正如前文所述," 單論技術而言,中國可能離國際一流水平仍有些許差距,但中國有著豐富的應用場景 ",在行業落地方面,尤其是與應用結合方面,在郭威看來,中國能走得更快一些," 中國市場的一個顯著特點就是應用發展迅速,能夠較快地探索出解決行業痛點的有效途徑。" 郭威強調。
其次,模型推理能力的提升。當大模型真正落到行業側應用時,僅僅依靠模型的訓練還不夠,要想真正解決行業痛點,模型推理能力的提升尤為重要,而在郭威看來,模型推理能力在今年也會有顯著的提升。
第三,在郭威看來,大模型在行業落地方面,需要協調好云端、端側,以及邊緣之間的算力分布," 如果只是垂直大模型的一些標準應用,可能大模型主要部署在云端。但由于行業落地的需要,必然會促使 AI 算力向邊緣和端側分布。" 郭威告訴鈦媒體 APP。
已有諸多場景落地
正如郭威所述,今年以來,已經有不少的行業大模型的應用場景在端側得以部署落地。
在教育方面,希沃基于英特爾的技術,聯合推出了 "AI+ 教育 " 的解決方案,借助英特爾 酷睿 Ultra 處理器,希沃無需依賴云端計算資源,即可在本地完成 AI 教學大模型的運行,從而提高系統響應速度和穩定性,確保教學過程中的流暢體驗。
在零售業方面,多樂之日通過邊緣計算技術,打造了智慧門店解決方案。該解決方案可借助門店已有的音視頻采集設備,并通過數據整合及優化的管理平臺,針對不同門店需求和特點,為其打造一套專屬數智化門店模型,提供從商品陳列、門店服務、門店衛生、員工規范、到人群洞察、客流洞察的不同功能,提升了多樂之日門店運營差異化的管理能力、提高了管理效率、降低了人工巡店成本投入并強化了員工規范的執行,加速烘焙行業的智能化發展。
在醫療健康方面,京東健康基于京東言犀大模型推出了 " 京醫千詢 " 醫療大模型,整合了大量的臨床實踐指南、醫學文獻和專家知識,能快速完成在醫療健康領域各個場景的遷移和學習。并基于 " 京醫千詢 " 大模型,面向執業醫生推出了包括云診室、診后隨訪、專家聯合會診、臨床科研、醫生 IP 品牌孵化、" 智能醫生助手 " 工具等在內的一系列解決方案,既優化了醫生在線診療的效率和質量,也提高了執業安全性。
在安全方面,包括 360、奇安信、騰訊云、深信服等在內的諸多安全廠商都基于大模型能力,或推出了安全行業大模型產品,或將 AI 大模型的能力植入到原有的安全產品之中,面對 AI 時代,AI 帶來的日益嚴峻的安全挑戰,實現 " 用 AI 打敗 AI" 的目標。
在辦公方面,諸多廠商都提出了 AIPC 的概念,并圍繞辦公 AI 助理發力,在 AI Chatbot 場景中,基于英特爾酷睿 Ultra AI PC 上能夠快速部署大模型,用戶能夠流暢地使用大模型強大的文本創作、編程、數學計算和邏輯推理能力,享受便捷、安全的本地化智能交互體驗;
在處理文檔方面,用戶可以利用 AI PC 高效處理郵件、表格數據、自動生成工作文檔,提高工作效率,還可以快速起草合同文書、以及利用 AI 智能分析訴訟案例,提供專業文檔撰寫能力。
上述僅是目前 AI 大模型應用比較火爆的幾個場景,除此之外,行業大模型還在金融、制造業、勘探等諸多領域已有較為廣泛的應用。各行業利用 AI 大模型的能力賦能業務的時代已經拉開序幕。
數據依舊是逃不開的話題
眾所周知,數據是大模型快速發展的 " 養分 ",無論是通用大模型,還是行業大模型,若想實現真正的價值,并降低 " 幻覺 ",數據是一個不可不談的話題。
就行業而言,行業大模型需要海量豐富的行業專有數據,這部分對于想要利用行業大模型實現降本增效,以及從數字化向著數智化轉變的企業來說,就對他們的數據治理能力提出了更高的要求。目前行業應用上來看,企業原有的數據是不足以訓練一個完善的企業級行業大模型的,目前主要的解決方式是采用合成數據。接下來,一方面企業需要提升自身數據質量,另一方面,如何選取優秀的合成數據也成為企業需要面對的棘手問題。
另一方面,行業大模型不同于通用大模型的是——行業大模型大多需要實現端側或邊緣側部署。Gartner 預測,到 2025 年,50% 以上由企業管理的數據,將在數據中心或云之外進行創建和處理。
換言之,就是到 2025 年,在端側的數據量將超過 50%。在這個過程中,隨著邊緣側數據量越來越大,數據傳輸的帶寬也是企業需要面對的一大挑戰," 雖然國內在整個基礎建設傳輸帶寬建設上是全球最領先的,但當大量數據在邊緣產生時,仍然可能引發網絡風暴,我們仍需要進一步優化網絡管理和數據傳輸策略。" 郭威告訴鈦媒體 APP。
展望未來,Sachin Katti 告訴鈦媒體 APP,AI 在驅動數據提升質量的同時,這些數據也將反過來支持 AI 變得更好,最終會實現良性循環。
顯然,大模型已經進入了在行業落地的快速發展期,在這個過程中,企業要遵循 " 數據驅動,場景為王 " 的原則,才能讓大模型更好地在行業側落地。
來源:鈦媒體