百川智能發(fā)布Baichuan 4及首款AI智能助手百小應，模型能力國內第一

每日快訊

2024

05/22

17:01

評論

5月22日，百川智能發(fā)布最新一代基座大模型Baichuan 4，并推出成立之后的首款AI助手“百小應”。Baichuan 4相較Baichuan 3 在各項能力上均有極大提升，其中通用能力提升超過10%，數學和代碼能力分別提升14%和9%，在國內權威大模型評測機構SuperCLUE的評測中，模型能力國內第一。此外，Baichun 4還具備行業(yè)領先的多模態(tài)能力，在各大評測基準上表現優(yōu)異，領先Gemini Pro、Claude3-sonnet等多模態(tài)模型。

在Baichuan 4強大能力的基礎上，百川智能將搜索技術與大模型深度融合，推出懂搜索、會提問的AI助手“百小應”。百小應不僅可以隨時回答用戶提出的各種問題，速讀文件、整理資料、輔助創(chuàng)作等，還具備多輪搜索、定向搜索等搜索能力，能更精準地理解用戶需求，為用戶提供專業(yè)、豐富的知識和資源。此外還會在用戶問題的基礎上通過一系列提問來幫助用戶明確自身需求，給出更精準的答案。百小應現在已經在Web端(ying.ai)及移動端各大應用商店同步上線。

此外，百川智能還宣布開放Baichuan 4、Baichuan3-Turbo、Baichuan3-Turbo-128k、Assistant API四款API，所有開發(fā)者、企業(yè)用戶均可登錄百川智能開發(fā)者中心選擇并接入相應API，便捷高效地體驗百川智能新一代模型的強大能力。(開發(fā)者體驗中心： https://platform.baichuan-ai.com/playground）

Baichuan 4模型能力國內第一，多項能力超越國外主流模型

作為百川智能發(fā)布的最新一代基座大模型，Baichuan 4在國內權威大模型評測機構SuperCLUE的評測中，模型能力國內第一，相較上一代大模型Baichuan 3提升顯著。

不僅如此，與國外主流大模型對比，Baichuan4在知識百科、長文本、生成創(chuàng)作等文科類中文任務上明顯優(yōu)于國外大模型。

Baichuan 4能在較短的時間內取得突破，源于其在訓練過程中引入了諸多業(yè)界領先的技術優(yōu)化手段。例如，在預訓練階段采用了基于Model-based+Human-based的協同數據篩選優(yōu)化方法，以及對長文本建模位置編碼科學的Scaling Law，有效提升了模型對數據的利用；在對齊階段重點優(yōu)化了模型Reasoning、Planning、Instruct following能力，通過loss驅動的數據選取與訓練，多階段爬坡，多模型參數融合等方式有效提升了模型的關鍵指標和穩(wěn)定性。同時突破RLHF和RLAIF融合的RLxF強化學習對齊技術，大幅提升模型的指令遵循等能力。

此外，Baichuan 4還具備行業(yè)領先的多模態(tài)能力，在MMMU、MMBench-EN、CMMMU、MMBench-CN、MathVista等評測基準上表現優(yōu)異，大幅領先Gemini Pro、Claude3-sonnet等多模態(tài)模型。

上線首款AI助手百小應，懂搜索、會提問

“百小應”是百川智能成立之后推出的首款AI應用。百川智能認為，不同于信息時代工具屬性的產品，大模型創(chuàng)造的是新物種，讓AI從工具變?yōu)榛锇椤ｋm然受限于模型能力，當下的AI應用還無法完全做到如同人一樣，能夠使用工具、會思考、有情感等，但隨著模型能力的持續(xù)提升，相關應用一定會逐步具備完整能力。

為了讓用戶能夠擁有更優(yōu)質的智能體驗，百小應很好地融合了Baichan 4行業(yè)領先的通用能力與百川智能前沿的搜索技術，具備多步搜索、智能定向搜索等能力，將百小應打造成一款懂搜索、會提問的AI助手。

多輪搜索指的是針對用戶提出的問題，百小應逐步解析，深入探究，解鎖問題的核心答案。相比單輪搜索，在市場調研、產業(yè)分析等復雜場景下，多輪搜索能夠有效地獲取更專業(yè)、更有深度的信息。定向搜索則能讓百小應精準定位問題領域，直接訪問權威站點，快速、準確的找到相關信息。

在搜索結果呈現方面，百小應同樣與其他在單次搜索后“簡單總結網頁信息”的應用不同，它是將搜索結果作為觀點、論據直接應用到問答結果中。與此同時，其結果的結構化也非常優(yōu)秀，能夠將搜索結果以表格等結構化形式呈現，優(yōu)化信息布局，便于用戶快速定位、解讀所需信息，可以為行業(yè)分析、調研工作提供強大助力。此外，還在搜索結果中增加了來源參考，用戶只需點擊引用角標即可快速校驗搜索結果，十分便捷。

不僅如此，針對一部分用戶無法明確表述出自身需求，或者問題過于籠統、抽象的情況，百小應還貼心的用提問功能構建了個性化解決方案，百小應會在用戶問題的基礎上通過一系列提問來幫助用戶明確自身需求，然后再給出更精準的答案。

除了強大的搜索和提問功能以外，用戶還能在百小應中上傳PDF、word文檔，或者直接輸入網頁鏈接（URL），閱讀并分析書籍、報告、學術論文等長篇內容，僅用一分鐘便能讀完上市公司財報。在Baichuan 4多模態(tài)能力的支持下，用戶在提問的同時還可以同步上傳圖片，對圖片內容進行解讀，或者將圖片作為補充材料，獲取更精準的回答；并且，它還支持用戶通過語音的方式進行交互。

百小應的名稱源自“一呼百應”；icon中的橙色區(qū)別于科技領域常用的冷色調，寓意有溫度的人工智能；icon中的形象由水滴和對話氣泡組合而成，水滴象征百川入海的無盡智慧，對話氣泡象征溝通交流。

MaaS 1000萬免費token、AaaS免費試用，兼顧性能與成本

百川智能認為，企業(yè)客戶需要的并不是大模型，而是生產力、生產效率的提升，擁有 MaaS+ AaaS（Agent as a service）雙重能力，企業(yè)才能構建出智能化的最佳方案。

秉持這一理念，百川智能推出了全新的MaaS+AaaS服務。MaaS版塊由基座模型組成，分為旗艦版和專業(yè)版。旗艦版將全量開放Baichuan 4的各項能力，Baichuan 4不僅擁有國內第一的中文能力，并且具備行業(yè)領先的金融知識和問答能力，在SuperCLUE的金融知識百科能力上Baichuan 3就已取得了A+的最高評級。

專業(yè)版包含Baichuan3-Turbo和Baichuan3-Turbo-128K兩款模型，在價格方面相比旗艦版Baichuan 4更實惠，且均針對企業(yè)用的高頻場景進行了針對性優(yōu)化，綜合測試相比GPT3.5整體效果提升8.9%。百川智能表示，即日起，MaaS 的新用戶可以獲得1000萬免費token。

Assitants API是百川智能在Baichuan 4基礎上針對Agent構建推出的API接口，不僅支持Code interpreter、RAG內建工具，還支持自定義工具調用，方便企業(yè)接入各種豐富復雜的API。評測結果顯示其工具調用能力接近Open AI Assistants API，本次發(fā)布的Assitants API現已正式開啟公測，感興趣的用戶均可申請免費試用。

未來，百川智能將推出零代碼Agent創(chuàng)建平臺產品，讓業(yè)務人員通過自然語言的方式，也能創(chuàng)建Agent，更好地賦能企業(yè)智能化發(fā)展。

目前百川智能已經服務了數千家客戶，包括完美世界游戲、愛奇藝、創(chuàng)夢、什么值得買等各行業(yè)的領軍企業(yè)，并且與信雅達、用友、軟通動力、新致軟件、達觀數據等多家行業(yè)生態(tài)伙伴，以及華為、曙光等硬件廠商和中國移動、電信、聯通等運營商達成了合作，攜手構建百川大模型生態(tài)。

THE END

廣告、內容合作請點擊這里尋求合作

免責聲明：本文系轉載，版權歸原作者所有；旨在傳遞信息，不代表砍柴網的觀點和立場。

百川智能發(fā)布Baichuan 4及首款AI智能助手百小應，模型能力國內第一

相關熱點

最新文章

相關推薦

“特斯拉又割了我 7 萬塊”

用 eSIM 取代手機卡，究竟難在哪里？

這就是 iPhone 13 的“殺手級新功能”？網友：炒華為冷飯！

谷歌Pixel 6真機曝光：最美安卓屏幕沒跑了！

iPhone 13機模曝光：值得等！

蘋果計劃在美國生產 Apple Car 汽車電池

關注我們