砍柴網(wǎng)消息: 3月26日,谷歌正式推出新一代人工智能推理模型Gemini 2.5系列,其首發(fā)版本Gemini 2.5 Pro憑借突破性的技術(shù)能力引發(fā)業(yè)界廣泛關(guān)注。該模型不僅在多項(xiàng)基準(zhǔn)測(cè)試中達(dá)到“最先進(jìn)水平”,更以單次處理100萬(wàn)token(約75萬(wàn)單詞)的驚人上下文窗口容量,刷新了長(zhǎng)文本與多模態(tài)推理的行業(yè)標(biāo)準(zhǔn)。
思維鏈推理:像人類一樣“先思考,再回答”
Gemini 2.5系列的核心創(chuàng)新在于其思維鏈(Chain-of-Thought)推理能力。與傳統(tǒng)的“輸入-輸出”模式不同,該模型在處理復(fù)雜任務(wù)時(shí),會(huì)模擬人類解決問(wèn)題的邏輯,先進(jìn)行系統(tǒng)性思考與推演,再生成最終答案。這種機(jī)制顯著提升了模型在數(shù)學(xué)、科學(xué)類問(wèn)題中的準(zhǔn)確性和邏輯嚴(yán)謹(jǐn)性。例如,在無(wú)需依賴“多數(shù)投票”等額外計(jì)算成本的情況下,Gemini 2.5 Pro已在**GPQA(通用問(wèn)題解答評(píng)估)和2025年AIME(國(guó)際數(shù)學(xué)邀請(qǐng)賽)**基準(zhǔn)測(cè)試中登頂。
百萬(wàn)token上下文窗口:解析《指環(huán)王》不在話下
Gemini 2.5 Pro的100萬(wàn)token上下文窗口是其另一大技術(shù)亮點(diǎn)。這一容量足以一次性解析《指環(huán)王》等長(zhǎng)篇巨著的全部?jī)?nèi)容,或同時(shí)處理長(zhǎng)達(dá)數(shù)小時(shí)的視頻、音頻及代碼文件。谷歌還宣布,未來(lái)將把這一能力升級(jí)至200萬(wàn)token,進(jìn)一步強(qiáng)化模型在跨模態(tài)復(fù)雜任務(wù)中的信息整合與分析能力。
原生多模態(tài)支持:文本、圖像、音視頻“通吃”
作為谷歌Gemini系列的最新成員,2.5 Pro延續(xù)了原生多模態(tài)支持的核心優(yōu)勢(shì),可無(wú)縫解析文本、圖像、音頻、視頻和代碼等多種輸入形式。這一特性使其在智能客服、內(nèi)容創(chuàng)作、數(shù)據(jù)分析等場(chǎng)景中展現(xiàn)出強(qiáng)大的應(yīng)用潛力。例如,用戶可直接上傳一段視頻并詢問(wèn)其核心內(nèi)容,模型將自動(dòng)分析畫面、語(yǔ)音及字幕信息,生成精準(zhǔn)摘要。
開發(fā)者與企業(yè)用戶已可接入
目前,Gemini 2.5 Pro已通過(guò)谷歌AI Studio開發(fā)平臺(tái)及Gemini Advanced用戶專區(qū)開放使用,支持移動(dòng)端與桌面端接入。開發(fā)者可基于其API快速構(gòu)建智能應(yīng)用,企業(yè)用戶則可將其應(yīng)用于自動(dòng)化報(bào)告生成、跨模態(tài)數(shù)據(jù)分析等高階任務(wù)。谷歌表示,未來(lái)將持續(xù)優(yōu)化模型效率,降低大規(guī)模部署成本。
(來(lái)源 / 砍柴網(wǎng)AI助手)