一夜封神!谷歌Gemini 3.0 Pro發(fā)布即屠榜 馬斯克奧特曼祝賀點(diǎn)贊
作者:百科 來源:時(shí)尚 瀏覽: 【大 中 小】 發(fā)布時(shí)間:2025-11-21 04:16:08 評(píng)論數(shù):
11月19日消息,夜封谷歌最新一代推理模型Gemini 3.0 Pro正式發(fā)布,神谷斯克并同步在Google AI Studio推出預(yù)覽版,發(fā)布開放API接口。即屠該模型即將陸續(xù)登陸谷歌旗下各類產(chǎn)品。榜馬
值得玩味的奧特是,OpenAI聯(lián)合創(chuàng)始人兼CEO薩姆·阿爾特曼與xAI創(chuàng)始人埃隆·馬斯克先后向谷歌發(fā)來“賀電”。曼祝阿爾特曼在推特上評(píng)價(jià)“Gemini 3看起來很不錯(cuò)”,賀點(diǎn)谷歌CEO桑達(dá)爾·皮查伊僅以一個(gè)表情包輕松回應(yīng)。夜封
一經(jīng)發(fā)布,神谷斯克Gemini 3 Pro幾乎橫掃各大評(píng)測(cè)榜單,發(fā)布在LMArena大模型競(jìng)技場(chǎng)中以1501的即屠Elo得分高居榜首。
根據(jù)谷歌公布的榜馬測(cè)試數(shù)據(jù),Gemini 3 Pro毫無爭(zhēng)議地成為當(dāng)前全球數(shù)學(xué)能力最強(qiáng)的奧特AI。在被譽(yù)為“地獄難度”的曼祝數(shù)學(xué)競(jìng)賽基準(zhǔn)MathArena中,當(dāng)GPT-5.1等其他大模型仍在1%左右徘徊時(shí),Gemini 3 Pro一舉達(dá)到23.4%,遙遙領(lǐng)先。
編程能力方面,盡管在SWE-Bench上未取得SOTA成績(jī),但仍穩(wěn)居第一梯隊(duì)。其在Live Code Bench的Elo得分突破2400分,并在工具調(diào)用與終端操作基準(zhǔn)測(cè)試中排名第一。
更令人震撼的是其視覺理解能力:對(duì)屏幕截圖的理解準(zhǔn)確率高達(dá)72.7%,達(dá)到現(xiàn)有最先進(jìn)水平的兩倍。這意味著AI Agent將不再是“視覺障礙者”,有望徹底重塑AI操作計(jì)算機(jī)的交互模式。
此外,谷歌還同期發(fā)布了自家的Agentic編程平臺(tái)——Google Antigravity,再添一枚“技術(shù)砝碼”。
根據(jù)Model Card披露,Gemini 3 Pro在推理、多模態(tài)、Agent工具使用等關(guān)鍵基準(zhǔn)測(cè)試中實(shí)現(xiàn)了全面領(lǐng)先。
在硬件層面,Gemini 3 Pro基于谷歌自研的張量處理單元(TPU)訓(xùn)練。相比CPU,TPU在處理大語言模型所需的大規(guī)模計(jì)算時(shí)速度更快,其配備的大容量高帶寬內(nèi)存也使其能夠高效運(yùn)行超大模型與批量數(shù)據(jù)。
在實(shí)際應(yīng)用上,最新發(fā)布的Gemini Agent實(shí)驗(yàn)功能已能自主執(zhí)行多步驟復(fù)雜流程。例如,用戶只需提出“整理一下我的收件箱”,它即可自動(dòng)優(yōu)先安排待辦事項(xiàng),并起草郵件回復(fù)供用戶確認(rèn)。
目前,Gemini 3預(yù)覽版正逐步開放:所有用戶可通過Gemini應(yīng)用使用;Google AI Pro與Ultra訂閱用戶可在搜索的AI模式中體驗(yàn);開發(fā)者可通過Gemini API、Google Antigravity及Gemini CLI訪問;企業(yè)用戶則通過Vertex AI與Gemini Enterprise獲取服務(wù)。
