11月19日消息,谷歌谷歌家旗艦版Gemini 3 Pro model上線,招拆招官宣其編碼和推理能力都有所提升,谷歌而“諂媚”變少。招拆招
不難發現,谷歌谷歌瞄準了它的招拆招對手ChatGPT。這款號稱谷歌迄今為止“最智能”、谷歌“最準確”的招拆招模型首次向所有用戶開放,并且發布首日即可體驗。谷歌
谷歌DeepMind高級總監兼產品負責人Tulsee Doshi表示,招拆招隨著谷歌搜索引擎的谷歌不斷發展,這款新模型將助力谷歌實現“人人皆可獲取且人人皆可使用”的招拆招信息目標。
“我認為朝著這個方向邁出的谷歌一大步,就是招拆招跳出僅僅提供文字回復的模式,讓你看到更豐富、谷歌更完整的實際內容。”
對OpenAI見招拆招
簡單來說,Gemini 3 Pro 具有“原生多模態”特性,它可以同時處理文本、圖像和音頻,傳統的文本-文本的單一交互狀態得到了提升,編碼功能的增強也使其能夠生成更好的視覺效果。在谷歌的官方演示中,AI 對RNA進行了加工處理,整體表現得很流暢。
谷歌官方表示,Gemini 3 Pro 還可以翻譯菜譜照片,然后將其轉換成食譜;除此之外,它還可以根據一系列視頻講座創建交互式學習卡片。
在 Gemini 應用中,用戶則可以在內置的 Canvas 中構建功能更全面的程序。升級后的 AI 模型支持“生成式界面”,一方面可以創建類似雜志的視覺格式,其中包含可供瀏覽的圖片,另一方面可以根據用戶的提示創建定制的自定義用戶界面的動態布局。這款工具目前還在測試中。
在搜索功能上,Gemini 3 Pro可以根據用戶的搜索呈現圖像、表格、網格和模擬等視覺元素。根據 Google 的公告,這項技術現在不僅能將問題分解成可搜索的部分,還能更好地理解用戶的搜索意圖,從而“找到之前可能遺漏的新內容”。
谷歌對OpenAI見招拆招,幾乎毫不掩飾地暗諷,稱Gemini 3 Pro不像ChatGPT那樣充斥著空洞的奉承。
Doshi表示,Gemini 3 Pro的回復會有“顯著”的變化,谷歌將其描述為“智能、簡潔、直接,摒棄陳詞濫調和奉承,提供真正的洞見——告訴你你需要聽到的,而不僅僅是你想聽到的”。
除了這些改進之外,Gemini 3 Pro 還具備更強大的推理和智能代理能力,使其能夠完成更復雜的任務,并“可靠地進行長期規劃”。谷歌表示,該模型為 Gemini Agent 的一項實驗性功能提供支持,該功能可以在 Gemini 應用內幫用戶執行任務,例如查看和整理電子郵件,或搜索和預訂旅行。
也就是說,谷歌此番發行的不僅僅是模型單品,還是一個充滿策略的“聰明桶”——覆蓋了AIGC、AI應用、AI搜索和AI Agent全范圍。
跑分表達
而在官方的跑分21項基準測試中,Gemini 3 Pro 除了OCR和代理編碼表現相對較弱,其他指標幾乎都遙遙領先,有相當的優勢。
不僅如此,而谷歌又單獨拎出了人類最終測試、終端工作臺2.0和SimpleQA Verified三個指標加以強調,矛頭直指Claude Sonnet4.5和GPT-5.1。
谷歌試圖表達,Gemini 3 Pro 在標準化知識生成、AI工具使用乃至“人工智能”這幾個重要指標方面,具有全方位的優勢。
Antigravity:“智能體優先的未來”
在發布Gemini 3 Pro的同時,谷歌還推出了 Antigravity,這是一款基于 Gemini 3 Pro 以及其他第三方模型的開發工具。谷歌表示,Antigravity 支持多個智能體,并允許它們直接訪問編輯器、終端和瀏覽器,其設計理念是面向“智能體優先的未來”。
Antigravity 有兩個關鍵組件。
其中之一在于它如何報告自身的工作。具體來說,在完成任務的過程中,它會生成 Google 稱之為“工件”的文件:任務列表、計劃、屏幕截圖和瀏覽器錄制,旨在驗證它已完成的工作以及即將執行的工作。
不僅如此,Antigravity 還會報告其操作和外部工具的使用情況,但 Google 表示,相比模型操作和工具調用的完整列表,“工件”更便于用戶驗證。
另一項重大改進是提供了兩種主要使用視圖。默認的編輯器視圖提供熟悉的集成開發環境 (IDE) 體驗,類似于 Cursor 和 GitHub Copilot 等競爭對手,并在側邊欄中顯示代理。而全新的管理器視圖則旨在同時控制多個代理,使每個代理都能更加自主地工作。
谷歌將其比作“任務控制中心”,用于“并行地在多個工作區中生成、協調和觀察多個代理”。
谷歌推出了更多向人工智能代理提供反饋的方式,用戶可以在代理執行特定任務時留下評論,供其參考,而無需中斷其工作。谷歌表示,Antigravity 中的代理能夠“從過去的工作中學習”,保留特定的代碼片段或執行特定任務所需的步驟。
在官方演示中,Antigravity 構建了一個基本的航班跟蹤應用程序,對其進行了測試,并通過瀏覽器錄制報告了該測試結果。
目前,Antigravity 已推出公開預覽版,兼容 Windows、macOS 和 Linux 系統。
谷歌此次的出擊,并不止于發布一個大模型這么簡單。智能體開發平臺的開放性,展露出谷歌構建從模型、應用到開發者的完整生態閉環的野心。
多模態的交互將AI從一位博學的“對話者”,重塑為一個能看、能聽、能行動、能規劃的“執行者”。當 AI 開始理解和操作多媒體世界,未來3D和全景、沉浸式的交互競賽,也就不遠了。


相關文章




精彩導讀
熱門資訊
關注我們