谷歌對(duì)OpenAI見(jiàn)招拆招
11月19日消息,谷歌谷歌家旗艦版Gemini 3 Pro model上線,招拆招官宣其編碼和推理能力都有所提升,谷歌而“諂媚”變少。招拆招
不難發(fā)現(xiàn),谷歌谷歌瞄準(zhǔn)了它的招拆招對(duì)手ChatGPT。這款號(hào)稱谷歌迄今為止“最智能”、谷歌“最準(zhǔn)確”的招拆招模型首次向所有用戶開(kāi)放,并且發(fā)布首日即可體驗(yàn)。谷歌
谷歌DeepMind高級(jí)總監(jiān)兼產(chǎn)品負(fù)責(zé)人Tulsee Doshi表示,招拆招隨著谷歌搜索引擎的谷歌不斷發(fā)展,這款新模型將助力谷歌實(shí)現(xiàn)“人人皆可獲取且人人皆可使用”的招拆招信息目標(biāo)。
“我認(rèn)為朝著這個(gè)方向邁出的谷歌一大步,就是招拆招跳出僅僅提供文字回復(fù)的模式,讓你看到更豐富、谷歌更完整的實(shí)際內(nèi)容。”
對(duì)OpenAI見(jiàn)招拆招
簡(jiǎn)單來(lái)說(shuō),Gemini 3 Pro 具有“原生多模態(tài)”特性,它可以同時(shí)處理文本、圖像和音頻,傳統(tǒng)的文本-文本的單一交互狀態(tài)得到了提升,編碼功能的增強(qiáng)也使其能夠生成更好的視覺(jué)效果。在谷歌的官方演示中,AI 對(duì)RNA進(jìn)行了加工處理,整體表現(xiàn)得很流暢。
谷歌官方表示,Gemini 3 Pro 還可以翻譯菜譜照片,然后將其轉(zhuǎn)換成食譜;除此之外,它還可以根據(jù)一系列視頻講座創(chuàng)建交互式學(xué)習(xí)卡片。
在 Gemini 應(yīng)用中,用戶則可以在內(nèi)置的 Canvas 中構(gòu)建功能更全面的程序。升級(jí)后的 AI 模型支持“生成式界面”,一方面可以創(chuàng)建類似雜志的視覺(jué)格式,其中包含可供瀏覽的圖片,另一方面可以根據(jù)用戶的提示創(chuàng)建定制的自定義用戶界面的動(dòng)態(tài)布局。這款工具目前還在測(cè)試中。
在搜索功能上,Gemini 3 Pro可以根據(jù)用戶的搜索呈現(xiàn)圖像、表格、網(wǎng)格和模擬等視覺(jué)元素。根據(jù) Google 的公告,這項(xiàng)技術(shù)現(xiàn)在不僅能將問(wèn)題分解成可搜索的部分,還能更好地理解用戶的搜索意圖,從而“找到之前可能遺漏的新內(nèi)容”。
谷歌對(duì)OpenAI見(jiàn)招拆招,幾乎毫不掩飾地暗諷,稱Gemini 3 Pro不像ChatGPT那樣充斥著空洞的奉承。
Doshi表示,Gemini 3 Pro的回復(fù)會(huì)有“顯著”的變化,谷歌將其描述為“智能、簡(jiǎn)潔、直接,摒棄陳詞濫調(diào)和奉承,提供真正的洞見(jiàn)——告訴你你需要聽(tīng)到的,而不僅僅是你想聽(tīng)到的”。
除了這些改進(jìn)之外,Gemini 3 Pro 還具備更強(qiáng)大的推理和智能代理能力,使其能夠完成更復(fù)雜的任務(wù),并“可靠地進(jìn)行長(zhǎng)期規(guī)劃”。谷歌表示,該模型為 Gemini Agent 的一項(xiàng)實(shí)驗(yàn)性功能提供支持,該功能可以在 Gemini 應(yīng)用內(nèi)幫用戶執(zhí)行任務(wù),例如查看和整理電子郵件,或搜索和預(yù)訂旅行。
也就是說(shuō),谷歌此番發(fā)行的不僅僅是模型單品,還是一個(gè)充滿策略的“聰明桶”——覆蓋了AIGC、AI應(yīng)用、AI搜索和AI Agent全范圍。
跑分表達(dá)
而在官方的跑分21項(xiàng)基準(zhǔn)測(cè)試中,Gemini 3 Pro 除了OCR和代理編碼表現(xiàn)相對(duì)較弱,其他指標(biāo)幾乎都遙遙領(lǐng)先,有相當(dāng)?shù)膬?yōu)勢(shì)。
不僅如此,而谷歌又單獨(dú)拎出了人類最終測(cè)試、終端工作臺(tái)2.0和SimpleQA Verified三個(gè)指標(biāo)加以強(qiáng)調(diào),矛頭直指Claude Sonnet4.5和GPT-5.1。
谷歌試圖表達(dá),Gemini 3 Pro 在標(biāo)準(zhǔn)化知識(shí)生成、AI工具使用乃至“人工智能”這幾個(gè)重要指標(biāo)方面,具有全方位的優(yōu)勢(shì)。
Antigravity:“智能體優(yōu)先的未來(lái)”
在發(fā)布Gemini 3 Pro的同時(shí),谷歌還推出了 Antigravity,這是一款基于 Gemini 3 Pro 以及其他第三方模型的開(kāi)發(fā)工具。谷歌表示,Antigravity 支持多個(gè)智能體,并允許它們直接訪問(wèn)編輯器、終端和瀏覽器,其設(shè)計(jì)理念是面向“智能體優(yōu)先的未來(lái)”。
Antigravity 有兩個(gè)關(guān)鍵組件。
其中之一在于它如何報(bào)告自身的工作。具體來(lái)說(shuō),在完成任務(wù)的過(guò)程中,它會(huì)生成 Google 稱之為“工件”的文件:任務(wù)列表、計(jì)劃、屏幕截圖和瀏覽器錄制,旨在驗(yàn)證它已完成的工作以及即將執(zhí)行的工作。
不僅如此,Antigravity 還會(huì)報(bào)告其操作和外部工具的使用情況,但 Google 表示,相比模型操作和工具調(diào)用的完整列表,“工件”更便于用戶驗(yàn)證。
另一項(xiàng)重大改進(jìn)是提供了兩種主要使用視圖。默認(rèn)的編輯器視圖提供熟悉的集成開(kāi)發(fā)環(huán)境 (IDE) 體驗(yàn),類似于 Cursor 和 GitHub Copilot 等競(jìng)爭(zhēng)對(duì)手,并在側(cè)邊欄中顯示代理。而全新的管理器視圖則旨在同時(shí)控制多個(gè)代理,使每個(gè)代理都能更加自主地工作。
谷歌將其比作“任務(wù)控制中心”,用于“并行地在多個(gè)工作區(qū)中生成、協(xié)調(diào)和觀察多個(gè)代理”。
谷歌推出了更多向人工智能代理提供反饋的方式,用戶可以在代理執(zhí)行特定任務(wù)時(shí)留下評(píng)論,供其參考,而無(wú)需中斷其工作。谷歌表示,Antigravity 中的代理能夠“從過(guò)去的工作中學(xué)習(xí)”,保留特定的代碼片段或執(zhí)行特定任務(wù)所需的步驟。
在官方演示中,Antigravity 構(gòu)建了一個(gè)基本的航班跟蹤應(yīng)用程序,對(duì)其進(jìn)行了測(cè)試,并通過(guò)瀏覽器錄制報(bào)告了該測(cè)試結(jié)果。
目前,Antigravity 已推出公開(kāi)預(yù)覽版,兼容 Windows、macOS 和 Linux 系統(tǒng)。
谷歌此次的出擊,并不止于發(fā)布一個(gè)大模型這么簡(jiǎn)單。智能體開(kāi)發(fā)平臺(tái)的開(kāi)放性,展露出谷歌構(gòu)建從模型、應(yīng)用到開(kāi)發(fā)者的完整生態(tài)閉環(huán)的野心。
多模態(tài)的交互將AI從一位博學(xué)的“對(duì)話者”,重塑為一個(gè)能看、能聽(tīng)、能行動(dòng)、能規(guī)劃的“執(zhí)行者”。當(dāng) AI 開(kāi)始理解和操作多媒體世界,未來(lái)3D和全景、沉浸式的交互競(jìng)賽,也就不遠(yuǎn)了。









