在大模型領(lǐng)域,誰(shuí)能殺死比賽這個(gè)問(wèn)題有了更多的解法。
11月19日,谷歌發(fā)布Gemini 3 Pro。在業(yè)界一片贊譽(yù)聲之余,很快,埃隆·馬斯克和山姆·奧特曼在推特平臺(tái)上公開(kāi)表達(dá)了對(duì)這套模型的認(rèn)可。
團(tuán)隊(duì)將其描述為其迄今最先進(jìn)的模型。從性能上看,Gemini 3目前以1501分登頂LMArena全球排行榜,是首個(gè)突破1500分的模型;在博士級(jí)推理benchmark(GPQA Diamond、MATH Apex、人類(lèi)最后考試)中也實(shí)現(xiàn)了躍升。

圖源:谷歌官網(wǎng)
DeepMind CEO Demis Hassabis強(qiáng)調(diào),本次提升主要體現(xiàn)為更穩(wěn)定的多步驟推理。這意味著模型能夠處理復(fù)雜流程,如自動(dòng)整理收件箱、按風(fēng)格生成可運(yùn)行的2D游戲代碼等,不再依賴(lài)用戶(hù)逐步給出指令。
一名應(yīng)用開(kāi)發(fā)者通過(guò)Gemini 3生成了一款Pokemon Go游戲,他對(duì)界面新聞?dòng)浾呙枋龅溃傻挠螒虿粌H畫(huà)面審美水平在線(xiàn),并且竟然真的能玩還有背景樂(lè),“太強(qiáng)了,谷歌要?dú)⑺辣荣惲恕?rdquo;

Gemini 3生成能力對(duì)比(圖源:谷歌官網(wǎng))
令人驚艷的Gemini 3讓前一天發(fā)布的Grok 4.1以及前一周推出的GPT 5.1都隱隱有些尷尬。尤其是被認(rèn)為長(zhǎng)期處于引領(lǐng)地位的OpenAI。一名AI大模型實(shí)驗(yàn)室的研究人員對(duì)界面新聞?dòng)浾咴u(píng)論道,“它在今年的表現(xiàn)平平,行業(yè)焦點(diǎn)再次又回到了谷歌的‘老派’技術(shù)。”
GPT 5.1甚至沒(méi)激起多大水花。它不再?gòu)?qiáng)調(diào)跑分與榜單成績(jī),官方宣傳重點(diǎn)從模型指標(biāo)轉(zhuǎn)向真實(shí)對(duì)話(huà)體驗(yàn),突出更自然、更具情緒價(jià)值的交互能力。其個(gè)性化能力成為核心賣(mài)點(diǎn),新增人設(shè)模板(專(zhuān)業(yè)、友好、書(shū)呆子、諷刺等)。
它分為Instant與Thinking兩個(gè)子模型,分別面向日常對(duì)話(huà)與復(fù)雜推理場(chǎng)景。其中,Instant遵循指令能力提升,尤其在語(yǔ)氣、格式、風(fēng)格類(lèi)要求上更可靠,同時(shí)采用自適應(yīng)推理(adaptive reasoning),能按問(wèn)題難度自動(dòng)決定思考量。
Thinking主推深度推理,處理復(fù)雜問(wèn)題時(shí)的結(jié)構(gòu)化表達(dá)更強(qiáng),減少專(zhuān)業(yè)術(shù)語(yǔ),讓解釋更可讀,同時(shí)讓簡(jiǎn)單問(wèn)題更快,復(fù)雜問(wèn)題允許更長(zhǎng)推理鏈。
拋開(kāi)性能競(jìng)爭(zhēng)角度,谷歌和OpenAI的動(dòng)作都顯示了同一個(gè)信號(hào),即大模型競(jìng)爭(zhēng)正在比拼進(jìn)入產(chǎn)品化深水區(qū)。
例如,OpenAI在個(gè)性化上主動(dòng)邁出一大步,通過(guò)風(fēng)格模板與可調(diào)節(jié)人格參數(shù),ChatGPT更接近產(chǎn)品而非工具,提升用戶(hù)粘性的同時(shí),也進(jìn)一步增強(qiáng)平臺(tái)鎖定效應(yīng)。
而不同于以往的模型升級(jí),Gemini 3在發(fā)布當(dāng)天便同步進(jìn)入了谷歌的核心產(chǎn)品體系,包括搜索的AI Mode、Gemini App、Android系統(tǒng)以及企業(yè)智能體平臺(tái)Antigravity。至此,谷歌得以將推理、多模態(tài)理解與智能體能力整合為一個(gè)完整平臺(tái)。這使得谷歌在大模型領(lǐng)域的生態(tài)定位開(kāi)始變得更加清晰。
谷歌從一開(kāi)始的看似頹勢(shì)已經(jīng)完全扭轉(zhuǎn)了局面,幾乎是從Gemini 2.5起,從模型層到產(chǎn)品層,它為這片領(lǐng)域曾經(jīng)勢(shì)頭最猛的OpenAI帶來(lái)了前所未有的壓力。事實(shí)上,今年在全球范圍內(nèi)頗為出圈的兩大AI應(yīng)用產(chǎn)品Sora 2和NanoBanana,也是來(lái)自這兩家公司。
一名AI領(lǐng)域投資人對(duì)界面新聞?dòng)浾弑硎荆贠penAI風(fēng)頭正盛時(shí),他就更看好谷歌的長(zhǎng)期表現(xiàn),因?yàn)楣雀璁?dāng)前有一個(gè)其他競(jìng)爭(zhēng)對(duì)手都難以復(fù)制的全棧體系——從芯片到數(shù)據(jù)再到終端產(chǎn)品的布局,足以構(gòu)成谷歌獨(dú)有的競(jìng)爭(zhēng)壁壘。
在AI Infra層面,谷歌自研TPU讓其具備大規(guī)模部署能力,算力成本也更加可控;數(shù)據(jù)方面,從C端(用戶(hù))到B端(企業(yè)),搜索、Gmail、YouTube與Android等提供持續(xù)反饋與訓(xùn)練數(shù)據(jù),使其模型可在真實(shí)使用場(chǎng)景中不斷優(yōu)化;應(yīng)用層面,依托谷歌產(chǎn)品體系,Gemini 3可能是第一個(gè)在發(fā)布當(dāng)天就觸達(dá)數(shù)十億用戶(hù)的大模型。
“還有一個(gè)很現(xiàn)實(shí)的較量是,對(duì)于谷歌來(lái)講,它如果想要成本減半,可能每一層稍微便宜一點(diǎn),加在一起就可以達(dá)成;但是對(duì)于Open AI,它只能把模型層的價(jià)格和成本往下砍,才可以跟人家對(duì)標(biāo),這是很難做到的。”這位投資人表示。
在美國(guó)大模型技術(shù)領(lǐng)域,谷歌、OpenAI、Anthropic、xAI以及Meta構(gòu)成的第一軍團(tuán),其市場(chǎng)格局正在日益激烈的競(jìng)爭(zhēng)中逐漸清晰。
不過(guò),在中國(guó)大模型領(lǐng)域,行業(yè)還未能形成非常穩(wěn)定的格局:大廠(chǎng)開(kāi)始進(jìn)一步從產(chǎn)品端發(fā)力,創(chuàng)業(yè)公司也還未放棄通過(guò)模型占領(lǐng)絕對(duì)高地,一切都還未成定數(shù)。