Gemini 3推理能力 遠勝其他模型

谷歌推出Gemini 3獲得好評,使用自行研發的TPU,傳出Meta也可能採購。(路透)

谷歌上週一推出Gemini 3,引起矽谷科技人一陣驚呼,過往愛用CahtGPT的人們,反而慢慢靠向Gemini 3。爲什麼Gemini 3這麼受歡迎?因爲Gemini 3最大的突破在於「深度推理」能力提升,這意味着AI不僅能夠回答人類的提問,還能在「思考過後」,給予人們更深度的迴應。

舉一個例子,兩年前,當你請AI模型規畫一個五天的日本京都旅遊行程,無論是哪一個AI模型,都會在短短五分鐘之內,吐出一個看起來似模似樣的行程規畫表,但當你仔細去看這個行程表的時候,就可以發現,這個行程表根本無法執行,因爲AI只是整理出京都最熱門的地點,並把這些地點都湊在一起,沒有考慮路途的長短、順不順路、旅客要更換多少個交通工具才能到達。兩年前,許多揹包客都對AI規畫的行程表嗤之以鼻。

這幾年,不管是ChatGPT或Gemini,都陸續在模型之中加入「推理」能力。

現在,同樣的問題丟到AI模型之中,AI模型已經可以給旅人一份可行的行程表,不僅保證行程順暢,還能生成互動式行程表。

而現在的Gemini 3推理能力更甚過往,舉例來說,在最具挑戰性的數學競賽MathArena Apex中,Gemini 3 Pro得分爲百分之廿三點四,而GPT-5.1的分數低於百分之二;在視覺推理測試ARC-AGI-2上,Gemini 3 Pro拿下百分之卅一點一的得分,其他模型的得分大多落在百分之十三到十七。從這些得分數據來看,Gemini 3 Pro的能力,遠超過其他AI模型。

谷歌執行長皮伽日前接受BBC專訪時,提到AI需求真的很強,他更預期未來十二個月的變化:AI會從聊天進到「幫你做事」、下一步更進化到幫你買生日禮物、安排行程,甚至幫你診斷「要不要買這檔股票」。