☰

Gemini 3推理能力遠勝其他模型

谷歌推出Gemini 3獲得好評，使用自行研發的TPU，傳出Meta也可能採購。（路透）

谷歌上週一推出Gemini 3，引起矽谷科技人一陣驚呼，過往愛用CahtGPT的人們，反而慢慢靠向Gemini 3。爲什麼Gemini 3這麼受歡迎？因爲Gemini 3最大的突破在於「深度推理」能力提升，這意味着ＡＩ不僅能夠回答人類的提問，還能在「思考過後」，給予人們更深度的迴應。

舉一個例子，兩年前，當你請ＡＩ模型規畫一個五天的日本京都旅遊行程，無論是哪一個ＡＩ模型，都會在短短五分鐘之內，吐出一個看起來似模似樣的行程規畫表，但當你仔細去看這個行程表的時候，就可以發現，這個行程表根本無法執行，因爲ＡＩ只是整理出京都最熱門的地點，並把這些地點都湊在一起，沒有考慮路途的長短、順不順路、旅客要更換多少個交通工具才能到達。兩年前，許多揹包客都對ＡＩ規畫的行程表嗤之以鼻。

這幾年，不管是ChatGPT或Gemini，都陸續在模型之中加入「推理」能力。

現在，同樣的問題丟到ＡＩ模型之中，ＡＩ模型已經可以給旅人一份可行的行程表，不僅保證行程順暢，還能生成互動式行程表。

而現在的Gemini 3推理能力更甚過往，舉例來說，在最具挑戰性的數學競賽MathArena Apex中，Gemini 3 Pro得分爲百分之廿三點四，而GPT-5.1的分數低於百分之二；在視覺推理測試ARC-AGI-2上，Gemini 3 Pro拿下百分之卅一點一的得分，其他模型的得分大多落在百分之十三到十七。從這些得分數據來看，Gemini 3 Pro的能力，遠超過其他ＡＩ模型。

谷歌執行長皮伽日前接受ＢＢＣ專訪時，提到ＡＩ需求真的很強，他更預期未來十二個月的變化：ＡＩ會從聊天進到「幫你做事」、下一步更進化到幫你買生日禮物、安排行程，甚至幫你診斷「要不要買這檔股票」。

Gemini 3推理能力 遠勝其他模型

相關資訊

Gemini 3推理能力遠勝其他模型