整理包/Gemini 3再掀生成式 AI 震撼!Nano Banana Pro 產圖能力多強、怎麼用一次看
Google推出Nano Banana Pro,具備更強的AI圖像生成能力。 圖/取自Google官方網站
近日,科技龍頭Google旗下的生成式人工智慧Gemini正式推出了全新版本Gemini 3,影像編輯平臺Nano Banana也同步得到了飛躍式的性能升級,一開放便震撼全球用戶。包括身爲最大競爭對手的OpenAI創辦人奧特曼(Sam Altman)與xAI創辦人馬斯克(Elon Musk)也爲Gemini的進步向Google送上祝賀,展現出新模型的強大宰制力。
升級過的Gemini 3與Nano Banana Pro究竟比起前代要厲害在哪裡?爲什麼他們能夠一堆出就奪走ChatGPT忠實用戶的芳心?《經濟日報》在此一次整理給您。
Nano Banana Pro,正式名稱爲「Gemini 3 Pro Image」,是基於Gemini 3系列的強化版Gemini 3 Pro的影像編輯、創作平臺。相較於過去的模型,現在Gemini 3具備了「推理」的性能,終於可以理解、解釋資料,察覺創意構想中的微妙線索,或是解析難題的層層結構,真正去了解要求背後的脈絡與想法。Google更指出,AI已從單純地閱讀文字和圖像,進化到能「讀懂空氣」。
在開始動筆之前,Gemini 3會經過大量的「思考過程」,理解目前的任務、透過Google搜尋來得到最新的資訊、推理清楚邏輯,纔會真正開始下筆。你可以對他提出簡單的要求、上傳複雜的資料,Gemini 3都能分析、整理好資訊,讓Nano Banana Pro生成能夠被使用者理解且美觀的圖片、資訊表格,或是教學示意圖等視覺產出。
● 思考型(Thinking)
通常當我們使用ChatGPT或Gemini時,AI模型都會很快地把問題的答案吐回來給我們;但只要是稍微複雜一點的問題或要求,它們就很可能會出現錯誤。現在,最新版本的Gemini 3 Pro模型,也就是思考型(Thinking)模型,在回答問題時不會急着告訴你答案,而是花上許多力氣和時間去拆解整個要求、思考內容、找尋答案、檢查錯誤,最後纔會把它覺得足夠正確的結果告訴你。
這在使用者想要進行數學題計算、撰寫程式碼、討論邏輯問題,或是規劃旅遊行程等複雜討論時非常強大。但如果使用者只是要進行日常問答,那麼標準的Gemini 3迅捷模型功能就足夠了:思考型會花上不少時間去運作,反而會拖延到時間。
● 「讀空氣」
Gemini 3理解使用者要求背後的脈絡、想法的能力變得更強,可以分辨出更加細微的語意差別,甚至能「感受」到使用者語氣中的情緒;它也會根據同一串對話中加入的新資訊而給出越來越精準的迴應或是個人化的建議。只是,目前Gemini在不同對話當中的記憶是不會共通的,只能透過將其他對話的資訊匯出至雲端、再從新的對話中讀取來繼承。
● 長脈絡處理
現在Gemini 3能夠接受的輸入上限增加到了高達100萬個「符元」(token),能夠接受、處理大型資料集的長脈絡,如對學術論文、影片等巨量資訊進行分析;單次輸出則可達6.4萬個符元。
Google推出效能強勁的Gemini 3模型,衝擊ChatGPT、xAI等對手。 路透
跟舊版的Nano Banana相比,如今的Pro版在各方面的性能都有所強化。首先,光是輸出圖片的解析度就大爲提升,支援解析度高達4K的圖像生成功能;能夠理解整個圖片,針對要求去推理、進行部分修改並保留其他元素不變。
由Nano Banana Pro生成,將原圖片改聚焦在花朵上。 圖/AI生成,取自Google臺灣官方部落格
由Nano Banana Pro生成,將原圖片場景變爲夜間。 圖/AI生成,取自Google臺灣官方部落格
在文字方面,閱讀和繪製能力都有顯著進步,可爲資訊圖表、菜單、圖表和行銷素材等等生成清晰的文字;這尤其體現在繁體中文上,對於臺灣用戶來說簡直是福音。
由Nano Banana Pro生成,要求將這三個黃色罐子上的所有英文文字翻譯成韓文,其餘部分保持不變。 圖/AI生成,取自Google臺灣官方部落格
作爲Google旗下的AI模型,Gemini可以直接使用Google搜尋功能,因此得以根據即時資料驗證事實並用來生成圖像。
由Nano Banana Pro生成,要求其製作一張圖表,顯示如何製作豆蔻茶。 圖/AI生成,取自Google臺灣官方部落格
使用Nano Banana Pro透過Google搜尋擷取即時天氣資訊,製作一張普普藝術風格的資訊圖表。 圖/AI生成,取自Google臺灣官方部落格
Nano Banana Pro現在還能夠一次取用最多14張參考圖片來進行混成,生成最終圖片。其中包括最多6張高保真度的物件圖片,以及最多5張人物圖像,並維持角色的一致性。也就是說,現在不會一下新指示就讓原本人物的細節跑掉啦。
由Nano Banana Pro生成,展示在複雜的構圖中保持多達14個輸入源(包括多個角色)的一致性。 圖/AI生成,取自Google臺灣官方部落格
Nano Banana與Nano Banana Pro比一比
項目Nano BananaNano Banana Pro
說了這麼多,但是到底該怎麼去使用這個生成平臺呢?透過在Gemini的介面中選擇「建立圖像」,並直接輸入你希望生成的畫面描述,便可以讓Nano Banana Pro生成出相應的圖像內容。但實際的過程是個你沒辦法直接控制的「黑箱作業」,那該如何才能讓他產出儘可能接近你想像的畫面呢?
對此,Google官方舉出了一些新模型的功能範例,並列出了可以有效控制生成出的畫面的關鍵要點。
☆ 創造擬真的圖片
手邊沒有現成的概念圖?沒問題,直接描述當然也OK。但是你需要儘可能鉅細靡遺地去形容整個場面,包括人物的外貌、動作、神情,物品的形狀、風格,背景的氛圍、打光,鏡頭的角度、焦距、焦點,以及整張圖片的比例等等細節。以下便是描述一位年長的日本陶藝家的圖片的指令與結果。
由Nano Banana Pro生成,一位年長的日本陶藝家,以寫實風格拍攝的特寫肖像照。 圖/AI生成,取自Google說明文件
☆ 精確嵌入文字
到了Gemini 3的版本,文字處理能力也得到改進,大幅減少了出現錯字或是糊在一起的狀況。以設計一個Logo爲例,輸入Logo上面該出現的文字,以及它的字體和風格,便能夠得到清楚的結果。只是在中文字的處理上,文字過多或過小時,仍然會出現一定比例的錯誤。
由Nano Banana Pro生成,爲名爲「The Daily Grind」的咖啡廳製作現代簡約的標誌。 圖/AI生成,取自Google說明文件
☆ 漫畫、連續圖像化
如果是要創造出一段連續圖片呢?可以給他一張參考的圖片,並要求他以特定的美術風格、劇情風格進行改編,變成如漫畫一樣的形式。
由Nano Banana Pro生成,以粗獷的黑色電影藝術風格製作3格漫畫。 圖/AI生成,取自Google說明文件
☆ 新增及移除元素
如果想要在原本的圖片上加上其他物件、刪除特定元素、只修改其中一部份的樣式,或是將兩圖合併,也都可以簡單地做到。下圖即爲以提供的貓咪照片讓Nano Banana Pro加上巫師帽的範例。
由Nano Banana Pro生成,使用提供的貓咪圖片,加上一頂小小的針織巫師帽。 圖/AI生成,取自Google說明文件
☆ 風格轉換
大部分使用者可能比較熟悉轉換畫風的功能,比如前陣子相當火熱的以ChatGPT來將圖片轉換爲吉卜力畫風的做法。詳加描述畫風、視覺效果等元素,便能轉換成完全不同的風格。
由Nano Banana Pro生成,將繁忙城市街道的擬真高解析度相片轉換成梵谷風格的畫作。 圖/AI生成,取自Google說明文件
☆ 讓某件事物活靈活現
手邊只有畫一半的草稿,或是自己實在畫不好細節嗎?那也沒問題。告訴它完成品應該有的風格、細節、顏色等,就能夠生成出完成度相當高的版本了。
由Nano Banana Pro生成,將汽車的草圖修飾後的車輛相片。 圖/AI生成,取自Google說明文件
使用建議
雖然Nano Banana Pro提供的功能千變萬化,但是無論如何,要想讓他生成出高品質、符合你想像的圖片,幾點基本道理是共通的:
提供越多細節,對結果的掌控度越高:比起籠統的「奇幻風盔甲」,應該更改爲「華麗的武士盔甲,刻有雄獅圖案,鑲着閃爍華麗光芒的寶石」等具備細節的描述方式。
解釋生成圖片的用途:讓模型理解你的意圖也會影響最終的生成內容。比簡單的「設計Logo」,應該告訴他「爲傳統小吃店設計Logo」,結果會更好。
反覆測試、調整:做好需要多次調整的心理準備,AI還沒有神奇到可以直接完美實現你的想法。可以逐次向它要求修改色調、光線、某個人物的表情、手中拿的物品的細節等等。
逐步進行指示:如果你想像的場景過於複雜且包含太多元素,可以將提示分成「首先......,接着......,最後......。」等多個步驟讓模型去理解。
使用「語意負面提示」:比起直接否定的「沒有車輛」,可以改用正面描述的「空蕩蕩的荒涼街道,缺乏交通跡象」。
調整鏡頭:除了描述圖片以外,還可以適當利用電影術語來控制構圖、視角。
根據Google目前推出的「Google One」不同等級訂閱方案,使用者每天能夠使用的Gemini 3功能額度也不同:
各訂閱方案的Gemini 3、Nano Banana Pro使用額度比較
項目普通訂閱Google AI ProGoogle AI Ultra
一般來說,如果只是平日會隨手問個問題、不會經常需要Gemini認真思考的使用者,使用免費版就已經足夠;大部分的專業工作者、工程師、創作者,或是需要長文分析,使用Google AI Pro基本上也能滿足需求;真正需要用到高價位的Google AI Ultra方案的通常是企業、有大量自動化工作需求,或是需要巨量雲端空間的使用者。
目前,所有使用者都可以免費試用一個月的Google AI Pro方案;臺灣的大學生只要在12月9日前申請,更可以享有一年免費Google AI Pro方案試用期。
(資料來源:記者彭慧明、編譯周辰陽;AI協助制稿)