- Gemini 3是什麼?
- Gemini 3 Pro 5大功能亮點
- Gemini 3 Pro怎麼用?
- Gemini 3 Pro不同族群應用情境
- Gemini 3 Pro實際應用範例
- Gemini 3 Pro費用
- Gemini 3 Pro vs GPT-5.1
- Gemini 3 Pro常見問題
Gemini 3是什麼?
Google在2025年11月正式推出新一代模型Gemini 3,宣稱是目前「最聰明、推理能力最強」的多模態大型語言模型。它同時具備高階推理能力、跨文字與影像的理解能力,以及能配合工具與環境自行執行任務的代理人特性。這一代的核心模型是Gemini 3 Pro,已率先導入搜尋AI模式、Gemini應用程式與Google AI Studio,成為Google整體AI產品的主力引擎。
對一般使用者來說,Gemini 3代表的是︰搜尋更懂你的問題、Gemini App回答更貼近需求;對工程師與企業來說,Gemini 3則是更強的代碼代理人與長期規劃助手。
Gemini 3整體特色可從3個核心能力與2項深化功能理解,涵蓋推理、多模態、代理人與長脈絡等面向。
| 項目 | 特色說明 | 適用情境 |
| 推理能力 | 多步驟邏輯推演、Deep Think強化推理。 | 高難度數理、科研分析、策略推演。 |
| 多模態理解 | 文字、圖片、PDF、影片、程式碼整合分析。 | 跨資料整理、內容分析、研究用途。 |
| 代理人能力 | 可規劃任務、調用工具、執行多步驟流程。 | 開發者、企業工作流、自動化任務。 |
| 長脈絡視窗 | 支援1百萬Tokens。 | 大型文件、程式碼庫、長文摘要。 |
| Vibe Coding | 從草圖或描述生成前端原型。 | 產品開發、UI/UX設計、原型建置。 |
Gemini 3 Pro 5大功能亮點
1.高階推理與Deep Think更能拆解複雜問題
Google在官方頁面與技術報告中,多次強調Gemini 3 Pro在推理與學術測試上的表現︰
- 在Humanity’s Last Exam學術推理測試中,Gemini 3 Pro達到37.5%,明顯高於Gemini 2.5 Pro與Claude Sonnet 4.5。
- 在GPQA Diamond科學知識測試中拿到91.9%,接近博士水準。
- 在AIME 2025數學競賽題上,搭配程式碼執行時可達到100%解題率。
Deep Think模式進一步強化這種能力︰它會在內部進行多步驟推演與自我檢查,再輸出答案,適合用在研究、風險分析、大型決策等情境。
對一般使用者來說,直覺感受會是︰Gemini 3在處理複雜問題時,比前一代更願意「花時間想清楚」,而不是急著給出聽起來順眼、實際卻不準確的回答。
2.一百萬Token長脈絡與更強多模態理解
Gemini 3 Pro提供1百萬Token的脈絡長度,遠高於許多同級模型的40萬或40多萬Token上限。
這代表它可以︰
- 一次讀完一本厚書、整份研究報告或完整法規條文,再幫你做結構化整理。
- 吃下整個程式碼庫,協助Refactor、找Bug或產生技術文件。
- 在影片、PDF與圖片混合的情況下,仍然維持相對一致的理解。
在多模態測試MMMU-Pro與Video-MMMU上,Gemini 3 Pro分數同樣領先其他旗艦模型,顯示它在解讀圖表、螢幕畫面與影片情境上有更好的穩定度。
3.Vibe Coding與視覺化程式開發
Vibe Coding讓Gemini 3 Pro不只是寫程式,更能理解視覺與互動設計,成為「會寫程式的設計夥伴」。
- 可以上傳手繪UI草圖,Gemini 3 Pro會解析按鈕、版面與互動關係,自動產生對應的HTML、CSS、JavaScript或React程式碼。
- 也可以用比較抽象的描述,例如「我想要一個Cyberpunk風格的3D儀表板」,讓模型同時幫你處理視覺與互動細節。
- 在WebDev Arena等開發相關排行榜上,Gemini 3 Pro以1487 Elo拿下第一名,顯示其在網頁與互動介面生成上的整體實力。
對工程師來說,它不只是一個補程式碼的助手,而是真正能從「構想」一路協助到「可執行原型」的共同開發者。
4.更成熟的代理能力與工具整合
自Gemini 2開始,Google就把「Agent」概念放進產品設計,Gemini 3則把這條路走得更遠︰
- 在Vending-Bench 2長期規劃測試中,Gemini 3 Pro模擬經營自動販賣機業務1年,最終報酬遠超過Gemini 2.5 Pro、GPT-5.1與Claude Sonnet 4.5,顯示它在長時程任務上更能維持穩定策略。
- 搭配Google Antigravity時,代理人可以直接存取編輯器、終端機與瀏覽器,幫你完成端對端的開發任務。
- 在搜尋AI模式中,Gemini 3會根據你的問題自動生成互動式工具,例如房貸計算機、物理模擬或資料視覺化介面。
這種能力,對想打造AI Agent產品的團隊尤其關鍵。
5.減少幻覺,回答更精準
Google在介紹Gemini 3 Pro時,特別強調它的回答風格是「聰明、簡潔、直接」,並且「傾向告訴你需要聽的事實,而不是你想聽的好話」。
在SimpleQA與FACTS Benchmark等測試中,Gemini 3 Pro的事實準確性也明顯優於前一代與多數競品,代表在一般資訊查詢與說明型任務上,出現嚴重幻覺的機率相對更低。
Gemini 3 Pro怎麼用?
Gemini 3 Pro使用方式非常簡單,只需要透過Google Gemini或Google AI Studio就可以輕鬆開始創作。
Gemini:直接開啟Gemini 網頁,右下角的「模型選擇(Model)」預設是「快速(2.5 Flash)」,點開後切換成Thinking(3 Pro)。
Google AI Studio:開啟Google AI Studio,選擇「Gemini 3 Pro Preview」。
Gemini 3 Pro不同族群應用情境
|
族群 |
能解決的需求 |
實際可使用方式 |
|
學生與研究者 |
整理大量學習資料、理解複雜概念、協助推理與檢查論證。 |
|
|
上班族與商務人士 |
快速整合市場資訊、做簡報、管理信件與行程。 |
|
|
工程師與產品團隊 |
加速開發、快速產生原型、簡化操作流程。 |
|
|
內容創作者與媒體 |
整理多來源資料、加速稿件製作、多平台內容轉換。 |
|
Gemini 3 Pro實際應用範例
Gemini 3 Pro已經能做出更多超乎想像的成果。許多使用者分享,只要上傳1張相片並輸入簡單指令,就能把平面的照片轉成動畫;也有人用幾句話就生成互動式地圖App。從個人網站、網站小工具、甚至小型網頁遊戲,Gemini 3 Pro都能在極短時間內做出可操作的版本,讓不會寫程式的人也能實現把想法變成作品。
以下整理5個最常見、實用的Gemini 3 Pro使用方式:
1.整合PDF、圖片與影片內容
在處理不同格式的資料時,Gemini 3 Pro能一次讀懂PDF、圖片、截圖與影片內容,並把重點整理成摘要、條列或比較表。不需要先轉檔或拆資料,能大幅減少整理資訊的時間。
2.整理辨識手寫內容、筆記與掃描文件
面對手寫筆記、會議白板或掃描文件,Gemini 3 Pro能看懂內容、還原文字,並用上下文判斷真正的意思。它不只把字轉出來,也能幫忙整理成條列、摘要或結構化資料。
3.協助核對帳冊與檢查數字是否合理
例如帳本上的金額、單位或加總結果有沒有問題,Gemini 3 Pro能讀取內容後進行計算與比對,並說明推算過程。它能協助發現「數字怪怪的地方」,讓你更快確認資料正確性,特別適合大量表格或跨頁資訊,能節省大量人工逐格檢查的時間。
4.產生基本款網站小工具
如果你需要製作簡單的網站小工具,像是處理影片的剪輯、加字幕,或是倒數計時器、隨機密碼產生器、地圖查詢等功能,Gemini 3 Pro能依描述生成可運作的基礎原型。模型會將需求拆解成可執行的網頁或前端程式碼,讓你立即測試概念,而不必自己從零開始搭架構。
範例指令:
幫我寫一個「自定義隨機密碼產生器」的網頁小工具。
- 功能需求:使用者可以選擇密碼長度(滑桿)、是否包含符號、數字或大寫字母。
- 介面設計:用現代化的深色模式風格,按鈕要明顯,並包含一個「一鍵複製」的功能。
- 程式碼要求:提供一個單一的HTML檔案,將CSS和JavaScript全部內嵌在裡面,讓我存檔後直接用瀏覽器打開就能運作。不需要依賴外部函式庫。
5.依照描述生成基本3D場景或互動示意
如果想要展示一個空間、遊戲場景或互動概念,Gemini 3 Pro能用Three.js等方式生成簡單的 3D世界,例如方塊地形、光影效果或可移動視角。這類內容雖然不等於完整遊戲,但很適合作為設計提案或初步Demo,讓概念更具體。
範例指令:
幫我寫一個「3D守宮飼養箱互動模型」的網頁。
- 功能需求:幫我生成一個守宮飼養箱的立體模型,使用者可以用滑鼠拖放或點擊新增守宮及佈景物件,所有物件都能自由移動、旋轉、縮放和改變顏色。
- 介面設計:用現代感的深色模式,畫面須含有「物件選單」、「3D飼養箱空間」和「編輯面板」3塊區域。
- 程式碼要求:提供一個單一的HTML檔案,將CSS和JavaScript全部內嵌在裡面,讓我存檔後直接用瀏覽器打開就能運作。使用最適合在網頁上呈現3D互動的技術來實現。」
Gemini 3 Pro價格與費用方案
Gemini 3 Pro的費用分成「免費試用」與「付費方案」。免費方案只能在Google AI Studio裡體驗模型,不提供API使用。如果開發者要正式使用API,就會按照Token(字數)計費。
| 項目 | 免費方案 | 付費方案(每100萬Tokens計費,美金) |
| 輸入Token價格 | 無法使用 |
$2.00(輸入≤20萬Tokens) $4.00(輸入>20萬Tokens) |
| 輸出Token價格(含思考Tokens) | 無法使用 |
$12.00(輸出≤20萬Tokens) $18.00(輸出>20萬Tokens) |
| 脈絡快取(Context Caching) | 無法使用 |
$0.20(≤20萬Tokens) $0.40(>20萬Tokens) |
| 脈絡快取儲存費 | 無法使用 | 每小時每100萬Tokens收$4.50 |
| Google搜尋基準(Search Grounding) | 無法使用 |
每日1500次免費(RPD) 之後每1000次查詢$14(即將上線) |
| Google地圖基準(Maps Grounding) | 無法使用 | 無法使用 |
| 是否會用你的資料改善模型 | 會 | 不會 |
Gemini 3 Pro vs GPT-5.1誰比較強?
| 項目 | Google Gemini 3 Pro | OpenAI GPT-5.1 |
| 模型定位 | Google旗艦級多模態、強推理、強代理能力。 | OpenAI旗艦級泛用模型,強語言生成能力。 |
| 推理能力 | 在學術推理類測試分數較高(例如:HLExam、GPQA)。 | 推理能力強,但在部分科學推理測試落後Gemini 3。 |
| 數學能力 | AIME類型題目搭配程式執行可達高正確率。 | 數學表現穩定,但進階賽題通常不及Gemini 3 Pro。 |
| 多模態(圖片、PDF、影片) | 文字、圖片、PDF、影片、程式碼整合度高,在MMMU-Pro與Video-MMMU中領先。 | 具備多模態能力,但影片推理與長影片分析表現較不突出。 |
| 長脈絡能力 | 支援1百萬tokens,可處理大型程式碼庫與長文件。 | 脈絡長度提升,但未達Gemini 3的百萬等級。 |
| 編碼與代理能力 | 強調Vibe Coding,可從草圖生成前端原型;代理人能執行多步驟任務。 | 編碼能力強,但偏向補充與生成;代理任務執行深度較低。 |
| 工具整合度 | 深度整合Google搜尋、Gmail、日曆、瀏覽器與CLI。 | 整合度高,但依賴外部插件與API,整體屬互補式。 |
| 事實準確性與幻覺 | 走「簡潔、不阿諛」路線,在SimpleQA等測試中幻覺率低。 | 敘事更自然流暢,但有時較易補內容填空。 |
| 適合族群 | 工程師、分析師、研究者、需要跨資料整合作業者。 | 作家、內容創作者、客服對話、語言生成場景。 |
| 使用場景優勢 | 跨格式資料整合、程式開發、自動化、研究分析。 | 文案生成、自然語言理解、創作輸出。 |
Gemini 3 Pro常見問題
Gemini 3 Pro要付費嗎?
一般用戶可以在Gemini網頁免費使用基礎額度,包括一定次數的Thinking模式,也就是以Gemini 3 Pro處理複雜任務。若需要更高額度或進階能力,例如代理人功能、長時間推理或更快的運算速度,則需升級到Google AI Plus、Pro或Ultra方案。
台灣目前能用到Gemini 3 Pro嗎?
Gemini 3 Pro已在全球多數地區上線,台灣用戶可透過Gemini網頁或Google AI Studio直接使用。搜尋AI模式的Thinking選項則依Google區域政策逐步開放,進階代理人功能會優先提供給高階訂閱用戶。
什麼情況下需要用Gemini 3 Pro模式?
當任務需要深度分析、整合多種來源、處理長文或涉及推理時,就適合切換到Thinking模式。例如分析研究資料、拆解商業案例、協助程式開發或比對多份文件。若只是簡單查詢或一般內容生成,使用快速模式即可。
參考資料:Google 3 pro
延伸閱讀:博士生等級的AI助理來了!Google Gemini 3 Pro 四大功能一次看
核稿編輯:陳虹伶