Gemini 3怎麼用？Gemini 3 Pro免費開放功能、費用、使用教學一次看

2025/11/21

2,945

Gemini 3怎麼用？Gemini 3 Pro免費開放功能、費用、使用教學一次看 — Gemini 3是Google最新一代大型語言模型，主打更強推理、多模態理解與代理人能力。(來源：Google Gemini)

摘要

Gemini 3是什麼？
Gemini 3 Pro 5大功能亮點
Gemini 3 Pro怎麼用？
Gemini 3 Pro不同族群應用情境
Gemini 3 Pro實際應用範例
Gemini 3 Pro費用
Gemini 3 Pro vs GPT-5.1
Gemini 3 Pro常見問題

Gemini 3是什麼？

Google在2025年11月正式推出新一代模型Gemini 3，宣稱是目前「最聰明、推理能力最強」的多模態大型語言模型。它同時具備高階推理能力、跨文字與影像的理解能力，以及能配合工具與環境自行執行任務的代理人特性。這一代的核心模型是Gemini 3 Pro，已率先導入搜尋AI模式、Gemini應用程式與Google AI Studio，成為Google整體AI產品的主力引擎。

對一般使用者來說，Gemini 3代表的是︰搜尋更懂你的問題、Gemini App回答更貼近需求；對工程師與企業來說，Gemini 3則是更強的代碼代理人與長期規劃助手。

Gemini 3整體特色可從3個核心能力與2項深化功能理解，涵蓋推理、多模態、代理人與長脈絡等面向。

項目	特色說明	適用情境
推理能力	多步驟邏輯推演、Deep Think強化推理。	高難度數理、科研分析、策略推演。
多模態理解	文字、圖片、PDF、影片、程式碼整合分析。	跨資料整理、內容分析、研究用途。
代理人能力	可規劃任務、調用工具、執行多步驟流程。	開發者、企業工作流、自動化任務。
長脈絡視窗	支援1百萬Tokens。	大型文件、程式碼庫、長文摘要。
Vibe Coding	從草圖或描述生成前端原型。	產品開發、UI/UX設計、原型建置。

Gemini 3 Pro 5大功能亮點

1.高階推理與Deep Think更能拆解複雜問題

Google在官方頁面與技術報告中，多次強調Gemini 3 Pro在推理與學術測試上的表現︰

在Humanity’s Last Exam學術推理測試中，Gemini 3 Pro達到37.5％，明顯高於Gemini 2.5 Pro與Claude Sonnet 4.5。
在GPQA Diamond科學知識測試中拿到91.9％，接近博士水準。
在AIME 2025數學競賽題上，搭配程式碼執行時可達到100％解題率。

Deep Think模式進一步強化這種能力︰它會在內部進行多步驟推演與自我檢查，再輸出答案，適合用在研究、風險分析、大型決策等情境。

對一般使用者來說，直覺感受會是︰Gemini 3在處理複雜問題時，比前一代更願意「花時間想清楚」，而不是急著給出聽起來順眼、實際卻不準確的回答。

2.一百萬Token長脈絡與更強多模態理解

Gemini 3 Pro提供1百萬Token的脈絡長度，遠高於許多同級模型的40萬或40多萬Token上限。

這代表它可以︰

一次讀完一本厚書、整份研究報告或完整法規條文，再幫你做結構化整理。
吃下整個程式碼庫，協助Refactor、找Bug或產生技術文件。
在影片、PDF與圖片混合的情況下，仍然維持相對一致的理解。

在多模態測試MMMU-Pro與Video-MMMU上，Gemini 3 Pro分數同樣領先其他旗艦模型，顯示它在解讀圖表、螢幕畫面與影片情境上有更好的穩定度。

3.Vibe Coding與視覺化程式開發

Vibe Coding讓Gemini 3 Pro不只是寫程式，更能理解視覺與互動設計，成為「會寫程式的設計夥伴」。

可以上傳手繪UI草圖，Gemini 3 Pro會解析按鈕、版面與互動關係，自動產生對應的HTML、CSS、JavaScript或React程式碼。
也可以用比較抽象的描述，例如「我想要一個Cyberpunk風格的3D儀表板」，讓模型同時幫你處理視覺與互動細節。
在WebDev Arena等開發相關排行榜上，Gemini 3 Pro以1487 Elo拿下第一名，顯示其在網頁與互動介面生成上的整體實力。

對工程師來說，它不只是一個補程式碼的助手，而是真正能從「構想」一路協助到「可執行原型」的共同開發者。

4.更成熟的代理能力與工具整合

自Gemini 2開始，Google就把「Agent」概念放進產品設計，Gemini 3則把這條路走得更遠︰

在Vending-Bench 2長期規劃測試中，Gemini 3 Pro模擬經營自動販賣機業務1年，最終報酬遠超過Gemini 2.5 Pro、GPT-5.1與Claude Sonnet 4.5，顯示它在長時程任務上更能維持穩定策略。
搭配Google Antigravity時，代理人可以直接存取編輯器、終端機與瀏覽器，幫你完成端對端的開發任務。
在搜尋AI模式中，Gemini 3會根據你的問題自動生成互動式工具，例如房貸計算機、物理模擬或資料視覺化介面。

這種能力，對想打造AI Agent產品的團隊尤其關鍵。

5.減少幻覺，回答更精準

Google在介紹Gemini 3 Pro時，特別強調它的回答風格是「聰明、簡潔、直接」，並且「傾向告訴你需要聽的事實，而不是你想聽的好話」。

在SimpleQA與FACTS Benchmark等測試中，Gemini 3 Pro的事實準確性也明顯優於前一代與多數競品，代表在一般資訊查詢與說明型任務上，出現嚴重幻覺的機率相對更低。

Gemini 3 Pro怎麼用？

Gemini 3 Pro使用方式非常簡單，只需要透過Google Gemini或Google AI Studio就可以輕鬆開始創作。

Gemini：直接開啟Gemini 網頁，右下角的「模型選擇（Model）」預設是「快速（2.5 Flash）」，點開後切換成Thinking（3 Pro）。

Google AI Studio：開啟Google AI Studio，選擇「Gemini 3 Pro Preview」。

Gemini 3 Pro不同族群應用情境

族群	能解決的需求	實際可使用方式
學生與研究者	整理大量學習資料、理解複雜概念、協助推理與檢查論證。	把論文PDF、課堂錄影、講義一起丟給Gemini3，整理成重點或摘要。製作互動式單字卡、練習題。用Deep Think檢查數學或科學推導過程，找出可能的錯誤或盲點。
上班族與商務人士	快速整合市場資訊、做簡報、管理信件與行程。	用搜尋AI模式做市場資料彙整、競品比較、商業模式分析。請它整理簡報架構、決策摘要。透過Gemini Agent整理Gmail、產生回信草稿、排定行程。
工程師與產品團隊	加速開發、快速產生原型、簡化操作流程。	用Vibe Coding把草圖變成可執行的前端原型。讓Gemini3閱讀整個程式碼庫，協助找bug、補技術文件。在Gemini CLI中用自然語言請代理人操作Git、診斷Cloud Run或產生專案架構。
內容創作者與媒體	整理多來源資料、加速稿件製作、多平台內容轉換。	讀影片或直播逐字稿，快速產生稿件大綱與摘要。把圖表、截圖與PDF一起丟進去，請它寫成懶人包或教學文。同一篇內容轉寫成適合社群、電子報或短影片腳本的版本。

Gemini 3 Pro實際應用範例

Gemini 3 Pro已經能做出更多超乎想像的成果。許多使用者分享，只要上傳1張相片並輸入簡單指令，就能把平面的照片轉成動畫；也有人用幾句話就生成互動式地圖App。從個人網站、網站小工具、甚至小型網頁遊戲，Gemini 3 Pro都能在極短時間內做出可操作的版本，讓不會寫程式的人也能實現把想法變成作品。

以下整理5個最常見、實用的Gemini 3 Pro使用方式：

1.整合PDF、圖片與影片內容

在處理不同格式的資料時，Gemini 3 Pro能一次讀懂PDF、圖片、截圖與影片內容，並把重點整理成摘要、條列或比較表。不需要先轉檔或拆資料，能大幅減少整理資訊的時間。

2.整理辨識手寫內容、筆記與掃描文件

面對手寫筆記、會議白板或掃描文件，Gemini 3 Pro能看懂內容、還原文字，並用上下文判斷真正的意思。它不只把字轉出來，也能幫忙整理成條列、摘要或結構化資料。

3.協助核對帳冊與檢查數字是否合理

例如帳本上的金額、單位或加總結果有沒有問題，Gemini 3 Pro能讀取內容後進行計算與比對，並說明推算過程。它能協助發現「數字怪怪的地方」，讓你更快確認資料正確性，特別適合大量表格或跨頁資訊，能節省大量人工逐格檢查的時間。

4.產生基本款網站小工具

如果你需要製作簡單的網站小工具，像是處理影片的剪輯、加字幕，或是倒數計時器、隨機密碼產生器、地圖查詢等功能，Gemini 3 Pro能依描述生成可運作的基礎原型。模型會將需求拆解成可執行的網頁或前端程式碼，讓你立即測試概念，而不必自己從零開始搭架構。

範例指令：

幫我寫一個「自定義隨機密碼產生器」的網頁小工具。

功能需求：使用者可以選擇密碼長度（滑桿）、是否包含符號、數字或大寫字母。
介面設計：用現代化的深色模式風格，按鈕要明顯，並包含一個「一鍵複製」的功能。
程式碼要求：提供一個單一的HTML檔案，將CSS和JavaScript全部內嵌在裡面，讓我存檔後直接用瀏覽器打開就能運作。不需要依賴外部函式庫。

5.依照描述生成基本3D場景或互動示意

如果想要展示一個空間、遊戲場景或互動概念，Gemini 3 Pro能用Three.js等方式生成簡單的 3D世界，例如方塊地形、光影效果或可移動視角。這類內容雖然不等於完整遊戲，但很適合作為設計提案或初步Demo，讓概念更具體。

範例指令：

幫我寫一個「3D守宮飼養箱互動模型」的網頁。

功能需求：幫我生成一個守宮飼養箱的立體模型，使用者可以用滑鼠拖放或點擊新增守宮及佈景物件，所有物件都能自由移動、旋轉、縮放和改變顏色。
介面設計：用現代感的深色模式，畫面須含有「物件選單」、「3D飼養箱空間」和「編輯面板」3塊區域。
程式碼要求：提供一個單一的HTML檔案，將CSS和JavaScript全部內嵌在裡面，讓我存檔後直接用瀏覽器打開就能運作。使用最適合在網頁上呈現3D互動的技術來實現。」

Gemini 3 Pro價格與費用方案

Gemini 3 Pro的費用分成「免費試用」與「付費方案」。免費方案只能在Google AI Studio裡體驗模型，不提供API使用。如果開發者要正式使用API，就會按照Token（字數）計費。

項目	免費方案	付費方案（每100萬Tokens計費，美金）
輸入Token價格	無法使用	$2.00（輸入≤20萬Tokens） $4.00（輸入>20萬Tokens）
輸出Token價格（含思考Tokens）	無法使用	$12.00（輸出≤20萬Tokens） $18.00（輸出>20萬Tokens）
脈絡快取（Context Caching）	無法使用	$0.20（≤20萬Tokens） $0.40（>20萬Tokens）
脈絡快取儲存費	無法使用	每小時每100萬Tokens收$4.50
Google搜尋基準（Search Grounding）	無法使用	每日1500次免費（RPD）之後每1000次查詢$14（即將上線）
Google地圖基準（Maps Grounding）	無法使用	無法使用
是否會用你的資料改善模型	會	不會

Gemini 3 Pro vs GPT-5.1誰比較強？

項目	Google Gemini 3 Pro	OpenAI GPT-5.1
模型定位	Google旗艦級多模態、強推理、強代理能力。	OpenAI旗艦級泛用模型，強語言生成能力。
推理能力	在學術推理類測試分數較高（例如：HLExam、GPQA）。	推理能力強，但在部分科學推理測試落後Gemini 3。
數學能力	AIME類型題目搭配程式執行可達高正確率。	數學表現穩定，但進階賽題通常不及Gemini 3 Pro。
多模態（圖片、PDF、影片）	文字、圖片、PDF、影片、程式碼整合度高，在MMMU-Pro與Video-MMMU中領先。	具備多模態能力，但影片推理與長影片分析表現較不突出。
長脈絡能力	支援1百萬tokens，可處理大型程式碼庫與長文件。	脈絡長度提升，但未達Gemini 3的百萬等級。
編碼與代理能力	強調Vibe Coding，可從草圖生成前端原型；代理人能執行多步驟任務。	編碼能力強，但偏向補充與生成；代理任務執行深度較低。
工具整合度	深度整合Google搜尋、Gmail、日曆、瀏覽器與CLI。	整合度高，但依賴外部插件與API，整體屬互補式。
事實準確性與幻覺	走「簡潔、不阿諛」路線，在SimpleQA等測試中幻覺率低。	敘事更自然流暢，但有時較易補內容填空。
適合族群	工程師、分析師、研究者、需要跨資料整合作業者。	作家、內容創作者、客服對話、語言生成場景。
使用場景優勢	跨格式資料整合、程式開發、自動化、研究分析。	文案生成、自然語言理解、創作輸出。

Gemini 3 Pro常見問題

Gemini 3 Pro要付費嗎？

一般用戶可以在Gemini網頁免費使用基礎額度，包括一定次數的Thinking模式，也就是以Gemini 3 Pro處理複雜任務。若需要更高額度或進階能力，例如代理人功能、長時間推理或更快的運算速度，則需升級到Google AI Plus、Pro或Ultra方案。

台灣目前能用到Gemini 3 Pro嗎？

Gemini 3 Pro已在全球多數地區上線，台灣用戶可透過Gemini網頁或Google AI Studio直接使用。搜尋AI模式的Thinking選項則依Google區域政策逐步開放，進階代理人功能會優先提供給高階訂閱用戶。

什麼情況下需要用Gemini 3 Pro模式？

當任務需要深度分析、整合多種來源、處理長文或涉及推理時，就適合切換到Thinking模式。例如分析研究資料、拆解商業案例、協助程式開發或比對多份文件。若只是簡單查詢或一般內容生成，使用快速模式即可。

參考資料：Google 3 pro

延伸閱讀：博士生等級的AI助理來了！Google Gemini 3 Pro 四大功能一次看

核稿編輯：陳虹伶