早前《PCM》報道過 Google 將新開 Gmail 帳戶的儲存容量,由 15GB 降級為 5GB,用戶必須縛定一個流房電話號碼,才能使用 15GB 儲存。近日再有發現 Google 更改 Gemini 用戶介面,模型選項新增「3.1 Flash-Lite」,實際上背後涉及 Google 偷偷更改 Gemini 的用量計法,由過去按提問次數計算,變成按運算量計費。即越複雜的問題,越消耗運算量。無論是免費或者付費用戶,只要經常用進階功能,又或者長對話的用戶,這變更等同將 AI 可用量大縮水。
取消次數計算限額
Google Gemini 過往以提問次數作用量計法,如免費用戶每日可用 5 次 Gemini Pro、生成 100 張圖片,以至每月生成 5 份深度研究報告。不過,Google 自 5 月 17 日起更改計算方法,引入以運算能力為基礎的實時扣減點數計算,不再用次數去計。
系統會根據以下三大高消耗指標,動態扣除用戶的配額:
- 提示詞複雜度(指令越複雜,扣減越多)
- 開啟進階功能(如生成圖片、影片、音樂,以至深度研究報告)
- 對話歷史長度(隨着上下文範圍變長,每次送出都消耗運算資源)
新機制將用量限量改為每 5 小時重新計算,同時加入每星期用量總上限。Google 在 Gemini 設定內加入用量儀錶板,用百分比顯示用戶當前的消耗運算量進度。

Google AI 各方案的運算量如下:
- 免費用戶:標準
- AI Plus:比標準上限高 2 倍
- AI Pro:比標準上限高 4 倍
- AI Ultra:比 AI Pro 高 20 倍

引入 3.1 Flash-Lite 與「思考等級」
Gemini 同時改變模型選項,分別設:
- 3.1 Flash-Lite
- 3 Flash
- 3.1 Pro
而且每個選項加入思考等級(Thinking Level)的標準和伸延思考。即用戶有 6 個選項叫 Gemini 回答問題。

3.1 Flash-Lite 為新增選項,背後對應 gemini-3.1-flash-lite,極輕量推理,僅處理指令,幾乎不消運算資源。
3 Flash 為以往的 Fast 模型,背後對應 gemini-3-flash-preview。啟動伸延思考,加入思維鏈,中型模型作深度推理,平衡速度與邏輯能力。 3.1 Pro 為 gemini-3.1-pro-preview,旗艦模型直接回答,適合複雜指令但無需繁瑣檢錯。啟動伸延思考,加入深度思維鏈,即以往的Deep Think / Research,消耗最多運算資源。



