Google 放大招!史上最強開放 AI 模型 Gemma 4 免費任玩

Author:

Published:

- 廣告 -

Google 宣佈正式推出全新一代 DeepMind 開放模型 Gemma 4,號稱是其迄今為止最智能的開放模型系列。全新 Gemma 4 以 Apache 2.0 開源許可證授權發佈,旨在為開發者提供極高的靈活性與數據自主權。新系列繼承了與旗艦級 Gemini 3 相同的頂尖研究基礎,專為進階邏輯推理及代理工作流程(Agentic Workflows)而設,並能在極少的硬體資源下實現前所未有的「每參數智能(Intelligence-per-parameter)」。

四種尺寸靈活部署 越級挑戰大型模型

為滿足不同層面的硬體需求,Gemma 4 共提供四款不同尺寸:專為行動及物聯網裝置而設的 Effective 2B (E2B) 與 Effective 4B (E4B);以及針對個人電腦、工作站離線運算的 26B 混合專家模型(MoE)和 31B 密集模型(Dense)。 Google 強調,Gemma 4 在各項業界指標中表現優異,其中 31B 模型目前在全球業界標準的 Arena AI 文本排行榜中位列開源模型第三,而 26B 模型更成功擊敗體積大其 20 倍的競爭對手排在第六位,讓開發者以更低硬體門檻獲得頂級效能。

截至 4 月 1 日,Arena.ai聊天競技場上的開放模型表現與規模對比。

多模態升級:原生支援長文、視覺與語音

Gemma 4 的升級不僅限於文字生成,更全面向多模態(Multimodal)進發。 新模型全線原生支援影片及圖像處理,在 OCR(光學字元辨識)及圖表理解上表現出色;而針對邊緣運算的 E2B 及 E4B 型號更獨家加入原生音訊輸入,支援語音辨識與理解。 在文本處理方面,Gemma 4 支援超過 140 種語言,邊緣模型的上下文窗口(Context window)達 128K,大型模型更達 256K,讓開發者能將超長篇檔案或程式碼庫一次過輸入進行分析。 此外,Gemma 4 亦針對 JSON 輸出及函數呼叫(Function-calling)作原生最佳化,大大方便開發者建立能與不同 API 互動的自動化 AI 代理(AI Agents)。

Google 使用大量不同的數據集和指標對這些模型進行了評估,以涵蓋文本生成的各個方面。更多基準測試結果請參考Google 官方的 模型卡
- 廣告 -
Buy Me a CPM: PCM 讀者會員資助計劃
Lawrence
Lawrence
《PCM》創刊編輯, 見證電腦由 Monochrome 到 3D,9.6Kbps 撥號到 5G 無線上網年代,DIY、攝影、影音、手機樣樣啱玩。
- 廣告 -

Related Articles

- 廣告 -

Recent Articles

- 廣告 -

最新影片

- 廣告 -