8 大 AI 模型國際象棋大激鬥 OpenAI o3 三戰全勝霸氣封王

Author:

Published:

- 廣告 -

現今 AI 大模型無論在文、理、商、工科都「叻到癲」,淵博知識仿如鯨吞百科全書、教科書與專業期刊,面對無所不知的 AI,人類有時都難免感到幾分尷尬。不過 AI 之間都要分出高下,早前 8 款通用型 AI 大模型就參加了一場國際象棋比賽,OpenAI o3 以三戰未嘗一敗的無敵姿態擊倒對手,絕對係近期科技界極為精彩的對決。

AI Chess Exhibition Tournament 已於 8 月初舉行,8 大 AI 大模型成為參賽選手。
AI Chess Exhibition Tournament 已於 8 月初舉行,8 大 AI 大模型成為參賽選手。

由 Google 旗下 Kaggle 舉辦的「AI Chess Exhibition Tournament」已於 8 月初舉行比賽,並於 8 月 14 日公布賽果。參賽的選手就有多款炙手可熱 AI 大模型,包括 Anthropic Claude Opus 4、DeepSeek-R1、Google Gemini 2.5 Pro、Google Gemini 2.5 Flash、Moonshot AI Kimi 2-K2-Instruct、OpenAI o3、OpenAI o4-mini 以及 xAI Grok 4。

初賽中 OpenAI o3、o4 mini、Google Gemini 2.5 Pro 和 Grok 4 均表現亮眼,各自以 4:0 擊敗對手;晉級次輪後,OpenAI o3 再以 4:0 之姿擊敗同門 o4 mini,而 Grok 4 則以 3:2 苦勝 Google Gemini 2.5 Pro。最後冠軍戰則再由 OpenAI o3 以 4:0 橫掃 Grok 4,季軍戰則由 Google Gemini 2.5 Pro 擊敗 OpenAI o4 mini。

- 廣告 -
最後賽果由 OpenAI o3 以無敵姿態勝出,表現之佳令大家驚訝。
最後賽果由 OpenAI o3 以無敵姿態勝出,表現之佳令大家驚訝。
比賽最終由 OpenAI o3 奪得金牌、 xAI Grok 4 得銀牌,Google Gemini 2.5 Pro 得銅牌。
比賽最終由 OpenAI o3 奪得金牌、 xAI Grok 4 得銀牌,Google Gemini 2.5 Pro 得銅牌。

其實今次比賽對於 AI 發展來說確實別具意義。因為有別於以往 AlphaGo 及 Deep Blue 等專門訓練奕棋的某些模型,這些通用型 AI 大模型就像人類一樣學習掌握遊戲規則,並利用推理邏輯操作遊戲策略對戰,可說是邁向 AGI(通用人工智能)的一個里程碑。不過一眾 AI 大模型的表現實在可圈可點。

觀戰的現任世界棋王 Magnus Carlsen 形容這些模型的棋感尤如「天賦很高但不懂棋子走法的孩子」,他強調這些大模型就算語言處理實力強勁,但下棋表現仍然相當幼嫩,約等於 800 ELO 左右。他指出,Grok 4 在關鍵時刻出現嚴重失誤,例如在關鍵時刻無可挽回地損失重要棋子,這與 OpenAI o3 更為穩定的策略走法形成鮮明對比。

至於另一位大師級棋手中村光則聚焦於兩款 AI 選手截然不同的策略和錯誤管理。中村指出,Grok 4 飽受多次戰術性失誤困擾,而 OpenAI o3 則可將錯誤減到最少,並在整場比賽中保持一致且連貫的策略思路。看來 AI 大模型要在棋壇稱霸,以至實現更多推理、模擬等高層次任務,仍然要加倍努力。

來源:Kaggle

- 廣告 -
- 廣告 -

Related Articles

- 廣告 -

Recent Articles

- 廣告 -

最新影片

- 廣告 -