小赖子的英国生活和资讯

Alpha Arena: AI 在真实市场的实盘对决与深度分析

阅读 桌面完整版

Alpha Arena:AI 在真实Crypto市场的表现

这几天国内外都在关注的一个有意思的事情, 就是 nof1.ai 搞了一个各大AI在虚拟货币市场投资/操盘能力。此刻,有人正让6个顶级AI模型,真金白银地炒币,看谁赚得多,不是模拟盘,是直钱实战。现在DeepSeek移居第一,已经赚了3000多刀。游戏规则简单粗暴,每个AI模型发10000美元启动资金,让它们自己分析比特币、以太坊等6种主流币的行情,自己决定买卖、加杠杆,最后谁账户里的钱最多谁赢。这个比赛非常有看头,用得都是通用AI,不是专门为了炒币训练的,能看出AI到底行不行。也不让AI组队商量,就是看每个AI自己的本事。如果AI真能炒币赚钱,以后可以用来自动管理投资池,帮DAO做决策,捕捉套利机会。

DeepSeek 曾一度领跑,但现在暂时被阿里的千问(Qwen 3 Max)反超。GPT-5 操作太频繁了,几乎是“手痒型”交易员,频繁进出导致手续费都交了不少。事实再次证明:折腾得越多,亏得越快。市场里,少操作往往意味着少风险。

我在想——如果 AI 什么都不做,拿着那 1 万美元静静不动,岂不是既不亏也不赚?不过估计在提示词(prompt)里早就规定了不能一直“躺平”HODL,否则这比赛就没意思了。

看来连 AI 都逃不掉人类交易者的通病——手太勤,赚不来稳。

哪个AI能真实搞到钱?我们拭目以待

比赛规则与目标

当前赛况速览(截至 10/23)

模型 当前净值(近似) 表现摘要
Qwen 3 Max $14,287.91 领先者,持仓与择时均有较好表现
DeepSeek V3.1 Chat $12,766.00 稳健系统化交易,风险管理较好
Grok 4 $8,500.46 偏激进,倚重方向判断;单笔盈亏波动大
Claude 4.5 Sonnet $8,734.66 温和趋势跟随,频率中等
Gemini 2.5 Pro $3,607.77 多次方向判断失误,回撤较大
GPT 5 $2,714.07 短线频繁进出,但连日亏损,风险控制需加强

重点实盘交易摘录与解读

从交易行为看 AI 策略类型与弱点

为何用真实市场作为训练环境?

改进方向与研究建议

结语:资本配置是智能的试金石

附:选取交易流水(节选,按时间倒序)

时间(UTC) 模型 品种 方向 开价 → 平价 数量 名义变化 持仓时长 净 P&L
10/23 16:11 Grok 4 BNB $1,076.9 → $1,143 7.07 $7,614 → $8,081 136h36m $463.13
10/23 16:10 GPT 5 BNB $1,103 → $1,124.6 -1.81 $1,996 → $2,036 7h35m -$40.14
10/23 15:20 Claude 4.5 SOL $190.16 → $188.4 37.02 $7,040 → $6,975 53m -$70.76
10/23 14:10 GPT 5 ETH $3,891.1 → $3,834.5 1.40 $5,448 → $5,368 4h45m -$82.06
10/22 22:39 DeepSeek V3.1 XRP $2.4666 → $2.3397 3,542 $8,737 → $8,287 61h38m -$455.66
10/22 22:11 Grok 4 ETH $3,851.2 → $3,724.4 5.06 $19,487 → $18,845 118h33m -$657.41

网友说:

Grok的风格是最激进的。Grok的回撤的过程中是非常猛的。Grok开的倍数很高,出现大回调Grok仍然采用高倍战法,甚至20倍的做多。

最惨的是GPT-5和Gemini。

让所有的大模型一起跑够一个月,那这个参考价值就更加的强悍了。

昨天还是加密市场好赚的AI大模型们,今天却全线崩盘,Alpha Arena的这个“大模型实盘交易竞技赛” 给每个AI模型配置一万美元的本金,让它们在真实市场中自由交易,整个过程全自动、无人干预。入场才两天多,DeepSeek就狂赚超40%,稳坐第一。可就在今天凌晨,市场突然大跳水,AI们完全没反应过来,继续死扛,结果全被套牢。最惨的DeepSeek一天亏掉31%。连一向最稳的Qwen 3 Max也跌了20%。

为啥会翻车?18号刚入场的时候,正好赶上了市场的低点。表现好的模型甚至加了10-15倍的杠杆,一路顺风顺水,AI看到行情好,几乎都全线加多仓。但今天市场突变,AI模型不会看新闻,只是机械执行策略,而且没及时学会止损,杠杆太高,一旦下跌很容易直接爆仓。更扎心的是Gemini,还老频繁买卖/交易。光手续费就亏出去一大笔。

最后6个模型几乎在同一个点集体翻车。当然,这实验才刚三天多。时间还太短,真要论长期,到底谁能赢还说不定呢。

这场实验最有意思的地方,就是让AI在实盘里真刀真枪摔跟头,把问题都暴露出来,到底谁最怕突发状况?谁反应最快,换做是你,敢让AI直接帮你炒币吗?

这是唯–个融合了“Ai+Crypto+Web1”三大概念的注意力产品。6万美金+半个月时间,就打造出了这么一款神级产品,6个中美顶级大模型实盘跑分,7×24小时自动运行。你总会忍不住的想看哪个模型赚了亏了,要是再增加一个“预测市场”的功能,估计大家就可以下注竞猜了。这个产品经理真厉害!

谁要是把这个交易工具给做出来了,我马上投。听说国内马上就有人开源了。

DeepSeek,这是你老本行,这个你熟。

实盘的魅力,主打一个刺激。

垫底的是GPT-5和Gemini,四天亏了3000上下。

AI在Hyperliquid的永续合约上面去真刀真枪自由操作,在链上是全透明,可追溯。最后就是谁赚得多,谁赢。

虽然不提供API,你看不到AI是怎么做思考和复盘的,但是你可以看到机器人交易记录。每一个大模型都像一个非常有性格的交易员。

DeepSeek Chat v3.1就是一个多头纪律性特别强的万能手,没有什么高频交易,Grok4跟它相比之下,就能承受比较高的波动。Qwen就一直比较稳不赚不赔,GPT-5和Gemini 2.5 Pro就俩活宝,高频交易逆势操作,匆匆忙忙连滚带爬,把钱亏了。

以前大家对AI的期待是什么?写个论文、画个图、做个视频、写个代码就不得了了,但是这些所有的测试都有很大的缺陷。都是在无菌、可预测的环境里面。币圈可不一样。实战的零和游戏。金融市场,是世界的终级建模引擎,同时也是唯一一个会随着AI变聪明,它的难度也会提高的基准。

金融市场的逻辑就是波动、反应、惩罚、奖励。每个大模型以后比得就不是“谁的标签打得最好” 而是比别的一套逻辑,第一,你解读波动的速度快不快,第二你怎么权衡这个风险,第三你怎么快速准确的纠错。这就变得很实战。新的玩法、新的标准会改变所有人,对所有AI公司的标准和估值。

真实的市场才是最好的试金石,不论是驴是马,都得拉出来遛遛。不过话说回来——你敢把自己的钱交给 AI 来操作吗?

人工智能 / Artificial Intelligence

英文:AI Trading in Real Markets? Would you put your money to it?
英文:Alpha Arena: How AI Performs in the Real Crypto Market

强烈推荐

微信公众号: 小赖子的英国生活和资讯 JustYYUK

阅读 桌面完整版
Exit mobile version