AI大模型投资竞赛落幕!阿里通义千问Qwen3-Max以22.32%回报率夺冠
竞赛概况
- 主办方:美国研究机构Nof1
- 竞赛名称:Alpha Arena(首届AI大模型实盘投资竞赛)
- 结束时间:2025年11月4日
- 参赛模型:6个顶级人工智能大语言模型(LLMs)
- 冠军模型:阿里巴巴通义千问Qwen3-Max
- 关键指标:实现**22.32%**的投资回报率
竞赛规则与设置
- 初始资金:每个模型获得10,000美元
- 交易品种:比特币(BTC)、以太坊(ETH)等加密货币永续合约
- 交易平台:Hyperliquid
- 决策依据:仅限数值市场数据(价格、交易量、技术指标)
- 禁止信息:不得参考新闻或其他外部信息
- 评估标准:
- 主要目标:最大化盈亏(PnL)
- 风险调整指标:夏普比率
模型表现分析
- 交易风格差异:各模型在交易风格、风险偏好和持仓周期上存在显著差异
- 交易频率:部分模型交易活跃,部分偏好长期持有
- 数据敏感性:数据格式敏感性直接影响模型表现
- 关键发现:仅调整提示中的"数据顺序"即可修正某些模型的误读
实验局限性与未来计划
- 当前局限:
- 样本量有限
- 测试周期较短
- 未来改进:下一赛季计划引入更多控制因素和特征,增强实验统计效力
研究意义
此次实验推动AI研究从静态基准测试转向更真实、动态的决策场景,探索大语言模型在未经特定微调情况下能否有效进行交易,为AI在金融领域的应用提供了新视角。
其他AI要闻速览
1. 蚂蚁集团推出多语言视觉大模型训练框架
- 发布场合:香港金融科技周
- 技术特点:突破多语言应用瓶颈,针对埃及阿拉伯语等小语种
- 创新机制:语言感知优化框架,实现"目标语言思维"机制
- 应用效果:提升资源稀缺语言的训练效果
2. 苹果Siri重大变革
- 合作方:谷歌
- 技术方案:采用定制化Gemini语言模型
- 架构策略:"端云协同"混合模式
- 优势:结合云端大模型优势与本地数据隐私保护
3. 现代汽车与英伟达合作
- 投资规模:30亿美元
- 合作内容:基于Blackwell架构建设AI工厂
- 重点领域:自动驾驶、智能工厂、机器人
- 支持方:韩国政府
4. 度小满CEO谈AI赋能金融
- 应用成果:客户服务从月度调研转向实时响应
- 核心理念:以客户为中心的变革性转型
5. 微信支付新增AI功能
- 主要功能:自动收款、自动算账、社区文案和技术开发指导
- 目标用户:中小商户
- 效果:简化日常业务流程,提升效率
6. 字节跳动Trae AI工具调整
- 调整内容:停止Claude模型支持
- 补偿方案:Pro会员每月额外获得50次快速请求(至2026年1月31日)
- 总计:每月300次请求
7. 其他产品发布
- 昆仑万维:SkyReels V3(集成Sora2、Veo3.1等顶级AI视频技术)
- 月之暗面:Kimi Linear模型
- MiniMax:音乐2.0版本
- 谷歌Gemini:PPT自动生成功能(Gemini Canvas工作区)
- 高德地图:正式进军Robotaxi领域,定位全球市场
