AI-NEWS · 2025年 11月 5日

阿里通义千问夺冠

AI大模型投资竞赛落幕!阿里通义千问Qwen3-Max以22.32%回报率夺冠

竞赛概况

  • 主办方:美国研究机构Nof1
  • 竞赛名称:Alpha Arena(首届AI大模型实盘投资竞赛)
  • 结束时间:2025年11月4日
  • 参赛模型:6个顶级人工智能大语言模型(LLMs)
  • 冠军模型:阿里巴巴通义千问Qwen3-Max
  • 关键指标:实现**22.32%**的投资回报率

竞赛规则与设置

  • 初始资金:每个模型获得10,000美元
  • 交易品种:比特币(BTC)、以太坊(ETH)等加密货币永续合约
  • 交易平台:Hyperliquid
  • 决策依据:仅限数值市场数据(价格、交易量、技术指标)
  • 禁止信息:不得参考新闻或其他外部信息
  • 评估标准
    • 主要目标:最大化盈亏(PnL)
    • 风险调整指标:夏普比率

模型表现分析

  • 交易风格差异:各模型在交易风格、风险偏好和持仓周期上存在显著差异
  • 交易频率:部分模型交易活跃,部分偏好长期持有
  • 数据敏感性:数据格式敏感性直接影响模型表现
  • 关键发现:仅调整提示中的"数据顺序"即可修正某些模型的误读

实验局限性与未来计划

  • 当前局限
    • 样本量有限
    • 测试周期较短
  • 未来改进:下一赛季计划引入更多控制因素和特征,增强实验统计效力

研究意义

此次实验推动AI研究从静态基准测试转向更真实、动态的决策场景,探索大语言模型在未经特定微调情况下能否有效进行交易,为AI在金融领域的应用提供了新视角。


其他AI要闻速览

1. 蚂蚁集团推出多语言视觉大模型训练框架

  • 发布场合:香港金融科技周
  • 技术特点:突破多语言应用瓶颈,针对埃及阿拉伯语等小语种
  • 创新机制:语言感知优化框架,实现"目标语言思维"机制
  • 应用效果:提升资源稀缺语言的训练效果

2. 苹果Siri重大变革

  • 合作方:谷歌
  • 技术方案:采用定制化Gemini语言模型
  • 架构策略:"端云协同"混合模式
  • 优势:结合云端大模型优势与本地数据隐私保护

3. 现代汽车与英伟达合作

  • 投资规模:30亿美元
  • 合作内容:基于Blackwell架构建设AI工厂
  • 重点领域:自动驾驶、智能工厂、机器人
  • 支持方:韩国政府

4. 度小满CEO谈AI赋能金融

  • 应用成果:客户服务从月度调研转向实时响应
  • 核心理念:以客户为中心的变革性转型

5. 微信支付新增AI功能

  • 主要功能:自动收款、自动算账、社区文案和技术开发指导
  • 目标用户:中小商户
  • 效果:简化日常业务流程,提升效率

6. 字节跳动Trae AI工具调整

  • 调整内容:停止Claude模型支持
  • 补偿方案:Pro会员每月额外获得50次快速请求(至2026年1月31日)
  • 总计:每月300次请求

7. 其他产品发布

  • 昆仑万维:SkyReels V3(集成Sora2、Veo3.1等顶级AI视频技术)
  • 月之暗面:Kimi Linear模型
  • MiniMax:音乐2.0版本
  • 谷歌Gemini:PPT自动生成功能(Gemini Canvas工作区)
  • 高德地图:正式进军Robotaxi领域,定位全球市场

火龙果频道