AI-NEWS · 2026年 2月 17日

京东发布JoyAI大模型

京东开源JoyAI-LLM-Flash大模型,推动AI技术创新

核心摘要

2026年2月14日,京东在Hugging Face平台正式开源其最新大模型JoyAI-LLM-Flash。该模型总参数量达48亿,其中激活参数量为30亿,在20万亿文本token上进行了预训练,展现出对前沿知识的优秀理解、推理及编程能力。

技术亮点

1. 创新优化框架

  • FiberPO优化框架:将纤维丛理论引入强化学习,结合Muon优化器和密集多token预测(MTP)技术,成功解决了传统模型扩展时的不稳定性问题。
  • 性能提升:相比非MTP版本,吞吐量提升1.3至1.7倍,大幅提升了训练效率和应用潜力。

2. 模型架构

  • 混合专家(MoE)模型:共40层
  • 上下文长度:支持128K
  • 词表大小129K

行业意义

此次发布标志着京东在AI领域的重要进展,特别是在模型效率优化和规模化训练方面取得了实质性突破。

同日其他AI动态(2026年2月14日)

1. 火山引擎推出豆包大模型2.0

  • 核心升级:推理成本降低一个数量级
  • 开放API:面向企业和开发者提供API服务,个人用户可通过指定平台访问。
  • 能力特点:针对生产环境优化,具备高效推理、多模态理解和复杂指令执行能力。

2. MiniMax开源M2.5模型

  • 发布节奏:M2系列在108天内的第三次升级。
  • 开源平台:在ModelScope上开源。
  • 能力表现:在编程、搜索和办公任务方面表现优异,在SWE-Bench Verified等基准测试中成绩突出。
  • 目标:推动低成本Agent技术发展,提供从无代码使用到私有化部署的完整解决方案。

3. DeepSeek预告长文本模型测试

  • 测试时间:2月14日。
  • 核心能力:支持高达100万token的长文本处理。
  • 知识更新:知识库更新至2025年5月。
  • API状态:保持V3.2版本,上下文长度为128K,被视为即将发布的V4模型的前奏。

近期其他AI要闻(2026年2月13-16日)

1. 抖音AI视频模型首登春晚(2月16日)

  • 事件:央视春晚将首次深度应用国产AI视频生成模型Seedance2.0
  • 开发方:抖音团队。
  • 应用现状:已集成至多个抖音平台,用户可通过提示词快速生成短视频。

2. Google Gemini遭遇大规模蒸馏攻击(2月15日)

  • 攻击规模:攻击者使用超过10万次重复查询提取其内部机制。
  • 攻击目的:克隆或增强自身AI系统。
  • 行业影响:引发全行业对大模型安全性的担忧。

3. 横店影视推出AI短剧(2月13日)

  • 作品:《九州·暮云录》(改编自管平潮小说)。
  • 特色:融合东方美学与青春冒险,展示“AIfilm”工业创新。
  • 意义:标志中式网络短剧进入AI时代。

4. 蚂蚁集团开源万亿参数模型(2月13日)

  • 模型名称:Ring-2.5-1T。
  • 历史地位:全球首个线性架构混合万亿参数思维模型。
  • 性能优势
    • 在长文本生成、数学推理和智能体任务执行方面表现卓越。
    • 对32K以上文本,内存访问减少10倍以上,生成吞吐量提升3倍

5. 其他产品动态(2月13日)

  • 字节跳动:推出Seedream 5.0 Lite,具备“视觉推理”和实时联网能力。
  • 小红书:将限制未标注AI内容的流量。
  • 美图快拍:首批集成Seedance 2.0大模型,预计2月底上线,旨在将AI生成能力深度嵌入用户工作流。
  • 同程旅行:全面集成腾讯元宝(基于腾讯混元大模型),推出AI旅行管家功能,可基于实时数据提供住宿推荐等专业建议。

信息整理自AIbase等公开新闻源,截至2026年2月17日。

火龙果频道