京东开源JoyAI-LLM-Flash大模型,推动AI技术创新
核心摘要
2026年2月14日,京东在Hugging Face平台正式开源其最新大模型JoyAI-LLM-Flash。该模型总参数量达48亿,其中激活参数量为30亿,在20万亿文本token上进行了预训练,展现出对前沿知识的优秀理解、推理及编程能力。
技术亮点
1. 创新优化框架
- FiberPO优化框架:将纤维丛理论引入强化学习,结合Muon优化器和密集多token预测(MTP)技术,成功解决了传统模型扩展时的不稳定性问题。
- 性能提升:相比非MTP版本,吞吐量提升1.3至1.7倍,大幅提升了训练效率和应用潜力。
2. 模型架构
- 混合专家(MoE)模型:共40层。
- 上下文长度:支持128K。
- 词表大小:129K。
行业意义
此次发布标志着京东在AI领域的重要进展,特别是在模型效率优化和规模化训练方面取得了实质性突破。
同日其他AI动态(2026年2月14日)
1. 火山引擎推出豆包大模型2.0
- 核心升级:推理成本降低一个数量级。
- 开放API:面向企业和开发者提供API服务,个人用户可通过指定平台访问。
- 能力特点:针对生产环境优化,具备高效推理、多模态理解和复杂指令执行能力。
2. MiniMax开源M2.5模型
- 发布节奏:M2系列在108天内的第三次升级。
- 开源平台:在ModelScope上开源。
- 能力表现:在编程、搜索和办公任务方面表现优异,在SWE-Bench Verified等基准测试中成绩突出。
- 目标:推动低成本Agent技术发展,提供从无代码使用到私有化部署的完整解决方案。
3. DeepSeek预告长文本模型测试
- 测试时间:2月14日。
- 核心能力:支持高达100万token的长文本处理。
- 知识更新:知识库更新至2025年5月。
- API状态:保持V3.2版本,上下文长度为128K,被视为即将发布的V4模型的前奏。
近期其他AI要闻(2026年2月13-16日)
1. 抖音AI视频模型首登春晚(2月16日)
- 事件:央视春晚将首次深度应用国产AI视频生成模型Seedance2.0。
- 开发方:抖音团队。
- 应用现状:已集成至多个抖音平台,用户可通过提示词快速生成短视频。
2. Google Gemini遭遇大规模蒸馏攻击(2月15日)
- 攻击规模:攻击者使用超过10万次重复查询提取其内部机制。
- 攻击目的:克隆或增强自身AI系统。
- 行业影响:引发全行业对大模型安全性的担忧。
3. 横店影视推出AI短剧(2月13日)
- 作品:《九州·暮云录》(改编自管平潮小说)。
- 特色:融合东方美学与青春冒险,展示“AIfilm”工业创新。
- 意义:标志中式网络短剧进入AI时代。
4. 蚂蚁集团开源万亿参数模型(2月13日)
- 模型名称:Ring-2.5-1T。
- 历史地位:全球首个线性架构混合万亿参数思维模型。
- 性能优势:
- 在长文本生成、数学推理和智能体任务执行方面表现卓越。
- 对32K以上文本,内存访问减少10倍以上,生成吞吐量提升3倍。
5. 其他产品动态(2月13日)
- 字节跳动:推出Seedream 5.0 Lite,具备“视觉推理”和实时联网能力。
- 小红书:将限制未标注AI内容的流量。
- 美图快拍:首批集成Seedance 2.0大模型,预计2月底上线,旨在将AI生成能力深度嵌入用户工作流。
- 同程旅行:全面集成腾讯元宝(基于腾讯混元大模型),推出AI旅行管家功能,可基于实时数据提供住宿推荐等专业建议。
信息整理自AIbase等公开新闻源,截至2026年2月17日。
