AI-NEWS · 2025年 12月 5日

DeepSeek双模齐发

DeepSeek 同时发布两大新模型:官方版 V3.2 与特别推理版上线

发布日期:2024年12月4日(北京时间)
发布方式:无预告直接发布,官网、App及API已一键无缝切换。

一、两大新模型核心亮点

1. DeepSeek-V3.2:首个“思考并用工具”的开源大模型

  • 核心突破:首次将“思考过程”与“工具调用”相结合。
  • 两种并行模式
    • 思考模式:模型可在准确调用工具前进行长链推理。
    • 非思考模式:仍保持闪电般的响应速度。
  • 训练与表现:通过海量Agent合成训练数据,V3.2在未进行任何针对性训练的情况下,直接主导了当前所有智能体公开评测榜单,轻松位居开源模型榜首,甚至接近部分闭源顶级模型的性能。

2. DeepSeek-V3.2-Speciale:推理怪兽的终极形态

  • 定位:可理解为“将思考开到最大”的增强版,唯一目标是将开源模型的推理能力推向物理极限。
  • 能力继承:继承了DeepSeek-Math-V2在证明数学定理方面的顶级能力。
  • 场景表现:在长链逻辑、复杂问题分解、多步骤规划等场景中表现出卓越的稳定性。
  • 测试结果:在需要超过30步深度推理的任务中,Speciale显著优于所有现有开源模型,被社区戏称为“开源o3/o4杀手”。

二、发布与用户体验

  • 无缝更新:模型发布后立即可用。DeepSeek官网聊天界面、移动应用及API服务均已升级至V3.2官方版本。
  • 用户操作:用户无需任何操作,只需刷新页面即可体验新能力,真正实现“醒来即更强模型”。

三、行业影响与评价

  1. 开源社区标杆:在2025年初,DeepSeek通过连续两次发布(灵活高效的V3.2和推理驱动的Speciale),直接将“性能极限”和“可用性”推向极致。
  2. 技术路线领先:当其他厂商仍在比拼参数和上下文长度时,DeepSeek已经开始比拼“模型是否会思考”。
  3. 版本潜力:此次发布的仅是DeepSeek-V3系列的“点二”版本,预示着后续仍有更大升级空间。
  4. 行业天花板:此举被认为再次将国内开源模型的天花板推高了三层。

四、同期其他AI要闻摘要(2024年12月4日)

  1. 阿里通义千问:APP推出基于Qwen3训练的学习大模型Qwen3-Learning,提供拍照解题和作业批改两项免费服务,识别准确率高于OpenAI和谷歌的付费功能,支持多语言及跨文化解题,整合全球超30个国家资源。
  2. 罗永浩评字节跳动“豆包手机”:肯定其探索精神,认为AI助手将无处不在是完全改变生活、不可或缺的历史必然趋势。
  3. OpenAI“企鹅”家族模型矩阵曝光(传闻):包括旗舰Emperor512、中端Rockhopper64、轻量Macaroni16和无推理Mumble0四个推理预算等级。旗舰Emperor512推理预算达512单位,是当前模型的8-10倍,可能成为GPT-5.2的核心。
  4. 三星电子:任命39岁的李康洙为新成立的NovaAILab首任所长,负责领导公司AI战略创新,其为三星史上最年轻的高管之一。
  5. 快手可灵:2.6版本全面上线,引入“影音同步”功能,可同步生成画面、人声、音效和环境氛围。
  6. 腾讯视频孙忠怀:表示未来12个月将是AI长片诞生的关键窗口期,生成式AI正深刻改变影视行业创作。
  7. Anthropic与Snowflake:达成2亿美元协议,Claude AI代理将于2026年第一季度在美国和欧洲原生集成至Snowflake平台,实现在数据仓库内直接进行自然语言查询和报告生成。
  8. 微软:AI服务销售遇挫,销售目标被削减50%。尽管AI技术受欢迎,但企业不愿完全替代人力,导致微软Azure销售团队业绩不佳。
  9. AI安全指数报告:《2025年AI安全指数》显示,领先的AI公司在生存风险控制和安全流程披露方面集体不及格,行业平均分仅42/100,远低于欧盟标准。仅三家公司披露了系统性的风险识别方法,而OpenAI、DeepMind等未透露针对“超智能”的应对措施。

信息源:AIbase Daily | 整理日期:2024年12月5日

火龙果频道