AI-NEWS · 2026年 1月 5日

OpenAI投资音频AI提速

OpenAI 加速音频AI技术研发以提升响应速度

核心摘要

OpenAI 正在加速开发音频人工智能技术，旨在提升语音对话模型的性能和响应速度，为其即将推出的“语音优先”智能设备做准备。新音频模型计划于 2026年第一季度 发布。

详细内容

1. 技术整合与目标

团队重组：过去两个月，OpenAI 整合了多个工程、产品和研究团队，集中精力攻关音频交互技术。
核心目标：提升语音AI模型的对话性能和响应速度，提供更流畅的沟通体验。
当前短板：内部人士指出，现有语音对话模型在准确性和响应速度上仍无法与文本模型媲美。

2. 新一代音频模型特性

发布时间：计划于 2026年第一季度 发布。
核心能力提升：
- 更自然、更具情感表现力的语音输出。
- 更好地处理对话中的实时打断和交互场景。
创新功能：支持“听即说”功能，允许设备在用户说完话之前就开始响应，以实现更流畅的实时互动。该功能在当前大多数语音AI产品中仍属罕见。

3. 与硬件战略的关联

此次技术升级直接关联 OpenAI 即将推出的“语音优先”个人设备。

预计上市时间：大约一年后（即约 2027年初）。
产品形态：可能不是一个单一产品，而是一个系列，包括无屏智能眼镜、带极小屏幕的语音助手等形态。
设计理念：降低用户对屏幕的依赖，通过自然语音通信增强整体用户体验。

4. 战略意义

OpenAI 正加速迈向 “语音成为核心交互界面” 的未来。这不仅是其自身产品开发的战略调整，也是科技行业对交互模式转变的主动应对。

本文信息来源于 AIbase，发布日期为 2026年1月4日。

火龙果频道

您可能还喜欢...