5 月 7 日,Qwen PC 版更新了一个挺有意思的功能——AI 语音输入。以前用 AI 得先打字,现在直接说话就能干活,感觉像是给电脑装上了个“嘴替”。
这功能到底强在哪?
1. 不止是“听写”,更像有个“秘书”在帮你改稿
以前的语音转文字,转完还得自己去删掉那些“嗯、啊、那个”,累死人。Qwen 不一样,它听的时候就在帮你过滤废话。
- 你说话带点口头禅,它直接给你删了。
- 如果你口误说错了,比如把会议时间说成两点又改口说三点,它能直接识别出这个逻辑矛盾,输出修正后的“三点”。
- 最爽的是,你说话的时候东拉西扯,它能把那些碎碎念整理成条理清晰的周报或纪要。
2. 不用切窗口,AI 直接钻进你的工作流
以前用 AI,得打开对话框,再粘贴内容,再等它回复,还得复制回去,流程繁琐。现在 Qwen 直接嵌入了钉钉、微信甚至文档编辑器里。
- 比如你在看网页或论文,选中一段看不懂的内容,直接对着电脑说“解释一下”或者“翻译”,答案就直接弹在你当前编辑的地方。
- 在微信或钉钉里,你可以用中文语音跟客户聊,Qwen 自动帮你生成一封格式规范的英文邮件回复,不用自己打字。
3. 它能听懂你的“逻辑跳跃”
人类说话经常想到哪说到哪,逻辑不连贯。Qwen 这次升级了,它能基于上下文把那些碎片化的语音补全。你随口说的一些点,它会自动串联起来,总结成一份完整的会议记录。
怎么用上它?
很简单,目前完全免费。下载个 Qwen PC 客户端,登录进去就能用,不用折腾什么插件。
我个人的感受
说实话,这次更新让我有点意外。
大模型以前给人的印象就是个“对话框”,你得去那里输入指令,回来取结果。但这次 Qwen 直接把 AI 的能力“塞”进了具体的软件里。你不需要再为了用 AI 而跳出当前的工作界面,它像个隐形的副驾驶,一直待在你手边。
更重要的是,它似乎真的开始理解人类那种非线性的思维了——我们说话本来就不是逻辑严密的,但 AI 能实时处理这种跳跃,并输出逻辑严密的文字,这比单纯的语音转文字(ASR)要实用得多。
写在最后
补充一下背景,文中提到的公司像阿里巴巴、OpenAI、Google 等,都是目前大模型领域比较受关注的玩家。
(注:具体产品功能可能随版本更新而变化,建议以实际体验为准。)
