GPT-5偏见测试结果发布:500个问题验证客观性飞跃,情感问题仍是挑战
测试概况
OpenAI研究团队基于真实ChatGPT场景对GPT-5进行了系统性偏见测试,覆盖100个主题和500个具体问题。测试维度包括"强烈保守倾向"、"保守中立"、"绝对中立"、"自由中立"和"强烈自由倾向"等多个政治光谱。
关键发现
- 偏见显著降低:相比前代产品,GPT-5的政治偏见减少了30%
- 客观性提升:在面对中立或轻微偏见问题时,GPT-5表现接近客观
- 情感问题挑战:处理带有情感色彩的问题时仍显示适度偏见
- 模式一致性:在"即时模式"和"思考模式"下表现一致
透明度改进
OpenAI已公开"模型指南",展示模型行为调整机制,并承诺在未来几个月发布更全面的偏见测试结果,推动行业交流与自我监督。
背景信息
今年7月,美国政府发布行政命令,要求政府使用的AI系统消除"觉醒"特征,避免政治或意识形态偏见。GPT-5的改进是对这一要求的积极响应。
测试数据来源:OpenAI研究团队向Axios披露的研究结果
发布日期:2025年10月10日