Sam 非常详细的解释了 GPT-5 模型表现差和发布会数据问题的原因以及对应的修复措施，还有透露了

Sam 非常详细的解释了 GPT-5 模型表现差和发布会数据问题的原因以及对应的修复措施，还有透露了后续的规划

GPT-5 推出进展与技术问题：
- GPT-5 在推出初期遇到重大技术问题，尤其是自动切换器（autoswitcher）故障，导致模型表现明显下降。OpenAI 已对决策边界进行干预，提升用户获得正确模型的概率，并增加了对当前回答模型的透明度。
- 大规模上线导致 API 流量在 24 小时内翻倍，数亿用户出现服务波动。团队预计一两天内可稳定，并已为 ChatGPT Plus 用户加倍速率限制。
- 编程相关任务出现路由 bug，导致 GPT-5 在代码生成等方面表现不佳，需手动触发“思考模式”或明确要求模型“认真思考”。
- 直播演示中出现人为失误，导致柱状图误导，但官方博客和系统卡片中的数据是准确的。

用户访问与模型选择：
- OpenAI 收到大量要求恢复 GPT-4o 的反馈，决定让 Plus 用户可选用 4o，并根据使用情况决定是否长期支持。
- 正在开发 GPT-5-mini，逐步恢复用户在 o3、o4-mini-high、o4-mini 时的推理消息总量，提升整体推理能力。
- Plus 用户理论上应有无限 GPT-5 使用权限，若遇限流属于 bug，团队正在调查。
- 正在考虑是否需要同时开放 4o 和 4.1，以及在 $20 Plus 和 $200 Pro 之间增加新的定价层级。
- UI 将优化，方便用户手动触发“思考”，并考虑通过自定义指令强制模型进入深度推理。

编程能力与工具：
- Codex CLI 已支持 GPT-5，Pro 用户几乎不会遇到限制，Plus/Team 用户每周可进行多次 1-2 小时编程会话，速率每 5 小时重置。
- 计划将 GitHub 集成到普通 ChatGPT 对话，无需深度研究或代理模式。
- API 工具调用能力增强，考虑推出 GPT-5 Pro API，但目前尚无具体计划。

模型特性与未来规划：
- 记忆功能即将升级，模型可记住用户偏好，相关功能即将上线。
- 新语音模型更擅长指令遵循和响应，计划向所有免费用户开放高级语音模式，并增强多模态能力。
- 上下文窗口希望提升至 1M tokens，但受限于算力和 GPU，Pro 用户有 128k，Plus 用户有 32k。
- 未来将统一推理与非推理模型，并考虑按 token 计费而非消息数。
- 长远目标包括语音无屏幕访问，甚至神经接口，帮助用户减少设备使用时间但获得更多价值。

用户反馈与定制化：
- OpenAI 低估了用户对 GPT-4o 某些特性的喜爱，尽管 GPT-5 在多数方面表现更好。
- 理解没有一种模型能适合所有人，已推出不同“人格”研究预览。未来将提供更多个性化选项，如表情符号、逻辑/情感风格等。
- 当前重点是完成 GPT-5 全面上线并稳定运行，随后会让 GPT-5 更“温暖”，但真正的个性化定制还需时间。
- 团队正努力优化系统和扩容，但下周仍面临算力挑战，所有决策将保持透明，尽量解释权衡依据。

也有人说路由坏了是借口，GPT-5 的抽卡下限很低，甚至不如 5B 的 oss 模型
https://t.co/zf1b7Crx0d

歸藏(guizang.ai)