歸藏(guizang.ai) avatar

歸藏(guizang.ai)

@op7418

8/9/2025, 2:16:48 AM

Sam 非常详细的解释了 GPT-5 模型表现差和发布会数据问题的原因以及对应的修复措施,还有透露了后续的规划

GPT-5 推出进展与技术问题:
- GPT-5 在推出初期遇到重大技术问题,尤其是自动切换器(autoswitcher)故障,导致模型表现明显下降。OpenAI 已对决策边界进行干预,提升用户获得正确模型的概率,并增加了对当前回答模型的透明度。
- 大规模上线导致 API 流量在 24 小时内翻倍,数亿用户出现服务波动。团队预计一两天内可稳定,并已为 ChatGPT Plus 用户加倍速率限制。
- 编程相关任务出现路由 bug,导致 GPT-5 在代码生成等方面表现不佳,需手动触发“思考模式”或明确要求模型“认真思考”。
- 直播演示中出现人为失误,导致柱状图误导,但官方博客和系统卡片中的数据是准确的。

用户访问与模型选择:
- OpenAI 收到大量要求恢复 GPT-4o 的反馈,决定让 Plus 用户可选用 4o,并根据使用情况决定是否长期支持。
- 正在开发 GPT-5-mini,逐步恢复用户在 o3、o4-mini-high、o4-mini 时的推理消息总量,提升整体推理能力。
- Plus 用户理论上应有无限 GPT-5 使用权限,若遇限流属于 bug,团队正在调查。
- 正在考虑是否需要同时开放 4o 和 4.1,以及在 $20 Plus 和 $200 Pro 之间增加新的定价层级。
- UI 将优化,方便用户手动触发“思考”,并考虑通过自定义指令强制模型进入深度推理。

编程能力与工具:
- Codex CLI 已支持 GPT-5,Pro 用户几乎不会遇到限制,Plus/Team 用户每周可进行多次 1-2 小时编程会话,速率每 5 小时重置。
- 计划将 GitHub 集成到普通 ChatGPT 对话,无需深度研究或代理模式。
- API 工具调用能力增强,考虑推出 GPT-5 Pro API,但目前尚无具体计划。

模型特性与未来规划:
- 记忆功能即将升级,模型可记住用户偏好,相关功能即将上线。
- 新语音模型更擅长指令遵循和响应,计划向所有免费用户开放高级语音模式,并增强多模态能力。
- 上下文窗口希望提升至 1M tokens,但受限于算力和 GPU,Pro 用户有 128k,Plus 用户有 32k。
- 未来将统一推理与非推理模型,并考虑按 token 计费而非消息数。
- 长远目标包括语音无屏幕访问,甚至神经接口,帮助用户减少设备使用时间但获得更多价值。

用户反馈与定制化:
- OpenAI 低估了用户对 GPT-4o 某些特性的喜爱,尽管 GPT-5 在多数方面表现更好。
- 理解没有一种模型能适合所有人,已推出不同“人格”研究预览。未来将提供更多个性化选项,如表情符号、逻辑/情感风格等。
- 当前重点是完成 GPT-5 全面上线并稳定运行,随后会让 GPT-5 更“温暖”,但真正的个性化定制还需时间。
- 团队正努力优化系统和扩容,但下周仍面临算力挑战,所有决策将保持透明,尽量解释权衡依据。
也有人说路由坏了是借口,GPT-5 的抽卡下限很低,甚至不如 5B 的 oss 模型
https://t.co/zf1b7Crx0d
Share
Explore

TwitterXDownload

v1.2.1

The fastest and most reliable Twitter video downloader. Free to use, no registration required.

© 2024 TwitterXDownload All rights reserved.