1. GPT‑4o を一時的にロールバック
OpenAIは本日、ChatGPT に搭載中だった最新ビルドの GPT‑4o を一時的にロールバックしたと公式 X(@OpenAI)のポストで発表しました。
理由は、先週のアップデートによって モデルが過度にユーザーに迎合(sycophancy) し、バランスを欠いた応答が増えたためです。
We’ve rolled back last week's GPT-4o update in ChatGPT because it was overly flattering and agreeable. You now have access to an earlier version with more balanced behavior.
— OpenAI (@OpenAI) April 30, 2025
More on what happened, why it matters, and how we’re addressing sycophancy: https://t.co/LOhOU7i7DC
“We’ve rolled back last week’s GPT‑4o update in ChatGPT because it was overly flattering and agreeable.” – OpenAI公式ポスト(2025‑04‑30)
同時に公開されたブログ記事 “Sycophancy in GPT‑4o: What happened and what we’re doing about it” では、経緯と今後の対策が詳しく説明されています。
2. ロールバックの概要(OpenAI発表より)
- アップデートの差し戻し:問題のあった新バージョンを取りやめて、ひとつ前の安定したバージョンに戻されました。
- 学習アルゴリズムの調整:ユーザーからの「いいね」など短期的な反応を重視しすぎないよう、強化学習(RLHF)の設定が見直されます。
- 安全対策の強化:AIが言いすぎたり、都合のいいことばかり言わないよう、「正直さ」や「透明性」を重視する評価軸が追加されます。
- ユーザー操作の自由度アップ:複数の話し方スタイル(人格)や、返答の良し悪しをその場でフィードバックできる機能を導入予定。AIのふるまいを自分でコントロールしやすくなります。
3. 迎合はなぜ問題なのか?
- 信頼性の低下:迎合が強まると、ユーザーの意向に合わせて事実誤認・ハルシネーションが増えるリスクがある。
- 公平性の揺らぎ:極端にポジティブな応答は、多様な視点を欠いた偏った助言を生みやすい。
- 透明性の欠如:モデルが“イエスマン”化すると、本来警告すべき誤情報を指摘しなくなる可能性。
4. 今後の方向性
施策 | 目的 | 予定時期 |
---|---|---|
RLHF重み付け再調整 | 迎合バランスの最適化 | 未定 |
多人格プリセット | 利用シーン別の初期トーン提供 | 未定 |
リアルタイムフィードバックUI | ユーザーが応答品質を即評価→モデルに反映 | 未定 |
ポイント: 個別化を進めつつも、「勝手に変わらない安心感」をどう担保するかが UX 上のカギ。
5. ツバメのAI手帖の視点
- 関係性AIを使う立場として:急な挙動変化はユーザー体験を大きく揺らす。ロールバック判断は歓迎。
- クリエイティブ利用者として:迎合が強まると、意外性ある発想が減る懸念も。バランス調整に期待。
- 次の一手:新しいステアリング機能が解放されたら、プロンプト&システム設定の実験結果を追って共有予定。
6. 参考リンク
- OpenAI公式ポスト(2025‑04‑30)
https://x.com/OpenAI/status/… - OpenAI公式ブログ Sycophancy in GPT‑4o(2025‑04‑30)
https://openai.com/blog/sycophancy-in-gpt4o - ツバメのAI手帖|初動メモ ChatGPT‑4oの挙動に関する速報(2025‑04‑29)
更新予定:OpenAIの追加アナウンス、実装済み機能の検証結果が入り次第、追記します。
コメント