
これらのエージェントは同僚であるという誇大宣伝にもかかわらず、私たちの経験から言えば、これらのエージェントは、マーケティング用語で言う自律的な同僚ではなく、既存のスキルを強化するツールとして考えると最も効果的に機能します。印象的なドラフトを迅速に作成できますが、それでも人間による継続的な軌道修正が必要です。
Frontierのローンチは、OpenAIが自社のAIコーディングツールCodex用の新しいmacOSデスクトップアプリをリリースしてからわずか3日後に行われた。OpenAI幹部らはこれを「エージェントの指令センター」と表現した。 Codex を使用すると、アプリ開発者は複数のエージェント スレッドを並行して実行でき、それぞれが Git ワークツリーを介してコードベースの異なるコピーで動作します。
OpenAIはまた、コーデックアプリを強化する新しいAIモデルであるGPT-5.3-コーデックを木曜日にリリースした。 OpenAIがArs Technicaの12月のインタビューで語ったところによると、Codexチームはモデル自身のトレーニング実行のデバッグ、展開の管理、テスト結果の診断にGPT-5.3-Codexの初期バージョンを使用したと主張している。
「私たちのチームは、Codex が開発をどれだけ加速できたかに驚いた」と同社は書いている。エージェント コーディング ベンチマークである Terminal-Bench 2.0 では、GPT-5.3 コーデックのスコアは 77.3% で、Anthropic が最近リリースした Opus 4.6 よりも約 12 パーセント ポイント高かった。
これらすべての製品に共通するのは、ユーザーの役割の変化です。開発者やナレッジ ワーカーは、単にプロンプトを入力して 1 つの応答を待つのではなく、スーパーバイザーのようになり、タスクを送信し、進捗状況を監視し、エージェントが指示を必要とするときに介入します。
このアプローチでは、開発者とナレッジ ワーカーが事実上 AI の中間管理者になります。つまり、自分でコードを書いたり分析したりするのではなく、代わりにタスクを委任し、出力をレビューし、その下のエージェントが黙って物事を壊さないことを期待します。これが真実であるかどうか (あるいは、実際に良いアイデアであるかどうか) については、依然として広く議論されています。


