ソフトウェア

OpenAIがAIコーディングエージェント「Codex」を公開、クラウドベースで複数タスクを並行して実行可能


OpenAIが、機能開発やコードベースに関する質問への回答、バグ修正、プルリクエストの提案など、複数のタスクを並行して実行できるクラウドベースのソフトウェアエンジニアリングエージェント「Codex」の研究プレビュー版をリリースしました。CodexはChatGPT Pro、Enterprise、Teamユーザー向けに提供され、PlusとEduへの提供は近日中に開始されます。

Introducing Codex | OpenAI
https://openai.com/index/introducing-codex/

ChatGPT is getting an AI coding agent | The Verge
https://www.theverge.com/command-line-newsletter/668251/chatgpt-is-getting-an-ai-coding-agent

ChatGPT rolls out Codex, an AI tool for software programming
https://www.bleepingcomputer.com/news/artificial-intelligence/chatgpt-rolls-out-codex-an-ai-tool-for-software-programming/

Codexは強化学習を用いて様々な環境での実際のコーディングタスクで訓練されており、人間のスタイルやプルリクエストの好みに近いコードを生成できるとOpenAIはアピールしています。また、Codexは指示に正確に従う能力と、合格結果が得られるまで反復的にテストを実行する機能も備えています。

ユーザーはChatGPTのサイドバーからCodexにアクセスし、プロンプトを入力して「Code」ボタンをクリックすることでコーディングタスクを割り当てることができます。コードベースについて質問する場合は「Ask」ボタンを使用します。


Codexはリポジトリ内に配置されたREADME.mdに似た形式のテキストファイルである「AGENTS.md」を通じて設定でき、コードベースのナビゲーション方法、テスト用コマンド、プロジェクトの標準的な実践方法などをCodexに指示することができます。

Codexの中核的な特徴は、複数のタスクを同時に処理できる並行処理能力です。各タスクはクラウド上の独立した環境で実行され、ユーザーのリポジトリがあらかじめロードされています。技術的な基盤として、OpenAI o3をソフトウェアエンジニアリング向けに最適化した「codex-1」を搭載しています。


Codexはファイルの読み取りや編集、テストハーネス、リンター、型チェッカーなどのコマンド実行が可能。各タスクは分離された環境で独立して処理され、コードベースが事前にロードされます。

タスク完了には複雑さに応じて1~30分程度かかり、ユーザーはリアルタイムで進捗を確認できるとのこと。タスク完了後、Codexは環境内で変更をコミットし、ターミナルログやテスト出力を通じて処理の各ステップを証明します。また、ユーザーは結果を確認し、追加修正を依頼したり、GitHubプルリクエストを作成したり、変更をローカル環境に統合したりすることができます。


Codexは安全な隔離されたコンテナ内でクラウド上で動作し、タスク実行中はインターネットアクセスが無効化されます。エージェントとのリアルタイムペアリングやタスク委任は、GitHubリポジトリを通じて明示的に提供されたコードと、ユーザーがセットアップスクリプトで設定した事前インストール済みの依存関係のみに限定されています。

内部ベンチマークとコーディング評価では、codex-1はAGENTS.mdファイルやカスタムスキャフォールディングがなくても高いパフォーマンスを示しているとOpenAIはアピール。SWE-Bench Verifiedでは、4回の試行で約80%の精度を達成しており、OpenAIの内部SWEタスクベンチマークでは75%の精度を実現しています。


また、Codexはセキュリティと透明性を重視して設計されており、出力を検証できる機能が組み込まれているとのこと。引用、ターミナルログ、テスト結果によりユーザーが作業を確認できるようになっていて、不確実性やテスト失敗が発生した場合、Codexは明示的にこれらの問題を伝え、ユーザーが進め方について情報に基づいた決定ができるようサポートします。なお、全てのエージェント生成コードは統合や実行前に手動でレビューし検証することが推奨されています。

OpenAIは「今後の計画としては、より対話的で柔軟なエージェントワークフローを導入する予定」と述べており、開発者がタスクの途中でガイダンスを提供したり、実装戦略について協力したり、積極的な進捗状況の更新を受け取ったりできるようになることを目指していると語りました。また、記事作成時点だとCodexはGitHubと接続可能ですが、将来的にはCodex CLI、ChatGPT Desktop、さらには外部ツールからタスクを割り当てられることも目標としていることをOpenAIは明らかにしました。

この記事のタイトルとURLをコピーする

・関連記事
OpenAIがオープンソースのコーディングツール「Codex CLI」をリリース - GIGAZINE

OpenAIの「o3」はマスターランクのGeoGuessrプレイヤーに勝利できる、偽のEXIFデータを与えられても関係なし - GIGAZINE

OpenAIのo3はAGIではないかという問いから生まれた概念「ギザギザのAGI」とは? - GIGAZINE

OpenAIの「o3」と「o4-mini」は従来のAIよりも「幻覚」を起こしやすいことが判明 - GIGAZINE

in ソフトウェア,   ネットサービス, Posted by log1i_yk

You can read the machine translated English article OpenAI releases Codex, an AI coding agen….