SZ MEMBERSHIP

2026.05.25

Claude Codeを“追いかける立場”となったOpenAI、その内幕｜The Big Story

OpenAIは、なぜAIコーディング革命に出遅れたのか？巻き返しを狙うCodexの安全性は信頼できるものか？サム・アルトマン以下30人へのインタビューから見えてきた社内力学。

Image may contain Murray Gold Bruce Benamran Joshua McGuire Groupshot Person People Adult Clothing and Pants

table of contents

OpenAIはなぜ後れをとったのか
Codexの回り道
アクセルを踏み込む
コーディングエージェントの急進
「使わなければ確実に仕事を失う」
IT株価を動かすAIコーディング
競争の激化と置き去りの安全性

サム・アルトマンはオフィスチェアの上であぐらを組み、天井をじっと見つめていた。OpenAIの新社屋──サンフランシスコのミッションベイ地区に建つ、ガラスと明るい木材を組み合わせた神殿のような建物──が、彼をこんなふうに静思させるのも納得できる。

受付の後ろにある売店には「AIの時代」を悟りへの道であるかのように解説するパンフレットが並んでいる。階段沿いの壁には、何千人もの人々がライブ配信で見守るなか、人工知能（AI）が世界的なeスポーツチームを「Dota 2」で打ち負かした瞬間など、AI開発のマイルストーンとなった出来事を記念するポスターが飾られている。

廊下では、研究者たちが神聖なグッズを身につけて行き来していた。ある人のシャツには「優れたリサーチには時間がかかる」と書かれていた。だが理想を言えば、時間はかけすぎない方がいい。

アルトマンとわたしは巨大な会議室にいた。わたしが投げかけたのは、AIコーディング革命でOpenAIが先頭に立っていない理由だった。

数百万ものソフトウェアエンジニアがプログラミング作業をAIに委ねるようになり、シリコンバレーで働く人々の多くが初めて、自分たちの仕事も自動化されるかもしれないという現実に向き合い始めている。

コーディングエージェントは、企業が大金を支払ってでも導入しようとする数少ないAI活用分野のひとつだ。OpenAIにとって、この分野は輝かしい勝利として新たなポスターになりえた。そしてなるべきでもあった。だが、その栄光は別の企業の手に渡った。

OpenAIを離れていった元社員たちが設立した小さなライバル会社のAnthropicが、プログラミングエージェント「Claude Code」で爆発的な成功を収めている。

Anthropicは2026年2月、Claude Codeが同社の売上のおよそ5分の1を占め、年間売上高にして25億ドル（約4,000億円）を超えると発表した。一方、消息筋の話によると、1月末時点でOpenAIのコーディング製品「Codex」の年間売上は10億ドルをやや上回る程度だった。いったい、何が起きているのだろうか？

「市場に一番乗りすることに、大きな意味があります」。ついにアルトマンが口を開いた。「わたしたちはChatGPTでそれに成功しました」。だがいまこそOpenAIはコーディングに本腰を入れるべきだ、とも付け加えた。

彼の考えでは、同社のAIモデルはいまの時点ですでに、高性能なコーディングエージェントを動かせるだけの性能を備えている（もちろん、そのためのトレーニングに数十億ドルを投じてきた）。

「これは巨大なビジネスになります。経済的な価値はもちろんのこと、コーディングでさまざまな仕事が可能になるでしょう」。アルトマンは続けた。「冗談ではなく、数兆ドル規模に成長するまれな市場のひとつだと思っています」

さらに、Codexは「汎用人工知能（AGI）の実現に向けた最も有力な道筋」だとも主張した。OpenAIの定義に従えば、人間が行なう経済的に価値のある作業のほとんどで人間を凌駕する性能を誇るAIシステムのことをAGIと呼ぶ。

だが、アルトマンが悠然とあぐらをかいて自信に満ちた言葉を並べる一方で、ここ数年、OpenAIの社内は明らかに混乱していた。

その様子を探るために、わたしは30人以上に話を聞いた。そこには、会社の承認を得て取材に応じたOpenAIの幹部や社員に加え、匿名を条件に非公開企業の内情を話してくれた人々も含まれている。

それらの証言が描き出すのは、OpenAIがめったに経験したことのない立場、つまり「追いかける側」に置かれているという事実だ。

OpenAIはなぜ後れをとったのか

2021年、アルトマンやOpenAIの幹部たちは、『WIRED』のジャーナリスト、スティーヴン・レヴィをサンフランシスコのミッション地区にあった当時の本社に招いた。OpenAIのGPT-3に数十億行分のGitHubオープンソースコードでトレーニングを施して開発した新ツールを披露するためだ。

デモの際、幹部が英語で指示を入力すると、「Codex」と名付けられたそのツールは、シンプルなコードの断片、いわゆるスニペットを出力した。

「これはコンピューターの世界であなたの代わりに動いてくれます」と、OpenAIの社長兼共同創業者だったグレッグ・ブロックマンは語った。「命令を実行できるシステムが誕生しました」。当時でさえ研究者たちは、Codexが「スーパーアシスタント」開発の鍵になると確信していた。

そのころのアルトマンとブロックマンの生活は、OpenAIの最大の出資者であるマイクロソフトとのミーティングを中心に回っていた。ソフトウェア大手のマイクロソフトはCodexを用いて、最初期の商業AIプロダクトのひとつとして「GitHub Copilot」を開発しようとしていた。

GitHub Copilotは、プログラマーが普段の開発環境で利用できるコード補完ツールと位置づけられていた。当時のCodexは「オートコンプリート（自動補完）程度のことしかできませんでした」とOpenAIの初期の社員は言うが、マイクロソフトの幹部たちはその機能をAIの未来として称えた。22年に一般公開されたGitHub Copilotは、数カ月のうちに数十万人のユーザーを集めた。

Codexの初期チームは別のプロジェクトへと移っていった。当時の社員の説明によると、コーディング能力は将来のモデルに組み込まれる予定だったため、独立したチームをもつ必要はないと、会社は判断したのだという。

エンジニアの一部は画像生成ツール「DALL-E 2」の開発に回り、別の一部はGPT-4の訓練に移った。GPT-4こそがOpenAIをAGIに近づける最善の手段とみなされていた。

そして22年11月、ChatGPTが登場し、2カ月で1億人以上のユーザーを獲得した。これをもって、ほかのすべてのプロジェクトが止まった。それから何年もの期間、OpenAIにはAIコーディングプロダクトに専念するチームが存在しなかった。

かつてCodexの開発チームに所属していたある人物は、新たに獲得した消費者向け製品に集中するという方針を採用した会社にとって、Codexは事業の中核から外れた存在となったからだと説明する。

また、「コーディング分野はGitHub Copilotでカバーできているという感覚」もあったという。OpenAIはGitHub Copilotを動かすための新モデルを開発しようとしたが、それはマイクロソフトの管轄だった、というわけだ。

23年から24年にかけて、OpenAIが力を注いだのはマルチモーダルなAIモデルとAIエージェントだった。テキスト、画像、映像、音声を理解し、人間と同じようにカーソルとキーボードを操作できるシステムの開発に集中した。

この取り組みは、AI業界の将来を見据えた判断だと思われた。当時すでに、スタートアップのMidjourneyがAI画像生成で話題をさらい、大規模言語モデル（LLM）が真の知性を得るには世界を「見て、聞く」必要があるという考え方が広まっていたからだ。

Codexの回り道

だが、Anthropicは別の道を進んだ。チャットボットやマルチモーダルモデルにも手を出しはしたが、OpenAIよりも先に、コーディングの可能性に気づいていたようだ。

ブロックマンは最近あるポッドキャストで、Anthropicは「初期の段階から熱心にコーディングに取り組んでいました」と称え、モデルのトレーニングに学術的な競技プログラミングで出題されるような難問だけでなく、実際のコーディング現場の煩雑なリポジトリで見つかる問題も用いていたと指摘した。「この点で、わたしたちは後れをとってしまったのです」

24年初め、Anthropicは新モデル「Claude Sonnet 3.5」をそうした煩雑なコードリポジトリでトレーニングした。同モデルが同年6月に公開されると、そのコーディング能力に多くのユーザーが感動した。殊に20代の若者たちが創業したスタートアップAnysphere（エニスフィア）のプロダクト「Cursor」にとっては願ってもないモデルだった。

Cursorは、ソフトウェア開発者が普通の英語で修正を指示するだけでAIにコードを書かせることができるというものだった。Anthropicの新モデルを製品に組み込むやいなや、Cursorの利用者数が一気に増加した。そして数カ月後、Anthropicが社内で新バージョンのテストを開始した。「Claude Code」だ。

Cursorの人気の高まると、OpenAIは買収を打診した。だが、Anysphereに近しいある人の話によると、交渉が本格化する前に、創業者たちが申し出を断ったという。彼らはコーディング業界の可能性を見抜き、独立の維持を選んだのだ。

そのころ、OpenAIは、段階的に思考を重ねながら答えを導くいわゆる「推論モデル」の第1号となる「o1」のトレーニングを進めていた。リリースの際、OpenAIはこのモデルが「複雑なコードの生成とデバッグに優れている」と説明した。

Codexのリサーチリードを務めるアンドレイ・ミシチェンコは、AIモデルのコーディング能力が向上してきたおもな理由として、コーディングが「検証可能なタスク」である点を挙げる。コードには動くか動かないかの二択しかない。そのため、モデルが間違えると、明確なフィードバックが得られる。OpenAIはこのフィードバックループを利用して、o1のトレーニングに用いる課題の難易度を上げていった。

「コードベースを探索し、変更を加え、自分でテストする能力はどれも推論に必要な能力で、これらがなければコーディングエージェントは今日ほど高性能にはなっていなかったと思います」とミシチェンコは言う。

24年12月までには、OpenAI社内で複数の小グループが本腰を入れてAIコーディングエージェントの開発に取り組み始めた。ミシチェンコとティボー・ソティオー──かつてグーグルでDeepMindの研究に携わり、現在はOpenAIでCodexのリーダーを務めている人物──が率いるチームもそのひとつだ。

初めのうち、チームが最も関心をもっていたのは、AIコーディングエージェントによってAI研究を効率化すること──つまり、トレーニングの管理やGPUクラスターの監視といった地味な作業を自動化することだった。

もうひとつの取り組みは、OpenAIでマルチモーダルエージェントを手がけた経歴をもち、現在はCodexのプロダクトリードを務めるアレクサンダー・エンビリコスが率いる開発研究だった。エンビリコスが「Jam」というデモを披露すると、社内でたちまち話題になった。

カーソルとキーボードを使ってコンピューターを操作するのではなく、Jamはコマンドラインに直接アクセスした。21年のCodexのデモが「人間が実行するためのコードを出力」した一方で、エンビリコスのJamは自らコードを実行できた。

自分のノートパソコンでJamが次々とアクションを実行し、それを追跡するウェブページがどんどん更新されていくのを見て、エンビリコス自身、思わず息をのんだ。

「ずっと、マルチモーダルなインタラクションこそがミッションへの近道だと考えていました。それはすなわちAIと一日中同じ画面を共有することを意味します」とエンビリコスは言う。「ところが突然、モデルにコンピューターを操作する権限を与えることが、ミッションをクリアする方法であることがはっきりとわかったんです」

こうした複数のプロジェクトがひとつの取り組みに統合されるまでには数カ月かかった。25年の初頭、o1以上にコーディングに最適化された「o3」モデルのトレーニングを終えたとき、OpenAIにはようやく本格的なAIコーディングプロダクトを開発するための基盤が整った。だが、Claude Codeはすでに一般公開を目前に控えていた。

アクセルを踏み込む

Claude Codeは25年2月に「限定リサーチプレビュー」として、そして同年5月には一般に公開された。それまでは、「バイブコーディング」が最先端トレンドとして話題だった。人間のプログラマーはプロジェクトを大まかに指揮するだけで、AIが残りの仕事をやってくれるコーディングスタイルのことで、そのためのツールに、人々は何億ドルもの資金を投じていた。

だが、Jamと同様、Anthropicの新製品はコンピューターのコマンドラインから直接動作する。つまり、開発者のすべてのファイルとアプリケーションに直接アクセスできるのだ。もはやバイブコーディングどころの話ではない。開発者はAIエージェントに作業を丸投げできるようになった。

OpenAIは競合製品のリリースを急いだ。ソティオーによれば、25年3月に「スプリントチーム」を編成したという。社内のグループを統合し、数週間でAIコーディングプロダクトを出荷することが、スプリントチームの任務となった。

その作業と並行して、アルトマンはAnthropicに追いつき追い越すために、もうひとつの買収を模索していた。AIコーディングを手がけるスタートアップの「Windsurf」を30億ドルで買い取るつもりだった。OpenAIの経営陣の目には、Windsurfはすでに確立されたAIコーディングプロダクトをもつ企業で、それを構築するノウハウもあり、しかも法人顧客の基盤をもたらす企業と映った。

だが、Windsurfの買収は何カ月も話が進まなかった。『The Wall Street Journal』によれば、立ち往生の原因はOpenAIの巨大パートナーであるマイクロソフトが、Windsurfの知的財産へのアクセスを求めたことにあったようだ。

マイクロソフトは21年からGitHub CopilotのエンジンとしてOpenAIのモデルを用いていた。GitHub Copilotは決算発表のたびに注目される花形となっていた。だが、Cursor、Windsurf、Claude Codeが新たなエージェント型コーディング体験を提供するようになると、GitHub Copilotは時代遅れになり始めた。OpenAIがさらに別のコーディングプロダクトを世に出すことは、マイクロソフトの利益にならなかった。

Windsurf買収の話は、OpenAIとマイクロソフトの関係が特にぎくしゃくしていた時期と重なった。両社はパートナーシップを再交渉中で、OpenAIはAIプロダクトとコンピューティングリソースに対するマイクロソフトの支配を弱めようとしていた。

その過程でWindsurf買収の話は立ち消えとなり、7月までに破談となった。この機に乗じて、グーグルがWindsurfの創業者たちを雇い入れ、同社の残りは別のコーディングスタートアップである「Cognition」に買収された。

「あの交渉はまとめたかった」とアルトマンは言う。「でも、すべての取引をコントロールすることはできませんから」。Windsurfを買収できていたら「ある程度のスピードアップは期待できた」と惜しみながらも、アルトマンはCodexチームがたどった軌跡には感心していると言う。

ソティオーとエンビリコスはWindsurf相手の交渉中もCodexの開発とアップデートを続けていた。そしてアルトマンの言葉を借りれば、8月に「アクセルを踏んだ」。

コーディングエージェントの急進

グレッグ・ブロックマンは、AIの性能を測る方法として、自身が考案した「リバース・チューリングテスト」と呼ぶゲームを用いることが多い。何年も前に自分でコードを書いたゲームで、AIエージェントにゼロから同じものをつくらせるというものだ。

AIエージェントに与えるのは基本的なことだけ──ふたりの人がそれぞれ自分のコンピューターの前に座っている。画面には、ふたつのチャットウィンドウが表示されていて、ひとつには相手の発言が、もうひとつにはAIの発言が表示される。この状況で、自分がチャットしているふたつのうちどちらがAIのものであるかを見破り、同時に相手に自分の発言をAIのものと思い込ませるというゲームだ。

25年のほとんどの期間、OpenAI最高のモデルを使っても、このようなゲームを書くのに数時間かかり、途中で人間の指示やサポートが必要になったと、ブロックマンは語る。だが12月、新たなGPT-5.2モデルをエンジンとして搭載したCodexが、適切なプロンプトを1回与えただけで、完全に動作するゲームを生成した。

この変化に気づいたのはブロックマンだけではない。全世界の開発者たちが、各種AIコーディングエージェントが一気に優秀になったとささやき始めた。

主役はあくまでClaude Codeだったが、この話題はシリコンバレーの外にまで飛び出し、主流メディアもニュースとして取り上げるほどになった。コーディング経験のない一般人まで、自分でソフトウェアをつくるようになった。

利用者が急増したのは偶然ではない。この時期、AnthropicもOpenAIも、多額の費用をかけてコーディングエージェントの新規顧客獲得に努めていた。複数の開発者が『WIRED』に語ったところによれば、月200ドル（約32,000円）というCodexおよびClaude Codeのプランに加入すれば、優に1,000ドル（約16万円）分を超える分量の使用が可能だった。こうした太っ腹な勧誘は、開発者に職場でのAIコーディングプロダクトの利用を促して普及させ、その後で使用量に応じて料金を請求するためのものだった。

「使わなければ確実に仕事を失う」

複数の情報源によると、25年9月の時点では、Codexの利用数はClaude Codeのわずか5％程度だった。ところが26年1月には、CodexのユーザーベースはClaude Codeの約40％にまで跳ね上がっていた。

テック系スタートアップで10年の経験を積んできた開発者のジョージ・ピケットは最近、Codexをテーマにした集会を開いている。「ホワイトカラーの仕事はエージェントに置き換えられていくと思います」とピケットは言う。

「それで社会がどうなるかなんて誰にもわかりません。混乱は起きるでしょうが、わたしはいま起きていることについては、とても楽観視しています」

生産性スタートアップで時価総額110億ドル（約18兆円）を誇る「Notion」の共同創業者サイモン・ラストは、GPT-5.2のリリースに合わせて自分も、同社のトップエンジニアたちも、Codexに乗り換えたと語る。理由は信頼性だ。「Claude Codeは嘘をつくんです」とラストは言う。「働いていると言いながら、実は働いていません」

Codexチームのリサーチリードを務めるケイティ・シーは、Codexのデフォルトの個性を「乾いたパン」と表現する人もいるが、その一方で、Codexのあまり媚びないスタイルを好む人も多いと説明する。「エンジニアリングの仕事では、批判的なフィードバックを悪意と受け取らずに受け入れる能力が重要になります」と彼女は言う。

いくつかの大手企業もCodexの採用に踏み切った。OpenAIのアプリケーション部門でCEOを務めるフィジ・シモは、「ChatGPTがAIの代名詞になっていることが、B2B市場におけるわれわれの優位性につながっています」と語る。「会社は社員が使い慣れているテクノロジーを使おうとするからです」。Codexの販売戦略は、ChatGPTやほかのOpenAI製品とセットで提供することを基本としている、とシモは説明する。

Ciscoの社長兼最高プロダクト責任者のジーツ・パテルは社員に対し、コストを気にせずにCodexを使えと伝えた。ツールを使いこなせるようになることのほうが重要だからだ。

パテルは、「このツールを使い続ければ仕事を失うことになるのでしょうか」と尋ねてくる社員に、こう答えることにしている。「ノー。だが逆に、使わなければ確実に仕事を失う。使わないならきみに価値はない。出て行ってもらう」

IT株価を動かすAIコーディング

いまや、AIコーディングエージェントが引き起こしたパニックがシリコンバレーをはるかに超えて拡がっている。

『The Wall Street Journal』は26年2月、Claude Codeが1兆ドル規模のIT株の暴落を引き起こしたと報道した。ソフトウェアがまもなく完全に時代遅れになると恐れた投資家たちが、株を手放したからだ。

数週間後、AnthropicがIBMマシンで広く使われるCOBOLなどのレガシーシステムの代わりにClaude Codeを利用できると発表すると、IBMの株価は25年ぶりの大幅下落を記録した。

OpenAIも話題づくりに必死だ。スーパーボウルのCM枠を数百万ドルで買い取って、ChatGPTではなくCodexを宣伝した。

ミッションベイ地区の「神殿」では、Codexを売り込む必要はない。取材したOpenAIのエンジニアのほとんどが、いまではコードをキーボードで打つことはほとんどなくなったと言う。Codexに話しかけることが日々の仕事になった。ときにはチームが集まって、一緒にそうすることもある。

わたしは本社内で開催された「Codexハッカソン」を見学した。100人ほどのエンジニアが大部屋に集まっていた。それぞれ、Codexを使って4時間以内に最高のデモプログラムをつくることが目的だ。

OpenAIの上級リーダーのひとりがマイクの前に立ち、手に持ったノートパソコンからチーム名を読み上げていく。チーム代表者は緊張した様子で舞台に上り、震える声で自分たちの作品について短いスピーチをした。優勝チームにはパタゴニアのバックパックが贈られた。

多くのプロジェクトは、Codexを使ってつくられたと同時に、Codexをより使いやすくするためのものだった。あるチームはSlackのメッセージを週次レポートにまとめるツールをつくった。AIが生成したウィキペディア風のOpenAI社内サービスガイドを発表したチームもあった。

デモのほとんどは、以前なら完成させるのに数日から数週間かかっただろう。それがいまでは午後の数時間でできてしまう。

本社を出ようとしたとき、廊下でケヴィン・ウェイルに会った。もとはInstagramの幹部だった人物で、いまはOpenAIのサイエンス部門「OpenAI for Science」を率いている。自分の代わりにCodexがいくつかのプロジェクトを夜通し進めていて、明朝自分の目で確認するつもりだと話してくれた。ウェイルやほかの数百人の社員にとって、いまやそれが日常だ。

OpenAIが26年に掲げている目標のひとつは、研究を自動で行なうインターンの開発だ。何の研究かって？もちろんAIだ。

シモによれば、会社としてはCodexを最終的にChatGPTやほかのすべての製品に組み込み、プログラミングだけでなくあらゆるタスクを実行できるようにしたいと考えているという。アルトマンも汎用版Codexをリリースしたいと望んでいるが、安全性の問題が気がかりらしい。

競争の激化と置き去りの安全性

1月末、アルトマンは技術に詳しくない何人かの友人から、いま話題となっているAIコーディングエージェント「OpenClaw」のセットアップを頼まれた。だが、重要なファイルを削除する恐れがあるため、「いまはまだインストールすべきではない」と言って断ったそうだ。そのエピソードを話してから数週間後、OpenAIはOpenClawの開発者の採用を発表した。

わたしが話した開発者の多くが、CodexとClaude Codeの競争はかつてないほどの接戦になっていると指摘する。だが、これらのツールがより高性能になり、効率を求める企業によって広く導入されるようになれば、社会はどちらのエージェントを使うかという問いよりも、はるかに大きな問題に向き合うことになる。

Claude Codeに追いつくことを急ぐあまり、OpenAIが安全性を後回しにしているのではと懸念する声もある。

ミダス・プロジェクトという非営利団体は、OpenAIがGPT-5.3-Codexの開発では安全性の約束をないがしろにし、サイバーセキュリティ上のリスクを適切に説明していないと非難した。

OpenAIのアライメント部門を統括するアメリア・グレーズは、安全性を犠牲にしてCodexの開発が進められているという主張を否定し、OpenAIもミダス・プロジェクトの主張は誤解に基づいていると説明した。

ブロックマンは25年、AI推進派の政治活動委員会とトランプ支持の政治活動委員会にそれぞれ2,500万ドル（約40億円）を寄付した。また、AGI開発についても「順調に進んでいる」と楽観的に語る。だがその彼でさえ、昨今の新しい現実には複雑な心境を抱いているようだ。

シリコンバレーのエンジニアのあいだでは、ブロックマンは「没頭タイプ」として知られてきた。プロダクトがリリースされる前夜でさえ、自らコードベースをいじるタイプの上司だ。多くの点で、この新しい「自分の手を使わなくていい時代」には「とても解放感がある。頭のなかが余計なディテールで埋め尽くされていたことに気づかされる」とブロックマンは言う。

だが同時に、「何十万ものエージェントの艦隊のCEOになって、自分の目標やビジョンをエージェントたちが実行していく」とき、「個別の問題がどう解決されているかまでは正しく把握できなくなる」とも語る。

ある意味、この新しい仕事のやり方には、「問題の本質を見失うような感覚がある」とブロックマンは漏らした。

（Originally published on wired.com, translated by Kei Hasegawa/LIBER, edited by Nobuko Igari)

※『WIRED』によるコーディングの関連記事はこちら。

※雑誌『WIRED』日本版 VOL.59 特集「Future of Health：生きることの未来」の詳細はこちら。