AIが「答える」から「やる」に変わった月——2026年3月のAIリリースを振り返る
2026年3月の第1〜2週で、AIの世界に大きなリリースが3本重なりました。
- 3月5日:OpenAI「GPT-5.4」リリース
- 3月9日:Anthropic「Claude Code Review」リリース
- 3月9日:Microsoft「Copilot Cowork」リリース
個別に見ると「また新しいモデルが出た」で終わりますが、3本を並べると共通した方向性が見えてきます。
AIが「答えを返す」から「タスクを実行する」に変わった——2026年3月は、そういう月でした。
この記事はこんな人向けです
- 3月に相次いだAIリリースを一気に把握したい
- 「AIエージェント」という言葉が何を意味するのか整理したい
- 自分の仕事・開発にどう関係するか知りたい
3つのリリースをざっくり振り返る
各記事の詳細は個別記事に任せて、ここでは要点だけ整理します。
GPT-5.4(3月5日)

OpenAIが推論・コーディング・PC操作の成果を1モデルに集約したフロンティアモデルをリリースしました。
最大のトピックはネイティブPC操作(Computer Use)です。AIがスクリーンショットを認識し、マウス・キーボードを自律的に操作する精度が、人間基準(72.4%)を超える75.0%(OSWorld-Verified)を達成しました。
GPT-5.2比でのその他の主な改善
- ハルシネーション33%減
- Web調査力(BrowseComp):57%→82.7%
- 最大100万トークンのコンテキストウィンドウ
- 思考途中での指示変更(Mid-Response Steering)
使えるプラン: ChatGPT Plus以上・API(即日)
Claude Code Review(3月9日)

AnthropicがClaude Codeの新機能として、PRを自動レビューするエージェント機能をリリースしました。
PRが開かれると複数のエージェントが並列でバグ・脆弱性・エッジケースを探し、重大度タグ付きのインラインコメントをGitHub上に投稿します。Anthropic社内では導入後にレビューコメントがついたPRの割合が16%から54%に改善したとされています。
使えるプラン: Claude for Teams・Enterprise(リサーチプレビュー)
料金: $15〜$25/PR(トークンベース従量課金)
Copilot Cowork(3月9日)

MicrosoftがAIエージェント「Copilot Cowork」をリリースしました。裏側にはAnthropicのClaude Cowork技術が使われています。
自然言語でタスクを伝えると、Outlook・Teams・Excel・SharePointを横断してAIが自律的に処理を進めます。カレンダー最適化・資料一式の自動作成・会議後フォローアップ・社内リサーチなどが代表的なシナリオです。
使えるプラン: Microsoft 365 E7($99/ユーザー/月)・5月1日GA予定
3本に共通する「エージェント化」という文脈
3本を並べると、共通するキーワードが見えてきます。「エージェント化」です。
| GPT-5.4 | Claude Code Review | Copilot Cowork | |
|---|---|---|---|
| 何を自律実行するか | PCの操作 | PRのレビュー | 業務タスク全般 |
| 人間の役割 | 指示→確認 | PRを開く→コメントを確認 | 目的を伝える→要所で承認 |
| 動く場所 | OS・ブラウザ | GitHub | Microsoft 365 |
従来のAIは「聞いたことに答えるアシスタント」でした。 エージェント型AIは「目的を伝えると、自分でやり方を考えて実行するアシスタント」です。
この変化を一段階ずつ整理するとこうなります。
第1世代:テキストを生成する(GPT-3時代)
第2世代:質問に答える・要約する(ChatGPT普及期)
第3世代:コードを書く・画像を作る(ツール統合期)
第4世代:タスクを計画して自律実行する ← 今ここ
「AIが答えてくれる」から「AIがやってくれる」へ。 この転換が、2026年3月に一気に可視化されました。
それぞれ誰に関係するか:立場別の整理
3本のリリースは対象読者が少しずつ違います。自分に関係するものから読み始めるのが効率的です。
💼 ビジネスマン・業務改善担当
最も関係するのはCopilot Coworkです。
すでにMicrosoft 365を使っている職場なら、AIがOutlookのスケジュール整理・会議後のフォローアップ・資料作成を代わりにやってくれる未来が5月に近づいています。 ただし、E7ライセンス($99/月)が必要なため、中小企業での導入は経営判断が必要です。IT担当者であれば5月のGA(一般提供)後に自社環境での検証計画を立て始めるのが現実的なアクションです。
💻 個人開発者・エンジニア
Claude Code ReviewとGPT-5.4の両方が関係します。
Claude Code ReviewはチームでGitHubを使っている場合の話ですが、「AIがPRをレビューする」という機能が実用レベルに達したことは、開発の進め方を変える可能性があります。まずはTeams・Enterpriseプランを使っている職場で試験導入を提案する価値があります。
GPT-5.4については、API経由でのPC操作(Computer Use)が個人開発者にとって最も実験しがいのある新機能です。ブラウザ操作やデスクトップアプリの自動化を自前で組める可能性が広がりました。
🙋 IT初心者・ChatGPT一般ユーザー
GPT-5.4のアップグレードが一番身近な変化です。
ChatGPT Plus以上を使っているなら、モデル選択でGPT-5.4 Thinkingに切り替えるだけで恩恵を受けられます。とくに「長い資料を読ませて質問する」「ウェブ調査を任せる」用途での精度が上がっています。 Copilot CoworkやClaude Code Reviewは今のところ企業・チーム向けなので、一般ユーザーへの影響はもう少し先の話です。
「AIがやる」時代の注意点
エージェント化のトレンドは本物ですが、現時点でのリスクや限界も整理しておきます。
人間の確認・承認ループは必須
3本のリリースに共通しているのが、「AIが自律実行するが、人間が確認・修正・一時停止できる」という設計です。完全自律ではなく、人間がループに入り続けることが前提になっています。これは現時点では正しい設計だと思います。
「AIが勝手にメールを送った・ファイルを消した」という事態を防ぐためにも、人間の承認ループをどこに設けるかを意識して使うことが重要です。
コストが跳ね上がる
エージェント型AIはトークン消費が多く、コストが想定外に膨らむリスクがあります。Claude Code ReviewはPR1件あたり$15〜$25、Copilot CoworkはE7ライセンスで月$99/ユーザー。従来の「AIチャットに少し課金する」とは桁が変わります。組織導入の場合は予算管理の仕組みを先に設計することが必要です。
リサーチプレビューは変わる
Claude Code Review・Copilot Coworkはいずれもリサーチプレビュー段階です。仕様・料金・機能は今後変わる可能性があります。「本番業務に組み込む」前に、GA後の安定性を確認してから判断するのが無難です。
IT Picks的な総括
3本のリリースを通じて感じるのは、「AIの戦場が、チャット画面の外に広がった」ということです。
OS・GitHub・Microsoft 365。これらはすでに私たちが毎日使っている場所です。そこにAIエージェントが入り込んで、人間の代わりに操作・レビュー・実行を担い始めました。
「AIを使う」という行為が、「AIと話す」から「AIに任せる」に変わりつつあります。
ただ、「任せる」ためには信頼が必要で、その信頼はまだ積み上がっている最中です。3本ともリサーチプレビュー・限定提供の段階であることは、開発者側もまだ慎重に進めているサインだと思います。
今の適切なスタンスは、「試して、覚えて、準備しておく」ではないかと思います。
ChatGPT Plus以上のユーザーはGPT-5.4に切り替えてみる。チームでGitHubを使っているエンジニアはClaude Code Reviewの動向を追う。Microsoft 365を使っている職場のIT担当は5月のCopilot Cowork GAを待つ。
小さな一歩から始めておくことで、「AIがやる時代」への移行をスムーズに乗り越えられると思います。
