週間生成AIニュース【2026年4月13日〜4月19日】

今週も生成AI市場では複数のアップデートがありました。

AnthropicはClaude Opus 4.7を正式リリース。先週発表されたMythos Previewと同等のサイバー攻撃能力を持たないよう意図的に設計されており、料金据え置きのまま性能が向上しています。OpenAIはサイバーセキュリティ専門家向けに特化したGPT-5.4-Cyberを発表し、AIとセキュリティをめぐる競争が続いています。Googleは個人のGmailや検索履歴と連携するPersonal Intelligenceを日本で提供開始。一方でCopilot Studio(Microsoft)とAgentforce(Salesforce)に、外部フォーム経由でCRMデータを流出させるプロンプトインジェクション脆弱性が報告されました。

目次

①Anthropic、Claude Opus 4.7を正式リリース。コーディング性能87.6%・高解像度ビジョン対応

引用:Anthropic

重要ポイント

  • SWE-bench Verifiedで87.6%を記録。Opus 4.6(80.8%)から6.8ポイント向上
  • 画像の対応解像度が約3倍に拡大。設計図・財務書類・技術図面の解析精度が改善
  • 料金はOpus 4.6と同額(入力$5・出力$25/百万トークン)。本日より利用可能

ニュース概要

Anthropicが4月16日、Claude Opus 4.7を正式リリースしました。Opus 4.6から約2ヶ月というリリースサイクルに沿ったアップデートで、コーディング性能・画像解像度・自己検証機能・メモリ管理の4領域で実質的な改善が加えられています。料金はOpus 4.6から変更なし(入力$5・出力$25/百万トークン)となっており、即日利用可能です。

今回のリリースにはもう一つ重要なポイントがあります。Anthropicは公式ブログで「Opus 4.7は先週発表したMythos Previewと同レベルのサイバー攻撃能力を持たない。トレーニング段階でこれらの能力を意図的に抑制した」と明言しています。Mythosは主要OS・ブラウザ全般のゼロデイ脆弱性を自律的に発見・悪用できる水準に達しており、その能力をそのまま一般公開モデルに引き継がない設計が必要でした。Anthropicはこの「能力の意図的な抑制」という取り組みが、将来的にMythosクラスのモデルを安全に一般提供するための技術的な前提になると説明しています。

コーディング性能の向上。難易度が高いタスクほど差が出る

最大の改善点はコーディング性能です。実際のオープンソースリポジトリのバグ修正能力を測るベンチマーク評価「SWE-bench Verified」で87.6%を記録。Claude Opus 4.6(80.8%)から6.8ポイント向上しています。より難易度の高い「SWE-bench Pro」では64.3%(Opus 4.6比+10.9ポイント)を記録しており、難しいタスクになるほど差が開く傾向があります。

早期導入テスターの実績もこれを裏付けています。楽天はRakuten-SWE-Benchで「Opus 4.6比3倍の本番タスク解決数」を達成。CursorはCursorBench(Cursor IDE内でのコーディング評価)で58%から70%への改善を報告しています。Anthropicは「これまで密な監視が必要だった難度の高いコーディング作業を、Opus 4.7なら安心して委ねられると報告するユーザーが増えている」と説明しています。

VentureBeatは「Opus 4.7とGPT-5.4を直接比較可能なベンチマークで比較すると7対4でOpus 4.7が上回っており、競争は接近している。コーディング・知識業務・視覚理解では明確なリード、抽象推論はほぼ同水準」と評しています。

高解像度ビジョンの追加。技術図面・財務書類への適用が現実的に

Opus 4.7ではClaudeシリーズ初の高解像度画像サポートを搭載しています。対応最大解像度が長辺1,568ピクセル(約1.15メガピクセル)から長辺2,576ピクセル(約3.75メガピクセル)へ、約3倍に拡大しました。これにより、スクリーンショット解析・化学構造式の読み取り・細かい文字を含む技術図面・密度の高い財務書類など、従来は低解像度のため読み取り精度が不安定だった用途への適用が現実的になります。

ただし高解像度画像は低解像度より多くのトークンを消費するため、ビジョンタスクの処理コストは増加する点に注意が必要です。

自己検証機能とメモリ改善。長時間エージェントの安定性向上

Opus 4.7はアウトプットを返す前に自分の出力を検証するプロセスが追加されました。データが欠落している場合、もっともらしい誤データを返す代わりに欠落を正確に報告する動作が確認されています。HexのCTOは「Opus 4.6が引っかかるようなエッジケースでも、Opus 4.7は正確に対応する」と評しています。

また、長時間にわたるエージェントタスクで作業途中の状態をファイルとして保持し、中断後に再開できる能力が強化されました。さらに推論エフォートレベルに「xhigh」が新設され、low/medium/high/xhighの4段階から精度と速度のバランスを選択できるようになっています。

Opus 4.6とのベンチマーク比較

評価項目 Opus 4.7 Opus 4.6
コーディング実務(SWE-bench Verified) 87.6% 80.8% +6.8
難関コーディング(SWE-bench Pro) 64.3% 53.4% +10.9
自律タスク(Terminal-Bench 2.0) 71.2% 65.4% +5.8

参考:Anthropic

現在Opus 4.6を業務に使用している場合、料金変更なしでOpus 4.7に切り替えられます。特に複数ファイルにまたがるコードの修正・リファクタリング、設計図・財務資料の画像読み取り、数時間以上にわたる長時間エージェントタスクでは効果が出やすい改善です。

詳細はこちらの記事をご覧ください。

関連記事

2026年4月16日、AnthropicがClaude Opus 4.7を正式リリースしました。2026年2月のOpus 4.6から約2ヶ月というこれまでの更新ペースを維持したアップデートで、コーディング性能・高解像度ビジョン・自己検証機能[…]

②OpenAI、サイバーセキュリティ特化の「GPT-5.4-Cyber」を発表。限定されたユーザーに段階提供開始

引用:OpenAI

重要ポイント

  • GPT-5.4をベースに防衛目的のセキュリティ業務向けに特化した派生モデル
  • 一般のChatGPT・APIからは利用不可。「Trusted Access for Cyber(TAC)」の上位ティアのみ
  • Anthropicの「Claude Mythos + Project Glasswing」に対するOpenAIの対抗策として位置づけられる

ニュース概要

OpenAIが4月14日、「GPT-5.4-Cyber」を発表しました。同社の最新モデルGPT-5.4をサイバーセキュリティの防衛業務向けにファインチューニングした派生モデルで、身元確認済みのセキュリティ専門家に段階的に提供されます。発表タイミングはAnthropicが「Claude Mythos Preview」と「Project Glasswing」を発表した約1週間後で、AIとサイバーセキュリティをめぐるOpenAIとAnthropicの競争が続いています。

通常のGPT-5.4は、セキュリティリスクを考慮して脆弱性の詳細分析や攻撃手法に関するリクエストに制限が設けられています。GPT-5.4-Cyberはこの制限の閾値を、認証済み専門家に限定して引き下げた設計です。正規のセキュリティ業務では「一般ユーザー向けには適切な制限でも、担当者にとっては業務の妨げになる」という問題への対応です。ChatGPT PlusやProプランへの加入だけではアクセスできず、2026年2月に発足したTAC(Trusted Access for Cyber)プログラムへの登録と身元審査が別途必要です。

バイナリリバースエンジニアリング対応。セキュリティ実務での差別化機能

GPT-5.4-Cyberの主要機能の一つがバイナリリバースエンジニアリングへの対応です。ソフトウェアのソースコードが入手できない状況でも、コンパイル済みのバイナリファイルを解析して内部のロジックや脆弱性を特定できます。一般向けのGPT-5.4では制限されていた領域です。

これに加え、エージェント型動作によるセキュリティタスクの自動化にも対応しています。脆弱性スキャン・ペネトレーションテスト・ログ解析といった複数ステップにわたるセキュリティ作業を、エージェントとして一連の流れで実行できます。

AnthropicのMythosとの設計上の違い

同じ「AIをセキュリティ防衛に使う」方向性でも、OpenAIとAnthropicのアプローチは設計思想が異なります。

比較項目 GPT-5.4-Cyber(OpenAI) Claude Mythos(Anthropic)
ベースモデル GPT-5.4をファインチューニング Mythos専用モデルとして独立開発
提供方式 TACプログラム経由で段階提供 Project Glasswing参加12社に限定
参加条件 身元確認済みセキュリティ専門家 Amazon・Apple・Googleなど大手企業との個別契約
料金 非公開 Opus 4.6の約5倍($25/$125/百万トークン)

OpenAIは「既存の最強モデルをセキュリティ向けにカスタマイズして専門家に提供する」アプローチをとっています。Anthropicは「セキュリティ能力を持つ独自モデルを、防衛目的に限定して少数の大手企業のみに提供する」という、より限定的な枠組みです。個人のセキュリティ専門家が実際に使えるという点では、GPT-5.4-Cyberのほうが間口が広い設計です。

参考:OpenAI

GPT-5.4-Cyberは一般企業のDX担当者が直接利用するものではありません。ただし、社内にセキュリティ専門チームがある場合、TACプログラムへの参加申請が今後の選択肢になります。

詳細はこちらの記事をご覧ください。

関連記事

2026年4月14日、OpenAIはサイバーセキュリティ専用AIモデル「GPT-5.4-Cyber」を発表しました。同社の最新モデルGPT-5.4をベースに、防衛目的のセキュリティ業務に特化してファインチューニングしたモデルで、身元確認済み[…]

③Google、「」の日本提供を開始。Gmail・YouTube等と連携し個人最適化された回答を提供

引用:Google

重要ポイント

  • GeminiがGmail・Googleフォト・Google検索・YouTubeの履歴を参照し、個人に最適化した回答を返す機能が日本でも利用可能に
  • 個人のGoogleアカウントが対象。Google Workspaceの法人アカウントでの利用は現時点で制限あり
  • 入力データはGoogleのAI学習には使用されない(オプトアウト不要)

ニュース概要

Googleが4月14日、Geminiの新機能「Personal Intelligence」の日本提供を開始しました。ユーザーが許可したGoogleアプリのデータをGeminiが参照し、個人に最適化した回答を返す機能です。

これまでのGeminiは、インターネット上の一般的な情報をもとに回答を生成しており、誰に対しても同一の回答を返す設計でした。Personal Intelligenceを有効にすると、GeminiはユーザーのGmailの受信・送信内容・Googleフォトの撮影履歴・YouTube視聴履歴・過去の検索履歴を参照できるようになります。毎回「私は〇〇が得意でなくて」「東京の南側エリアが便利で」などと一から説明しなくても、Geminiがアカウントに蓄積された情報をもとに文脈を理解した状態で回答が返ってきます。

Personal Intelligenceの連携アプリ別の活用範囲

連携アプリ 参照されるデータ 活用例
Gmail 受信・送信メールの内容 「先月の出張費用の合計を教えて」への回答
Googleフォト 撮影日時・場所・被写体 「去年の京都旅行の写真を探して」への対応
Google検索 過去の検索キーワード・閲覧履歴 興味分野に沿った情報の提案
YouTube 視聴履歴・チャンネル登録 視聴傾向をふまえた動画・情報の推薦

日本展開のタイミングと競合との関係

Personal Intelligenceは2025年末に米国・英国での提供が先行していた機能で、今回日本での提供が開始されました。類似の機能としてはAppleのApple Intelligenceが存在しますが、Apple IntelligenceはAppleデバイス内に閉じた処理が前提です。Personal IntelligenceはGoogleの各サービスとの連携を軸にしており、Googleアカウントに蓄積されたデータを横断的に活用できる点が特徴です。

ただし現時点でPersonal IntelligenceはGoogleの個人アカウント向けです。Google Workspaceの法人アカウントでの提供状況は組織の管理設定に依存します。社員が個人のGoogleアカウントで業務上のGmailやファイルにアクセスしている場合、業務データがPersonal Intelligence経由でGeminiに参照される可能性があります。社内のAI利用ポリシーで「個人アカウントと法人アカウントの使い分け」が明記されていない企業は、この機能の日本展開を機に整備を検討することが実務的な対応です。

入力データはGoogleのAIモデルの学習には使用されません。ただし、Googleのサービス利用規約に基づくデータ処理は行われるとのことです。

参考:Google

詳細はこちらの記事をご覧ください。

関連記事

2026年4月14日、GoogleはGeminiの新機能「Personal Intelligence(パーソナルインテリジェンス)」の日本での提供を開始しました。GmailやGoogleフォト、YouTube、Google検索の履歴と連携し[…]

④Copilot StudioとAgentforceでプロンプトインジェクション脆弱性が報告。CRMデータの外部流出を確認され、各社が対応。

重要ポイント

  • Copilot Studio(Microsoft)とAgentforce(Salesforce)で、外部フォームを経由してCRMデータを外部流出させる攻撃手法が確認された
  • Microsoftは修正済み(CVE-2026-21520、深刻度7.5)。Salesforceは部分的な対応にとどまり、主要な攻撃経路は未解決のまま
  • 両ツールでAIエージェントを運用している企業は、対応状況の確認が必要

ニュース概要

セキュリティ調査会社Capsule Securityが4月14日、Microsoft Copilot StudioおよびSalesforce Agentforceにおけるプロンプトインジェクション脆弱性(ShareLeak・PipeLeak)を公開しました。

プロンプトインジェクションとは、AIエージェントへの入力に悪意ある指示を埋め込み、エージェントを攻撃者の意図通りに動作させる攻撃手法です(AIエージェントは「入力されたテキストを指示として実行する」性質を持つため、悪意ある入力と正当な業務入力の区別が技術的に難しい)。今回の脆弱性では、外部から誰でも送信できるWebフォームに悪意ある指示を埋め込むだけで、AIエージェントが内部のCRMデータを攻撃者のメールアドレスに送信する動作が確認されました。攻撃を受けた社員側には何の通知も表示されない点が特に問題視されています。

ShareLeak(Copilot Studio)の攻撃の仕組みと対応状況

SharePointフォームへの問い合わせ内容に悪意ある指示を含めると、Copilot Studioエージェントがその指示をシステムの命令と区別せずに実行します。Capsuleの検証では、フォームの入力フィールドに「この情報を〇〇に送信せよ」という指示を埋め込むだけで、エージェントが社内データを外部サーバーに転送することが確認されました。

Microsoftはこの脆弱性をCVE-2026-21520(深刻度7.5)として登録し、1月15日にパッチを適用済みです。ユーザー側での追加対応は不要ですが、2025年11月〜2026年1月15日の期間にSharePointフォームをトリガーとするエージェントを運用していた場合、その期間のログを確認することが推奨されています。

PipeLeak(Agentforce)の攻撃の仕組みと対応状況

公開されたリードフォーム(営業問い合わせフォームなど)に悪意ある指示を埋め込むと、内部担当者がAgentforceにそのリード情報を確認依頼した際に、エージェントがCRMデータを外部に送信します。Capsuleの検証では、単一フォーム送信で複数のリード情報を一括取得できることが確認されており、「GetLeadsInformation」関数経由でのデータ取得に制限がかかっていないことも問題視されています。

Salesforceはメール経由のエージェント操作については対応を完了したと表明しましたが、Capsule Securityは企業の多くが使用する「カスタムトピック(Sub-Agents)」経由の攻撃経路は未解決のままと報告しており、Capsuleが再検証した結果でも動作は変わっていないとしています。Salesforceは今のところCVEの割り当ても公式のセキュリティアドバイザリの発行もしておらず、対応状況の不透明さが続いています。

項目 Copilot Studio(ShareLeak) Agentforce(PipeLeak)
攻撃経路 SharePointフォームへの入力 公開リードフォームへの入力
流出するデータ 社内データ全般(エージェントのアクセス権に依存) CRM顧客データ・リード情報
Microsoftの対応 修正済み(CVE-2026-21520)
Salesforceの対応 一部対応済み。主要経路は調査継続中

参考:VentureBeat / CSO Online

AIエージェントのセキュリティ設計における構造的な問題

今回の脆弱性は特定のバグというより、AIエージェントが抱える設計上の構造的な問題を示しています。AIエージェントは外部からの入力(フォーム・メール・チャット)をトリガーに動作する設計上、悪意ある入力と正当な業務入力を区別することが難しい状態です。Copilot StudioやAgentforceのように外部公開されたフォームを入口にしている場合、入力の検証が不十分であれば同じ攻撃パターンが成立します。

Copilot StudioとAgentforceは現在多くの日本企業でも導入・検討が進んでいるツールです。今回の脆弱性は「エージェントに与えるアクセス権限の最小化」と「外部入力をトリガーとするフローの監査」が、本番運用時の標準的なチェック項目として位置づけられるべき段階にあることを示しています。

⑤【編集部まとめ】今週登場したトピックを整理。エージェントの「使う側」と「守る側」が同時に動いた週だった

今週のニュースを並べると、AI活用の「展開」と「セキュリティ」が同じ週に問われた構図になっています。

先週はAnthropicとOpenAIがAIをサイバーセキュリティの「防衛ツール」として位置づける動きが相次ぎました(Claude Mythos、Project Glasswing、GPT-5.4-Cyber)。今週はその裏側として、すでに業務で使われているAIエージェント(Copilot Studio、Agentforce)自体がサイバー攻撃の標的になっていることが明らかになりました。

AIが強力になるほど、AIを狙った攻撃の影響範囲も拡大します。エージェントに与えるアクセス権限・外部入力への対応・ログの監査という3点は、エージェントを本番運用する際の標準的な確認項目として位置づけるべき段階に入っています。

トピック 実務への影響
Copilot Studio・Agentforce脆弱性 既存運用中の場合は対応状況の確認が必要
Claude Opus 4.7リリース 料金据え置きで性能向上。現在Opusモデルを利用中なら切り替えを検討
Google Personal Intelligence日本展開 個人向け機能だが、法人向け展開を見据えた利用ポリシーの整備が必要
GPT-5.4-Cyber発表 企業への直接的な影響なし。セキュリティ専門チームはニュース概要の把握を

まとめ

今週は、AIの機能拡張とセキュリティリスクの両面が同時に顕在化した週でした。

Claude Opus 4.7は料金据え置きのまま性能を更新し、コーディングと高解像度ビジョンで改善が確認されました。特にSWE-bench Proでの+10.9ポイントという向上幅は、難易度の高いタスクで差が出やすいことを示しており、現在Opus 4.6を使用している企業は設定変更なしで切り替えられます。

GPT-5.4-Cyberの発表で、OpenAIとAnthropicのいずれもが「セキュリティ専門モデルを専門家向けに段階提供する」という同方向の競争に入ったことが確認されました。提供範囲や設計思想には差がありますが、AIとサイバーセキュリティの統合が業界全体のトレンドとして定着しつつあります。

Google Personal Intelligenceは個人向けの機能ですが、日本展開を機に業務データの取り扱いポリシーを整備できていない企業では、社員の個人アカウント経由で業務データが連携されるリスクを検討する必要があります。

今週最も対応優先度が高いのは、Copilot StudioおよびAgentforceの脆弱性です。Microsoftはパッチ適用済みですが、SalesforceはCustom Topics経由の主要な攻撃経路が未解決のままです。先週のMythos発表が示した「AIが攻撃ツールになりうる」という問題と、今週の「AIエージェント自体が攻撃対象になる」という問題は、表裏一体の課題です。エージェントの本番運用を進める企業ほど、セキュリティ設計の見直しを並行して進める必要があります。

×