週間生成AIニュース【2月9日-2月15日】

今週も、Taskhubマガジンが厳選したAIニュースをお届けします

OpenAIとGoogleは、AIがより深く思考し、複雑な調査や推論を行う能力を大幅に向上させましたこれにより、AIは単なる情報検索ツールから、専門的な分析や未知の課題解決を支援する「思考パートナー」へと進化しています

一方、AnthropicとMicrosoftは、複数のAIエージェントが連携してタスクを分担・並列処理する「AIチーム」のアプローチを発表人間がAIの活動範囲を定め、チームとして機能させることで、より安全で高精度な業務自動化を実現します

これまでは個々のAIの性能が注目されてきましたが、これからは専門家のように思考するAIを、いかにチームとして機能させ、人間と協業させていくかが重要になります

①OpenAI、Deep ResearchをGPT-5.2ベースに刷新。外部ツール連携と参照先の指定が可能に

引用:OpenAI

重要ポイント

  • GPT-5.2への刷新と精度向上: 基盤モデルの更新により、推論能力が大幅に強化。複雑な多段階調査の成功率が向上し、専門的な内容のレポート作成における「AIの独り歩き」を抑制

  • 「指定ソース」によるノイズ排除: 特定のWebサイトや、Google Drive / SharePointの外部ツールと連携し、それらを調査対象として直接指定可能に。

  • 進捗の可視化と動的制御: 調査プロセスのリアルタイム追跡と、実行中の中断・修正が可能に。AIに「丸投げ」するのではなく、人間が「口出し」できるプロセスへと進化

ニュース概要

2026年2月10日、OpenAIはChatGPTの調査機能「Deep Research」のアップデートを実施しました。

最大の変更点は、OpenAIの最新モデルGPT-5.2の採用です。これにより、単なる検索の代行から、ビジネスコンテキストを理解した調査ができるように性能が強化されました。

今回のアップデートでは、新たに「ソース指定機能」が搭載されました。ユーザーは調査対象とするドメインの指定や、組織内のストレージとの連携したデータの参照が可能になります。生成されたレポートは専用のフルスクリーンビューアで管理され、目次や引用元一覧を備えた形式(Markdown / PDF等)で出力できます。

参考:OpenAI

データソースの制御による「調査プロセスの構造化」

今回のアップデートにおける技術的な本質は、AIによる自律的なWeb探索能力に、人間による「検索範囲の制御」が加わった点にあります。

従来のAI検索機能では、ソースの選択がモデルの内部アルゴリズムに依存しており、企業実務で求められる根拠の網羅性や信頼性の担保に課題がありました。GPT-5.2への刷新とソース指定機能の実装により、ユーザーが定義した特定のドメインや連携アプリ内での重点的な探索が可能となり、調査結果のトレーサビリティ(追跡可能性)が大幅に向上しています。

比較軸 従来のDeep Research 新しいDeep Research
基盤モデル o3 / o4-mini GPT-5.2
情報源 AI任せのWebクロール 特定サイト・社内アプリの指定
透明性 ブラックボックスな生成過程 プランの事前確認・修正が可能
成果物形式 チャット内の長いテキスト 専用ビューア・構造化レポート

Web情報の網羅性と「特定ソース参照」による高精度化

Deep Researchの価値は、モデルが多段階の推論を経てハルシネーションを抑制し、Web上の膨大な情報を構造化する点にありました。
今回のアップデートでSharePoint等の社内ポータルを参照できるようになったことで、「広域な探索アルゴリズム」を「クローズドな社内ナレッジ」にまで適用できるようになったことを意味します。これは単なるドキュメント検索(RAG)の代替ではなく、Web上の最新動向と社内固有の文脈を、Deep Researchの高度な推論プロセスの中で統合的に処理できるようになった点に真の価値があります。

今回のアップデートされた「Deep Research」機能は、加入しているプランによって提供時期と利用条件が異なります。

プラン名 料金 Deep Researchの利用可否
Plus 月額 約3,000円 利用可能
Pro 月額 約30,000円 利用可能
Go (新設) 月額 約1,400円 近日提供予定
Free 無料 近日提供予定
Enterprise 別途(OpenAIの営業担当への問い合わせが必要) 利用可能

②Googleが、「Gemini 3 Deep Think」を大幅刷新

重要ポイント

  • 「System 2」思考の実装: 並列思考と強化学習(RL)により、従来のLLMが苦手としていた複雑な多段階推論とプロセスの自己修正を実現

  • 科学・数学での圧倒的優位: 国際数学オリンピック(IMO)金メダル級の性能に加え、ARC-AGI-2で84.6%という「未知の課題への適応力」を実証。

  • 実務インパクト: 既存モデルでは見落とされていた論理的欠陥の検知(査読支援)や、複雑な物理システムのコード化など、高度専門職の「実行支援」から「検証パートナー」へと役割が進化

ニュース概要

Google DeepMindは、推論能力を極限まで高めた新機能「Gemini Deep Think」のアップグレードを発表しました。本モデルは、回答を生成する前に内部で試行錯誤し、複数の仮説を検討・検証する「熟考型(System 2)」のアプローチを採用しています。

引用:Google

特筆すべきは、単なるテキスト生成に留まらず、化学・物理学の複雑な実験データの解釈や、手書きスケッチからの3Dモデリングといった、「物理空間と論理空間を橋渡しする能力」が大幅に強化された点です。

引用:Google

現在はGoogle AI Ultraサブスクリプションおよび、特定の研究者・企業向けにGemini APIを通じて提供が開始されています。

OpenAIの「Prism」と「Gemini 3 Deep Think」の違い

科学者向けの生成AIツールとしては、OpenAIのPrismも存在しています。

OpenAI Prismの特徴は「研究プロセスの器(プラットフォーム)」であることです。 論文執筆に必要なLaTeXエディタ、文献管理、チーム間での共同編集機能が一つに統合されており、研究者が「執筆やフォーマット調整」という定型作業に費やす時間を最小化することに特化しています。

Gemini Deep Thinkの特徴は「論理推論の深さ(エンジン)」であることです。 特定のプラットフォームを提供するのではなく、AIが回答を出す前に「自分で考え、間違いを修正し、論理を組み立て直す」という思考プロセスそのものを強化しています。数学の証明や複雑な物理法則の解釈など、「未知の難問に対する壁打ち相手」として機能します。

OpenAI Prism Gemini Deep Think
提供形態 LaTeX統合ワークスペース(プラットフォーム)
APIおよびチャットを通じた推論機能
得意な成果物 査読付き論文、共同研究ドキュメント
未解決問題の証明、コード、科学的仮説
主な機能 文献検索、引用管理、リアルタイム共同編集
自己修正を伴う多段階推論、高度な数学・物理
優位性 執筆に関わる各種作業のサポート
既存知識を超えた「未知の論理」への到達

参考:OpenAI

参考:Google

企業R&Dや学術機関においては、プロジェクトのフェーズによってこれらを使い分けていくことがおすすめです。

フェーズ 推奨ツール 具体的な運用
1. 基礎研究・探索 Gemini Deep Think
新しい数理モデルの妥当性検証や、シミュレーションコードの作成。
2. 実証・データ分析 Gemini Deep Think
実験結果からの異常検知や、複雑な因果関係の特定。
3. 文献調査・統合 OpenAI Prism
関連論文の高速な要約と、自社成果との対比整理。
4. 論文執筆・投稿準備 OpenAI Prism
LaTeX形式への変換、引用文献の書式統一、チーム間レビュー。

③AnthropicがAgent Teams発表。複数タスクの同時並行処理を実現

  • マルチエージェントによる分業化: 単一のチャットUIではなく、役割を持つ複数のエージェントが各々連携。タスクの直列処理から「並列・分散処理」へとシフト。

  • 専門性の深化と精度向上: 特定のドキュメントやツールに特化した複数のエージェント構成。従来のRAG(検索拡張生成)で発生していたノイズを低減し、回答精度を最適化する。

  • ガバナンスの細粒度化: エージェントごとにアクセス権限や使用ツールを制限可能。全社データへの無制限なアクセスを避け、最小権限の原則に基づいた安全なAI運用を実現

ニュース概要

Anthropicは、複雑なワークフローを自動化するための新機能「Agent Teams」を公開しました。これは、ユーザーの指示に対して1つのAIが答える従来の形式を超え、「リーダー(指揮役)」と「スペシャリスト(実行役)」に分かれたAI達が、相互にコミュニケーションを取りながらゴールを目指す仕組みです。

特筆すべきは、これまで人間が手動で行っていた「プロンプトの連結」や「情報の受け渡し」を、AIが自律的に判断して行う点です。これにより、市場調査からレポート作成、コードの実装からテストまでといった、長期間かつ多段階のプロセスをノンストップで完結させることが可能になります。

▼Agent Teamsの使用イメージ

Sub-agentsとAgent Teamsの違い

サブエージェント方式は、メインエージェントが特定のタスク実行のために下位の機能を一時的に呼び出す「階層型(Hierarchical)」の制御構造です。これに対し、Agent Teamsは、各エージェントが独立したコンテキストウィンドウと個別の実行権限を保持し、相互に通信を行う「分散型(Distributed)」のネットワーク構造を形成しています。

サブエージェント (Sub-agents)
エージェントチーム (Agent Teams)
コンテキスト 独自のコンテキストウィンドウを持つが、結果は呼び出し元に集約される。
各エージェントが独自のコンテキストウィンドウを持ち、完全に独立している。
コミュニケーション 結果はメインエージェントに対してのみ報告する。
チームメイト(エージェント)同士が直接メッセージを送り合い協調する。
調整(Orchestration) メインエージェントがすべての作業フローを中央集権的に管理する。
自己調整機能を備えた「共有タスクリスト」に基づき自律的に動く。
想定されるユースケース 最終的な「結果」のみが重要となる、特定の集中した業務。
メンバー間の「議論」や「協力」を必要とする、多角的で複雑な業務。
トークンコスト コスト低: 必要な結果のみをメインのコンテキストに要約して戻すため効率的。
コスト高: 各チームメイトが独立して動作し、対話が発生するため。

参考:Anthropic

④Microsoft「Agents in OneDrive」の一般提供開始

重要ポイント

  • RAG構築が簡単に: 特別なインフラ構築を介さず、最大20個のファイルをソースとした検索拡張生成(RAG)環境を、現場の一般ユーザーが数クリックで作成可能に。

  • コンテキストの固定と共有: 従来のCopilotと異なり、特定のプロジェクトに回答範囲を制限した「.agent」ファイルを生成。これをチーム間で共有することで、情報参照の前提条件を統一できる。

  • 運用上の重要課題: 利便性の裏で、「古いデータの参照」と「エージェントの乱立」が新たなリスクとして浮上。導入前のデータクレンジングと、中央管理的なガバナンス設計が不可欠となる。

ニュース概要

Microsoftは「Agents in OneDrive」の一般提供(GA)を開始しました。Microsoft 365 Copilotライセンスを持つユーザーは、OneDrive上のWebインターフェースから特定のファイル群を選択し、それらを知識ソースとする専用エージェントを構築できます。

引用:Microsoft

技術的な進歩として、AIエージェントが「.agent」という拡張子のファイルとしてカプセル化された点が挙げられます。これにより、従来の「対話履歴による一時的な記憶」から、「ファイルとして永続化・共有可能な知性」へと管理形態が進化しました。

Copilot (Global Brain) Agents in OneDrive (Local Brain)
情報のスコープ 組織全体、メール、チャット等
ユーザーが指定した特定の20ファイル
回答の精度 広範だがノイズが混入しやすい
範囲が限定されるため、ハルシネーションを抑制
共有の単位 個人の対話履歴(共有不可)
「.agent」ファイルによるチーム共有
管理コスト 管理者による統制が必要
ユーザー単位でのセルフサービス構築

参考:Microsoft

活用の注意点:エージェントの乱立とサイロ化

作成のハードルが極めて低い分、エージェントが量産される可能性があり、注意が必要です。
各個人が独自の判断でソースファイルを選択すると、同一プロジェクト内でもエージェントごとに回答が食い違う状況が発生し、組織としての意思決定の整合性が失われる恐れがあります。また、有益な知見が個人のOneDrive内に「.agent」ファイルとして蓄積・固定化されることで、かえって情報のサイロ化を加速させる懸念も拭えません。これを防ぐには、個人利用のエージェントと、チームで一律に使っていくエージェントを明確に区分し、それらを一元管理できるような仕組み・運用体制の確立が不可欠です。
▼想定される「Agents in OneDrive」のユースケース
具体的なユースケース 推奨される構成
プロジェクト管理 過去の議事録からの決定事項の抽出
最新の議事録のみをサブフォルダに隔離して指定
エンジニアリング 特定製品の仕様書やマニュアルの参照
「共通で活用する」と認識統一した、マスターAgentとして承認済み資料のみを学習
オンボーディング 新メンバーへの既存ルールの周知
共通の「Onboarding_Agent」をチームで使い回す