週間生成AIニュース【2026年2月16日-2月23日】

今週も、Taskhubマガジンが厳選したAIニュースをお届けします

今週は各社モデルの性能向上や、外部連携機能の強化など、実務に直結するアップデートが多く発表されました。

AnthropicのClaude Sonnet 4.6は、GUI操作を通じて既存システムを自動化する能力を獲得GoogleのGemini 3.1 Proも、与えられた目的に対し、最適なツールを自ら選択・実行する高度な推論能力を示しました

さらに、デザインやマーケティングといった専門領域でもAIの活用が加速していますFigmaとClaudeの連携は「コードからデザイン」への変換を自動化し、開発プロセスを効率化GoogleのPomelliは、1枚の商品写真から多彩な販促クリエイティブを自動生成し、ブランドの世界観を保ちながら制作リードタイムを劇的に短縮しますそれぞれのニュースについて詳しく解説します。

①Anthropic、Claude Sonnet 4.6発表。100万トークン対応とComputer Useによる自動化機能を搭載

引用:Anthropic

重要ポイント

  • コスト対効果の改善: 前世代の最上位モデル(Claude Opus 4.5)を上回るコーディング・推論能力を、比較的安価に提供。

  • 自動化領域の拡大: APIを持たないレガシーシステムやSaaSを、人間と同様の「画面操作(Computer Use)」で自動化可能に。

  • コンテキスト管理: 1Mトークン対応および自動要約機能(Context Compaction)により、大規模なコードベースや文書の処理効率が向上。

ニュース概要

2026年2月17日、Anthropic社は「Claude Sonnet 4.6」を発表しました。今回のアップデートの注目点は、モデル性能の向上もさることながら、「自律的なコンピュータ操作機能(Computer Use)」の性能向上にあります

引用:Anthropic

最大の特徴である「Computer Use」機能は、OSWorldベンチマークにおいて顕著な進化を遂げました。これまでのモデルでは困難だった、仮想デスクトップ上にて「ブラウザで情報を検索し、Excelに転記し、社内システムへ登録する」といった、複数のアプリケーションを横断する複雑なワークフローを、人間と同様にGUI操作することが可能です。

▼Sonnet4.6の比較表。ツール操作性能がOpus4.6に匹敵する性能でありつつ、費用はSonnet4.5と同等。

引用:Anthropic

安全性評価とプロンプトインジェクション攻撃への耐性向上

Claude Sonnet 4.6に実施された安全性評価によれば、深刻なミスアライメント(運用意図から逸脱回答を行うなどの動作)の兆候は見られず、従来のモデルと同等の高い安全性が確認されています。

一方、「Computer Use(PC直接操作)」特有のリスクとして、悪意のあるWebサイトに隠された指示によってモデルが乗っ取られる「プロンプトインジェクション攻撃」の懸念が存在します。

この課題に対し、Sonnet 4.6は前世代のSonnet 4.5と比較して同攻撃への耐性が大幅に向上しており、最上位モデルであるOpus 4.6と同等の防御性能を示しています。なお、その他のリスク緩和策に関する詳細なガイダンスは、公式のAPIドキュメントにて提供されています。

「性能向上」だけではなく「運用安定性」が向上

Sonnet 4.5でも、Webページや長いPDFをそのまま入力することは可能でした。ただし、大量の情報をそのまま渡すとノイズも一緒に処理され、無関係な内容に引っ張られることがあります。そのため、精度を安定させるには、人が事前に重要部分を抜き出すなどの整理を行う場面も少なくありませんでした。Sonnet 4.6では、必要な部分を拾いやすくなり、会話が長くなっても整理しながら継続しやすくなっています。

比較項目 Sonnet 4.5 Sonnet 4.6 Opus 4.6
使用料(Claudeアプリのプラン) 旧モデル(現在は4.6へ移行) Free / Pro の既定モデル Pro / Max / Team / Enterprise
API料金(USD / 100万トークン) 入力:$3出力:$15 入力:$3出力:$15 入力:$5出力:$25
コンテキスト幅 標準:200K/1M(ベータ)
最大出力:64K
標準:200K/1M(ベータ)
最大出力:64K
標準:200K/1M(ベータ)
最大出力:128K
具体的なユースケース 提案書ドラフトの作成、議事録整理、軽〜中規模コード生成、仕様書要約等のタスクの効率化。 「社内資料などを横断し、影響ある差分だけ抽出→整理→部門別ToDo化」といった一連の業務フローの効率化。
複数リポジトリ横断の基盤移行や大型リファクタを、設計→実装→レビューまで一気通貫で進める。

②FigmaとClaude Codeが連携、作成したUIをそのまま取り込む「Code to Canvas」

重要ポイント

  • 「コードからデザイン」への即時変換: Claude Code等で生成した動的なUI(ローカルホスト/本番環境)を、1クリックで編集可能なFigmaフレームへ変換。手動のスクリーンショットや再作成コストをゼロ化。

  • MCP(Model Context Protocol)による双方向性: Figma MCPサーバーを介し、LLMがデザイン意図を直接参照してコードを生成。デザインとコードの「乖離(ドリフト)」を機械的に抑制。

  • 開発リードタイムの短縮: プロトタイプ作成からフィードバック収集までのサイクルを、従来の「数日単位」から「分単位」へ短縮。属人的な「実装後の修正」を防ぐガバナンスを構築。

ニュース概要

2026年2月17日、FigmaはAnthropicのエンジニアリング向けAIツール「Claude Code」との強力な連携機能を発表しました。

これまでのAI開発フローでは、AIがコードを生成しても、その結果を再び手動でデザインツールに書き起こす必要がありました。今回のアップデートにより、「ブラウザ上の実稼働コード」を直接Figmaのキャンバスへ、編集可能なレイヤー構造を維持したまま取り込むことが可能になりました。

単なる「キャプチャ」ではなく、CSSやコンポーネント構造を保持した「設計資産」として同期される点が、従来のツールと一線を画します。

ツール間の分断を埋める新しいコラボレーション

これまでのプロダクト開発では、デザインツールと開発環境という異なる言語を持つ環境を往復する際の「翻訳コスト」にありました。
今回の連携は、AIを媒介にこの二つの世界をシームレスに繋ぐブリッジとして機能します。

Figma MCPサーバーを通じて、AIエージェントが自社のデザインルールを理解した状態でコードを生成できることで、エンジニアは「ルール確認」に使っていたリソースを、ロジックやアーキテクチャの設計に充てることが可能になります。

これにより、エンジニアが実装に集中しながらも、その成果を即座にデザイン資産として共有・還元できる環境が整います。

業務フェーズ 推奨されるアクション 期待される効果
機能拡張・UI変更 コード先行で試作し、Figmaへ逆同期 実装上の制約を早期にデザインにフィードバック
デザインレビュー 実装済みUIをFigmaに取り込んで比較 「実際の動き」に基づいた精度の高いレビュー
コンポーネント管理 MCP経由でデザイン意図をコードへ反映 デザインシステムからの逸脱を未然に防止

③Google、Gemini 3.1 Proを発表。複数ファイル横断のリファクタリングと自律的なAPI実行機能を実装

重要ポイント

  • 推論性能が前モデル比で2倍以上へ向上: 未知の論理パターンを解決するベンチマーク「ARC-AGI-2」で77.1%を記録。単なる知識検索ではなく、複雑なビジネスロジックの自己構築が可能に

  • 「Google Antigravity」によるエージェント開発の加速: 開発者向けプラットフォームとの統合により、指示待ちのAIから、目的達成のために自らツールを使い分ける「自律型ワークフロー」への移行を支援

  • コードベースの動的アウトプット能力: テキストから直接アニメーションSVG等を生成可能。ピクセルデータ(画像・動画)ではなくコードを介することで、軽量かつセマンティックなビジネス資料作成を自動化

ニュース概要

2026年2月19日、GoogleはGemini 3シリーズの中核を担う最新モデル「Gemini 3.1 Pro」を公開しました。本モデルは、科学・研究分野に特化した「Deep Think」の成果を汎用モデルにフィードバックしたもので、開発者向けAPIおよび「Vertex AI」「Gemini Enterprise」を通じて即時提供が開始されます

引用:Google

最大の特徴は、「答えのない問い」に対する推論力の進化です。従来のAIが過去の学習データに基づく「確率的な補完」に依存していたのに対し、3.1 Proは与えられたコンテキストから論理を自ら組み立てる能力が大幅に強化されています。これにより、データ合成や複雑なコード生成を伴う「エージェント的タスク」の精度が飛躍的に向上しました。

作業の「断片」から「工程全体」の代行へ

今回のアップデートの注目点は、AIが「指示を待つツール」から「目的を達成するエージェント」へと進化した点にあります。
従来は人間が「どのツールを使い、どのデータを見るか」を定義する必要がありましたが、Gemini 3.1 Proは「目的」を提示されるだけで、手段を自ら設計を行い、タスクを実行します。

Gemini 3 Pro(従来モデル) Gemini 3.1 Pro(新モデル)
コーディング実務 単一ファイルのボイラープレート生成や、既存コードのバグ修正。
複数ファイルにまたがるリファクタリング計画の策定と、依存関係の自動整合。
データ分析 散在する売上データからの数表作成や、指定された軸でのグラフ化。
「売上低下の要因」を仮説立て、複数のDBから必要な指標を自ら抽出・統合して報告。
ドキュメント活用 1,000枚の仕様書から「特定の機能」に関する記述を探し出す。
仕様書間の矛盾を検知し、最新のビジネスロジックに適合しない箇所を特定・修正案を提示。
外部ツール連携 指定されたAPIを叩くためのコードを書く(実行は人間)。
目的(例:出張手配)に対し、最適なAPI(カレンダー、決済、メール)を自律的に選択・実行。

参考:Google

④Google、Pomelliの新機能「Photoshoot」を発表。商品画像やURLから販促クリエイティブを自動生成

引用:Google

重要ポイント

  • 手持ちの粗い画像からプロ級のスタジオ写真を自動生成: 最新モデル「Nano Banana」と自社ブランド情報(Business DNA)を統合し、外部撮影コストと制作リードタイムを抜本的に削減します。

  • プロンプト不要のコンテキスト主導型UIへの進化: 製品URLや参照画像を読み込ませるだけで、AIがサイト内の説明文やトーンを解釈し、一貫性のあるキャンペーン素材を自動構築します。

  • ブランドガバナンスと現場の機動力の両立: 現場部門単独での迅速なクリエイティブ展開を実現しつつ、システム側でブランドルールの逸脱を防ぐ統制環境を提供します。

ニュース概要

2026年2月19日、Google LabsはPomelliの新機能「Photoshoot」を発表しました。 本アップデートは、単なる画像生成エンジンの性能向上にとどまりません。ユーザーがアップロードした日常的な製品写真に対し、事前に設定した「Business DNA(ブランド文脈)」をAIが自律的に適用し、高品質なスタジオショットやライフスタイル画像を生成します。さらに、製品URLを入力するだけで、既存サイトの画像や説明文(コンテキスト・記憶)をAIが解釈し、キャンペーン素材を瞬時に構築する機能も追加されました。これにより、担当者が手動でプロンプトの試行錯誤をする時間が削減され、ビジネスプロセスが劇的に加速します。

※Pomelliは現在、米国、カナダ、オーストラリア、ニュージーランドで無料提供中であり、日本では未公開となっています

参考:Google

システムによるブランド要件の自動適用

従来の画像生成AIは、オペレーターが詳細なテキスト指示(プロンプト)を都度入力する必要があり、個々人のプロンプトの質によって出力品質にばらつきが生じていました。 Pomelliの「Photoshoot」は、ブランドのルールやトーンといった「知識」をシステム側で事前に定義・保持し、それを実際の画像生成やキャンペーン展開という「行動」に直接連携させます。これにより、属人的なプロンプト操作から、システムが規定のブランド要件を自動適用する仕組みへと移行しました。

▼Pomelliの使用イメージ

ユースケース:新製品プロモーションにおける業務フロー

Pomelliを導入する場合、マーケティング/プロモーション業務は「どこをAIに任せ、どこを人間が担当するか」が明確に再定義されます。
「新製品のプロモーション素材制作」を例に挙げると、具体的な分業イメージとプロセスは以下のような形で実施することができるでしょう。

フェーズ 担当 実行するタスク(具体例)
プロモーション戦略・デザインのトンマナの整理・決定 人間
新製品のブランドガイドライン(配色、トーン)を定義し、
Pomelliの「Business DNA」としてシステムに事前登録する。
素材入力 人間
新製品の簡易な写真(スマートフォン等で撮影した画像など)を
アップロードし、対象の製品ページURLを入力する。
自動生成 Pomelli
読み込んだURLから製品の仕様やターゲット層を解釈。
登録済みのBusiness DNAを適用し、粗い写真をプロ品質のスタジオ画像やライフスタイル画像へと自律的に変換・生成する。
承認・配信 マーケター
Pomelliが生成した複数パターンのクリエイティブを確認し、
要件を満たしているものを承認。各メディアへ展開する。