週間生成AIニュース【2026年1月9日-1月15日】

2026年1月20日
AIニュース

今週の生成AIニュース、キーワードは「AIに任せる時代の到来」です。Anthropicが発表した「Cowork」は、フォルダを指定して「整理して」と言うだけでAIが勝手に仕事を片付けてくれる画期的な機能。

そしてAppleとGoogleがライバル関係を超えてタッグを組み、SiriがGeminiの力で大幅パワーアップすることになりました。チャットで質問するAIから、実際に手を動かしてくれるAIへ。AIとの付き合い方が大きく変わる、そんな未来を予感させる1週間でした。

1 ①ElevenLabs、世界最高峰の音声生成AI「Scribe v2」を発表
2 ②Anthropic、非開発者でも使えるAIエージェント「Cowork」を発表
3 ③伸和エージェンシーとECマーケティング、住宅業界向け「生成AI対策/LLMO弱点あぶり出し調査」サービスを開始
4 ④AppleとGoogleがAIで歴史的提携、次世代SiriにGemini技術を採用
- 4.1 ニュース概要
- 4.2 編集部コメント：競合の壁を越えた、戦略的かつ現実的な提携
5 ⑤GeminiがGoogleアプリ連携で進化！新機能「Personal Intelligence」登場
- 5.1 ニュース概要
- 5.2 編集部コメント：「アプリ間の分断」を埋める究極の効率化

①ElevenLabs、世界最高峰の音声生成AI「Scribe v2」を発表

ニュース概要

AI音声技術の世界的リーダーであるElevenLabs社が、次世代の音声文字起こしモデル「Scribe v2」を発表しました。このモデルの最大の特徴は、競合他社を凌駕する「圧倒的な正確性」と、150ミリ秒以下という「驚異的な低遅延（反応の速さ）」を両立させている点です。

日本語を含む90以上の言語に対応しており、単なる言葉の書き出しだけでなく、笑い声や足音といった周囲の音の識別、さらには専門用語を事前に学習させる機能まで備えています。企業の議事録作成から、リアルタイムのAI対話エージェント、動画の字幕制作まで、私たちのビジネスやクリエイティブな活動をより円滑で豊かなものに変えてくれる、非常に実用的なツールと言えるでしょう。

驚異の「0.15秒」で世界最高峰の精度を実現

Scribe v2は、OpenAIやGoogleなどの名だたる競合を抑え、業界最高水準の正確さを達成しました。特筆すべきはリアルタイム版の速さで、わずか150ミリ秒（0.15秒）未満で音声をテキスト化します。これは、人間が会話の内容を理解するのとほぼ変わらない、あるいはそれ以上のスピード感です。

その他主要文字起こしモデルとの精度比較

引用:ElevenLabs

この「速さと正確さ」は、顧客との対話においてストレスをゼロにします。例えば、カスタマーサポートの現場でAIが即座に要望を理解し、回答を提示するようなシーンで真価を発揮します。まずは自社のオンライン会議やカスタマー窓口で、この「ラグのない体験」が顧客満足度をどれだけ高められるか、試験的に導入して体感してみるのがおすすめです。

専門用語や「場の空気」まで逃さない高度な認識力

一般的なAIが苦手とする「業界用語」や「社内独自の固有名詞」も、最大100単語まで事前に登録できる「Keyterm Prompting」機能により、正確に認識できるようになりました。また、言葉だけでなく笑い声や拍手などの環境音も自動でタグ付け（Dynamic Audio Tagging）してくれるため、録音データがより「文脈」を持った生きた情報として整理されます。

専門性の高い会議の記録で、誤変換の修正に時間を取られていませんか？まずは頻出する専門用語をリストアップし、このモデルに読み込ませてみてください。手直し作業が劇的に減り、本来の重要な意思決定やクリエイティブな業務に集中できる時間が増えるはずです。現場の「生の声」を、より深いニュアンスまでデータ化できるのは大きな強みになります。

公式サイトから実際にリアルタイム録音 / ファイルアップロードでの文字起こしを試すことができます。

参考: ElevenLabs

②Anthropic、非開発者でも使えるAIエージェント「Cowork」を発表

ニュース概要

Anthropic社が発表した「Cowork」は、これまでエンジニア向けだった高度なAIエージェント機能を、誰でも直感的に使えるようにした画期的な新機能です。最大の特徴は、PC内の特定のフォルダへのアクセス許可を与えることで、Claudeが自律的にファイルの整理や資料作成、Webリサーチまで代行してくれる点にあります。

従来の「一問一答」のチャット形式を超え、まるで優秀な同僚に業務を丸投げするような新しい働き方を提案しています。現在はmacOS版の「Claude Max」プラン利用者向けに提供されており、Windows版への対応も今後予定されています。

専門知識不要で、AIに業務を「丸投げ」できる時代へ

これまでのAI活用は、指示を出して回答を待つ「一問一答」が基本でしたが、Coworkは「フォルダを整理して」「レポートを作って」といった抽象的な依頼に対し、自ら計画を立てて実行まで完結させます。特筆すべきは、エンジニアのような専門的な操作が一切不要な点です。

実際の検証では、400個のファイルが散らかったデスクトップをわずか4分で自動整理した例もあります。まずは「一時的な作業用フォルダ」を一つ作成し、そこへ関連資料を放り込んで「この中の情報をExcelにまとめて」と依頼することから始めてみてください。手作業で1時間かかる整理や集計が、数分間のコーヒー休憩中に終わる快感を体験できるはずです。

Coworkでデスクトップ上にあるフォルダを整理

開発以外の仕事向け「Claude Code」が登場

– Coworkは、開発者がClaude Codeを使うのと同じような感覚で、非技術系の作業を完了できるようにするツール
– 動画では、散らばったデスクトップのファイルを種類毎に整理させているpic.twitter.com/izuzMh3nSx
— SOU⚡️仮想通貨 / ビットコイン (@SOU_BTC) January 13, 2026

Coworkでローカル上のファイルをもとにPowerPoint形式の資料を作成

【早速CoWork使ってみた】
Claude Codeが『コーディング以外』にも使われまくってる流れで、Anthropicが『Cowork』を発表した。
つまり、Claude Codeの体験をその他すべての仕事でも再現できると。

1. フォルダ権限を渡して、資料/スライド/表作成や整理を任せる
2.… https://t.co/kSYS05dOSX pic.twitter.com/hYAPB3Qu3V
— shimayuz ⤴️ AIエージェント実装・業務効率化 (@Shimayus) January 13, 2026

導入の壁となる「高価格帯」と賢い判断基準

Coworkを今すぐ利用するには、月額100ドル（約1.5万円）または200ドル（約3万円）という、個人向けAIツールとしては非常に高額な「Claude Max」プランへの加入が必須となります。一般的なProプランが月額20ドルであることを考えると、5倍以上のコストがかかる点は無視できない事実です。これは、AIが自律的に何度も試行錯誤を繰り返すため、通信量（トークン）を膨大に消費することが理由です。まずは「自分の時給と、AIに任せられる作業時間」を天秤にかけてみてください。

例えば、月1.5万円の投資で、毎月数時間かかっていた面倒なファイル整理やレポート作成が自動化され、本来の重要業務に集中できるのであれば、十分に元が取れる計算になります。もし「まだそこまでの出費は……」と感じる場合は、無理に加入せず、まずは無料のウェイトリストに登録して一般公開を待つのも賢い選択です。自分の業務量に見合う投資かどうか、まずは冷静に見極めることから始めましょう。

参考:Claude

③伸和エージェンシーとECマーケティング、住宅業界向け「生成AI対策/LLMO弱点あぶり出し調査」サービスを開始

ニュース概要

大和ハウスグループの広告代理店「伸和エージェンシー」と「ECマーケティング」は、2026年1月15日より、住宅業界向けに生成AIへの最適化を支援する新サービス「生成AI対策/LLMO弱点あぶり出し調査」を開始します。

これに先駆けた調査では、戸建住宅の購入検討者のうち、直接AIを活用して情報収集している人は約3割にのぼり、受動的な影響も含めると実に「7割のユーザー」の行動に生成AIが関与していることが明らかになりました。

引用:大和ハウス工業株式会社

「検索」から「AIへの相談」へ。新時代の標準「LLMO」とは？

今回のニュースで最も重要なキーワードが「LLMO（大規模言語モデル最適化）」です。これは、ChatGPTやGeminiといった生成AIが回答を作る際、自社の情報が引用・参照されやすくするための取り組みを指します。調査によると、住宅検討者の約3割がすでに生成AIを直接使っており、潜在的な影響を含めると全体の70％にも及びます。

これまでの「検索窓に単語を打ち込む」行動から、「AIに具体的な悩みを相談して回答を得る」スタイルへと、消費者の行動が劇的に変化しているのです。AIが推薦するメーカーのリストに入らなければ、検討の土俵にすら乗れないリスクがあります。まずは自社の社名やサービス名をChatGPTなどに投げかけ、「おすすめのハウスメーカーは？」と聞いてみてください。自社が出てこない、あるいは情報が古い場合は、LLMO対策の第一歩として、AIが読み取りやすい「正しい一次情報」をWebサイト上に整理して掲載することから始めましょう。

AIに「選ばれる」ための評価基準と具体的な対策

AIはどのような基準で会社を選んでいるのでしょうか？本サービスで導入される「LLMOファインダビリティスコア」には、8つの評価基準があります。例えば「自社ブランドの認識度」や「Wikipedia・PR TIMESでの露出」など、AIが「信頼できる情報源」として参照しやすい場所での実績が重視されます。特に注目すべきは「比較文脈での出現率」です。AIは「〇〇と△△の違いは？」といった質問に対して、Web上の情報を組み合わせて回答します。

そこで自社の強みが正しく伝わるように、比較表やFAQ（よくある質問）などを構造化データ（AIが理解しやすい形式）で整えておくことが、評価を上げる鍵となります。自社のWebサイトに「お客様からよく聞かれる他社との違い」や「独自の技術解説」を、箇条書きなどを用いて明確に記載しましょう。AIは複雑な文章よりも、整理された構造的なデータを好みます。これだけでAIに見つけてもらえる確率はぐっと高まります。

LLMOスコア採点ガイドライン

評価軸	評価内容
➀ 自社ブランド名の認識度	主要なサービスが何かと聞いた際に自社が紹介されるか
② サービスや商品名の認識度	商品名やサービス名が混同なく認識されているかサービスや商品の特徴が適切に紹介されているか
③ 一次情報としての引用性	技術情報・インタビュー等が情報源として生成AIに使われているか
④ 生成AI回答への引用実績	主要生成AIでの引用件数
⑤ Wikipedia / PR TIMES等の露出	生成AIが参照する信頼性高いメディアでの掲載実績があるか
⑥ 比較文脈での出現率	“おすすめ”や“比較”系の質問で自社ブランドが出現するか
⑦ 構造化データ対応	Schema.orgなど構造化データが整備されているか
⑧ UX要素の独自性	診断機能・インタラクティブUI等、生成AIで代替されにくい体験があるか

参考:大和ハウス工業株式会社

④AppleとGoogleがAIで歴史的提携、次世代SiriにGemini技術を採用

ニュース概要

アップルは、音声アシスタント「Siri」を抜本的に進化させるため、競合であるグーグルとの複数年にわたる提携を発表しました。2026年春に登場予定の次世代Siriの基盤として、グーグルの生成AI「Gemini」が採用されます。これまでアップルは独自のAI開発に苦戦し、他社技術への依存が続いていましたが、今回の提携によりGeminiの高度な対話能力とアップルのプライバシー保護技術を組み合わせた、新しい「Apple Intelligence」が誕生します。

ユーザーの好みを学習し、アプリを横断してタスクをこなす「本当に賢い秘書」の実現に向け、業界の勢力図が大きく動き出しました。

編集部コメント：競合の壁を越えた、戦略的かつ現実的な提携

今回の提携に驚かれた方も多いかもしれませんが、実は両社には深い信頼の土台があります。グーグルは、iPhoneの標準検索エンジンとして採用してもらうために、年間約200億ドル（約3兆円）という巨額の契約金をアップルに支払ってきた背景があるからです。

独自でのAI開発が遅れていたアップルにとって、一から最高峰のモデルを作るよりも、既に実績のあるGeminiを活用することは、2026年春のリリースに間に合わせるための「現実的な英断」といえます。私たちビジネスパーソンにとっても、「自前主義」にこだわらず、最高の成果のために外部の強みを柔軟に取り入れる姿勢は、スピード感が求められる現代において非常に参考になる戦略です。

参考:Google

⑤GeminiがGoogleアプリ連携で進化！新機能「Personal Intelligence」登場

ニュース概要

Googleは、Geminiを「あなた専属の秘書」へと進化させる新機能「Personal Intelligence」を発表しました。最大の特徴は、Gmail、Googleフォト、カレンダーといった複数のGoogleアプリをワンタップで連携させ、AIがあなたの状況や好みを深く理解することにあります。

これまで人間が各アプリを開いて行っていた「情報の確認と統合」をAIが代行し、過去のメールや写真から必要な情報を瞬時に探し出し、最適な提案を行ってくれます。現在は米国でのベータ版提供ですが、AIが「知識を教えるツール」から「あなたの人生をサポートするパートナー」へと変わる大きな転換点となるニュースです。

編集部コメント：「アプリ間の分断」を埋める究極の効率化

私たちは日々、メールで予定を確認し、マップで行き先を調べ、写真で過去の記録を振り返るといった、アプリ間の「反復横跳び」に多くの時間を費やしています。Personal Intelligenceは、この断絶を解消します。例えば、店舗のレジで「自分の車のナンバー」が必要になった際、わざわざ駐車場に戻らなくても、GeminiがGoogleフォトの中から「7桁のナンバープレート」が写った写真を特定し、瞬時に教えてくれます。

これは、AIが単に画像を探すだけでなく、文脈を理解して「推論」しているからです。まずは、ご自身の情報がどのアプリに眠っているかを整理し、AIに「〇〇の情報を探して」と話しかける習慣を持つことから始めてみてください。

参考:Google