DeepSeek社は1月20日に同社の提供する最新LLM「DeepSeek-R1」をリリースしました。
DeepSeek-R1は性能や価格でChatGPT-o1を上回る反面、注意しなければならないリスクも抱えています。
本記事では、DeepSeek-R1の概要や特徴、抱えるリスクについて詳しく解説します。
DeepSeekとは
DeepSeekは、2023年に趙 永剛(Zhao Yongang)氏によって設立された、中国のAI企業です。
DeepSeekの提供する大規模言語モデル(LLM)の性能は、OpenAIやGoogleの提供するLLMの性能を一部上回る性能を記録しています。
本企業は中国の投資ファンドである「幻方量化(High-Flyer Capital Management)」の支援を受けており、幻方量化が培った金融領域での機械学習ノウハウを生成AI研究に活用しています。
DeepSeek-R1とは
DeepSeek-R1は、DeepSeekが生成AIの最新モデルです。
Mixture-of-Experts (MoE)と呼ばれるアーキテクチャを利用している、一つの前のモデル「DeepSeek-V3」に強化学習を直接行うことにより、推論能力が大幅に向上しています。
DeepSeekが実施した、各種モデルのベンチマーク評価結果では、推論・数学・コーディングの3項目でOpenAIの「OpenAI-o1」の性能に匹敵、上回るスコアを記録しています。

引用:DeepSeek
また、「蒸留モデル」と呼ばれる、DeepSeek-R1-Distillも優れたパフォーマンスを発揮します。
DeepSeek-R1-Distillは、DeepSeek-R1の推論データを用いて、LlaMa3などのモデルを微調整することで、軽量化を行ったモデルです。
このモデルのベンチマーク評価では、「OpenAI-o1-mini」の能力を上回る結果を記録しています。

引用:DeepSeek
DeepSeek-R1は、どのバージョンでも今までのLLMの性能を上回る性能を持っていると言えます。
DeepSeek-R1の3つの特徴
DeepSeek-R1の特に注目すべき特徴は以下の3点です
- 推論・数学・コーディングの能力でChatGPT-o1に匹敵
- オープンソースでの利用が可能
- API利用価格が安価
この3点について解説します。
①推論・数学・コーディングの能力でChatGPT-o1に匹敵
先掲のベンチマーク結果の通り、DeepSeek-R1はChatGPT-o1に匹敵する能力を持っています。
試しにその推論能力を使ってみると、深く思考し、非常に精緻な回答を出力できることが確認できました。
プロンプト:
「生成AI導入を行いたいが、できていない」という状況に現在置かれている企業の課題を深堀して
・ペルソナ
・どんな課題があって導入ができていないのか
・解決策は何なのか
出力結果:

推論能力は当然ながら、「生成AIによる仕事の代替」に対する人間特有の定性的な感覚を「生成AI導入の課題」として捉え、効果の高い施策を考えることができており、推論の観点の幅広さも非常に優秀と言えます。
②オープンソースでの利用が可能
DeepSeek-R1はgithub上に公開されている、オープンソースモデルです。
そのため、ローカル環境で本モデルを構築し、自社向けにカスタムした生成AIとしてセキュアな環境で使用することができます。
情報漏洩等のセキュリティリスクが懸念点となる生成AIで、高性能モデルが安全な環境で利用できることは非常に重要です。
また、DeepSeek自体が持つリスクの観点からも、ローカル環境での構築が最もオススメの方法です。
③API利用価格が安価
DeepSeek-R1は、APIの利用料金がOpenAI-o1を利用したときと比べ、9割近く安い値段で使用することができます。
トークン(100万当たり) | OpenAI-o1 | DeepSeek-R1 |
入力トークン(キャッシュ有) | $7.50 | $0.14 |
入力トークン(キャッシュ無) | $15.00 | $0.55 |
出力トークン | $60.00 | $2.19 |
DeepSeek-R1の利用方法
DeepSeekの利用方法には3つの方法があります。
簡単にそれぞれの方法について解説します。
①Webページから利用
一番簡単な方法はWebページ、スマホアプリから利用する方法です。
以下の画面から、「Start Now」を選択し、初めてであれば「Sign Up」を選択します。

※社用メールアドレスだと登録時にエラーが発生する可能性があります。
②API連携で利用
DeepSeekはOpenAI互換のAPIを提供しています。
リンク先ページでアカウントを開設後、APIキーを取得することでDeepSeek-R1を使用することができます。
③ローカル環境で利用
DeepSeek-R1はgithub上にソースコードが公開されているため、ローカル環境での構築・活用ができます。
後述するDeepSeekが抱えるリスクの観点からも、可能であれば、ローカル環境での利用が最もおすすめです。
DeepSeek-R1が抱える4つのリスク
モデル性能・価格ともにトップクラスの性能を持つDeepSeek-R1ですが、使用時に注意しなければならないリスクも存在します。
- 入力データの取り扱いに関するリスク
- 中国企業であることのリスク
- 規約が不透明であることのリスク
この4つのリスクについて解説します。
①入力データの取り扱いに関するリスク
DeepSeekは利用規約内で、入力されたデータをモデル学習に使用する旨を明記しています。
また、オプトアウト(申請)に関する明確な言及がなく、データの保存期間も長期にわたる可能性があります。
そのため、自分が入力したデータが第三者への回答として利用されるリスクや、DeepSeek自体へのサイバー攻撃による情報漏洩のリスクなどが予想されます。
DeepSeek-R1を使用する際は、「公開情報」の入力のみに限定し、機密性の高い情報を入力しないようにしてください。
②中国企業であることのリスク
中国では、「国家情報法」により、中国政府の諜報活動への個人・企業の協力が義務化されています。
中国政府からの要請があった場合、DeepSeekは情報の開示を行うため、DeepSeekの保有するユーザーとその入力データが中国政府に検閲・収集されるリスクがあります。
また、中国的なイデオロギーが反映されている可能性があり、偏見に基づく誤回答(ハルシネーション)を引き起こす可能性があるため、十分注意して使用してください。
参考:ITmedia
③規約が不透明であることのリスク
DeepSeekの利用に際して、最も危険であるのは「利用規約・プライバシーポリシーが不透明であること」によるリスクです。
例えば、入出力データに関する条項(利用規約4.1条)では、以下のような記載があります。
You are responsible for all Inputs you submit to our Services and corresponding Outputs. By submitting Inputs to our Services, you represent and warrant that you have all rights, licenses, and permissions that are necessary for us to process the Inputs under our Terms. You also represent and warrant that your submitting Inputs to us and corresponding Outputs will not violate our Terms, or any laws or regulations applicable to those Inputs and Outputs.
引用:DeepSeek
入出力に関係するデータに関する責任は全て利用者が負うこととなるという旨の表記ですが、どの程度のレベルで権利侵害を起こし、訴訟に発展する可能性があるのかが不透明です。
また、知的財産権に関する表記も非常に抽象的です。
DeepSeek is the developer and operator of this service and holds all rights within the scope permitted by laws and regulations to this service (including but not limited to software, technology, programs, code, model weights, user interfaces, web pages, text, graphics, layout designs, trademarks, electronic documents, etc.), including but not limited to copyrights, trademark rights, patent rights, and other intellectual property rights. However, this excludes rights that relevant rights holders are entitled to under legal provisions or the terms of this agreement (such as Inputs and Outputs).
引用:DeepSeek
利用規約によると、DeepSeekの提供するモデルが生成したコンテンツは全てDeepSeek社に帰属し、そのコンテンツを無断で使用・複製・表示することが禁止されています。
また、この規約に違反した場合、DeepSeek社からの法的措置の可能性も示唆されています。
この表記に関しても、どこまでの二次利用が不可能であるのかが不明確です。
まとめ
ここまでDeepSeekとその最新モデル、DeepSeek-R1について解説しました。
まとめは以下の通りです。
- DeepSeek-R1の特徴: 最新の大規模言語モデルで、推論・数学・コーディング能力がChatGPT-o1に匹敵し、オープンソースかつ低価格で利用可能。
- リスク要因: 入力データの取り扱いや中国企業であること、規約の不透明さなどのリスクがあり、特にデータの第三者利用や情報開示の可能性が懸念される。
- 利用方法: Webページ、API連携、ローカル環境での構築の3つの方法があり、ローカル利用が推奨されている。
注意点はあるものの、非常に優れたモデルであるため、使用する際は利用規約をよく読み、ご活用ください。