2025年1月20日、中国のAI開発スタートアップDeepSeek社が、新たな推論モデル 「DeepSeek-R1」 を発表した。このモデルは、現時点での最高性能を誇るOpenAI社のChatGPT-o1モデルに匹敵、あるいは凌駕するとも言われる高い性能を示し、全世界で爆発的に普及した。
性能もさることながら、真に驚くべきはその開発コストの低さである。DeepSeek-R1の開発費用は、ChatGPT-o1のわずか1/10以下とされ、これまでAI開発に不可欠とされてきた巨額の投資が必ずしも必要でないことを示唆している。特に注目されるのは、米国による中国向けGPUの輸出規制のためにDeepSeekが NVIDIAの型落ちGPU「H800」 を使用してモデルの構築に成功した(と言われている)点である。これは、莫大なコストをかけて最先端のGPU、H100やB200を大量投入する米国のAI開発とは対照的である。一部では「GPUの輸出規制」というハンデが却って中国企業の技術向上を促進してしまった、という意見も見られる。
DeepSeek-R1は単にハードウェアの最適化によってコストを削減しただけではなく、モデルの学習方法やアーキテクチャのブレイクスルーにより、技術的にも革新的な手法が取り入れられている。このため、コスト面の優位性に加え、学術的な関心をも引きつけているという側面がある。
これらの優位性によってDeepSeek社は価格破壊レベルの安さでAPIを提供しており、米国のAI事業者の競争力低下が危惧される事態になった。実際、このニュースを受けてNVIDIAの株価は17%程度下落し、約90兆円(トヨタ自動車の時価総額のおよそ2倍)が失われたことが話題になった。またAIの学習に大量のGPUが必要でない可能性が開けたことで、電力消費の増大を見込んでいた電力インフラ関連株も大きく売られた。
しかし現在、DeepSeekがOpenAIの規約に違反して「ChatGPTの出力結果を教師データとしてDeepSeek-R1モデルの訓練に利用している」との報道があり、OpenAIとMicrosoftが調査に乗り出す意向を示している。不正なデータ利用の可能性を受け、米海軍ではセキュリティと倫理的な懸念から業務でのDeepSeekの使用禁止を通達。イタリアではDeepSeekのダウンロードが禁止されるなど、データの安全性が疑問視されるDeepSeekの利用制限に踏み切る動きも出てきている。
今、生成AI開発の舞台で何が起こっているのか、少し整理してみたい。
※お断り:本稿の内容の大半は2025年1月末頃に執筆されたものです。最新の情報を参照するように努めていますが、4月現在では状況が少し変わっている可能性があります。記事の内容そのものは一般論的なものになっていますが、上記の点についてお含みおきください。 “DeepSeekはAI界のプロメテウスか?” の続きを読む