DeepSeekはAI界のプロメテウスか?

2025年1月20日、中国のAI開発スタートアップDeepSeek社が、新たな推論モデル 「DeepSeek-R1」 を発表した。このモデルは、現時点での最高性能を誇るOpenAI社のChatGPT-o1モデルに匹敵、あるいは凌駕するとも言われる高い性能を示し、全世界で爆発的に普及した。

性能もさることながら、真に驚くべきはその開発コストの低さである。DeepSeek-R1の開発費用は、ChatGPT-o1のわずか1/10以下とされ、これまでAI開発に不可欠とされてきた巨額の投資が必ずしも必要でないことを示唆している。特に注目されるのは、米国による中国向けGPUの輸出規制のためにDeepSeekが NVIDIAの型落ちGPU「H800」 を使用してモデルの構築に成功した(と言われている)点である。これは、莫大なコストをかけて最先端のGPU、H100やB200を大量投入する米国のAI開発とは対照的である。一部では「GPUの輸出規制」というハンデが却って中国企業の技術向上を促進してしまった、という意見も見られる。

DeepSeek-R1は単にハードウェアの最適化によってコストを削減しただけではなく、モデルの学習方法やアーキテクチャのブレイクスルーにより、技術的にも革新的な手法が取り入れられている。このため、コスト面の優位性に加え、学術的な関心をも引きつけているという側面がある。

これらの優位性によってDeepSeek社は価格破壊レベルの安さでAPIを提供しており、米国のAI事業者の競争力低下が危惧される事態になった。実際、このニュースを受けてNVIDIAの株価は17%程度下落し、約90兆円(トヨタ自動車の時価総額のおよそ2倍)が失われたことが話題になった。またAIの学習に大量のGPUが必要でない可能性が開けたことで、電力消費の増大を見込んでいた電力インフラ関連株も大きく売られた。

しかし現在、DeepSeekがOpenAIの規約に違反して「ChatGPTの出力結果を教師データとしてDeepSeek-R1モデルの訓練に利用している」との報道があり、OpenAIとMicrosoftが調査に乗り出す意向を示している。不正なデータ利用の可能性を受け、米海軍ではセキュリティと倫理的な懸念から業務でのDeepSeekの使用禁止を通達。イタリアではDeepSeekのダウンロードが禁止されるなど、データの安全性が疑問視されるDeepSeekの利用制限に踏み切る動きも出てきている。

今、生成AI開発の舞台で何が起こっているのか、少し整理してみたい。


※お断り:本稿の内容の大半は2025年1月末頃に執筆されたものです。最新の情報を参照するように努めていますが、4月現在では状況が少し変わっている可能性があります。記事の内容そのものは一般論的なものになっていますが、上記の点についてお含みおきください。 “DeepSeekはAI界のプロメテウスか?” の続きを読む

LK-99の追試結果と一連の騒動に関する雑記

前回に続き、先月末の「常温常圧で超伝導現象を示す物質『LK-99』の合成に成功した」というニュースに関する続報をまとめる。騒動の発端となった原著論文が投稿されてから本日でちょうど1ヶ月が経過し、複数の研究チームによる再現実験のデータが集まってきた。本稿では主な追試結果について簡単に紹介する。

“LK-99の追試結果と一連の騒動に関する雑記” の続きを読む

LK-99は本当に常温常圧超伝導を達成しているのか

先月末、「常温常圧で超伝導を示す物質が作成できた」というニュースが飛び込んできた。合成の成功を主張しているのは韓国の高麗大学の研究チームである。超伝導転移温度は歴代最高温度を大幅に塗り替える127℃と報告されており、これが常圧(大気圧)下で超伝導性を発現するとのことである。現在様々な追試が世界中で進められており、ネット世界をリアルタイムで大いに騒がせている。

本稿では、現時点におけるこの周辺の状況について情報を整理したい。

“LK-99は本当に常温常圧超伝導を達成しているのか” の続きを読む

【最適化問題の基礎】ニュートン法で停留点を探す(鞍点と固有値の関係)

前回解説したニュートン法」を用いて曲面上における停留点を探索してみます。今回はその一つである「鞍点」について詳しく考察してみます。化学寄りの話題も含みます。

“【最適化問題の基礎】ニュートン法で停留点を探す(鞍点と固有値の関係)” の続きを読む

【最適化問題の基礎】ニュートン法とヘッセ行列

前回は最も単純な連続最適化の手法の一つである「最急降下法」について解説しました。続いて、本稿では目的関数の勾配の勾配(2次微分)「ヘッセ行列」の情報を使って最適化する「ニュートン法」について解説します。

“【最適化問題の基礎】ニュートン法とヘッセ行列” の続きを読む

【最適化問題の基礎】数理最適化とは何か

ここ数年~十数年のデータ科学の飛躍的な発展により、AIや機械学習が社会で広く認知され、利用されるようになりました。それに伴い、数理最適化の知識とそれを使いこなせる人材がこれまでになく求められる時代となっています。そこで管理人自身の知識整理も兼ねて【最適化問題の基礎】というシリーズで最適化手法についてまとめてみます。

今回は、最適化問題を解くために用いられる数理最適化とはそもそも一体何なのかについて解説していきます。

“【最適化問題の基礎】数理最適化とは何か” の続きを読む

©Copyright 2017-2025 理系のための備忘録 All Rights Reserved.