「DeepSeekショック」から1年、相次ぐ大規模障害で露呈した厳しい現状と今後 / 12/23(火) / ZDNET Japan
12月11日、DeepSeekでまた4時間にわたる大規模なシステム障害が発生した。1月には「DeepSeekショック」と呼ばれるほどの注目を集めた同サービスだが、システム障害は今回が初めてではない。2025年内だけでも、1月26~27日、2月6~8日、5月13日、8月11日と、同様の事態が頻発している。
今回の障害により、ウェブ版やアプリケーションからの応答遅延や利用不能が生じただけでなく、過去の利用履歴が消失する事態も発生した。さらに、法人向けのアプリケーションプログラミングインターフェース(API)にも影響が及び、サービスが停止した。
1日当たりのアクティブユーザー数(DAU)が3000万を超えると言われるDeepSeekだが、システムの不安定さを露呈したことで、中国のソーシャルネットワーキングサービス(SNS)上では「#DeepSeek崩了#」というハッシュタグが拡散された。利用者からは、字節跳動(バイトダンス)が提供する「豆包(ドウバオ)」など、他社製品への移行を検討する声も上がっている。
個人ユーザーにとって、レポート作成やコーディング、学習など幅広い用途で不可欠なツールが突如停止すれば、作業効率は大幅に低下する。しかし、より深刻なのは企業ユーザーへの影響である。APIの呼び出し成功率が一時的にほぼゼロまで落ち込んだことで、カスタマーサービスの自動応答や自動コンテンツ生成、投資調査、分析ツールなど、ビジネスチェーン全体が停止、または著しい遅延に見舞われた。
実際に、DeepSeek APIに依存したシステムを運用するスマートカスタマーサービスソリューション企業では、顧客からの苦情が500%増加し、200万元を超える直接的な経済損失が発生したと公表している。これら企業の一部は他社製モデルや自社開発ツールへの緊急切り替えを余儀なくされ、移行コストや正常稼働に向けた対応に追われた。DeepSeekは地方政府や医療機関にも導入されていることから、障害の影響はスマートシティーや行政サービスといった公共インフラにまで波及しているようだ(参考記事)。
インフラとしての信頼性が損なわれれば、ユーザーの評価は「予備的なツール」へと格下げされる。最新のユーザー数は公表されていないが、6月時点の訪問者数は、年初のピーク時と比較して30%近く減少していることが確認されている。
DeepSeekは過去の障害理由について「急激なトラフィック増、システムアップグレード、インフラの変動」と説明している。1月には「DeepSeek-R1」モデルのリリース後、わずか7日間でDAUが3000万人に急増した。これは当初計画されていた3カ月の拡張サイクルを大幅に上回る推移であり、サーバーリソースの割り当てに深刻な遅延を招いた。
関係者によると、当時のデータセンターにおけるCPU使用率は長時間にわたり95%を超え、メモリースワップが頻繁に発生するリソース枯渇状態に陥っていたという。また、8月の障害は次世代モデルへの期待によるアクセス増、今回の障害は「DeepSeek-V3.2」のリリース後に発生している。
同社の強みであるオープンソース戦略も、インフラ面では負荷増大の要因となった。MITライセンスで公開されたR1モデルは、開発者エコシステムと企業導入を急速に拡大させた。その結果、パブリックサービスとエンタープライズ双方の膨大なリクエストを同時に処理する必要が生じた。さらに、一部のサードパーティーがスクリプトを用いてAPIを過度に呼び出し、リソースを不当に奪取しようとしたことが、サーバー負荷を一層悪化させた。
DeepSeekは1万2000枚のGPUを導入してクラスターを構築しているが、ピーク時のタスクキュー遅延は10分を超え、ノード間のデータ転送におけるパケット損失率は3%に達した。これによりシステムの保護メカニズムが作動し、サービス停止に至ったという。同社にとってさらなる障壁となっているのが、米国政府による輸出規制だ。インフラを強化したくても、NVIDIA製の最新製品を購入できない状況にある。
今後、DeepSeekが画像生成に加え動画生成機能などを拡張すれば、コンピューティング能力への需要はさらに増大する。グローバルユーザーの期待に応えるためには、膨大な資金とインフラの先行準備が不可欠だ。しかし、モデル精度の完全な解決やマルチモーダル機能の拡張が遅れる間に、資金と人材で勝る阿里巴巴(アリババ)や騰訊(テンセント)といったIT大手が台頭し、競争は激化している。年初に脚光を浴びたDeepSeekは今、極めて厳しい現実に直面している。
山谷剛史(やまや・たけし)
フリーランスライター
2002年から中国雲南省昆明市を拠点に活動。中国、インド、ASEANのITや消費トレンドをIT系メディア、経済系メディア、トレンド誌などに執筆。メディア出演、講演も行う。著書に『日本人が知らない中国ネットトレンド2014』『新しい中国人 ネットで団結する若者たち』など。
https://news.yahoo.co.jp/articles/863e790149106d6cf4353c684622993c318f44de
'DeepSeek 쇼크'로부터 1년, 연이은 대규모 장애로 드러난 어려운 상황과 앞으로 / 12/23(화) / ZDNET Japan
지난 12월 11일 DeepSeek에서 또 4시간에 걸친 대규모 시스템 장애가 발생했다. 1월에는 딥 식 쇼크로 불릴 정도로 주목을 받았던 이 서비스지만 시스템 장애는 이번이 처음은 아니다. 2025년 내에만 해도 1월 26~27일, 2월 6~8일, 5월 13일, 8월 11일로 비슷한 사태가 빈발하고 있다.
이번 장애로 웹판이나 애플리케이션에서 응답 지연이나 이용 불능이 생겼을 뿐만 아니라 과거 이용 이력이 소실되는 사태도 발생했다. 또한 법인용 애플리케이션 프로그래밍 인터페이스(API)에도 영향을 미쳐 서비스가 정지됐다.
하루 활성 사용자 수(DAU)가 3000만이 넘는다는 딥씨크(DeepSeek)지만 시스템의 불안정을 드러내면서 중국 소셜네트워킹서비스(SNS)상에서는 #DeepSeek붕괴#라는 해시태그가 확산됐다. 이용자로부터는, 자막 뜀틀(바이트 댄스)이 제공하는 「도우바오」 등, 타사 제품으로의 이행을 검토하는 소리도 오르고 있다.
개인 유저에게 있어서, 리포트 작성이나 코딩, 학습 등 폭넓은 용도로 불가결한 툴이 갑자기 정지하면, 작업 효율은 큰폭으로 저하된다. 그러나, 보다 심각한 것은 기업 유저에의 영향이다. API 호출 성공률이 일시적으로 거의 제로로 떨어짐에 따라 고객 서비스 자동응답과 자동 콘텐츠 생성, 투자 조사, 분석 도구 등 비즈니스 체인 전체가 정지 또는 현저한 지연을 겪었다.
실제로 DeepSeek API에 의존한 시스템을 운용하는 스마트 고객 서비스 솔루션 기업에서는 고객 불만이 500% 증가해 200만 위안이 넘는 직접적인 경제 손실이 발생했다고 공표하고 있다. 이러한 기업의 일부는 타사제 모델이나 자사 개발 툴에의 긴급 전환을 피할 수 없게 되어, 이행 코스트나 정상가동을 향한 대응에 쫓겼다. DeepSeek는 지방 정부나 의료 기관에도 도입되고 있는 것부터, 장해의 영향은 스마트 시티나 행정 서비스라고 하는 공공 인프라에까지 파급하고 있는 것 같다(참고 기사).
인프라로서의 신뢰성이 훼손되면 이용자의 평가는 예비적인 도구로 격하된다. 최신 유저수는 공표되지 않았지만, 6월 시점의 방문자수는, 연초의 피크시와 비교해 30% 가까이 감소하고 있는 것이 확인되고 있다.
DeepSeek는 과거 장애 이유에 대해 "급격한 트래픽 증가, 시스템 업그레이드, 인프라 변동"이라고 설명하고 있다. 지난 1월에는 'DeepSeek-R1' 모델 출시 후 불과 7일 만에 DAU가 3000만명으로 급증했다. 이는 당초 계획된 3개월의 확장 사이클을 크게 웃도는 추이로, 서버 자원 할당에 심각한 지연을 초래했다.
관계자에 의하면, 당시의 데이터 센터에 있어서의 CPU 사용율은 장시간에 걸쳐 95%를 넘어, 메모 리스 스왑이 빈번히 발생하는 자원 고갈 상태에 빠져 있었다고 한다. 또, 8월의 장해는 차세대 모델에의 기대에 의한 액세스 증가, 이번 장해는 「DeepSeek-V3.2」의 발매 후에 발생하고 있다.
이 회사의 강점인 오픈소스 전략도 인프라 측면에서는 부하 증대 요인이 됐다. MIT 라이선스로 공개된 R1 모델은 개발자 생태계와 기업 도입을 빠르게 확대시켰다. 그 결과 퍼블릭 서비스와 엔터프라이즈 양측의 방대한 요청을 동시에 처리할 필요가 생겼다. 여기에 일부 서드파티가 스크립트를 이용해 API를 과도하게 불러내 리소스를 부당하게 탈취하려 한 것이 서버 부하를 한층 악화시켰다.
DeepSeek 는 12,000장의 GPU를 도입해 클러스터를 구축하고 있는데 피크 시 태스크큐 지연은 10분을 넘었고 노드 간 데이터 전송에서의 패킷 손실률은 3%에 달했다. 이로 인해 시스템의 보호 메커니즘이 작동해 서비스 정지에 이르렀다고 한다. 동사에 있어서 한층 더 장벽이 되고 있는 것이, 미국 정부에 의한 수출 규제다. 인프라를 강화하고 싶어도 엔비디아 제품의 최신 제품을 구매할 수 없는 상황이다.
앞으로 DeepSeek가 이미지 생성에 더해 동영상 생성 기능 등을 확장하면 컴퓨팅 능력에 대한 수요는 더욱 커진다. 글로벌 사용자들의 기대에 부응하기 위해서는 막대한 자금과 인프라의 선행 준비가 필수적이다. 그러나, 모델 정밀도의 완전한 해결이나 멀티 모달 기능의 확장이 늦어지는 사이에, 자금과 인재에서 나는 아리바(알리바바)나 텅쉰(텐센트)이라고 하는 IT대기업이 대두해, 경쟁은 격화하고 있다. 연초 각광받았던 DeepSeek는 지금 지극히 어려운 현실에 직면해 있다.
야마야 타케시(山谷剛史) / 프리랜서 작가
2002년부터 중국 윈난성 쿤밍시를 거점으로 활동. 중국, 인도, ASEAN의 IT나 소비 트랜드를 IT계 미디어, 경제계 미디어, 트랜드지 등에 집필. 미디어 출연, 강연도 실시한다. 저서로 일본인이 모르는 중국 인터넷 트렌드 2014 새로운 중국인 인터넷으로 뭉치는 젊은이들' 등.