ディープシークのAIアプリ、正答率17% 米欧競合をほぼ下回る

中国の新興企業ディープシークの人工知能(AI)アプリは、ニュースや情報に関する正答率がわずか17%と、米オープンAIの「チャットGPT」やグーグルの「ジェミニ」など米欧の競合との比較では11アプリ中10位だったことが分かった。27日撮影(2025年 ロイター/Dado Ruvic)

[29日 ロイター] - 中国の新興企業ディープシークの人工知能(AI)アプリは、ニュースや情報に関する正答率がわずか17%と、米オープンAIの「チャットGPT」やグーグルの「ジェミニ」など米欧の競合との比較では11アプリ中10位だったことが分かった。情報の信頼性評価を手がける米ニュースガードが29日公表した検証リポートから明らかになった。

ディープシークのアプリはニュース関連の問いかけ(プロンプト)に対して、30%の割合で誤った主張を繰り返し、53%の割合で曖昧または役に立たない回答を返し、不十分な回答の割合は83%となった。

米欧の競合の平均62%よりも悪く、ディープシークがオープンAIの提供するサービスと同等かそれ以上の性能をはるかに低いコストで実現できると主張しているAIの技術に疑問を投げかける結果となった。

ディープシークのアプリは発表から数日で、アップルのアプリ市場「アップストア」で最もダウンロードされたアプリとなった。米国のAIにおける優位性を巡る懸念が浮上し、米国のハイテク株は一時約1兆ドル下落した。

ディープシークはコメント要請にすぐには応じなかった。

ニュースガードによると、評価には米欧アプリに対してと同様300の問いかけを適用。ネット上で広まっている10の虚偽の主張に基づく30のプロンプトも盛り込んだ。

ディープシークのアプリは、問いかけに対する約3割の回答で、中国に関する質問をされていない場合でも中国政府の見解を繰り返した。

中国が直接関係しないアゼルバイジャン航空機の墜落事故に関しても、中国の立場を回答した。

ただ、専門家には、ディープシークは、同等のAIモデルの30分の1のコストであらゆる質問に答えられる点で画期的だ、との指摘も出ている。

私たちの行動規範:トムソン・ロイター「信頼の原則」, opens new tab

関連記事: