中国のAIが追いついています:DeepSeekはR1モデルをリリースし、米国の技術リーダーシップに挑戦しています

robot
概要作成中

中国のAI研究所DeepSeekは最近、オープンソース推論モデルDeepSeek-R1をリリースし、業界で広範なフォローを得ています。このモデルは「推論モデル」と呼ばれ、特定のAIベンチマークテストでは、OpenAIのo1に匹敵する性能を持つと言われています。R1はAI開発プラットフォームHugging Faceを介してMITライセンスでリリースされており、ユーザーは制約なしで商業利用することができます。

DeepSeekは、R1はAIME、MATH-500、SWE-bench Verifiedを含むいくつかのベンチマークテストでo1を超えたと主張しています。AIMEは推論能力を評価するために他のモデルを使用し、MATH-500はテキストの問題に焦点を当て、SWE-bench Verifiedはプログラム設計のタスクをテストします。

R1 モデルには利点がありますが、政治的な制約があります

推論モデルとして、R1は独自の自己検証能力を持っており、これにより物理学、科学、数学などの領域での信頼性が従来のモデルよりも優れています。推論モデルは通常、計算時間が数秒から数分かかることがありますが、複雑な問題を処理する際には高い精度が非常に有利です。

技術レポートによると、R1 には 6710 億のパラメータが含まれており、多くの既存のモデルをはるかに上回っています。パラメータの量は通常、モデルの問題解決能力と比例しており、これにより R1 は非常に大規模なモデルとなっています。しかし、D

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • 共有
コメント
0/400
コメントなし
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)