تحلیلگران Rosenblatt روز پنجشنبه در گزارشی به بررسی عمیقتری از مدل هوش مصنوعی DeepSeek-R1 پرداختند؛ مدلی که به دلیل هزینه پایین آموزش و عملکرد رقابتیاش توجه گستردهای را در صنعت به خود جلب کرده است.
با اینکه گزارشهای اولیه نشان میدادند که این مدل با هزینهای کمتر از ۶ میلیون دلار و در مدت دو ماه آموزش دیده است، تحلیلگران Rosenblatt معتقدند که هزینه واقعی این فرایند بسیار بالاتر بوده است.
گزارش Rosenblatt :
برآوردهای ما نشان میدهد که هزینههای کلی آموزش DeepSeek-R1 به مراتب بیشتر از ۶ میلیون دلار بوده، چرا که به نظر میرسد این مدل نسخهای بهینهشده از مدل قدیمیتر R1-Zero باشد.
چالشهای اخلاقی و قانونی
یکی از نگرانیهای مطرحشده در این گزارش، منشأ دادههای مورد استفاده در آموزش DeepSeek-R1 است. بر اساس ادعای Rosenblatt، این مدل از خروجیهای مدلهای بزرگتر و پیشرفتهتری مانند OpenAI بهره برده است که ممکن است نقض توافقات خدماتی و مسائل حقوقی را به همراه داشته باشد.
علاوه بر این، Rosenblatt به مسائلی همچون عدم شفافیت در جمعآوری دادهها و جانبداری مدل در ارائه پاسخهایی که مطابق با دیدگاههای چین باشد اشاره کرده است.
تحولی در مقیاسبندی هوش مصنوعی
یکی از ویژگیهای قابلتوجه DeepSeek-R1 استفاده از Test-Time Scaling است، رویکردی نوین در مقیاسبندی هوش مصنوعی که تمرکز پردازشی را از مرحله آموزش به مرحله استنتاج (Inference) منتقل میکند.
گزارش Rosenblatt :
Test-Time Scaling موج بعدی مقیاسبندی هوش مصنوعی خواهد بود، چرا که روشهای سنتی در حال رسیدن به نقطه اشباع هستند.
این روش اخیراً توسط انویدیا (Nvidia) در نمایشگاه CES مورد تأیید قرار گرفته و انتظار میرود که به استاندارد جدیدی در توسعه مدلهای هوش مصنوعی تبدیل شود.
آینده Test-Time Scaling در هوش مصنوعی
Rosenblatt پیشبینی میکند که این رویکرد جدید نهتنها در مدلهای هوش مصنوعی گستردهتر مورد استفاده قرار خواهد گرفت، بلکه بهویژه در حوزه هوش مصنوعی لبهای (Edge AI) تأثیر بسزایی خواهد داشت. با افزایش اهمیت پردازشهای استنتاجی، این تحول میتواند مدلهای آینده را به سمت بهینهسازی مصرف منابع و افزایش کارایی سوق دهد.