شرکت چینی DeepSeek که با عرضه نسخه اولیه مدل استدلالی R1 توانسته بود سروصدای زیادی بکند، از مدل متنباز جدیدی با عنوان DeepSeek-R1-0528 رونمایی کرده که قابلیتهای آن در استدلال به اندازه زیادی ارتقا یافته است. از نظر عملکرد، این مدل به o3 از OpenAI و گوگل جمینای 2.5 پرو نزدیکتر شده است.
طبق اطلاعات منتشر شده درباره این مدل، عملکرد DeepSeek-R1-0528 در حوزههایی مانند ریاضیات، علوم و برنامهنویسی بهشکل محسوسی بهبود یافته است.
براساس اطلاعات مدل منتشرشده در پلتفرم هاگینگفیس، DeepSeek-R1-0528 با استفاده از منابع محاسباتی بیشتر و بهینهسازیهای الگوریتمی پس از آموزش، بهبودهای چشمگیری در عملکرد نشان داده است. بهعنوان نمونه، دقت مدل در آزمون AIME 2025 از 70 به 87.5 درصد رسیده و در حوزه برنامهنویسی عملکرد مدل در بنچمارک LiveCodeBench از 63.5 به 73.3 درصد افزایش یافته است. در آزمون دشوار Humanity’s Last Exam نیز دقت آن از 8.5 به 17.7 درصد رسیده است.

نسخه کوچکتر مدل جدید DeepSeek
همزمان با نسخه اصلی، مدل کوچکتری با نام DeepSeek-R1-0528-Qwen3-8B نیز معرفی شده که برای اجرا در سختافزارهای ضعیفتر مناسب است. عملکرد این مدل از Qwen3-8B بهتر بوده و با Qwen3-235B-thinking برابری میکند. اجرای این مدل 8 میلیارد پارامتری در حالت FP16 حداقل به 16 گیگابایت حافظه گرافیکی نیاز دارد.
مانند نسخه قبلی، این مدل متنباز و تحت مجوز MIT منتشر شده و برای استفاده تجاری نیز دردسترس است. نسخه کامل مدل در پلتفرم Hugging Face بارگذاری شده و مستندات کامل آن نیز از گیتهاب و API اختصاصی DeepSeek در دسترس توسعهدهندگان قرار گرفته است. کاربران API دیپسیک نیز خودکار به این نسخه ارتقا پیدا میکنند.
کاربران در شبکههای اجتماعی انتشار این نسخه با استقبال است. کاربری با نام Haider در ایکس، عملکرد مدل را در برنامهنویسی فوقالعاده توصیف کرده و آن را تنها رقیب جدی o3 دانسته است. کاربر دیگری با نام Lisan al Gaib نیز DeepSeek را رقیب مستقیم o3 و Gemini معرفی کرده است.