دیپ‌سیک V۳.۱ آمد؛ هوش مصنوعی که جای یک کتاب قطور با شما حرف می‌زند

دیپ‌سیک V3.1 آمد؛ هوش مصنوعی که جای یک کتاب قطور با شما حرف می‌زند

استارتاپ چینی دیپ‌سیک نسخه جدید مدل هوش مصنوعی خود را با نام DeepSeek V3.1 منتشر کرد.

استارتاپ چینی دیپ‌سیک نسخه جدید مدل هوش مصنوعی خود را با نام DeepSeek V3.1 منتشر کرد. این مدل متن‌باز و قدرتمند توانایی پردازش حجم بسیار بالایی از متن و انجام محاسبات کدنویسی پیچیده را دارد و با معماری ترکیبی خود، گفت‌وگو، استدلال و کدنویسی را در یک سیستم واحد ارائه می‌دهد.

انتشار مدل V3.1 و ویژگی‌های جدید

DeepSeek روز سه‌شنبه در پیامی کوتاه برای یکی از گروه‌های کاربری خود در پیام‌رسان وی‌چت، از انتشار مدل V3.1 خبر داد. مهم‌ترین تغییر این نسخه، افزایش پنجره متنی (Context Window) به ۱۲۸ هزار توکن است؛ یعنی مدل می‌تواند در هر تعامل با کاربر اطلاعاتی به اندازه تقریباً یک کتاب ۳۰۰ صفحه‌ای را نگهداری کند.

با این حال، شرکت این به‌روزرسانی را در شبکه‌های اجتماعی عمومی خود از جمله حساب X اعلام نکرد که بسیار جای تعجب دارد. حذف ارجاع به مدل R1 از قابلیت «تفکر عمیق» نیز پرسش‌هایی درباره پیشرفت مدل نسل بعدی R2 ایجاد کرده که چینی‌ها هیچ توضیح خاصی در مورد آن ارائه نداده‌اند.

پیشینه و جایگاه DeepSeek در بازار

DeepSeek که توسط لیانگ وِن‌فنگ، کارآفرین و مدیر یک شرکت معامله‌گری کمّی، به‌عنوان پروژه جانبی تأسیس شد، با انتشار V3 در دی ماه گذشته و سپس مدل R1 در بهمن ماه 1403، توجهات گسترده‌ای در ابعاد جهانی را به سمت این مدل و شرکت دیپ سیک جلب کرد. مضاف بر آن، این موفقیت موجی از پذیرش مدل‌های متن‌باز هوش مصنوعی در چین را به دنبال داشت. با این حال، شرکت DeepSeek تا به امروز هیچ زمان‌بندی توسعه یا برنامه‌ای برای مدل‌های آینده ارائه نکرده است.

در ماه‌های اخیر، این استارتاپ کم‌حاشیه، کاربران خود را از دست داده است. علت اصلی این تغییرات آن است که مدل‌های متن‌باز شرکت‌های بزرگ‌تر چینی، مانند خانواده Qwen از گروه علی‌بابا، در میان کسب‌وکارها و مصرف‌کنندگان محبوبیت یافته‌اند. یکی از دلایل این کاهش محبوبیت، محدودیت DeepSeek در ارائه مدل‌های صرفاً متنی است، در حالی که رقبا قابلیت‌های چندرسانه‌ای و برنامه‌نویسی خود را گسترش داده‌اند.

طبق داده‌های پلتفرم رایانش ابری چینی PPIO، سهم DeepSeek از استفاده مدل‌های متن‌باز در سه‌ماهه اول سال 2025 بیش از ۹۹ درصد بود، اما تا خرداد ماه گذشته به حدود ۸۰ درصد کاهش یافت؛ در حالی که استفاده از مدل‌های Qwen علی‌بابا در اواخر اردیبهشت ماه از DeepSeek پیشی گرفت.

گزارش‌های اخیر نشان می‌دهد مدل متن‌باز Kimi-K2-Instruct که توسط استارتاپ MoonShot AI وابسته به علی‌بابا توسعه یافته نیز در سطح جهانی با استقبال مواجه شده است.

deepseek-3.1-02.jpg

ویژگی‌های برجسته DeepSeek V3.1

مدل V3.1 دیپ سیک، اولین بازنگری اصلی V3 از اسفند ماه گذشته تا به امروز بوده و اکنون در Hugging Face، بزرگ‌ترین جامعه متن‌باز هوش مصنوعی، در دسترس است. برخی آزمایش‌های مستقل نشان می‌دهد که توانایی‌های برنامه‌نویسی مدل بهبود یافته است.

بنابر گزارش SCMP، معیار Aider که قابلیت‌های برنامه‌نویسی هوش مصنوعی مدل‌ها را ارزیابی می‌کند، V3.1 را به عنوان بهترین مدل چینی معرفی کرده است. با این حال، در مقایسه با رقبای بین‌المللی، V3.1 همچنان عقب‌تر از Claude Opus 4 است، که به عنوان یکی از برترین مدل‌های برنامه‌نویسی هوش مصنوعی شناخته می‌شود.

deepseek-3.1-03.jpg

همچنین بررسی شبکه‌های اجتماعی چینی نشان می‌دهد که برخی کاربران از به‌روزرسانی ناامید شده‌اند. لیو کانگ، پژوهشگر علوم کامپیوتر از نانجینگ، در اظهار نظری اظهار داشت که V3.1 در مقایسه با مدل R1-0528 تغییری در قابلیت‌های استدلالی ایجاد نکرده و به نظر می‌رسد ترکیبی از توانایی‌های استدلالی و غیر استدلالی باشد. کاربر Hugging Face با نام «smile1030» نیز کاهش کیفیت تولید متن و سانسور شدید را گزارش کرده است.

دیپ سیک V3.1 تا 68 برابر ارزان‌تر از غول‌های آمریکایی

بنابر گزارش Venturebeat، مدل DeepSeek V3.1 دستاوردهای مهندسی قابل توجهی ارائه می‌دهد که انتظارات از عملکرد مدل‌های هوش مصنوعی را بازتعریف می‌کند. سیستم قادر است تا ۱۲۸ هزار توکن را پردازش کند (تقریباً معادل یک کتاب ۴۰۰ صفحه‌ای) و در عین حال سرعت پاسخ‌دهی بسیار بالایی دارد. مدل از قالب‌های دقت چندگانه، از BF16 استاندارد تا FP8 آزمایشی، پشتیبانی می‌کند تا توسعه‌دهندگان بتوانند عملکرد را با محدودیت‌های سخت‌افزاری خود بهینه کنند.

نوآوری اصلی در آنچه DeepSeek «معماری ترکیبی» می‌نامد نهفته است. برخلاف تلاش‌های قبلی برای ترکیب قابلیت‌های مختلف هوش مصنوعی که اغلب منجر به عملکرد ضعیف می‌شد، مدل V3.1 گفت‌وگو، استدلال و برنامه‌نویسی را در یک مدل منسجم ادغام کرده است.

البته واکنش‌های مثبت هم به عملکرد این مدل، رصد شده‌اند. برای مثال، پژوهشگر اندرو کریستینسون نیز در همین زمینه توییتی را در حساب خود در X منتشر کرده و می‌گوید:

DeepSeek V3.1 در معیار Aider غیر استدلالی، امتیاز ۷۱.۶ درصد کسب کرده است، یک درصد بالاتر از Claude Opus 4 و در عین حال ۶۸ برابر ارزان‌تر.

در حالت کلی باید بگوییم که تحلیل‌های مختلف منتشر شده توسط جامعه کاربران نشان می‌دهد که مدل 3.1 دیپ سیک با داشتن نوآوری‌های فنی پیچیده‌ای مانند چهار توکن ویژه برای جست‌وجوی وب در زمان واقعی و انجام فرآیندهای استدلال داخلی، از جمله پیشرفته‌ترین مدل‌های هوش مصنوعی رونمایی شده تا به امروز است.

بهینه‌سازی هزینه و اثربخشی

مدل V3.1 با هزینه حدود ۱.۰۱ دلار برای هر وظیفه برنامه‌نویسی کامل، عملکردی مشابه سیستم‌های تقریباً ۷۰ دلاری ارائه می‌دهد. برای کسب‌وکارهایی که هزاران تعامل روزانه با هوش مصنوعی دارند، این تفاوت هزینه می‌تواند میلیون‌ها دلار صرفه‌جویی ایجاد کند.

در نظر داشته باشید که گزارش اخیر Financial Times نشان می‌دهد که DeepSeek به دلیل چالش‌های آموزش مدل با تراشه‌های Ascend شرکت Huawei، عرضه مدل R2 را به تأخیر انداخته است. طبق این گزارش، استارتاپ با «مشکلات فنی مداوم» روبه‌رو بوده است. مدل اصلی V3 با استفاده از ۲,۰۴۸ تراشه Nvidia H800 آموزش دیده بود.

تغییر پارادایم: هوش واقعاً مصنوعی

ظهور DeepSeek V3.1 فقط یک پیشرفت فناورانه نیست؛ این مدل نشان می‌دهد هوش مصنوعی می‌تواند هم پیشرفته باشد و هم در دسترس همه قرار گیرد. تا پیش از این، بهترین سیستم‌های هوش مصنوعی معمولاً پشت محدودیت‌های اقتصادی و جغرافیایی پنهان بودند و دسترسی به آن‌ها دشوار بود.

دیپ‌سیک ثابت کرده که می‌توان همزمان قدرت بالا و دسترسی آزاد داشت. این یعنی محدودیت‌هایی که قبلاً مانع استفاده از هوش مصنوعی می‌شدند، بیشتر ساخته انسان بوده‌اند و اجتناب‌ناپذیر نبوده‌اند.

طنز ماجرا این است که در مسیر ساخت هوش مصنوعی پیشرفته، دیپ‌سیک نشان داده بسیاری از سدها و محدودیت‌های صنعت نیز مصنوعی را می‌توان به راحتی از میان برداشت. کاربران و تحلیل‌گران انتظار دارند که با انتشار نسخه‌های بعدی، مانند V4، تحولات بسیار بزرگ‌تری در راه باشد.

رقابت جهانی هوش مصنوعی حالا تغییر کرده و دیگر فقط بحث قدرت سیستم‌ها نیست، بلکه دسترس‌پذیری آن‌ها برای همه اهمیت پیدا کرده است. در این مسیر، محدودیت‌های مصنوعی شاید بزرگ‌ترین چالش هوش مصنوعی به حساب بیایند.

منبع: شهر سخت افزار

سایر اخباردانش و فناوریرا از اینجا دنبال کنید.