دیپسیک V۳.۱ آمد؛ هوش مصنوعی که جای یک کتاب قطور با شما حرف میزند

استارتاپ چینی دیپسیک نسخه جدید مدل هوش مصنوعی خود را با نام DeepSeek V3.1 منتشر کرد.
استارتاپ چینی دیپسیک نسخه جدید مدل هوش مصنوعی خود را با نام DeepSeek V3.1 منتشر کرد. این مدل متنباز و قدرتمند توانایی پردازش حجم بسیار بالایی از متن و انجام محاسبات کدنویسی پیچیده را دارد و با معماری ترکیبی خود، گفتوگو، استدلال و کدنویسی را در یک سیستم واحد ارائه میدهد.
انتشار مدل V3.1 و ویژگیهای جدید
DeepSeek روز سهشنبه در پیامی کوتاه برای یکی از گروههای کاربری خود در پیامرسان ویچت، از انتشار مدل V3.1 خبر داد. مهمترین تغییر این نسخه، افزایش پنجره متنی (Context Window) به ۱۲۸ هزار توکن است؛ یعنی مدل میتواند در هر تعامل با کاربر اطلاعاتی به اندازه تقریباً یک کتاب ۳۰۰ صفحهای را نگهداری کند.
با این حال، شرکت این بهروزرسانی را در شبکههای اجتماعی عمومی خود از جمله حساب X اعلام نکرد که بسیار جای تعجب دارد. حذف ارجاع به مدل R1 از قابلیت «تفکر عمیق» نیز پرسشهایی درباره پیشرفت مدل نسل بعدی R2 ایجاد کرده که چینیها هیچ توضیح خاصی در مورد آن ارائه ندادهاند.
پیشینه و جایگاه DeepSeek در بازار
DeepSeek که توسط لیانگ وِنفنگ، کارآفرین و مدیر یک شرکت معاملهگری کمّی، بهعنوان پروژه جانبی تأسیس شد، با انتشار V3 در دی ماه گذشته و سپس مدل R1 در بهمن ماه 1403، توجهات گستردهای در ابعاد جهانی را به سمت این مدل و شرکت دیپ سیک جلب کرد. مضاف بر آن، این موفقیت موجی از پذیرش مدلهای متنباز هوش مصنوعی در چین را به دنبال داشت. با این حال، شرکت DeepSeek تا به امروز هیچ زمانبندی توسعه یا برنامهای برای مدلهای آینده ارائه نکرده است.
در ماههای اخیر، این استارتاپ کمحاشیه، کاربران خود را از دست داده است. علت اصلی این تغییرات آن است که مدلهای متنباز شرکتهای بزرگتر چینی، مانند خانواده Qwen از گروه علیبابا، در میان کسبوکارها و مصرفکنندگان محبوبیت یافتهاند. یکی از دلایل این کاهش محبوبیت، محدودیت DeepSeek در ارائه مدلهای صرفاً متنی است، در حالی که رقبا قابلیتهای چندرسانهای و برنامهنویسی خود را گسترش دادهاند.
طبق دادههای پلتفرم رایانش ابری چینی PPIO، سهم DeepSeek از استفاده مدلهای متنباز در سهماهه اول سال 2025 بیش از ۹۹ درصد بود، اما تا خرداد ماه گذشته به حدود ۸۰ درصد کاهش یافت؛ در حالی که استفاده از مدلهای Qwen علیبابا در اواخر اردیبهشت ماه از DeepSeek پیشی گرفت.
گزارشهای اخیر نشان میدهد مدل متنباز Kimi-K2-Instruct که توسط استارتاپ MoonShot AI وابسته به علیبابا توسعه یافته نیز در سطح جهانی با استقبال مواجه شده است.
ویژگیهای برجسته DeepSeek V3.1
مدل V3.1 دیپ سیک، اولین بازنگری اصلی V3 از اسفند ماه گذشته تا به امروز بوده و اکنون در Hugging Face، بزرگترین جامعه متنباز هوش مصنوعی، در دسترس است. برخی آزمایشهای مستقل نشان میدهد که تواناییهای برنامهنویسی مدل بهبود یافته است.
بنابر گزارش SCMP، معیار Aider که قابلیتهای برنامهنویسی هوش مصنوعی مدلها را ارزیابی میکند، V3.1 را به عنوان بهترین مدل چینی معرفی کرده است. با این حال، در مقایسه با رقبای بینالمللی، V3.1 همچنان عقبتر از Claude Opus 4 است، که به عنوان یکی از برترین مدلهای برنامهنویسی هوش مصنوعی شناخته میشود.
همچنین بررسی شبکههای اجتماعی چینی نشان میدهد که برخی کاربران از بهروزرسانی ناامید شدهاند. لیو کانگ، پژوهشگر علوم کامپیوتر از نانجینگ، در اظهار نظری اظهار داشت که V3.1 در مقایسه با مدل R1-0528 تغییری در قابلیتهای استدلالی ایجاد نکرده و به نظر میرسد ترکیبی از تواناییهای استدلالی و غیر استدلالی باشد. کاربر Hugging Face با نام «smile1030» نیز کاهش کیفیت تولید متن و سانسور شدید را گزارش کرده است.
دیپ سیک V3.1 تا 68 برابر ارزانتر از غولهای آمریکایی
بنابر گزارش Venturebeat، مدل DeepSeek V3.1 دستاوردهای مهندسی قابل توجهی ارائه میدهد که انتظارات از عملکرد مدلهای هوش مصنوعی را بازتعریف میکند. سیستم قادر است تا ۱۲۸ هزار توکن را پردازش کند (تقریباً معادل یک کتاب ۴۰۰ صفحهای) و در عین حال سرعت پاسخدهی بسیار بالایی دارد. مدل از قالبهای دقت چندگانه، از BF16 استاندارد تا FP8 آزمایشی، پشتیبانی میکند تا توسعهدهندگان بتوانند عملکرد را با محدودیتهای سختافزاری خود بهینه کنند.
نوآوری اصلی در آنچه DeepSeek «معماری ترکیبی» مینامد نهفته است. برخلاف تلاشهای قبلی برای ترکیب قابلیتهای مختلف هوش مصنوعی که اغلب منجر به عملکرد ضعیف میشد، مدل V3.1 گفتوگو، استدلال و برنامهنویسی را در یک مدل منسجم ادغام کرده است.
البته واکنشهای مثبت هم به عملکرد این مدل، رصد شدهاند. برای مثال، پژوهشگر اندرو کریستینسون نیز در همین زمینه توییتی را در حساب خود در X منتشر کرده و میگوید:
DeepSeek V3.1 در معیار Aider غیر استدلالی، امتیاز ۷۱.۶ درصد کسب کرده است، یک درصد بالاتر از Claude Opus 4 و در عین حال ۶۸ برابر ارزانتر.
در حالت کلی باید بگوییم که تحلیلهای مختلف منتشر شده توسط جامعه کاربران نشان میدهد که مدل 3.1 دیپ سیک با داشتن نوآوریهای فنی پیچیدهای مانند چهار توکن ویژه برای جستوجوی وب در زمان واقعی و انجام فرآیندهای استدلال داخلی، از جمله پیشرفتهترین مدلهای هوش مصنوعی رونمایی شده تا به امروز است.
بهینهسازی هزینه و اثربخشی
مدل V3.1 با هزینه حدود ۱.۰۱ دلار برای هر وظیفه برنامهنویسی کامل، عملکردی مشابه سیستمهای تقریباً ۷۰ دلاری ارائه میدهد. برای کسبوکارهایی که هزاران تعامل روزانه با هوش مصنوعی دارند، این تفاوت هزینه میتواند میلیونها دلار صرفهجویی ایجاد کند.
در نظر داشته باشید که گزارش اخیر Financial Times نشان میدهد که DeepSeek به دلیل چالشهای آموزش مدل با تراشههای Ascend شرکت Huawei، عرضه مدل R2 را به تأخیر انداخته است. طبق این گزارش، استارتاپ با «مشکلات فنی مداوم» روبهرو بوده است. مدل اصلی V3 با استفاده از ۲,۰۴۸ تراشه Nvidia H800 آموزش دیده بود.
تغییر پارادایم: هوش واقعاً مصنوعی
ظهور DeepSeek V3.1 فقط یک پیشرفت فناورانه نیست؛ این مدل نشان میدهد هوش مصنوعی میتواند هم پیشرفته باشد و هم در دسترس همه قرار گیرد. تا پیش از این، بهترین سیستمهای هوش مصنوعی معمولاً پشت محدودیتهای اقتصادی و جغرافیایی پنهان بودند و دسترسی به آنها دشوار بود.
دیپسیک ثابت کرده که میتوان همزمان قدرت بالا و دسترسی آزاد داشت. این یعنی محدودیتهایی که قبلاً مانع استفاده از هوش مصنوعی میشدند، بیشتر ساخته انسان بودهاند و اجتنابناپذیر نبودهاند.
طنز ماجرا این است که در مسیر ساخت هوش مصنوعی پیشرفته، دیپسیک نشان داده بسیاری از سدها و محدودیتهای صنعت نیز مصنوعی را میتوان به راحتی از میان برداشت. کاربران و تحلیلگران انتظار دارند که با انتشار نسخههای بعدی، مانند V4، تحولات بسیار بزرگتری در راه باشد.
رقابت جهانی هوش مصنوعی حالا تغییر کرده و دیگر فقط بحث قدرت سیستمها نیست، بلکه دسترسپذیری آنها برای همه اهمیت پیدا کرده است. در این مسیر، محدودیتهای مصنوعی شاید بزرگترین چالش هوش مصنوعی به حساب بیایند.
منبع: شهر سخت افزار