به گزارش خبرگزاری مهر به نقل از اینترستینگ انجینرینگ، شرکت علی‌بابا مدل جدید سری Qwen۳ را در ابتدای سال جاری میلادی معرفی کرد. این سری در ابتدا شامل مدل‌هایی با اندازه‌های گوناگون، از ۶۰۰ میلیون پارامتر تا ۲۳۵ میلیارد پارامتر بود.

پارامترها عناصر کلیدی هستند که دقت یک مدل هوش مصنوعی را تعیین می‌کنند. هر چه تعداد پارامترها بیشتر باشد، به انرژی و قدرت پردازشی بیشتری برای هماهنگ‌سازی و فعال‌سازی آن‌ها نیاز است. برای مقایسه، چت جی‌پی‌تی ۴.۵ یکی از بزرگ‌ترین مدل‌های هوش مصنوعی جهان به شمار می‌رود که حدود پنج تا هفت هزار میلیارد پارامتر دارد. در همین زمینه، مدل Qwen-۳-Max-Preview که صرفاً متنی است، حتی از مدل قدرتمند Qwen۳-۲۳۵B-A۲۲B-۲۵۰۷ که در ماه جولای عرضه شد نیز هوشمندتر ارزیابی شده است.

علی‌بابا همچنین نتایج بنچمارکی منتشر کرده که نشان می‌دهد Qwen-۳-Max-Preview در عملکرد از مدل Kimi ۲ (متعلق به شرکت مون‌شات)، نسخه استدلالی هوش مصنوعی Claude Opus ۴ (متعلق به آنتروپیک) و DeepSeek V۳.۱ نیز برتر عمل کرده است. این شرکت در بیانیه‌ای اعلام کرد: «Qwen-۳-Max-Preview نشان‌دهنده پیشرفت‌های قابل توجه در توانمندی‌های کلی مدل با بهبود چشمگیر در درک متون چینی-انگلیسی، پیروی از دستورالعمل‌های پیچیده، انجام وظایف ذهنی باز و همچنین قابلیت‌های چندزبانه است. انتشار رسمی این مدل کاربران را بیش از پیش شگفت‌زده خواهد کرد.»

با وجود این، Qwen-۳-Max-Preview هنوز به صورت منبع باز ارائه نشده و تنها از طریق کانال‌های رسمی در دسترس قرار دارد. پیش‌تر نیز مدل Qwen۲.۵-Max به صورت منبع باز عرضه نشده بود. افزون بر این، «بین‌یوان هوی» مهندس هوش مصنوعی علی‌بابا، خبر داده که نسخه‌ای ویژه از این مدل با نام «متفکر» (Thinking Version) در راه است.

از نظر هزینه نیز این مدل در ردیف گران‌ترین محصولات سری Qwen قرار دارد. قیمت‌گذاری پلکانی آن به این صورت است:

۰.۸۶۱ دلار برای هر یک میلیون توکن ورودی

۳.۴۴۱ دلار برای هر یک میلیون توکن خروجی