شرکت چینی علیبابا از مدل هوش مصنوعی جدیدی با قابلیت استدلال پیشرفته به نام Qwen with Questions (QwQ) رونمایی کرده است که به عنوان رقیبی برای مدل o1 از OpenAI شناخته میشود. این مدل دارای 32.5 میلیارد پارامتر است و توانایی پاسخ به درخواستهایی با حداکثر 32 هزار توکن را دارد. مشابه سایر مدلهای بزرگ استدلالمحور (LRM)، هوش مصنوعی QwQ علی بابا نیز از چرخههای محاسباتی پیشرفته برای بررسی و تصحیح پاسخهای خود استفاده میکند، که آن را برای کارهایی مانند حل مسائل ریاضی و برنامهنویسی بسیار مناسب کرده است.
هوش مصنوعی QwQ علی بابا
در آزمایشهای انجامشده، QwQ موفق شد در بنچمارکهای AIME و MATH که عملکرد مدلها در حل مسائل ریاضی را ارزیابی میکنند، از o1-preview پیشی بگیرد. همچنین، در بنچمارک GPQA برای ارزیابی استدلال علمی، عملکرد بهتری نسبت به o1-mini نشان داد. با این حال، در بنچمارک LiveCodeBench که مربوط به کدنویسی است، o1 عملکرد بهتری داشته است، هرچند که QwQ توانسته مدلهای دیگری مانند GPT-4o و Claude 3.5 Sonnet را پشت سر بگذارد.
نکته قابل توجه درباره این مدل این است که برخلاف مدل o1، QwQ یک مدل متنباز است. بنابراین، «فرایند تفکر» آن شفاف بوده و میتوان عملکرد و نحوه استدلال آن در حل مسائل را از طریق کد و ساختار متنبازش تحلیل کرد. هرچند، علیبابا هنوز اطلاعاتی درباره دادهها یا فرایند آموزشی این مدل منتشر نکرده است.
علیرغم این پیشرفتها، QwQ همچنان با محدودیتهایی مواجه است؛ برای مثال، ممکن است در ترکیب زبانها یا در زمان گیر افتادن در حلقههای استدلال دچار مشکل شود. نسخه فعلی به صورت پیشنمایش عرضه شده است و انتظار میرود نسخههای بهبودیافته آن در آینده معرفی شوند.
علیبابا در بیانیهای درباره این مدل میگوید:
«آزمایشهای متعدد به ما نشان داد وقتی مدل در فرآیند تفکر و پرسش غرق میشود، درک آن از مسائل پیچیده مانند ریاضیات و برنامهنویسی به طرز قابل توجهی رشد میکند؛ این فرایند دروننگری، بهبود چشمگیری در حل مشکلات پیچیده ایجاد کرده است.»
اگر به دنبال خرید لپ تاپ برای اجرای مدلهای هوش مصنوعی یا انجام پروژههای برنامهنویسی هستید، توجه به توان پردازشی و سازگاری سیستم با ابزارهای محاسباتی پیشرفته، امری ضروری است.
نظرات کاربران