AIGridHQ News
返回首页

اختبار عملي لـ Gemma 4 31B FP8: يعادل Sonnet 4.6 Medium على Raspberry Pi، ونقطة تحول لنماذج الحافة مفتوحة المصدر

📅 2026-06-09 Reddit - LocalLLaMA (每日最热)
اختبار فعلي لـ Gemma 4 31B FP8: يعادل Sonnet 4.6 Medium على Raspberry Pi، ونماذج المصدر المفتوح الطرفية تصل لنقطة تحول

اختبار فعلي لـ Gemma 4 31B FP8: يعادل Sonnet 4.6 Medium على Raspberry Pi، ونماذج المصدر المفتوح الطرفية تصل لنقطة تحول

بينما لا يزال الناس يتجادلون حول السقف الأعلى لقدرات النماذج المغلقة المصدر، أعاد اختبار أقصى قاده المجتمع كتابة السيناريو بهدوء. نشر المستخدم knob-0u812 على Reddit نتيجة اختبار فعلي مثيرة: بعد التحسين بدقة FP8، تمكن نموذج Gemma 4 31B مفتوح المصدر من Google، في مجموعة تقييم شاملة مخصصة، من مجاراة Sonnet 4.6 Medium من Anthropic في الأداء العام. والأكثر إثارة للدهشة هو أن بعض المهام نُفذت حتى على أجهزة طرفية بمستوى Raspberry Pi، وحافظت طوال الوقت على قدرة سلسة في استدعاء الأدوات وتوليد الأكواد.

اختبار صارم عبر خمسة أبعاد، وأحمال عمل مختلطة بلقطة واحدة متواصلة

لم يكن هذا الاختبار مجرد نتيجة معيارية أحادية، بل سير عمل مركب يقترب من الحياة اليومية الحقيقية للمطورين. وفقًا لقائمة المهام التي نشرها المختبر، شمل التقييم خمسة اتجاهات شديدة التباين: استعلامات تنقل Cypher الموجهة لقواعد البيانات البيانية (سيناريو Neo4j)، استخراج الكيانات من مقاطع نصية غير مهيكلة، اتخاذ القرار واستدعاء أدوات الوكيل الذكي (اختيار وتنفيذ مهارة بنجاح في بيئة Pi)، كتابة كود Python، والتلخيص المعلوماتي لنتائج محركات الاسترجاع متجهة المسارات. يفحص تصميم الأحمال هذا، في جوهره، ما إذا كان النموذج يمتلك قدرة الحلقة المغلقة الكاملة بدءًا من البيانات المهيكلة وصولًا إلى الأكواد منخفضة المستوى، وانتهاءً بالتخطيط المستقل لسلسلة الأدوات.

التكميم بـ FP8 يكسر أختام الأجهزة الطرفية، و"استدعاء الأدوات" على Raspberry Pi يبعث على البهجة

يكمن جوهر التمييز في هذا الاختبار في أن النموذج استخدم دقة FP8. مقارنة بالاستدلال التقليدي بـ FP16 أو BF16، يخفض FP8 متطلبات ذاكرة الفيديو إلى النصف تقريبًا، مع الحفاظ على الاستقرار العددي لطبقات الانتباه وشبكات التغذية الأمامية إلى أقصى حد بفضل تقنية التدرج الميكروي الفعالة. إن استراتيجية التكميم هذه هي بالتحديد ما سمح لـ Gemma 4 31B بالعمل بنجاح في بيئة منخفضة الطاقة لم يُفصح عن عتادها المحدد ولكن أُلمح إليه بكلمة "Pi"، لإكمال تشغيل نماذج استدعاء الأدوات الأولية. وقد أشار المختبر بشكل خاص إلى "اختيار المهارات / التشغيل الناجح في Pi" وإلى أن "هذا جلب لي البهجة"، مما يكفي لإظهار متعة المطور الخالصة في مشاهدة وكيل ذكي يستدعي المهارات بشكل مستقل وفقًا للمسار الصحيح على جهاز محدود الموارد للغاية.

التنقل البياني والتلخيص متعدد المتجهات: ليس للمناسبات فقط، بل قابل للاستخدام هندسيًا

في مهمة استعلام Cypher البياني، احتاج النموذج إلى فهم أسئلة اللغة الطبيعية وترجمتها إلى جمل استعلام بيانية دقيقة، مع الحفاظ على توافق عالٍ مع هيكلية قاعدة البيانات البيانية. بينما تطلب استخراج الكيانات استخلاص حقول مهيكلة بدقة من نصوص مشوشة لتوفير نقاط ارتكاز لعمليات الاسترجاع البياني والبحث المتجهي في المراحل اللاحقة. وفي المرحلة النهائية لدمج المتجهات المتعددة والتلخيص، كان على النموذج إعادة ترتيب وفرز وتوليد ملخص متماسك لآراء متفرقة قادمة من قنوات متعددة كمكتبات المتجهات والبحث البياني. تعكس هذه السلسلة من الإجراءات القيمة المحورية للنموذج في بنى التوليد المعزز بالاسترجاع. أظهرت نتائج التقييم أن نسخة FP8 من Gemma 4 لم تعانِ من أي انهيار ملحوظ في الدقة في هذه المهام، وجاءت جودة المخرجات متوافقة بشكل كبير مع Sonnet 4.6 Medium.

الهجوم المضاد للمصادر المفتوحة: من "بالكاد صالحة للاستخدام" إلى "محاذاة للإنتاجية"

لفترة طويلة، وُصمت النماذج مفتوحة المصدر بأنها "غير موثوقة" في سيناريوهات مثل الرسوم البيانية المعرفية على مستوى المؤسسات والوكلاء المستقلين. لكن هذه الحالة تظهر أنه بعد التكميم الدقيق وهندسة الأوامر الموجهة، تجاوز Gemma 4 31B بالفعل نقطة حرجة للتحول الكيفي. واللافت للنظر بشكل خاص أنه لا يحاكي أسلوب الرد ببساطة، بل أصبح يشكل قدرة تنافسية مكافئة مع النماذج المغلقة من الطراز الأول في اختيار الأدوات، والتفكير المنطقي، واتساق التنفيذ. لم يكشف المختبر عن بيانات زمن الانتقال الكاملة، لكن وصف "مجاراة" بحد ذاته يعني أنه وبنفس معايير نجاح المهمة وجودة المخرجات، فإن إيقاع استجابة هذا النموذج مفتوح المصدر أصبح يلبي بالفعل احتياجات سياقات العمل الفعلية.

لا شك أن هذا يمثل حقنة محفزة للفرق التي تهتم بخصوصية البيانات وتطمح للنشر المحلي. عندما يصبح بمقدور قطعة Raspberry Pi أو جهاز طرفي مكافئ تشغيل نموذج بمستوى 31B، وبقدرة على استخدام الأدوات تضاهي Sonnet 4.6 Medium، سيبدأ نموذج بناء تطبيقات الذكاء الاصطناعي في التحول النظامي. سيواصل المجتمع لاحقًا إجراء تجارب استئصال أكثر تفصيلًا حول تأثير تكميم FP8 على نوافذ السياقات الطويلة والأداء التزامني، لكن نتائج اليوم كافية بالفعل لإثارة حماس كل مهندس يتابع عن كثب التطبيق العملي للنماذج مفتوحة المصدر.