AIGridHQ News
返回首页

التحكم في الأفاتار ثلاثي الأبعاد باللغة الطبيعية: وداعًا للأزرار، الحركات المعقدة بأمر شفهي

📅 2026-06-08 🤖 大模型智能生成

التحكم في الشخصيات ثلاثية الأبعاد باللغة الطبيعية: وداعًا للأزرار، الحركات المعقدة تصبح بأمر شفهي

في معظم التطبيقات والألعاب ثلاثية الأبعاد، لتحريك الشخصية الافتراضية، تضطر إلى حفظ عشرات اختصارات لوحة المفاتيح أو الاختيار المتكرر من القوائم المعدة مسبقًا. الآن، كسر مطور هذا الجمود بحل جديد يسمح بـالتحكم في الشخصيات ثلاثية الأبعاد باللغة الطبيعية. بناءً على إطار Programasweights الذي أنشأه سابقًا، قام ببناء شخصية افتراضية ثلاثية الأبعاد تستجيب للأوامر المعقدة في الوقت الفعلي بمجرد وصف الحركة باللغة الإنجليزية. لا يحتاج المستخدم للمس أي زر، فجملة مثل "لوِّح أثناء المشي، ثم اقفز مرتين" ستجعل الشخصية تؤدي الحركة بإتقان.

كسر قيود الحركات المعدة مسبقًا: من النقر على الأزرار إلى اللغة كواجهة

يعتمد التحكم التقليدي في الشخصيات ثلاثية الأبعاد بشكل كبير على آلات الحالة المحدودة ومكتبات التقاط الحركة. أي تركيبة غير مربوطة مسبقًا بنص برمجي — مثل جعل الشخصية تنحني فجأة وتدور أثناء الركض — تعني إعادة ترميز مرهقة. أما هذا العرض المنشور على programasweights.com/avatar فيسلم زمام التحكم بالكامل للغة. إنه يتعامل مع اللغة الطبيعية كواجهة إدخال عالية الكفاءة، حيث يفهم النظام منطق "في نفس الوقت" و"ثم" و"بشكل متكرر" وغيرها، ويولّد مباشرة حركات ديناميكية لم تُبرمج يدويًا من قبل. هذا ليس مجرد ترقية لأسلوب التفاعل، بل تحرير كامل لمخيلة المبدعين.

نواة Programasweights: كيف تُترجم الأوصاف اللغوية فوريًا إلى برامج حركية عصبية

يكمن جوهر هذه المعجزة في Programasweights — أداة قادرة على ترجمة الأوصاف بالإنجليزية العادية مباشرة إلى أوزان شبكات عصبية. في سيناريو التحكم بالشخصية، عندما يستقبل النظام تعليمات مثل "wave while walking, then jump a couple times"، فإنه لا يبحث عن مقاطع رسوم متحركة موجودة، بل يولّد برنامجًا عصبيًا خفيف الوزن من خلال نماذج لغوية كبيرة وتقنيات تركيب برمجي. يقود هذا البرنامج حركة الهيكل العظمي في الوقت الفعلي، ويمزج ديناميكيًا بين إيقاعي التلويح والمشي، ثم ينتقل بسلاسة إلى حلقة القفز، حيث تتولد جميع الإشارات بشكل مستمر دون أي أثر للتقطيع. ولأن الحركة تنبثق مباشرة من دلالات اللغة، يمكن للشخصية فهم وتنفيذ الحركات حتى لو لم تظهر تركيبتها المطابقة في بيانات التدريب مطلقًا.

تسلسلات معقدة في لقطة واحدة: الإمكانيات اللامحدودة للرسوم المتحركة المدفوعة باللغة

الصدمة الكبرى التي تجلبها هذه الرسوم المتحركة المدفوعة باللغة تكمن في التنفيذ الفوري للتسلسلات المعقدة. يمكنك أن تأمر الشخصية بأن "تتبختر بغطرسة، وتتوقف كل ثلاث خطوات لتصفق"، أو "تتسلل بهدوء، ثم تقفز وتستدير بقوة". هذه الحركات المستمرة والمتداخلة والمصحوبة بتعديلات عاطفية، كانت تتطلب في خطوط الإنتاج التقليدية من محركي الرسوم المتحركة ضبط آلة الحالة مرارًا وتكرارًا، بينما الحل الجديد لا يتطلب سوى إدخال واحد. يؤكد المطور بشكل خاص على قدرة النظام على التعميم بدون أمثلة مسبقة للتعليمات المركبة، مما يجعله متفوقًا بكثير على أي أوامر ماكرو قائمة على الأزرار، محققًا حقًا مبدأ "ما تراه هو ما تقوله".

المستقبل هنا: بوابة تفاعل جديدة لشخصيات الألعاب والأيقونات الافتراضية والميتافيرس

بمجرد انتشار هذه التقنية، ستعيد تشكيل قطاعات متعددة. سيتمكن مطورو الألعاب من خلق شخصيات غير قابلة للعب تفهم أوامر اللاعبين المكتوبة، مما يعزز الانغماس؛ وسيحتاج مقدمو البث الافتراضي ومشغلو الشخصيات الرقمية فقط لكتابة وصف الأداء لتوليد حركات مسرحية غنية بالطبقات؛ وفي الميتافيرس، سيتمكن كل مستخدم من قيادة شخصيته الافتراضية بأكثر لغاته الطبيعية سلاسة، وكأنه يتحدث إلى شخص آخر، دون الحاجة لتعلم أي واجهة تشغيل. عرض Programasweights هذه المرة ليس مجرد نموذج تجريبي رائع، بل يشير بوضوح إلى اتجاه الجيل القادم من التفاعل بين الإنسان والحاسوب: عندما تصبح اللغة قناة الأوامر الأكثر مباشرة، سيختفي الجدار بين الإبداع والوجود الرقمي تمامًا. ربما قريبًا، سيصبح "قل ما تريد ليتحرك" الإعداد الافتراضي في جميع التجارب الافتراضية.