أحدث منظمة العفو الدولية في الأنثروبور ، كلود 3.7 سونيت ، يمكن استخدامها لقهر بوكيمون الأحمر! يعرض القياس باستخدام الألعاب تطور الذكاء الاصطناعي

الإنسان هو نموذج جديد لمنظمة العفو الدولية يسمىكلود 3.7 السوناتة"، وأعلن"بوكيمون الأحمر'، الذي كان اختبارًا قياسيًا سمح له حتى بمسح كوتشيبزيم ماتيس.تقريرفعلتُ.

يمكن استخدام نموذج Claud الجديد لمسح Kuchibagym! تتطور بشكل مستمر لتكنولوجيا الذكاء الاصطناعي

يعد Claude 3.7 Sonnet ، الذي تم الإعلان عنه هذه المرة ، أول نموذج للاستدلال الهجين في صناعة الذكاء الاصطناعي ، ويتميز بنموذج واحد يوفر وضعًا قياسيًا يستجيب على الفور ووضع تفكير ممتد يسمح بالتفكير العميق.

أجرت الشركة اختبارات تم فيها لعب الألعاب الفعلية وتقييمها للتحقيق في قدرات الذكاء الاصطناعي. تتميز النماذج الجديدة والسابقة بقدرات الذاكرة الأساسية ، وإدخال بكسل الشاشة ، ومكالمات الوظائف للضغط على الأزرار ، والقدرة على تشغيل Pokemon Red على أساس مستمر.

ونتيجة لذلك ، هزم النموذج الجديد ، "Claude 3.7 Sonnet" ، ثلاثة من قادة الصالة الرياضية مع أكثر من 30،000 تفاعلات ، وكان قادرًا على التقدم إلى النقطة التي حصلوا فيها على دفعة من Kuchibajim Matisse. يتوقف النموذج التقليدي "Claude 3.5 Sonnet" عندما تصل إلى غابة Tokiwa وتلقي "All All" إلى Dr. ، وقد أظهر النموذج الجديد القدرات العالية.

المحور السيني: عدد التفاعلات أثناء اللعب Y-Axis: معلم يشير إلى التقدم

لقد أظهر كلود 3.7 Sonnet نتائج رائعة من اختبارات جديدة من خلال الألعاب ، التي تختبر إمكانات فهم الذكاء الاصطناعي والاستجابة في بيئة عملية للغاية. في الآونة الأخيرة ، ظهرت برنامج AI Aid Aid و NPCs التي تتضمن تقنية الذكاء الاصطناعي ، ولكن مع تطور الذكاء الاصطناعي ، قد يتوسع نطاق الأنشطة إلى أبعد من ذلك.