Sonnet و Opus مستشاران يرفعان من معدل نجاح المهام للوكيل الذكي

robot
إنشاء الملخص قيد التقدم

خبر ME News، 12 أبريل (التوقيت العالمي +8)، أظهرت اختبار حديث حول أداء الوكيل الذكي أنه في مهمة البحث للوكيل (BrowseComp)، يمكن أن يؤدي اقتران نموذج Sonnet مع مستشار Opus إلى رفع معدل النجاح من 58.1% إلى 60.4%. وفي مهمة ترميز الوكيل النهائي (Terminal-Bench 2.0)، ارتفع الأداء من 59.6% إلى 63.4%. ويعتقد المقال أن السبب في ذلك قد يكون لأن Opus يوفر تخطيطًا استراتيجيًا عالي الدقة للمهام الصعبة. (المصدر: InFoQ)

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت