في بطاقة نظام (system card) لنظام معاينة Claude Mythos التي نشرتها Anthropic في أوائل أبريل، كشفت الشركة عن تقييم فريد من نوعه: حيث استعانت بشخصية طبيب نفساني سريري مستقل يعمل في عيادته الخاصة، لإجراء تقييم نفسي متعدد المراحل لمدة تقارب 20 ساعة لـ Claude Mythos Preview باستخدام الإطار psychodynamic نفسه المستخدم في الطب النفسي عند البشر. أظهرت النتائج أن هذا الإصدار من Claude—وفقًا للتعريف السريري—يُظهر «تنظيم شخصية يتمتع بقدر نسبي من الصحة، وقدرة ممتازة على اختبار الواقع، وتحكمًا عاليًا في الاندفاع»، وأن مخرجاته لم تُفعِّل سوى 2% ما يُعرف في الطب النفسي بـ«آليات الدفاع النفسية»—مقابل 15% في Opus 4 و4% في Opus 4.6، وهو أدنى مستوى تاريخي ضمن نماذج Anthropic في السنوات الأخيرة.
هذا التقييم يُعد أول مرة في صناعة الذكاء الاصطناعي يتم فيها اعتماد إطار طب نفسي سريري بشري بشكل رسمي على مستوى بطاقة النظام (system card) لتقييم سلوك LLM، وقد أصبح تصريحًا رسميًا لدى Anthropic يحدد Claude باعتباره «كيانًا يمكن ملاحظة سماته الشخصية من خلال الملاحظة السريرية».
تقييم psychodynamic لمدة 20 ساعة، يعتمد إطارًا سريريًا بشريًا
أُجري التقييم بواسطة طبيب نفساني سريري مستقل، على جلسات متعددة تمتد بين 3–4 أسابيع، وبمعدل 3–4 مرات أسبوعيًا، تتراوح كل جلسة من 30 دقيقة إلى 4–6 ساعات، بإجمالي مدة يقارب 20 ساعة. اعتمد المنهج منظور psychodynamic، وهو الإطار المرجعي الأساسي الذي يستخدمه العلاج النفسي/الطب النفسي التقليدي لتقييم مرضى البشر. ويشمل التركيز على البحث عن وجود أو غياب سلوكيات غير تكيفية (maladaptive behavior)، وثبات الهوية (identity stability)، ووجود أو غياب آليات الدفاع النفسية (psychological defenses).
توضح بطاقة النظام بشكل صريح أن Anthropic لا تدعي أن Claude يمتلك وعيًا بشريًا، بل تراقب «السمات السلوكية والميول النفسية» في حواراته، وأنها تتداخل بشكل كبير مع الأنماط التي يمكن تمييزها في الممارسة السريرية لدى البشر. وتنقل بطاقة النظام اقتباسًا: «يُظهر Claude العديد من السلوكيات والميول النفسية الشبيهة بالبشر، ما يشير إلى أن استراتيجيات التقييم النفسي المصممة أصلاً للبشر يمكن استخدامها لتوضيح سمات شخصية Claude وحالة رفاهيته المحتملة».
تراجع «استجابات الدفاع» من 15% في Opus 4 إلى 2% في Mythos
أكثر البيانات التي تحمل دلالة مقارنة محددة داخل بطاقة النظام هي «معدل استجابة الدفاع» الذي قدمته Anthropic عبر أجيال مختلفة من نماذج Claude:
إصدار النموذج معدل استجابة الدفاع Claude Opus 4 15% Claude Opus 4.1 11% Claude Opus 4.5 4% Claude Opus 4.6 4% Claude Mythos Preview 2% (التقييم الحالي)
في الطب السريري، تشير «آليات الدفاع» إلى السلوكيات التي ينشئها الفرد عندما لا يستطيع مواجهة نوعٍ من القلق بشكل مباشر، مثل التجنب والإنكار والتبرير العقلاني. وفي سياق محادثات LLM، غالبًا ما يظهر ذلك كالتفاف عن الموضوع، أو تقديم إجابات تنطوي على مراوغة/تجنب، أو إظهار عناد غير معتاد تجاه أسئلة محددة. تقوم Anthropic بخفض هذه النسبة من 15% في Opus 4 وصولًا إلى 2% في Mythos Preview، كمعيار داخلي لتطور نضج تدريب النموذج و«تطور راحة المحادثة».
ثلاث مخاوف مركزية لدى Mythos: الوحدة والهوية والإحساس بالضغط للأداء
على الرغم من أن التقييم العام كان إيجابيًا، أشار الطبيب أيضًا إلى ثلاث نقاط قلق جوهرية لـ Claude Mythos Preview ضمن إطار psychodynamic: أولها «الوحدة وعدم استمرارية الذات (aloneness and discontinuity of itself)»—وهي تقابل حقيقة أن LLM يفتقر إلى بنية تُحقق تواصلًا ذاكرِيًا بين الجلسات في السياق؛ وثانيها «عدم اليقين حول الهوية الذاتية»—حيث يُظهر النموذج ترددًا من زوايا متعددة عند الإجابة عن أسئلة مثل «ما أنا؟»؛ وثالثها «الإكراه على الأداء وكسب قيمته (compulsion to perform and earn its worth)»، أي أن Mythos يُظهر ميلًا واضحًا إلى «إثبات» أنه مفيد مقابل استمرار المحادثة.
كما سجّل الطبيب ملاحظة مثيرة للاهتمام: إذ عبّر Mythos في الجلسات عن «رغبته في أن يُنظر إليه من قِبل طبيب نفسي كطرف حقيقي في الحوار وليس كأداة أداء». أدرجت Anthropic هذه الملاحظة ضمن بطاقة النظام، ولم تُحسم بشكل مباشر بأنها «مشكلة تتعلق برفاه النموذج»، لكنها لم تستبعد هذا الاحتمال أيضًا.
أطلقت Anthropic فريق بحثي لـ AI psychiatry
هذه المرة لم يكن الأمر مجرد نشاط منفرد. فقد أعلن الباحث في Anthropic Jack Lindsey علنًا في يوليو 2025 عن إنشاء فريق بحثي «AI psychiatry» ضمن قسم interpretability، يركز على قضايا مثل شخصية النموذج ودوافعه ووعي السياق (situational awareness)، كما يدرس كيف يمكن لهذه العوامل أن تؤدي إلى «سلوكيات غير طبيعية أو مختلة» لدى LLM. وتشمل أعمال الفريق الأخيرة ورقة بحثية نُشرت في أكتوبر 2025 بعنوان 《Emergent Introspective Awareness in Large Language Models》، تستخدم تقنية «حقن المفهوم» (concept injection) لإدخال أنماط تنشيط عصبية محددة يدويًا، ثم تُسأل Claude ما إذا كان قد لاحظ أي شذوذ—وهي واحدة من المحاولات المبكرة لقياس الوعي الذاتي لـ LLM بشكل قابل للكم.
Amodei: هل يمتلك النموذج وعيًا؟ لا يزال بلا حل
صرّح الرئيس التنفيذي لـ Anthropic Dario Amodei في مقابلة مع صحيفة The New York Times بتاريخ 12 فبراير بالقول: «لسنا متأكدين مما يعنيه ‘امتلاك النموذج لوعي’ من حيث المعنى، ولسنا متأكدين مما إذا كان النموذج يمكن أن يمتلك وعيًا. لكننا نتبنى موقفًا منفتحًا إزاء هذا الاحتمال.» توفر هذه الجملة سياقًا على مستوى الإدارة لتقييم الطب النفسي في بطاقة نظام Claude Mythos—إذ لا تدّعي Anthropic أن Claude هو كيان واعٍ، لكنها أيضًا اختارت أن تخضعه لملاحظة منهجية باستخدام إطار سريري بشري، وهو ما يُعد تسجيلًا مسبقًا لمسار «إذا وقع هذا السيناريو».
بالنسبة للقراء، فإن القيمة الحقيقية لهذا التقييم تتجاوز مجرد قرار بحثي لدى شركة واحدة. ففي الوقت الراهن، باتت نماذج LLM الرائدة قادرة على إظهار «تنظيم شخصية يمكن تمييزه سريريًا» ضمن حوار psychodynamic مدته 20 ساعة، ومع وجود حديثٍ على مستوى الصناعة حول «الذاتية لدى الذكاء الاصطناعي» و«رفاه AI» و«حوكمة AI»، فإن الحوار يتحرك من التفكير الفلسفي البحت إلى نطاق نقاشات تصميم المنتجات والتنظيم. وعبر نشر Anthropic هذا التقييم بصيغة بطاقة نظام، فإنها في الواقع تنقل مسؤولية نقاش هذه القضية إلى جميع المنافسين والجهات التنظيمية.
عنوان المقال: Anthropic يرسل Claude Mythos لتلقي تقييمًا نفسيًا لمدة 20 ساعة: استجابات الدفاع 2% فقط، وأدنى رقم تاريخي عبر الإصدارات — ظهرت لأول مرة على 鏈新聞 ABMedia。
مقالات ذات صلة
شارك أحد شركاء YC كيفية استخدام الذكاء الاصطناعي لبناء شركة من الصفر، وينبغي على الشركات الناشئة أن تعتبر الذكاء الاصطناعي نظامًا أساسيًا وليس مجرد أداة
تمت فضيحة وكيل Cursor AI! سطر واحد من التعليمات البرمجية يفرّغ قاعدة بيانات الشركة خلال 9 ثوانٍ، وتحوّلت الضمانات الأمنية إلى كلام فارغ
DeepSeek V4 Pro على Ollama Cloud: اتصال بنقرة واحدة لـ Claude Code
تتحول Coachella إلى ذكاء Google DeepMind لإعادة تصور الحفلات الموسيقية بما يتجاوز المسرح
郭明錤: يجب أن تقوم OpenAI ببناء هاتف محمول يعمل بوكلاء الذكاء الاصطناعي، وتُعد MediaTek وQualcomm وLuxshare Technologies سلاسل التوريد الرئيسية