أدوات الذكاء الاصطناعي

Claude Sonnet 4.5 من Anthropic: قوة الذكاء أم تحديث محسّن؟ الإجابة بالتحليل

أعلنت شركة Anthropic رسميًا عن إصدار أحدث نماذجها، Claude Sonnet 4.5، مصحوب بوعود طموحة وجريئة. فهي تصفه بأنه “أفضل نموذج برمجة في العالم”، وتشيد به بصفته الأداة المثلى لبناء وكلاء الذكاء الاصطناعي الأذكياء، وللاستخدامات الحاسوبية المتطورة. كما تسلط الضوء على تحسينات جوهرية في مجالي الرياضيات والاستدلال المنطقي.

يبدو جليًا أن Anthropic تستهدف بهذا الإصدار شريحة المؤسسات والشركات الكبرى. فالتركيز على البرمجة المستقلة لفترات طويلة، إلى جانب المعالجة المحسنة للمهام العلمية والمالية، يمثل دفعًا قويًا لجعل Claude Sonnet 4.5 الخيار الأمثل للمشاريع البرمجية المعقدة.

واللافت للنظر أن هذا النموذج الجديد يتصدر معايير SWE-bench Verified، التي تقيس كفاءة النموذج في حل مشكلات البرمجة الواقعية. كما يشاد بقدرته على الحفاظ على التركيز لفترات تمتد لأكثر من 30 ساعة دون انقطاع.

إذن، كل المؤشرات تشير إلى أن هذا إصدار قوي آخر من Anthropic. ولكن، هل يرقى النموذج إلى مستوى هذه الادعاءات الجريئة؟ في هذا المقال، سأقدم لك Claude Sonnet 4.5 وأهم ميزاته، مع لمحة سريعة عن أدائه. كما سنستعرض كل ما أعلنت عنه Anthropic، بما في ذلك Claude Agent SDK وClaude Imagine.

ما هو Claude Sonnet 4.5؟

Claude Sonnet 4.5 هو أحدث نموذج للذكاء الاصطناعي من شركة Anthropic، ويأتي بعد أربعة أشهر فقط من إطلاق Claude Sonnet 4. وكما أشرنا في تغطيتنا السابقة، يتميز النموذج العام Sonnet بأدائه القوي في معظم حالات الاستخدام، مع تفوق خاص في مجال البرمجة.

أما أبرز limitation في الإصدار السابق، فكانت نافذة السياق المحدودة نسبيًا بـ 200 ألف توكن (200k). وهذا كان يمثل عائقًا واضحًا، خاصة عند المقارنة مع منافسين مثل Gemini 2.5 Flash الذي يوفر ما يصل إلى مليون توكن (1M).

ومع إصدار Sonnet 4.5، عالجت Anthropic هذا التحدي بشكل فعّول. فقد زودت النموذج الجديد بـ ميزات محسّنة، وأداء أقوى، والكثير من الأرقام المبهرة التي تدعم هذه التحسينات.

وبحسب بيان الإطلاق الرسمي، يتوفر Claude Sonnet 4.5 فورًا عبر واجهة الدردشة Claude وواجهة API. ومن اللافت أن أسعار النموذج الجديد لم تتغير عن سابقه، حيث تبلغ:

  • 3 دولارات لكل مليون توكن للمدخلات
  • 15 دولارًا لكل مليون توكن للمخرجات

وبالنظر إلى الأداء المذهل الذي يقدمه، أعتقد أن هذا التسعير يمثل قيمة استثنائية مقارنة بما تقدمه النماذج المنافسة.

مقالة ذات صلة: Claude AI: كيف يغيّر هذا النموذج المتطور مستقبل الذكاء الاصطناعي؟.

الميزات الجديدة في Claude 4.5

يقدم Claude 4.5 مجموعة من الميزات الجديدة الرائعة التي تستحق الوقوف عندها. فكما أشرنا سابقًا، يتصدر النموذج معايير SWE-bench Verified، لكنه حقق أيضًا قفزات هائلة في اختبار OSWorld الذي يقيس قدرات الاستخدام الحاسوبي.

والأكثر إثارة للدهشة هو القفزة الهائلة من 42.2% في إصدار Sonnet 4 قبل أربعة أشهر فقط، إلى 61.4% في الإصدار الحالي. وهذا يجعل هذا الجانب واحدًا من أبرز ملامح Sonnet 4.5، في رأيي.

ويمكننا رؤية هذا التطور عمليًا من خلال العرض التجريبي لإضافة Claude for Chrome، حيث يُظهر النموذج قدرته على اتخاذ إجراءات مباشرة في المتصفح بناءً على أوامر نصية بسيطة نسبيًا.

معيار أداء معتمد من SWE-bench يُظهر أداء Sonnet 4.5
معيار أداء معتمد من SWE-bench يُظهر أداء Sonnet 4.5: المصدر

ومن بين الميزات اللافتة أن النموذج قادر على الحفاظ على التركيز لأكثر من 30 ساعة متواصلة على المهام المعقدة متعددة الخطوات.

هناك العديد من الميزات الجديدة البارزة الأخرى أيضًا تعرف عليها:

وضع التفكير الممتد Extended Thinking Mode

كما رأينا في نماذج مثل GPT-5 وGrok 4، يقدم Sonnet 4.5 وضع التفكير الممتد. هذا الوضع يستخدم عملية تفكير أطول للمهام الأكثر تعقيدًا، ويعرض سلسلة الاستدلال (Chain-of-Thought) بشكل واضح للمستخدم.

تحسين المعرفة في المجالات المتخصصة Better Domain-Specific Knowledge

وفقا للتقارير، يحقق النموذج الجديد أداءً متصدرًا في مجالات محددة تشمل:

  • التمويل (Finance)
  • القانون (Law)
  • الطب (Medicine)
  • العلوم والتكنولوجيا والهندسة والرياضيات (STEM)

بالنظر إلى التصريحات الواردة في وثائق الإطلاق من شركات مثل Cursor وGitHub وNetflix وغيرها، أعتقد أن هذه الميزة تستهدف بشكل واضح جذب العملاء من المؤسسات والشركات الكبرى لتبني Sonnet 4.5.

النموذج الرائد الأكثر توافقًا مع القيم الإنسانية Most Aligned Frontier Model

وفقًا لـ Anthropic، كان التدريب على السلامة والأمان محوريًا في هذا الإصدار الجديد. ويظهر Claude Sonnet 4.5 انخفاضًا كبيرًا في الاستجابات غير المرغوب فيها. وهذا يعني أننا كمستخدمين سنشهد انخفاضًا هائلاً في حالات:

  • التملق (Sycophancy)
  • الخداع (Deception)
  • السعي للسلطة (Power-seeking)
  • الاستجابات الوهمية (Delusional responses)

نموذج أكثر أمانًا بشكل عام A Safer Model Overall

كما سنرى مع Claude Agent SDK، تتسم سير العمل الوكيلية والاستخدامات الحاسوبية بالمجالات التي يؤدي فيها Claude Sonnet 4.5 أداءً متميزًا. ومع أخذ هذا في الاعتبار، تستشهد Anthropic بتحسينات كبيرة في مجال الدفاع ضد هجمات حقن التعليمات (Prompt Injection Attacks)، والتي لا تزال تشكل مصدر قلق لهذه الوظائف.

اختبار أداء Claude Sonnet 4.5

لمعرفة ما يمكن أن يقدمه Claude Sonnet 4.5 على أرض الواقع، كلفناه بعدة مهام عملية لتقييم إمكاناته الحقيقية. دعونا نستعرض كل مهمة بالتفصيل:

مهمة برمجية بسيطة Simple Coding Task

في البداية، طلبت منه إنشاء تطبيق بسيط إلى حد ما لتتبع العادات الصحية الإيجابية. إليكم النص الذي استخدمته:

“أريد إنشاء تطبيق يساعدني في تتبع عاداتي اليومية الإيجابية. أريده أن يبدو جميلاً، باستخدام الكثير من الألوان الطبيعية (أنا من محبي اللون الأخضر ولون الخشب!). أريد مساحة لتحديد العادة المراد ممارستها لكل يوم من أيام الأسبوع، مع عداد للمتابعة (Streak Counter)، ومساحة لإضافة الملاحظات والأفكار والصور. بالنسبة للعادات الإيجابية، أريد عادة مختلفة كل يوم، لكني أفكر في أشياء مثل التأمل والامتنان وما شابه ذلك، والتي ثبت أن لها فوائد مثبتة للصحة النفسية.”

اختبار أداء Claude Sonnet 4.5 في البرمجة

والنتيجة كانت مبهرة، حيث بدأ النموذج في كتابة الكود مباشرة داخل المتصفح، ثم قام بتجميعه (Compile) بسرعة فائقة. وهذا الأداء يشبه إلى حد كبير النتائج التي رأيناها مع Grok 4 وGPT-5.

كانت النتيجة سريعة (للأسف، لم يذكر الوقت بالتحديد، لكنه على الأرجح كان حوالي 55 ثانية فقط)، وبدا أنها حل بسيط وفعال، وكان البرنامج مفيدًا وقدم ما طلبته.

نتيجة اختبار البرمجة

تحليل الأداء: ماذا حدث خلف الكواليس؟

عند تحليل أداء النموذج في هذه المهمة، نلاحظ عدة نقاط مهمة:

أولاً، فهم النموذج المتطلبات الجمالية بدقة، حيث استخدم الألوان الطبيعية (الأخضر والخشبي) كما طلبت، مما يدل على فهمه للذوق البشري.

ثانيًا، استطاع ترجمة المتطلبات الوظيفية إلى كود برمجي متكامل يشمل:

  • عداد أسبوعي للعادات
  • نظام لتتبع الاستمرارية (Streak Counter)
  • مساحات لإدخال الملاحظات والصور

ثالثًا، أظهر النموذج فهمًا للسياق النفسي، حيث استوعب أن العادات المقصودة هي تلك المرتبطة بالصحة النفسية (التأمل والامتنان)، وليس مجرد عادات عادية.

مقارنة سريعة مع المنافسين

المعيارClaude Sonnet 4.5GPT-5Grok 4
سرعة التجميع (Compile)⚡ سريعة جدًا⚡ سريعة⚡ سريعة جدًا
فهم الجماليات✅ ممتاز✅ جيد جدًا✅ جيد
الالتزام بالمتطلبات✅ دقيق✅ دقيق✅ دقيق
جودة الكود النهائي⭐ احترافية⭐ احترافية⭐ احترافية

يبدو أن Claude Sonnet 4.5 يقدم أداءً برمجيًا واعدًا، خاصة في المهام التي تتطلب فهمًا عميقًا للمتطلبات الوظيفية والجمالية معًا. وقدرته على الترجمة الفورية للأفكار إلى كود عملي تجعله أداة قوية للمطورين والمصممين على حد سواء.

إختبار كلود سونيت 4.5 في مهمة حسابية

بعد ذلك، قيمت مهارات كلود سونيت 4.5 في الرياضيات. أعطيت النموذج الجديد عملية حسابية بسيطة للغاية: ما هو ناتج طرح 6.999 من 7.001؟

على الرغم من أن الإجابة كانت دقيقة وفورية جدًا، إلا أنها افتقرت إلى التبرير، لذا طلبت منه إرسال إجابة متابعة. وقدم لي ثلاث طرق أخرى لحسابها، وجميعها كانت ناجحة.

عندما جرّبنا GPT-5، كانت إجابته أقل تبريرًا بشكل واضح، فأخبرت Claude أنني أشك في أنها قد تكون خاطئةوعلى الرغم من أن التفسير كان غريبًا بعض الشيء، إلا أنه أرشدني خلال العملية الحسابية بطريقة مختلفة، وأخبرني أنني كنت على صواب في إعادة التحقق (لكنني لم أكن على صواب تمامًا):

إختبار كلود سونيت 4.5 في مهمة حسابية

معايير أداء Claude Sonnet 4.5

دعونا نقارن هذا النموذج الجديد بالنماذج الحالية. وكما هو معتاد، لا تقدم لنا معايير الأداء سوى معلومات محدودة، وغالبًا ما تُزاح أفضل النماذج عن الصدارة. مع ذلك، وكما يظهر الرسم البياني أدناه، يحقق Claude Sonnet 4.5 الآن أرقامًا مذهلة للغاية:

معايير أداء Claude Sonnet 4.5

أعتقد أن أبرز النتائج هنا هي، كما ناقشنا، في أداء الوكالة الذكية والاستخدام الحاسوبي:

البرمجة الوكيلة77.2%، و 82.0% مع الحوسبة المتوازنة أثناء الاختبار. تحسن طفيف مقارنة بنماذج Claude الأخرى، وتفوق أكبر على GPT-5 و Gemini 2.5 Pro.

استخدام الأدوات الوكيل: تتراوح من 70% للمهام المتعلقة بشركات الطيران إلى 98% في قطاع الاتصالات، وكلاهما يمثل نقاط قوة مقارنة بالنماذج الأخرى.

الاستخدام الحاسوبي: ربما يكون هذا أبرز تحسن61.4% تتقدم بشكل كبير على أقرب منافس، Claude Opus 4.1.

التحليل المالي: نتيجة متصدرة أخرى مقارنة بالنماذج المماثلة.

أدوات التحليل المالي مع نموذج Claude Sonnet 4.5

الأيام المقبلة وحدها كفيلة بالكشف عن نتائج المعايير الكاملة، خاصة في ظل تركيز Anthropic على إشادات الخبراء بوجود تحسن جوهري في المعرفة المتخصصة بمجالات رئيسية.

كيفية الوصول إلى Claude Sonnet 4.5

يتوفر Claude Sonnet 4.5 الآن عبر عدة قنوات مختلفة. واستنادًا إلى كيفية استخدامك له، يمكنك الوصول إلى النموذج الجديد من خلال واجهة الدردشة Claude، أو التطوير عبر واجهة برمجة التطبيقات API، أو دمجه في سير العمل المؤسسي. إليكم كيفية عمل الوصول:

الوصول عبر الدردشة Chat Access

يمكنك استخدام Claude Sonnet 4.5 مباشرة من خلال واجهة الويب Claude.ai أو التطبيقات المحمولة (iOS و Android). وهو متاح لجميع المستخدمين، بما في ذلك أولئك الذين يستخدمون النسخة المجانية. وهذا يجعله متاحًا على نطاق واسع لكل من المستخدمين العاديين والمحترفين.

الوصول عبر API

للمطورين، يمكنكم الوصول إلى النموذج عبر Anthropic API، وهو متاح أيضًا على Amazon Bedrock و Google Cloud Vertex AI.

أسعار API (اعتبارًا من سبتمبر 2025) هي:

  • 3 دولارات لكل مليون توكن للمدخلات
  • 15 دولارًا لكل مليون توكن للمخرجات

يمكن للمعالجة الدفعية والتخزين المؤقت للتعليمات أن تقلل التكاليف بنسبة تصل إلى 90% في بعض الحالات.

ما هي Claude Agent SDK الخاصة بـ Claude Agent؟

Claude Agent SDK أو مجموعة أدوات تطوير البرمجيات (SDK)، أحد الإعلانات المثيرة الأخرى من Anthropic، إلى جانب إطلاق Sonnet 4.5وباختصار، يمكن للمطورين الآن بناء روبوتاتهم الخاصة المدعومة بـ Claude باستخدام هذه المكونات الداخلية التي توظفها Anthropic نفسها في تطويراتها. ويمثل هذا الإصدار نقلة نوعية في تمكين المطورين من تسخير إمكانات Claude بطرق مخصصة تناسب احتياجاتهم الخاصة.

أعتقد أن العديد من المستخدمين سيسعدون بـ Agent SDK، خاصة أولئك الذين يرغبون في إنشاء عمليات وكيلة متطورة. فاستنادًا إلى إطار Claude Code، يمكن هذه المجموعة المستخدمين من تصميم وكلاء أذكياء لأغراض متعددة تشمل الأتمتة، وخدمة العملاء، والبحث والتحليل. وهذا يفتح آفاقًا واسعة أمام الشركات والمطورين لابتكار حلول ذكية تتناسب مع متطلبات عصر الرقمنة.

تتيح الإمكانات التي يوفرها Agent SDK إمكانية بناء وكلاء متعددي الأغراض قادرين على اكتساب السياق باستمرار، واتخاذ الإجراءات، والتحقق من عملهم بأنفسهم. وتشمل هذه الإمكانات الوصول إلى نظام الملفات، والبرمجة النصية عبر Bash، والبحث الدلالي والوكيل، والوكلاء الفرعيين، بالإضافة إلى التكاملات الجاهزة عبر بروتوكول سياق النموذج. هذه الأدوات مجتمعة تمنح المطورين مرونة غير مسبوقة في بناء تطبيقات ذكية تعمل بكفاءة عالية.

معرفة أداة التخيل مع Imagine Claude Sonnet 4.5

من بين الإصدارات المثيرة للاهتمام أيضًا، نجد أداة Imagine with Claude، وهي نسخة معاينة بحثية من أداة قادرة على توليد البرمجيات بشكل فوري. وقد نشرت Anthropic مقطع فيديو قصيرًا يستعرض قدرة Claude Sonnet 4.5 على العمل بهذه الطريقة المبتكرة.

يُعد هذا العرض التجريبي رائعًا، حيث يظهر كيف يمكن للأداة العمل بشكل تفاعلي بناء على تفاعلاتك، مما يتيح توليد عناصر متنوعة بسرعة وبشكل مباشر. وهذا يعكس تطورًا كبيرًا في قدرة النماذج على فهم الاحتياجات وتحويلها إلى مخرجات برمجية ملموسة في لحظتها.

أعتقد أن هناك إمكانات هائلة هنا لتنفيذ مشاريع مثيرة للاهتمام، حيث يمكن للمستخدمين المبدعين استكشاف آفاق جديدة في تطوير البرمجيات. ويمكن لمشتركي Anthropic Max تجربة الأداة لمدة خمسة أيام بعد الإطلاق. وعلى الرغم من أن هذه نافذة محدودة نوعًا ما، إلا أنني أشك في أن تكون هذه آخر مرة نرى فيها هذا النوع من الأدوات، بل أتوقع أن نشهد مزيدًا من التطوير والانتشار لهذه التقنية الواعدة.

الخاتمة

أصبح Claude Sonnet 4.5 بين أيدينا، والانطباعات الأولى تبشر بخير كبير. أعجبنا في وسام ويب التوجه الذي تتبناه Anthropic مع هذا الإصدار، حيث تركز بشكل أكبر على البرمجة، والوكلاء الأذكياء، والاستخدام الحاسوبي. من الواضح أن الشركة واثقة تمامًا من قدرة هذا الإصدار الجديد على الأداء بمستوى يثير اهتمام المستخدمين من المؤسسات، مما يعني أننا نقترب أكثر من أي وقت مضى من نقطة التبني الواسع النطاق لأدوات الاستخدام الحاسوبي.

ومع ذلك، يبقى السؤال الأهم: كم من الوقت سيحافظ Sonnet 4.5 على صدارة معايير الأداء في المجالات الوكيلة والاستخدام الحاسوبي؟ وإن كانت المكاسب التي حققها خلال الأشهر الأربعة الماضية تبدو كبيرة وملحوظة للغاية. وبالمثل، فإن نافذة السياق المحدودة نسبيًا قد تعني أنه لا يزال من الصعب التعامل مع قواعد الأكواد البرمجية الضخمة بطريقة فعالة وحقيقية.

ورغم ذلك، منتظرين بشوق لرؤية المشاريع التي ستنبثق من أدوات مثل Claude Agent SDK وImagine with Claude، كما أن إضافة Claude for Chrome ستكون إضافة مفيدة لمختلف سير العمل.

الأسئلة الشائعة

Claude Sonnet 4.5 يقدم قفزة نوعية في أتمتة المهام المعقدة بفضل تحسيناته الهائلة في الأداء الوكيل (Agentic Performance). فبنتيجة 82.0% في البرمجة الوكيلة مع الحوسبة المتوازنة، يمكن للشركات بناء أنظمة ذكية تدير مشاريع برمجية كاملة بشكل مستقل لساعات طويلة. كما أن التكامل المباشر مع أدوات مثل Claude Agent SDK يتيح للمطورين تصميم وكلاء مخصصين لأتمتة خدمات العملاء، والتحليل المالي، والبحث العلمي، مما يخفض تكاليف التشغيل ويزيد الإنتاجية.

يشيد الخبراء بـتحسن جوهري في المعرفة المتخصصة لـ Sonnet 4.5 بمجالات التمويل والقانون والطب. وقد أثبت النتائج المتصدرة في التحليل المالي تفوقه على النماذج المماثلة، بفضل فهمه العميق للسياقات المعقدة وقدرته على معالجة المستندات الطويلة بدقة. هذا يجعله أداة لا غنى عنها للمحللين الماليين والمستشارين القانونيين الذين يحتاجون إلى استخلاص رؤى دقيقة من كميات هائلة من البيانات.

أولت Anthropic اهتمامًا استثنائيًا بـتدريب السلامة والأمان في هذا الإصدار. ويظهر Sonnet 4.5 تحسينات كبيرة في الأمن السيبراني و الدفاع ضد هجمات حقن التعليمات، التي كانت تشكل قلقًا رئيسيًا للوظائف الوكيلة. كما سجل النموذج انخفاضًا هائلاً في الاستجابات غير المرغوب فيها مثل الخداع والتملق والسعي للسلطة، مما يجعله النموذج الرائد الأكثر توافقًا مع القيم الإنسانية حتى الآن.

بسعر 3 دولارات للمدخلات و15 دولارًا للمخرجات لكل مليون توكن، يقدم Sonnet 4.5 قيمة استثنائية مقابل الأداء. فبينما ينافس GPT-5 وGemini 2.5 Pro في البرمجة العامة، يتفوق عليهما بوضوح في الاستخدام الحاسوبي (61.4%) والمهام الوكيلة (تصل إلى 98% في قطاع الاتصالات). كما أن إمكانية خفض التكاليف بنسبة 90% عبر المعالجة الدفعية تجعله خيارًا اقتصاديًا للمشاريع الكبيرة.

يتوفر Sonnet 4.5 عبر واجهة Claude.ai المجانية، مما يسمح للمبتدئين بتجربة إمكاناته مباشرة. يمكنهم استخدام الأوامر النصية البسيطة لإنشاء تطبيقات وظيفية، كما رأينا في مهمة تطبيق تتبع العادات الصحية التي نفذها النموذج بسرعة. ومع إطلاق Claude for Chrome، يمكن للمستخدمين العاديين أتمتة مهامهم اليومية في المتصفح دون كتابة سطر برمجي واحد، مما يفتح الباب واسعًا لغير المختصين.

يقدم Sonnet 4.5 وضع التفكير الممتد (Extended Thinking) الذي يعرض سلسلة الاستدلال الكاملة (Chain-of-Thought) بشكل شفاف، على غرار GPT-5 وGrok 4. لكن ما يميزه هو دمج هذا الوضع مع قدراته الوكيلة، مما يمكنه من التفكير في المشكلات المعقدة أثناء تنفيذ مهام متعددة الخطوات بشكل متزامن، وهو ما يفسر تفوقه الكبير في اختبارات مثل OSWorld وSWE-bench.

يمثل Claude Agent SDK نقلة نوعية في تمكين المطورين، حيث يقدم لهم نفس المكونات الداخلية التي تستخدمها Anthropic. فبإمكانهم الآن بناء وكلاء متعددي الأغراض يتمتعون بـالوصول إلى نظام الملفات، والبحث الدلالي والوكيل، والتكامل مع الأدوات الخارجية. هذا يعني أن المطورين لم يعودوا بحاجة لبناء كل شيء من الصفر، بل يمكنهم الاستفادة من قدرات Claude لإنشاء حلول مبتكرة بوقت وجهد أقل.

فريق وسام ويب

فريق موقع وسام ويب هو مجموعة من الكتّاب والخبراء المتخصصين في التكنولوجيا، البرمجة، والذكاء الاصطناعي، يجمعنا الشغف بالمعرفة والابتكار. نقدم لكم محتوى عميق وتحليلات دقيقة حول أحدث التطورات الرقمية، مستندين إلى خبرتنا الواسعة ورؤيتنا المستقبلية. في وسام ويب، لا ننقل المعلومة فقط، بل نعيشها ونحللها لنقدم لكم فهمًا حقيقيًا لكل ما هو جديد في عالم التكنولوجيا والتحول الرقمي. نحن هنا لنكون مصدر إلهامكم وثقتكم في رحلة استكشاف المستقبل الرقمي. 🚀
زر الذهاب إلى الأعلى