GPT-4 مراجعة إصداراً أكثر قوة من تقنية الذكاء الاصطناعي لشركة OpenAI
لقد وضعت الشركات الكبرى ومنشئو المحتوى أنظارهم على تطوير الذكاء الاصطناعي الذي يمكنه القيام بجميع مهام البشر والإجابة على استفساراتهم. تم تصميم GPT-4 للإجابة على الاستفسارات وتقديم التوجيه على الإنترنت.
يمكن لهذا النموذج المتقدم متعدد الوسائط تفسير كل من مدخلات الصور والنصوص لتوليد مخرجات نصية. هذا تقدم كبير في مجال الذكاء الاصطناعي، وخاصة في معالجة اللغة الطبيعية. بالطبع، لا يزال بعيدًا عما كنا نأمله، لكنه خطوة في الاتجاه الصحيح.
OpenAI GPT-4 هو إصدار أكثر تقدمًا من ChatGPT 3.5 يمكن للجميع استخدامه. يحتوي هذا الإصدار على المزيد من الترقيات والوظائف الأفضل من الجيل السابق، ولكن ما مدى فائدته؟ هل يمكن استخدامه كمساعد عبر الإنترنت؟ كيف يمكن الوصول إليه على الإطلاق؟ تابع حتى نهاية المقال للحصول على إجابات لهذه الاستفسارات.
قبل أن نناقش GPT 4، من المهم أن نفهم تاريخه ونشأته، والذي سأفصله أدناه.
جدول المحتويات
ما هو GPT؟
المحولات المدربة مسبقًا التوليدية (Generative Pre-trained Transformers) إختصار لـ (GPT) هي نوع من نماذج التعلم العميق التي يمكنها توليد لغة تشبه الكتابة البشرية. وهي مفيدة لمهام مختلفة، بما في ذلك الإجابة على الاستفسارات، وتلخيص المعلومات، وترجمة المحتوى إلى لغات متعددة، وتوليد التعليمات البرمجية، وتوليد محتوى قائم على النص مثل منشورات المدونات والقصص والدردشات. يمكن أن يؤدي ضبط نماذج GPT بدقة لبيانات محددة إلى تعظيم إمكاناتها، مما يقلل من التكاليف الحسابية والوقت والموارد.
تاريخ GPT
مهدت نماذج المحولات، مثل نموذج BERT من Google في عام 2017، الطريق لتحديث الذكاء الاصطناعي للغة الطبيعية. قبل نموذج Transformer، كانت شبكات الذاكرة الطويلة والقصيرة المدى (LSTMs) موجودة. كانت تعمل بشكل جيد للكلمات أو العبارات الصغيرة ولكنها واجهت صعوبة في توليد معلومات أطول.
كان أداء نموذج BERT المحول أفضل بشكل ملحوظ لأنه لم يكن أسلوب تعلم خاضع للإشراف ولم يتطلب مجموعات بيانات مُصنَّفة باهظة الثمن للتدريب. بشكل عام، تنقسم أجيال GPT إلى المجموعات التالية:
- GPT-1
- GPT-2
- GPT-3
- GPT-4
قبل مناقشة GPT 4، من الأفضل مراجعة كل جيل من الأجيال المختلفة من GPT أو المحولات بإيجاز.
ما هو GPT-1؟
في عام 2018، قدمت OpenAI دراسة بعنوان (Improving Language Understanding by Generative Pre-Training) والتي وصفت استخدام فهم اللغة الطبيعية مع نموذج اللغة الرائد الخاص بهم، GPT-1. كان هذا النموذج بمثابة دليل على المفهوم ولم يتم إتاحته لعامة الناس. بنية هذا النموذج هي كما يلي:
ما هو GPT-2؟
بعد عام، نشرت OpenAI مقالة جديدة بعنوان (Language Models are Unsupervised Multitask Learners) وكشفت عن نموذجها المنقح، GPT 2. تم توزيع هذا النموذج على مجتمع التعلم الآلي وبدأ استخدامه في مهام إنشاء النصوص. يصور الرسم البياني التالي أداء النموذج في العديد من المهام، مثل الترجمة والتلخيص وإنتاج الردود وتفسير المعلومات:
ما هو GPT-3؟
في عام 2020، أصدرت OpenAI دراسة أخرى بعنوان (Language Models are Few-Shot Learners)، هذه المرة ركزت على نموذج الجيل الثالث، GPT3. احتوى هذا النموذج على معلمات أكثر بـ 100 مرة من GPT-2 وتم تدريبه على مجموعة بيانات نصية أكثر شمولاً، مما أدى إلى أداء أفضل بكثير. تطور نموذج GPT-3 إلى العديد من التجسيدات المعروفة باسم سلسلة GPT-3.5، والتي تضمنت ChatGPT الذي يركز على الدردشة. أسفرت مهام ضمان الجودة الثلاث ذات النطاق المفتوح لهذا النموذج عن النتائج التالية:
سرعان ما أصبح ChatGPT معروفًا بقدرته على توليد الكتابة الشبيهة بالكتابة البشرية. حقق هذا البرنامج رقمًا قياسيًا باعتباره أسرع تطبيق عبر الإنترنت نموًا على الإطلاق، حيث بلغ عدد مستخدميه 100 مليون مستخدم في شهرين فقط.
ما هو GPT-4؟
GPT-4، أحدث إصدار من ChatGPT، هو نموذج ذكاء اصطناعي متقدم طورته شركة Open AI. وهو خليفة GPT-3، الذي يتمتع بهندسة معمارية مماثلة ولكن مع بعض التحسينات. ويستند إلى هندسة Transformer، التي تستخدم تقنيات التعلم العميق لمعالجة وإنشاء نص يشبه الإنسان. يتم تدريب GPT-4 على مجموعة متنوعة من مجموعات البيانات النصية التي يتم جلبها من الإنترنت. وهذا يجعله قادرًا على فهم السياق وتوليد استجابات متماسكة وأداء مهام مثل التلخيص والترجمة.
تقول OpenAI إنها عملت مع العديد من الشركات، بما في ذلك Duolingo و Stripe و Khan Academy، لدمج نموذج اللغة الجديد في خدماتها. يتوفر نموذج اللغة الجديد لمشتركي ChatGPT Plus، الذين يدفعون 20 دولارًا شهريًا. قالت Microsoft بشكل منفصل أن الإصدار الجديد من Bing مبني على معيار GPT 4. ستتوفر واجهة برمجة تطبيقات نموذج لغة GPT-4 قريبًا للمطورين عبر OpenAI.
تدعي OpenAI أن الفرق بين GPT-4 و GPT-3.5 “غير محسوس” في المحادثات اليومية. GPT-3.5 هو النموذج المستخدم لإنشاء ChatGPT. ووفقًا للرئيس التنفيذي لشركة OpenAI سام ألتمان، فإن GPT-4 لا يزال “غير كامل ومحدود”، ويبدو أكثر إثارة للإعجاب للوهلة الأولى مما يبدو عليه بعد فترة.
يمكن أن يتراوح أداء نموذج الذكاء الاصطناعي هذا من تفسير أوراق العمل المحملة وتقديم إجابات للأسئلة إلى قراءة البيانات من المخططات وحساب النتائج بناءً على المعلومات المقدمة. توضح الصور التالية ذلك:
وأيضًا الصورة التالية توضح الفهم الكامل لهذا النموذج اللغوي للصورة:
ما هي الميزات الجديدة في GPT-4؟
يحتوي GPT-4 على عدد من التحسينات الجديدة التي تركز على “محاذاة النموذج” (Alignment)، والتي ستتطلب فهمًا أفضل لنية المستخدم وإنشاء ردود أكثر دقة وأمانًا وإحترافية. فيما يلي 3 من الميزات والقدرات الجديدة في GPT-4.
أداء محسّن
قد تتساءل ما هي الميزة الأكبر في النموذج الجديد، حيث أن GPT-4 أفضل بشكل ملحوظ من GPT-3.5 في إنتاج استجابات واقعية. يقلل هذا النموذج من احتمالية الهلوسة، أو المواقف التي يرتكب فيها النموذج أخطاء واقعية أو منطقية، مما يجعل GPT4 نموذجًا أكثر موثوقية. في الواقع، وفقًا لمعيار الأداء الداخلي في العالم الحقيقي لشركة OpenAI، تفوق GPT-4 على سابقه، GPT-3.5، بنسبة 40%.
يتميز النموذج أيضًا بمطالبات متقدمة، مما يسمح له بتعديل ناتجه بناءً على إدخال المستخدم. قد يطلب المستخدمون منه استخدام أسلوب أو نغمة أو صوت معين، على سبيل المثال. يمكن للمستخدمين تجربة مطالبات مختلفة.
على سبيل المثال، قد تطلب منه شرح موضوع للمبتدئين ثم تطلب منه تكرار العملية لخبير. هناك تحسن كبير آخر وهو الالتزام الصارم للنموذج بالمبادئ التوجيهية الأخلاقية. أصبح النموذج الآن أفضل في رفض الطلبات غير القانونية أو غير المناسبة.
المدخلات المرئية في GPT 4
يتمتع GPT-4 الآن بالقدرة على التعامل مع مدخلات الصور بالإضافة إلى النص، على الرغم من أن هذه الوظيفة لا يمكن الوصول إليها إلا في معاينة البحث ولم يتم الإعلان عنها بعد. تتيح هذه التقنية المتعددة الوسائط للمستخدمين تحديد المهام المرئية أو اللغوية باستخدام كل من النص والرسومات. وقد رأينا أمثلة على ذلك أعلاه. ويسلط المثال التالي الضوء أيضًا على هذه المشكلة، وتوضح هذه الصورة كيفية تحليل المواقف المعقدة باستخدام هذا النموذج.
معايير أداء GPT-4
سؤال مهم آخر قد يطرحه العملاء أثناء فحص أداء هذا النموذج هو ما هي مقاييس أداء GPT 4 ولماذا يعد هذا النموذج نموذج اللغة الأكثر شهرة المتاح. قامت OpenAI بتقييم مهارات جي بي تي-4 باستخدام مجموعة متنوعة من الاختبارات على مستوى الإنسان، بما في ذلك اختبار SAT للقبول في الكلية، واختبار نقابة المحامين الموحد، واختبار LSAT للمهنيين القانونيين. أشارت النتائج إلى أن جي بي تي-4 كان أداؤه على مستوى الإنسان في العديد من الاختبارات الأكاديمية والمهنية. توضح الصورة أدناه ذلك:
تم اختبار GPT-4 أيضًا باستخدام معايير التعلم الآلي النموذجية، وتفوق على نماذج اللغات الكبيرة الأخرى بالإضافة إلى معظم النماذج عالية المستوى التي تم إنشاؤها صراحةً لهذه المعايير أو تلقت تدريبًا إضافيًا. تضمنت هذه التقييمات أسئلة متعددة الخيارات في 57 تخصصًا مختلفًا، بالإضافة إلى التفكير العقلاني فيما يتعلق بالأحداث اليومية والمشكلات العلمية.
بالإضافة إلى ذلك، قامت OpenAI بتقييم كفاءة جي بي تي-4 في لغات أخرى غير الإنجليزية. تمت ترجمة معيار MMLU، الذي يتكون من 14000 سؤال متعدد الخيارات تغطي 57 موضوعًا، إلى العديد من اللغات باستخدام Azure Translate. من بين 26 لغة تم فحصها، تفوق جي بي تي-4 على GP-3.5 ونماذج اللغات الأخرى. باختصار، يمثل الأداء العالي لـ GPT-4 خطوة كبيرة إلى الأمام في سعي OpenAI لإنشاء نماذج الذكاء الاصطناعي ذات القدرات المتقدمة.
كيفية الوصول إلى GPT-4
على عكس سابقتها، فإن GPT-4 ليس مجانيًا. للوصول إلى GPT-4، تقدم OpenAI الآن خيار إدخال نص عبر عضوية ChatGPT Plus مقابل 20 دولارًا شهريًا. ومع ذلك، يفرض نموذج الاشتراك قيودًا على المستخدم، مما قد يحد من التوافر الدائم.
يوفر Bing Chat وصولاً مجانيًا إلى إمكانيات النص في GPT4. يدعم Bing Chat، الذي تم الإعلان عنه في نفس يوم GPT-4، الآن بواسطة الأخير لأول مرة.
ما هو الفرق بين GPT 3.5 وGPT-4؟
ما هو الفرق بين GPT 3.5 وGPT 4؟ سؤال مثير للاهتمام. يستخدم GPT-3.5، الذي يحد من قدرة chatbot على تفسير المدخلات والمخرجات النصية. الميزة الأهم لجي بي تي-4 على GPT-3.5 هي قدراته المتعددة الوسائط، مما يمكنه من تحليل إدخال الصور والنصوص.
قد لا يكون التمييز بين GPT-3.5 وGPT-4 واضحًا على الفور من حيث الاتصال التحادثي. ومع ذلك، تعتقد OpenAI أن GPT-4 يتفوق في الموثوقية والإبداع والذكاء، كما يتضح من الأداء المتزايد في معايير مختلفة.
قمنا بإعداد جدول شامل يوضح الفروق بين GPT-4 وGPT-3.5، بما في ذلك المعلومات التقنية، والأسعار، والمعلمات، والمزيد:
الميزة | GPT-3.5 | GPT-4 |
---|---|---|
سنة الإصدار | 2021 | 2023 |
عدد المعلمات | 175 مليار | 175 مليار (قد يكون أكثر في بعض النماذج) |
التحسينات في الأداء | أداء قوي في معالجة النصوص وتوليدها | تحسينات كبيرة في الفهم والتوليد والتعامل مع السياقات المعقدة |
فهم اللغة | قوي، لكن محدود في بعض السياقات | أفضل بكثير في فهم السياقات المعقدة وتعقيد النصوص |
الاستجابة للسياق | قدرة جيدة على التعامل مع سياقات النصوص | قدرة متقدمة على متابعة السياقات طويلة الأمد وتحليلها بشكل أعمق |
دقة الردود | عالية لكن قد تحتوي على بعض الأخطاء | دقة أعلى مع تقليل الأخطاء وتحسين النتائج المناسبة |
توليد النصوص | فعال في توليد نصوص مترابطة وجيدة | أفضل في توليد نصوص أكثر تماسكاً وتعقيداً |
التعامل مع الأسئلة المعقدة | جيد، لكن قد يواجه صعوبة في بعض الأسئلة | أفضل بكثير في التعامل مع الأسئلة المعقدة وتقديم إجابات دقيقة |
الاستجابة للإدخالات غير المتوقعة | قد يتسبب في ردود غير متوقعة أحياناً | قدرة أفضل على التعامل مع الإدخالات غير المتوقعة وتقديم ردود ملائمة |
الاستجابة للأوامر والتعليمات | فعالة، لكن قد تحتاج بعض التحسينات | تحسين كبير في فهم الأوامر والتعليمات وتقديم استجابات دقيقة |
القدرة على التعلم من البيانات الجديدة | محدود في التعلم بعد التدريب | يتضمن تحسينات في التعلم من البيانات الجديدة والتكيف مع التغيرات |
تكلفة الاستخدام | أقل من GPT-4 | أعلى من GPT-3.5 بسبب التحسينات والقدرات المتقدمة |
الأداء في التطبيقات التخصصية | جيد في التطبيقات العامة | أداء متفوق في التطبيقات التخصصية مثل الطب، القانون، وما إلى ذلك |
أيضا، في التقييمات مثل امتحان نقابة المحامين وامتحان القانون التنفيذي واختبار الرياضيات SAT، فإن الاختلافات بين جي بي تي-4 وسابقه أكثر وضوحًا. في مجموعة متنوعة من الاختبارات، سجل GPT-4 في النسبة المئوية 88 أو أعلى:
الامتحانات المحاكاة |
|
|
---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
هل من الممكن الحصول على إجابة خاطئة باستخدام GPT 4؟
على الرغم من أن جي بي تي-4 يمثل تقدمًا كبيرًا، إلا أنه ليس مثاليًا. لا يزال لديه نفس أوجه القصور التي كانت موجودة في الإصدارات السابقة، مثل العيوب الواقعية والمشكلات المنطقية. اعترفت OpenAI بهذه المشكلات، لكنها تتوقع أن يتفوق GPT-4 على GPT-3.5، حيث يسجل 40% أعلى في التقييمات الواقعية القاسية وبالتالي يكون أقل عرضة لـ “الاستجابات الوهمية” أو إنشاء حقائق غير صحيحة. هذا واضح. يوضح الرسم البياني التالي هذه الحقيقة:
الكلمة الأخيرة
يعد OpenAI GPT-4 خطوة كبيرة إلى الأمام في عالم الذكاء الاصطناعي والتعلم الآلي. مع التحسينات الكبيرة في قدرته على فهم السياقات المعقدة، وتوليد نص عالي الجودة، وتقديم إجابات دقيقة، يقدم جي بي تي-4 نموذجًا متقدمًا يمكنه تلبية مجموعة واسعة من الاحتياجات في مجالات مختلفة.
تسمح لنا هذه التكنولوجيا الجديدة باستكشاف إمكانيات جديدة في التطبيقات المتقدمة، من الذكاء الاصطناعي التوليدي إلى المساعدة في حل المشكلات المعقدة في العلوم والتكنولوجيا. ومع ذلك، يظل من الضروري أن نستمر في تطوير السياسات والمبادئ التوجيهية الأخلاقية لضمان استخدام هذه التكنولوجيا بشكل مسؤول وآمن.
نتطلع إلى مستقبل حيث ستشكل نماذج مثل جي بي تي-4 تطور الذكاء الاصطناعي، مما يؤثر بشكل إيجابي على كيفية تفاعلنا مع التكنولوجيا ومعالجة المعلومات. وبفضل هذه التطورات، أصبحنا أقرب خطوة واحدة إلى تحقيق إمكانات الذكاء الاصطناعي، مما سيعزز الابتكار ويساهم في تحسين نوعية حياتنا.
تم إصدار OpenAI GPT-4، نموذج اللغة الأكثر تقدمًا لتوليد النصوص، في 14 مارس 2023. يمكن لهذا النموذج قراءة الأوامر المكتوبة والمرئية. إن استخدام نموذج الذكاء الاصطناعي هذا ليس مجانيًا في الوقت الحالي، حيث تبلغ رسوم العضوية الشهرية حوالي 20 دولارًا.