GPT-4 مراجعة إصداراً أكثر قوة من تقنية الذكاء الاصطناعي لشركة OpenAI
لقد وضعت الشركات الكبرى ومنشئي المحتوى نصب عينيها على تطوير الذكاء الاصطناعي القادر على القيام بجميع مهام الإنسان والإجابة على استفساراته. تم تصميم GPT-4 للإجابة على الاستفسارات وتقديم التوجيه على الإنترنت.
يمكن لهذا النموذج المتعدد الوسائط المتطور تفسير كل من مدخلات الصورة والنص لتوليد مخرجات نصية. هذا يعتبر تقدم كبير في مجال الذكاء الاصطناعي، وخاصة في معالجة اللغة الطبيعية. بالطبع، لا يزال بعيدًا عما كنا نأمله، لكنه خطوة في الاتجاه الصحيح.
OpenAI GPT-4 هو إصدار أكثر تقدمًا من ChatGPT 3.5 يمكن للجميع استخدامه. يحتوي هذا الإصدار على المزيد من الترقيات والوظائف الأفضل من الجيل السابق، ولكن ما مدى فائدته؟ هل يمكن استخدامه كمساعد عبر الإنترنت؟ كيف يمكن الوصول إليه على الإطلاق؟ تابعوا حتى نهاية المقال للحصول على إجابات لهذه الاستفسارات.
قبل أن نناقش GPT 4، من المهم أن نفهم تاريخه ونشأته، والذي سأفصله أدناه.
جدول المحتويات
ما هو GPT؟
المحولات المدربة مسبقًا التوليدية (Generative Pre-trained Transformers) إختصار لـ (GPT) هي نوع من نماذج التعلم العميق القادرة على إنشاء لغة تشبه الكتابة البشرية. هي مفيدة لمجموعة متنوعة من المهام، بما في ذلك الإجابة على الاستفسارات، وتلخيص المعلومات، وترجمة المحتوى إلى لغات متعددة، وإنتاج التعليمات البرمجية، وإنشاء محتوى قائم على النص مثل منشورات المدونة والقصص والدردشات.
قد يؤدي ضبط نماذج GPT بدقة لبيانات محددة إلى تعظيم إمكاناتها، مما يقلل من تكلفة الحوسبة والوقت والموارد.
تاريخ GPT
مهد نماذج المحولات، مثل BERT من Google في عام 2017، الطريق لتحديث الذكاء الاصطناعي للغة الطبيعية. قبل المحول، كانت شبكات الذاكرة طويلة المدى (LSTMs) موجودة. كانت تعمل بشكل جيد للكلمات أو العبارات الصغيرة ولكنها واجهت صعوبة في توليد معلومات أطول.
كان أداء نهج محول BERT أفضل بشكل ملحوظ لأنه لم يكن أسلوبًا للتعلم الخاضع للإشراف ولم يتطلب مجموعات بيانات موصوفة باهظة الثمن للتدريب. بشكل عام، تنقسم أجيال GPT إلى المجموعات التالية:
- GPT-1
- GPT-2
- GPT-3
- GPT-4
قبل مناقشة GPT 4، من الأفضل مراجعة كل جيل من الأجيال المختلفة من GPT أو المحولات بإيجاز.
ما هو GPT-1؟
في عام 2018، قدمت OpenAI دراسة بعنوان (Improving Language Understanding by Generative Pre-Training) والتي وصفت استخدام فهم اللغة الطبيعية مع نموذج اللغة الرائد الخاص بهم، GPT-1. كان هذا النموذج بمثابة دليل على المفهوم ولم يتم إتاحته لعامة الناس. بنية هذا النموذج هي كما يلي:
ما هو GPT-2؟
بعد عام، نشرت OpenAI مقالة جديدة بعنوان (Language Models are Unsupervised Multitask Learners) وكشفت عن نموذجها المنقح، GPT 2. تم توزيع هذا النموذج على مجتمع التعلم الآلي وبدأ استخدامه في مهام إنشاء النصوص. يصور الرسم البياني التالي أداء النموذج في العديد من المهام، مثل الترجمة والتلخيص وإنتاج الردود وتفسير المعلومات:
ما هو GPT-3؟
في عام 2020، أصدرت OpenAI دراسة أخرى بعنوان (Language Models are Few-Shot Learners)، هذه المرة ركزت على نموذج الجيل الثالث، GPT3. احتوى هذا النموذج على معلمات أكثر بـ 100 مرة من GPT-2 وتم تدريبه على مجموعة بيانات نصية أكثر شمولاً، مما أدى إلى أداء أفضل بكثير. تطور نموذج GPT-3 إلى العديد من التجسيدات المعروفة باسم سلسلة GPT-3.5، والتي تضمنت ChatGPT الذي يركز على الدردشة. أسفرت مهام ضمان الجودة الثلاث ذات النطاق المفتوح لهذا النموذج عن النتائج التالية:
سرعان ما أصبح ChatGPT معروفًا بقدرته على توليد الكتابة الشبيهة بالكتابة البشرية. حقق هذا البرنامج رقمًا قياسيًا باعتباره أسرع تطبيق عبر الإنترنت نموًا على الإطلاق، حيث بلغ عدد مستخدميه 100 مليون مستخدم في شهرين فقط.
ما هو GPT-4؟
GPT-4، أحدث إصدار من تطبيق Chat GPT، هو نموذج ذكاء اصطناعي متقدم طورته شركة Open AI. وهو خليفة GPT-3، الذي يتمتع بهندسة مشابهة ولكن مع بعض التحسينات. ويعتمد على هندسة المحول، التي تستخدم تقنيات التعلم العميق لمعالجة وإنشاء نص يشبه الإنسان. يتم تدريب جي بي تي-4 على العديد من البيانات النصية التي يتم جلبها من الإنترنت. وهذا يجعله قادرًا على فهم السياق وتوليد استجابات متماسكة وأداء مهام مثل التلخيص والترجمة.
تقول شركة OpenAI إنها عملت مع العديد من الشركات، بما في ذلك Duolingo وStripe وKhan Academy، لدمج نموذج اللغة الجديد في خدماتها. يتوفر نموذج اللغة الجديد لمشتركي ChatGPT Plus، الذين يدفعون 20 دولارًا شهريًا. قالت شركة Microsoft بشكل منفصل أن الإصدار الجديد من Bing مبني على معيار GPT 4. ستتوفر واجهة برمجة تطبيقات نموذج لغة جي بي تي-4 قريبًا للمطورين عبر OpenAI.
تزعم OpenAI أن الاختلاف بين GPT-4 وGPT-3.5 “غير محسوس” في المحادثات اليومية. GPT-3.5 هو النموذج المستخدم لإنشاء ChatGPT. وفقًا للرئيس التنفيذي لشركة OpenAI سام ألتمان، لا يزال جي بي تي-4 “غير كامل ومحدود”، ويبدو أكثر إثارة للإعجاب للوهلة الأولى مقارنة باستخدامه لفترة من الوقت.
يمكن أن يتراوح أداء نموذج الذكاء الاصطناعي هذا من تفسير أوراق العمل المحملة وتقديم إجابات للأسئلة إلى قراءة البيانات من المخططات وحساب النتائج بناءً على المعلومات المقدمة. توضح الصور التالية ذلك:
وأيضًا الصورة التالية توضح الفهم الكامل لهذا النموذج اللغوي للصورة:
ما هي الميزات الجديدة في GPT-4؟
يحتوي GPT-4 على عدد من التحسينات الجديدة التي تركز على “محاذاة النموذج” (Alignment)، والتي ستتطلب فهمًا أفضل لنية المستخدم وإنشاء ردود أكثر دقة وأمانًا وإحترافية. فيما يلي 3 من الميزات والقدرات الجديدة في GPT-4.
أداء محسّن
قد تتساءل ما هي الميزة الأكثر أهمية في جي بي تي-4. يتفوق GPT-4 بشكل كبير على GPT-3.5 من حيث إنتاج ردود واقعية. يقلل هذا النموذج من احتمالية حدوث ردود فعل مهلوسة (hallucinations) أو الظروف التي يرتكب فيها النموذج أخطاء واقعية أو منطقية، مما يجعل جي بي تي-4 نموذجًا أكثر موثوقية. في الواقع، وفقًا لمعيار الأداء الداخلي في العالم الحقيقي لـ OpenAI، تفوق GPT-4 على سابقه، GPT-3.5، بنسبة 40%.
يتميز هذا النموذج أيضًا بتوجيه متقدم، مما يمكنه من ضبط ناتجه بناءً على مدخلات المستخدم. قد يطلب المستخدمون، على سبيل المثال، منه استخدام أسلوب أو نغمة أو صوت معين. يمكن للمستخدمين تجربة تنبيهات مختلفة.
على سبيل المثال، قد تطلب منه شرح موضوع ما لمبتدئ ثم تطلب منه تكرار العملية لخبير. هناك تحسين رئيسي آخر وهو الالتزام الصارم للنموذج بالمبادئ التوجيهية الأخلاقية. أصبح النموذج الآن أفضل في رفض الطلبات غير القانونية أو غير اللائقة.
المدخلات المرئية في GPT 4
يتمتع GPT-4 الآن بالقدرة على التعامل مع مدخلات الصور بالإضافة إلى النص، على الرغم من أن هذه الوظيفة لا يمكن الوصول إليها إلا في معاينة البحث ولم يتم الإعلان عنها بعد. تتيح هذه التقنية المتعددة الوسائط للمستخدمين تحديد المهام المرئية أو اللغوية باستخدام كل من النص والرسومات. وقد رأينا أمثلة على ذلك أعلاه. ويسلط المثال التالي الضوء أيضًا على هذه المشكلة، وتوضح هذه الصورة كيفية تحليل المواقف المعقدة باستخدام هذا النموذج.
معايير أداء GPT-4
سؤال مهم آخر قد يطرحه العملاء أثناء فحص أداء هذا النموذج هو ما هي مقاييس أداء GPT 4 ولماذا يعد هذا النموذج نموذج اللغة الأكثر شهرة المتاح. قامت OpenAI بتقييم مهارات جي بي تي-4 باستخدام مجموعة متنوعة من الاختبارات على مستوى الإنسان، بما في ذلك اختبار SAT للقبول في الكلية، واختبار نقابة المحامين الموحد، واختبار LSAT للمهنيين القانونيين. أشارت النتائج إلى أن جي بي تي-4 كان أداؤه على مستوى الإنسان في العديد من الاختبارات الأكاديمية والمهنية. توضح الصورة أدناه ذلك:
تم اختبار GPT-4 أيضًا باستخدام معايير التعلم الآلي النموذجية، وتفوق على نماذج اللغات الكبيرة الأخرى بالإضافة إلى معظم النماذج عالية المستوى التي تم إنشاؤها صراحةً لهذه المعايير أو تلقت تدريبًا إضافيًا. تضمنت هذه التقييمات أسئلة متعددة الخيارات في 57 تخصصًا مختلفًا، بالإضافة إلى التفكير العقلاني فيما يتعلق بالأحداث اليومية والمشكلات العلمية.
بالإضافة إلى ذلك، قامت OpenAI بتقييم كفاءة جي بي تي-4 في لغات أخرى غير الإنجليزية. تمت ترجمة معيار MMLU، الذي يتكون من 14000 سؤال متعدد الخيارات تغطي 57 موضوعًا، إلى العديد من اللغات باستخدام Azure Translate. من بين 26 لغة تم فحصها، تفوق جي بي تي-4 على GP-3.5 ونماذج اللغات الأخرى. باختصار، يمثل الأداء العالي لـ GPT-4 خطوة كبيرة إلى الأمام في سعي OpenAI لإنشاء نماذج الذكاء الاصطناعي ذات القدرات المتقدمة.
كيفية الوصول إلى GPT-4
على عكس سابقتها، GPT-4 ليس مجاني. للوصول إلى GPT-4، تقدم OpenAI الآن خيار إدخال نص عبر عضوية ChatGPT Plus بقيمة 20 دولارًا شهريًا. ومع ذلك، يفرض نموذج الاشتراك قيودًا على المستخدم، مما قد يحد من التوافر الدائم.
يوفر Bing Chat وصولاً مجانيًا إلى إمكانيات النص جي بي تي-4. Bing Chat، الذي تم الإعلان عنه في نفس يوم GPT-4، مدعوم الآن من قبل الأخير لأول مرة. هذه الخدمة مجانية، ولكن يجب عليك التسجيل من خلال قائمة انتظار. حاليًا، لم تجعل OpenAI إمكانيات الإدخال المرئي لجي بي تي-4 عامة. تتعاون OpenAI حاليًا مع شريك واحد لتنفيذ هذه الوظيفة. يمكنك أيضًا قراءة منشورنا حول كيفية استخدام Chatgpt في هذا الصدد لفهم أفضل.
ما هو الفرق بين GPT 3.5 وGPT-4؟
ما هو الفرق بين GPT 3.5 وGPT-4؟ سؤال مثير للاهتمام. يستخدم GPT-3.5، الذي يحد من قدرة chatbot على تفسير المدخلات والمخرجات النصية. الميزة الأهم لجي بي تي-4 على GPT-3.5 هي قدراته المتعددة الوسائط، مما يمكنه من تحليل إدخال الصور والنصوص.
قد لا يكون التمييز بين GPT-3.5 وGPT-4 واضحًا على الفور من حيث الاتصال التحادثي. ومع ذلك، تعتقد OpenAI أن GPT-4 يتفوق في الموثوقية والإبداع والذكاء، كما يتضح من الأداء المتزايد في معايير مختلفة.
قمنا بإعداد جدول شامل يوضح الفروق بين GPT-4 وGPT-3.5، بما في ذلك المعلومات التقنية، والأسعار، والمعلمات، والمزيد:
الميزة | GPT-3.5 | GPT-4 |
---|---|---|
سنة الإصدار | 2021 | 2023 |
عدد المعلمات | 175 مليار | 175 مليار (قد يكون أكثر في بعض النماذج) |
التحسينات في الأداء | أداء قوي في معالجة النصوص وتوليدها | تحسينات كبيرة في الفهم والتوليد والتعامل مع السياقات المعقدة |
فهم اللغة | قوي، لكن محدود في بعض السياقات | أفضل بكثير في فهم السياقات المعقدة وتعقيد النصوص |
الاستجابة للسياق | قدرة جيدة على التعامل مع سياقات النصوص | قدرة متقدمة على متابعة السياقات طويلة الأمد وتحليلها بشكل أعمق |
دقة الردود | عالية لكن قد تحتوي على بعض الأخطاء | دقة أعلى مع تقليل الأخطاء وتحسين النتائج المناسبة |
توليد النصوص | فعال في توليد نصوص مترابطة وجيدة | أفضل في توليد نصوص أكثر تماسكاً وتعقيداً |
التعامل مع الأسئلة المعقدة | جيد، لكن قد يواجه صعوبة في بعض الأسئلة | أفضل بكثير في التعامل مع الأسئلة المعقدة وتقديم إجابات دقيقة |
الاستجابة للإدخالات غير المتوقعة | قد يتسبب في ردود غير متوقعة أحياناً | قدرة أفضل على التعامل مع الإدخالات غير المتوقعة وتقديم ردود ملائمة |
الاستجابة للأوامر والتعليمات | فعالة، لكن قد تحتاج بعض التحسينات | تحسين كبير في فهم الأوامر والتعليمات وتقديم استجابات دقيقة |
القدرة على التعلم من البيانات الجديدة | محدود في التعلم بعد التدريب | يتضمن تحسينات في التعلم من البيانات الجديدة والتكيف مع التغيرات |
تكلفة الاستخدام | أقل من GPT-4 | أعلى من GPT-3.5 بسبب التحسينات والقدرات المتقدمة |
الأداء في التطبيقات التخصصية | جيد في التطبيقات العامة | أداء متفوق في التطبيقات التخصصية مثل الطب، القانون، وما إلى ذلك |
أيضا، في التقييمات مثل امتحان نقابة المحامين وامتحان القانون التنفيذي واختبار الرياضيات SAT، فإن الاختلافات بين جي بي تي-4 وسابقه أكثر وضوحًا. في مجموعة متنوعة من الاختبارات، سجل GPT-4 في النسبة المئوية 88 أو أعلى:
الامتحانات المحاكاة |
|
|
---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
هل من الممكن الحصول على إجابة خاطئة باستخدام GPT 4؟
على الرغم من أن جي بي تي-4 يمثل تقدمًا كبيرًا، إلا أنه ليس مثاليًا. لا يزال لديه نفس أوجه القصور التي كانت موجودة في الإصدارات السابقة، مثل العيوب الواقعية والمشكلات المنطقية. اعترفت OpenAI بهذه المشكلات، لكنها تتوقع أن يتفوق GPT-4 على GPT-3.5، حيث يسجل 40% أعلى في التقييمات الواقعية القاسية وبالتالي يكون أقل عرضة لـ “الاستجابات الوهمية” أو إنشاء حقائق غير صحيحة. هذا واضح. يوضح الرسم البياني التالي هذه الحقيقة:
الكلمة الأخيرة
يعد OpenAI GPT-4 خطوة كبيرة إلى الأمام في عالم الذكاء الاصطناعي والتعلم الآلي. مع التحسينات الكبيرة في قدرته على فهم السياقات المعقدة، وتوليد نص عالي الجودة، وتقديم إجابات دقيقة، يقدم جي بي تي-4 نموذجًا متقدمًا يمكنه تلبية مجموعة واسعة من الاحتياجات في مجالات مختلفة.
تسمح لنا هذه التكنولوجيا الجديدة باستكشاف إمكانيات جديدة في التطبيقات المتقدمة، من الذكاء الاصطناعي التوليدي إلى المساعدة في حل المشكلات المعقدة في العلوم والتكنولوجيا. ومع ذلك، يظل من الضروري أن نستمر في تطوير السياسات والمبادئ التوجيهية الأخلاقية لضمان استخدام هذه التكنولوجيا بشكل مسؤول وآمن.
نتطلع إلى مستقبل حيث ستشكل نماذج مثل جي بي تي-4 تطور الذكاء الاصطناعي، مما يؤثر بشكل إيجابي على كيفية تفاعلنا مع التكنولوجيا ومعالجة المعلومات. وبفضل هذه التطورات، أصبحنا أقرب خطوة واحدة إلى تحقيق إمكانات الذكاء الاصطناعي، مما سيعزز الابتكار ويساهم في تحسين نوعية حياتنا.
تم إصدار OpenAI GPT-4، نموذج اللغة الأكثر تقدمًا لتوليد النصوص، في 14 مارس 2023. يمكن لهذا النموذج قراءة الأوامر المكتوبة والمرئية. إن استخدام نموذج الذكاء الاصطناعي هذا ليس مجانيًا في الوقت الحالي، حيث تبلغ رسوم العضوية الشهرية حوالي 20 دولارًا.