تم تقديم الذكاء الاصطناعي فائق التقدم “Gemini Live” مع إمكانية المحادثة المباشرة
أطلقت شركة جوجل أداة جديدة للذكاء الاصطناعي، Gemini Live، يوم الثلاثاء الماضي. يعد جيميناي لايف، مثل GPT-4o الذي أطلقته OpenAI مؤخرًا، نموذجًا أصليًا متعدد الوسائط للذكاء الاصطناعي يتمتع بقدرات رائعة للصوت والفيديو.
Gemini Live مجرد جزء واحد من “Project Astra”، وهو وكيل عالمي للذكاء الاصطناعي قد يكون في طور تطوير النظارات الذكية. في الوقت الحالي، سيكون Jemini Live هو الإصدار الأول المتاح على الهواتف المحمولة.
ومع ذلك، فإن Gemini Live غير متوفر الآن. إذًا، ما هي الميزات التي يمكن الوصول إليها، ومتى يمكننا توقع Jemini Live على أجهزة Android؟ تابع القراءة لتكتشف ذلك.
إطلاق Gemini Live فائق التقدم مع إمكانية المحادثة المباشرة
تخطط Google لتطوير برنامج الدردشة الآلي الخاص بـ gamnai إلى الحد الذي يمكنه من فهم العالم البشري بشكل أفضل والتواصل معهم بسهولة أكبر. في حدث I/O 2024 الكبير، قدمت Google معاينة لنسخة جذابة من جيميناي تسمى Gemini Live، والتي تتيح للمستخدمين إجراء محادثة صوتية كاملة وشاملة مع gamnai عبر هواتفهم الذكية.
يمكن للمستخدمين مقاطعة المحادثة الصوتية عندما يطرح Jamnai chatbot أسئلة لمزيد من التوضيح؛ لذلك سوف يتكيف gamnai مع نمط كلام المستخدم بهذه الطريقة. ويمكن للذكاء الاصطناعي لشركة جوجل فحص البيئة المحيطة بالمستخدم من خلال الصور أو مقاطع الفيديو التي تلتقطها كاميرا الهاتف والإجابة على أسئلة المستخدم.
يمكن لـ Gemini Live الإجابة على الأسئلة المتعلقة بالأشياء الموجودة في عرض كاميرا الهاتف أو التي تم عرضها مؤخرًا. على سبيل المثال، سوف يجيب على أسئلة مثل الحي الذي يتواجد فيه المستخدم الآن أو ما اسم الجزء المكسور من الدراجة.
يمكن لـ Jamnai Live شرح الغرض من رمز الكمبيوتر، أو تحديد المكان الذي قد تكون فيه نظارات المستخدم، وإخبار المستخدم بالمكان الذي رأى فيه النظارات آخر مرة.
يقول سيسي هسياو، مدير Jamnai في Google: “مع Jamnai Live، ستتم إضافة إمكانية فهم أفضل للمستخدم إلى جيمناي. يوفر Gemini Live إمكانية تجربة محادثة حقيقية وحية مع الذكاء الاصطناعي”.
يمكن اعتبار Jumnai Live بمثابة نسخة مطورة من Google Lens، منصة Google المرئية القديمة لتحليل الصور ومقاطع الفيديو، بالإضافة إلى Google Assistant، مساعد Google المعتمد على الذكاء الاصطناعي.
يمكن للنسخة المباشرة من Jamnai أن تعمل كمدرب افتراضي وتدرب المستخدمين على أحداث مختلفة وتطرح أفكارًا جديدة. على سبيل المثال، فهو يعلم المستخدمين المهارات التي يحتاجونها للحصول على فرصة عمل. يمكن لـ Jumnai Live تقديم توصيات لإلقاء الخطب.
سيوفر Jamnai Live إجابات لمشاكل المستخدمين المعقدة من خلال الدردشة الصوتية المباشرة. يحتوي هذا الإصدار من Jamnai على بنية النموذج الأساسية Gemini 1.5 Pro، والتي تعد الرائدة في الذكاء الاصطناعي Jamnai، وتتمتع بسعة ذاكرة عالية.
يحتوي الإصدار المباشر من Jamnai على نافذة سياق جديدة تحتوي على مليوني رمز، مما يعني أنه يمكنه تلقي وفهم كميات هائلة من البيانات. يمكن لهذا الذكاء الاصطناعي تحليل مقطع فيديو مدته ساعة واحدة بمساعدة نافذة السياق.
قد لا يختلف Gemini Live كثيرًا عن Gemini للوهلة الأولى؛ لكن جوجل تدعي أنه في جيميناي لايف، تم استخدام تقنيات أحدث مع نسبة أخطاء أقل في مجال الذكاء الاصطناعي لتحليل الصور بشكل أكثر دقة.
أدخلت شركة جوجل تقنيات جديدة في مجال الذكاء الاصطناعي في Jumnai Live لمساعدتها على إنشاء محرك كلام أكثر تقدماً لمحادثة حية أكثر تماسكاً وأكثر واقعية ومع فهم أفضل لمشاعر المستخدم.
لن يكون Gemini Live متاحًا للمستخدمين مجانًا، وبعد الإصدار سيكون حصريًا لخدمة Gemini Advanced التي تتطلب الاشتراك في Google One AI Premium مقابل 20 دولارًا شهريًا.