PaLM 2.. ذكاء اصطناعي من Google يساعد المبرمجين
مع PaLM 2، تأمل Google في سد "فجوة الذكاء الاصطناعي" بين الشركة والمنافسين مثل Microsoft، التي كانت تدفع بقوة أدوات لغة الذكاء الاصطناعي إلى مجموعة برامج Office
أعلنت Google عن نموذج لغة PaLM 2 AI، والذي يدعم بالفعل 25 خدمة من خدمات Google وهو أحدث وأكبر نموذج لغة AI من Google. تقول الشركة إنه يتم نشره بالفعل عبر مجموعة برامجها ويقوم بتشغيل روبوت المحادثة التجريبي الخاص به، Bard. في المقال التالي سوف نستعرض PaLM 2.. ذكاء اصطناعي من Google يساعد المبرمجين
إطلاق PaLM 2.
أعلنت Google عن PaLM 2: أحدث نموذج للغة AI ومنافس لأنظمة منافسة مثل OpenAI"s GPT-4.
قال سوندار بيتشاي، الرئيس التنفيذي لشركة Google على خشبة المسرح في مؤتمر I / O للشركة: "تعد نماذج PaLM 2 أقوى في المنطق والاستدلال، بفضل التدريب الواسع في المنطق والاستدلال". "تم تدريبه أيضًا على نص متعدد اللغات يمتد إلى أكثر من 100 لغة".
كما أضاف سلاف بيتروف، كبير مديري الأبحاث في Google، للصحفيين في مائدة قبل إعلان النموذج في مؤتمر Google I / O، إن PaLM 2 أفضل بكثير في مجموعة من المهام القائمة على النصوص. بما في ذلك التفكير والترميز والترجمة، حيث قال بيتروف: "لقد تم تحسينه بشكل ملحوظ مقارنة بـ PaLM 1 [الذي تم الإعلان عنه في أبريل 2022]".
مثال على المهارات المتعددة للغات في PaLM 2.
كمثال على قدراتها متعددة اللغات، أظهر بيتروف كيف أن PaLM 2 قادر على فهم المصطلحات في لغات مختلفة، مع إعطاء مثال للعبارة الألمانية "Ich verstehe nur Bahnhof”، والتي تُترجم حرفيًا إلى "أنا أفهم محطة القطار"، حيث استطتع فهم اللجلة وترجمتها على الفور.
في ورقة بحثية تصف إمكانات PaLM 2، ادعى مهندسو Google أن الكفاءة اللغوية للنظام "كافية لتعليم تلك اللغة" وأشاروا إلى أن هذا يرجع جزئيًا إلى الانتشار الكبير للنصوص غير الإنجليزية في بيانات التدريب الخاصة به.
مثل نماذج اللغات الكبيرة الأخرى، التي تستغرق وقتًا هائلاً والموارد لإنشائها، فإن PaLM 2 ليس منتجًا واحدًا أكثر من مجموعة منتجات - بإصدارات مختلفة سيتم نشرها في إعدادات المستهلك والمؤسسات - حيث يتوفر النظام بأربعة أحجام، تسمى Gecko و Otter و Bison و Unicorn، من الأصغر إلى الأكبر، وقد تم ضبطه وفقًا للبيانات الخاصة بالمجال لأداء مهام معينة لعملاء المؤسسات.
فكر في هذه التعديلات مثل أخذ هيكل شاحنة أساسي وإضافة محرك جديد أو مصد أمامي لإنجاز مهام معينة أو العمل بشكل أفضل في تضاريس معينة. هناك نسخة من PaLM تم تدريبها على البيانات الصحية (Med-PaLM 2)، والتي تقول Google إنها يمكن أن تجيب على أسئلة مشابهة لتلك الموجودة في امتحان الترخيص الطبي بالولايات المتحدة إلى مستوى "خبير" وإصدار آخر مدرب على بيانات الأمن السيبراني (Sec-PaLM 2 ) يمكن أن "يشرح سلوك البرامج النصية الضارة المحتملة ويساعد في اكتشاف التهديدات في التعليمات البرمجية"، قال بيتروف. سيكون كلا الطرازين متاحين عبر Google Cloud، في البداية لاختيار العملاء.
المزيد من التطوير في PaLM 2.
ضمن نطاق Google الخاص، يتم استخدام PaLM 2 بالفعل لتشغيل 25 ميزة ومنتج، بما في ذلك Bard، برنامج المحادثة التجريبي للشركة. حيث تتضمن التحديثات المتاحة من خلال Bard إمكانات تشفير محسّنة ودعمًا أكبر للغة. يتم استخدامه أيضًا لتشغيل الميزات في تطبيقات Google Workspace مثل المستندات والعروض التقديمية وجداول البيانات.
والجدير بالذكر أن Google تقول إن الإصدار الأخف من PaLM 2، Gecko، صغير بما يكفي للتشغيل على الهواتف المحمولة، ومعالجة 20 رمزًا في الثانية - أي ما يعادل تقريبًا 16 أو 17 كلمة - لم تذكر Google الأجهزة التي تم استخدامها لاختبار هذا الطراز، لكنها اكتفت بالعمل "على أحدث الهواتف". ومع ذلك، فإن تصغير مثل هذه النماذج اللغوية أمراً مهماً. هذه الأنظمة مكلفة للتشغيل في السحابة، والقدرة على استخدامها محليًا سيكون لها فوائد أخرى، مثل تحسين الخصوصية. تكمن المشكلة في أن الإصدارات الأصغر من النماذج اللغوية هي حتما أقل قدرة من إخوانها الأكبر.
تسعى Google للتنافس مع كبار الشركات.
مع PaLM 2، تأمل Google في سد "فجوة الذكاء الاصطناعي" بين الشركة والمنافسين مثل Microsoft، التي كانت تدفع بقوة أدوات لغة الذكاء الاصطناعي إلى مجموعة برامج Office الخاصة بها. حيث تقدم Microsoft الآن ميزات AI التي تساعد في تلخيص المستندات وكتابة رسائل البريد الإلكتروني وإنشاء شرائح للعروض التقديمية وغير ذلك الكثير. ستحتاج Google إلى الحفاظ على التكافؤ مع الشركة أو تخاطر بأن يُنظر إليها على أنها بطيئة في تنفيذ أبحاث الذكاء الاصطناعي الخاصة بها.
على الرغم من أن PaLM 2 هي بالتأكيد خطوة للأمام بالنسبة لعمل Google في نماذج لغة الذكاء الاصطناعي، إلا أنها تعاني من مشاكل وتحديات مشتركة في التكنولوجيا على نطاق أوسع.
على سبيل المثال، بدأ بعض الخبراء في التشكيك في شرعية بيانات التدريب المستخدمة لإنشاء نماذج لغوية. عادةً ما يتم استخراج هذه البيانات من الإنترنت وغالبًا ما تتضمن نصًا محميًا بحقوق الطبع والنشر وكتب إلكترونية مقرصنة. استجابت شركات التكنولوجيا التي تصنع هذه النماذج عمومًا برفض الإجابة عن أسئلة حول مصدر بيانات التدريب الخاصة بهم. كما واصلت Google هذا التقليد في وصفها لـ PaLM 2، مشيرة فقط إلى أن مجموعة تدريب النظام مشتركة mprised من "مجموعة متنوعة من المصادر: مستندات الويب، والكتب، والرموز، والرياضيات، وبيانات المحادثة"، دون تقديم مزيد من التفاصيل.
هناك أيضًا مشاكل متأصلة في إخراج النماذج اللغوية مثل "الهلوسة"، أو ميل هذه الأنظمة إلى تكوين المعلومات ببساطة. في حديثه إلى The Verge، قال نائب رئيس Google للأبحاث Zoubin Ghahramani أنه في هذا الصدد، كان PaLM 2 بمثابة تحسين على النماذج السابقة "بمعنى أننا نبذل قدرًا هائلاً من الجهد في التحسين المستمر لمقاييس الأساس والإسناد" ولكن أشار إلى أن المجال ككل "لا يزال أمامه طرق طويلة" في مكافحة المعلومات الخاطئة التي يولدها الذكاء الاصطناعي.