الرئيسية
أخبار عاجلة
في الإمارات يجري تدريب "اللغة الضخمة"!

في الإمارات يجري تدريب "اللغة الضخمة"!

للآلات لغة هي صنيع خبرات البشر لكن قدرتها على تشبيك أطنان المعلومات ومعالجتها أسرع بمراحل. وفي الإمارات يتم تحقيق نجاحات واسعة لتدريب هذه اللغات المسماة "اللغات الضخمة"!

بقلم - المحرر العلمي

+ -

دعونا نفكر على هذا النحو: لكل شعب لغة. وكل فئة من هذا الشعب لديها مهارة مختلفة عن الأخرى في طريقة استخدام هذه اللغة.

الآن، لننتقل من عالم البشر الى عالم الآلات: هناك أيضا لغات ذكاء اصطناعي نسميها "اللغات الضخمة"، وهناك جهات لديها القدرة على انتاج نماذج من هذه اللغات أفضل من غيرها. هنا نفتح قوسين ونضع اسم منصة Amazon SageMaker من أمازون ويب سيرفيسز.

الآن، لنكمل سلسلة التطورات..

النماذج التي تحدثنا عنها، هناك جهات تسعى الى تدريبها وتحسين أدائها. الهدف؟ الاستدلال من خلال دمج تقنيات وخوارزميات لتعزيز مستوى الدقة والأداء.

الخبر الجيد الذي سيجعل كثر منا يشعرون بالفخر هو أن إحدى هذه الجهات متواجدة في المنطقة العربية، وتحديدا في دولة الإمارات وهي ( سنفتح قوسين مجددا): معهد الابتكار التكنولوجي.

ما هو نموذج اللغة الكبيرة في الأساس؟

نموذج اللغة الكبيرة LLM هو نموذج هو نظام ذكاء اصطناعي متقدم مصمم لفهم وإنشاء نص يشبه الإنسان. يتم تدريبه على كميات هائلة من البيانات ويمكنه أداء مهام مثل الإجابة على الأسئلة وتقديم التفسيرات وتوليد الردود والمزيد.

يهدف النظام الى تمكين أجهزة الكمبيوتر من فهم اللغة البشرية وتفسيرها وتوليدها. تستخدم الخوارزميات المعقدة وتقنيات التعلم العميق لمعالجة النص وإنشاءه. يتم تدريب LLM على مجموعات بيانات واسعة، بما في ذلك الكتب والمقالات والمواقع الإلكترونية وغيرها من المصادر النصية. أثناء التدريب، يتعلم النموذج الأنماط والقواعد والسياق والعلاقات الدلالية في النص. يمكّن هذا التدريب LLM من إنشاء استجابات متماسكة وذات صلة بالسياق.

يمكن لـ" اللغة الكبيرة" أيضا المساعدة في ترجمة اللغة وإنشاء المحتوى وتلخيص النص ودعم العملاء وروبوتات الدردشة والمزيد. تُستخدم LLM أيضًا في المساعدين الظاهريين ومحركات البحث وأنظمة التوصية لتوفير المعلومات ذات الصلة والتجارب الشخصية.

ما انجاز الإمارات في هذا المجال؟

نجح معهد الابتكار التكنولوجي، المركز العالمي المتخصص في البحث العلمي، وذراع البحوث التطبيقية التابع لمجلس أبحاث التكنولوجيا المتطورة في أبوظبي، في تدريب النموذج اللغوي للذكاء الاصطناعي «فالكون 40 بي»، والذي هو عبارة عن نموذج لغوي ضخم يضم 40 مليار عامل متغير ومتاح.

وبذلك أصبح «فالكون 40 بي»، وهو النموذج اللغوي المصنف رقم 1 من حيث الأداء وفقاً لأداة التقييم Hugging Face Open LLM Leaderboard، متاحا الآن عبر منصة Amazon SageMaker Jumpstart، ما يمكّن الشركات من إنشاء تطبيقات متطورة مدعومة بالذكاء الاصطناعي باستخدام أفضل نموذج مفتوح المصدر.

ويمكن للعملاء الآن الوصول إلى النسخة مفتوحة المصدر للنموذج اللغوي «فالكون 40 بي» من خلال منصة Amazon SageMaker JumpStart، وهي عبارة عن مركز متكامل لتعلم الآلة (ML) يوفر نماذج مدربة مسبقاً، ما يمكّن العملاء من الاستفادة من الميزات التي يتمتع بها النموذج اللغوي المبتكر وخاصة فيما يتعلق بالمستوى العالي من الدقة والأداء دون الحاجة إلى بناء نماذج خاصة بهم من الصفر.

وتم تدريب النموذج اللغوي للذكاء الاصطناعي «فالكون 40 بي» على ترليون رمز (tokens) على منصة Amazon SageMaker من أمازون ويب سيرفيسز، وهي خدمة مُدارة بالكامل لتطوير نماذج تعلم الآلة وتدريبها وضبطها واستضافتها، بما في ذلك النماذج اللغوية الضخمة LLMs. ويمثل إطلاق النسخة مفتوحة المصدر علامة فارقة في إطار مساعي دولة الإمارات العربية المتحدة لتعزيز الابتكارات المدعومة بالذكاء الاصطناعي وإثراء المساهمات العلمية بما يتماشى مع الاستراتيجية الوطنية للذكاء الاصطناعي 2031.

هذه 5 حقائق يجب معرفتها عن "فالكون 40 بي":

يضم النموذج 40 مليار عامل متغير.
جرى تصميمه على نحو مخصص كنموذج لفك الترميز وفق علاقة سببية فقط.
تم تدريب النموذج على ترليون رمز (tokens)، بما في ذلك رمز RefinedWeb المحسّن
تم توفير النموذج بموجب ترخيص Apache 2.0، ما يضمن إمكانية الوصول إليه وسهولة استخدامه
تم التركيز على تحسين البنية الهيكلية للنموذج اللغوي «فالكون 40 بي» لأغراض الاستدلال من خلال دمج تقنيات وخوارزميات لتعزيز مستوى الدقة والأداء.

الجدير ذكره أن أمازون ويب سيرفيسز (AWS) هي احدى شركات "أمازون العالمية" وتعتبر رائدة في تقديم عروض الخدمات السحابية شمولاً واعتماداً على مستوى العالم. وتعمل الشركة باستمرار على توسيع خدماتها لدعم جميع العمليات وأعباء العمل السحابية تقريباً.