شفا – أعلنت جامعة محمد بن زايد للذكاء الاصطناعي، بالتعاون مع شركة (بيتووم) ومنصة (LLM360)، إطلاق نموذج (K2-65B) الجديد، وهو نموذج لغوي كبير رائد مفتوح المصدر يستند إلى 65 مليار مُعامِل.
ويمثل هذا النموذج إنجازًا مهمًا في مجال الذكاء الاصطناعي المفتوح المصدر، إذ يقدم معايير جديدة للشفافية والأداء.
مزايا نموذج (K2-65B) الجديد:
يتميز نموذج (K2-65B) بتوفيره نهجًا شاملًا لدراسة دورة حياة النماذج اللغوية الكبيرة، بمايشمل جميع تفاصيل عملية الاستنساخ، وهذا النهج يعزز جهود المجتمع العلمي نحو تحقيق رؤية الذكاء الاصطناعي العام من خلال توفير نموذج مفتوح المصدر قابل للاستنساخ ويدعم البحث والتطوير ونقل التكنولوجيا في مجال الذكاء الاصطناعي التوليدي.
إليك أهم مزايا نموذج (K2-65B) الجديد:
الشفافية: يُعدّ نموذج K2-65B نموذجًا فريدًا من نوعه من حيث الشفافية التامة، إذ يوفر (مجموعات التدريب السابق والتطوير) عبر منصة (LLM360).
الأداء: يتفوق نموذج K2-65B على العديد من النماذج اللغوية الكبيرة المتقدمة، ومنها: نموذج (لاما 270B)، في مجالات مختلفة مثل الرياضيات والمنطق والبرمجة والطب.
الكفاءة: يتطلب نموذج K2-65B موارد حاسوبية أقل من النماذج اللغوية الكبيرة المشابهة، فيدعم زيادة الكفاءة التشغيلية ويساهم في الحد من استهلاك الطاقة، مما يجعله نموذجًا مستدامًا وصديقًا للبيئة.
إمكانية الاستنساخ: يُعدّ نموذج K2-65B النموذج اللغوي الكبير الوحيد القابل للاستنساخ من طرف ثالث، مما يسمح للباحثين والمطورين بتحليل ودراسة جميع مراحل عملية تطويره.
(K2-65B).. نموذج استثنائي:
دُرب نموذج (K2-65B) باستخدام 1.4 تريليون وحدة لغوية و480 وحدة معالجة رسومات من نوع A100 ضمن سحابة (دي جي إكس) الخاص بشركة إنفيديا، أي باستخدام موارد أقل بنسبة تبلغ 35% من الموارد المستخدَمة لتدريب نموذج (لاما 270B)، مما يجعله واحدًا من النماذج الأكثر استدامة في العالم ضمن فئته.
كما ينافس (K2-65B) نماذج أكبر بكثير مثل (GPT-4) في بعض المجالات الإستراتيجية، مثل التفكير المتعلق بالرياضيات والمنطق.
وقد دُرب نموذج (K2-65B) على مرحلتين، وخضع إلى 22 عملية تقييم صارمة وشاملة لتحديد مستوى أدائه في مختلف التخصصات، مثل: الرياضيات والبرمجة والطب ومجالاتٍ أخرى، فتفوق هذا النموذج الجديد على نموذج (لاما 270B) في كل مجال من هذه المجالات.
كما أظهر هذا النموذج مستويات أداء عالية حتى في المجالات التي يُعدّ التنافس فيها صعبًا مع أفضل النماذج اللغوية الكبيرة المفتوحة. وقد تفوق نموذج الدردشة الخاص به على نموذج الدردشة الخاص بنموذج (لاما 270B) على جميع المستويات التي شملها التقييم، إذ أثبت قدرته على الفهم وتوليد إجابات شبيهة بإجابات الإنسان في مختلف السيناريوهات.
الشركات الإماراتية تحرز تقدمًا هائلًا في مجال الذكاء الاصطناعي:
لقد أصبحت النماذج اللغوية الكبيرة واحدة من أهم الأدوات في مجال معالجة اللغات الطبيعية، إذ إنها تُمكّن الحواسيب من فهم النص وتوليده بطريقة تشبه إلى حد كبير التواصل البشري. وفي هذا الإطار، أحرزت الشركات الإماراتية تقدمًا هائلاً في هذا المجال في السنوات الأخيرة، لا سيما من خلال إطلاق (جيس) Jais، وهو النموذج اللغوي الكبير الأكثر تقدمًا في العالم باللغة العربية.
يُعدّ نموذج (جيس) ثمار التعاون الوثيق بين شركة (كور 42) وجامعة محمد بن زايد للذكاء الاصطناعي وشركة (سيريبراس سيستمز). وتأتي هذه الجهود لتدعم رؤية دولة الإمارات العربية المتحدة التي تعمل على تعزيز مكانتها كوجهة رئيسية في مجال الذكاء الاصطناعي.
وتعليقًا على إطلاق النموذج، قال البروفيسور إريك زينغ، رئيس جامعة محمد بن زايد للذكاء الاصطناعي، الذي دعم تطوير نموذج (K2-65B)، بالإضافة إلى غيره من أنظمة الذكاء الاصطناعي واسعة النطاق التي يعمل عليها معهد النماذج التأسيسية التابع للجامعة: “يثبت إطلاق نموذج (K2-65B) كفاءة دولة الإمارات في تطوير النماذج اللغوية الكبيرة العالية المستوى، وهي كفاءة تزداد يومًا بعد يوم. ويجسّد هذا النموذج أهمية تبني نهج مفتوح يقوم على التعاون بين مختلف الأطراف بهدف إنشاء نماذج لغوية كبيرة تتميز بمستوى استثنائي من الأداء والكفاءة والقدرة على إحداث تغيير جذري في جميع القطاعات والمنظمات”.
ومن جهته، قال هيكتور ليو، رئيس قسم الهندسة في شركة (بيتووم)، والمطور الرئيسي للنموذج: “يشكل توفير مخطط لاستنساخ نموذج K2 عاملًا أساسيًا لتعزيز المعرفة والقدرة البحثية وخيارات تطوير النماذج اللغوية الكبيرة على المستوى العالمي. وأنا على يقين بأن إصدار نموذج بهذا الحجم وبهذه الجودة سيؤثر بنحو إيجابي في منظومة المصادر المفتوحة، إذ سيتفاعل المجتمع مع النموذج ويستفيد من الحلول التي توصلنا إليها، على غرار ما شهدناه مع النماذج السابقة عبر منصة LLM360، مثل: (أمبر) و(كريستال كودر)”.
وتجدر الإشارة إلى أن فريق العمل الذي طوّر هذا النموذج يدرس إمكانية إعداد النموذج لفهم الصور، إلى جانب المبادرات التي أطلقها لتطويره وتقييمه والتي تهدف إلى تحسين أداء النموذج باستمرار وتعزيز استخداماته المتعددة.