![كيف نجحت ديب سيك في بناء نظام ذكاء اصطناعي بتكاليف أقل؟](https://www.shfanews.net/wp-content/uploads/2025/02/133-1-scaled.jpg)
شفا – في الشهر الماضي، انهارت الأسواق المالية الأميركية بعد أن أعلنت شركة صينية ناشئة تدعى ديب سيك أنها بنت أحد أقوى أنظمة الذكاء الاصطناعي في العالم باستخدام عدد أقل كثيراً من الرقائق الإلكترونية، مما كان يعتقد الكثير من الخبراء أنه ممكن.
ألفا رقيقة إلكترونية بدلاً من 16 ألفاً
وعادة ما تدرب شركات الذكاء الاصطناعي روبوتات الدردشة الخاصة بها باستخدام أجهزة كمبيوتر عملاقة مزودة بـ16 ألف رقيقة متخصصة أو أكثر. لكن ديب سيك قالت إنها احتاجت إلى نحو 2000 شريحة فقط.
عُشر تكاليف الإنفاق
وكما أوضح مهندسو ديب سيك في ورقة بحثية نشرت بعد عيد الميلاد مباشرة، استخدمت الشركة الناشئة الكثير من الحيل التكنولوجية لتقليل تكلفة بناء نظامها بشكل كبير. ولم يكن مهندسوها بحاجة سوى إلى نحو 6 ملايين دولار من قوة الحوسبة الخام، وهو ما يقرب من عُشر ما أنفقته ميتا في بناء أحدث تقنيات الذكاء الاصطناعي لديها.
ماذا فعلت ديب سيك بالضبط؟
إليك الدليل:
- كيف يتم بناء تقنيات الذكاء الاصطناعي؟ تعتمد تقنيات الذكاء الاصطناعي الرائدة على ما يسميه العلماء بالشبكات العصبية، وهي أنظمة رياضية تتعلم مهاراتها من خلال تحليل كميات هائلة من البيانات.
تقضي أقوى الأنظمة شهوراً في تحليل كل النصوص الإنجليزية تقريباً على الإنترنت، بالإضافة إلى العديد من الصور والأصوات والوسائط المتعددة الأخرى. وهذا يتطلب كميات هائلة من قوة الحوسبة.
قبل نحو 15 عاماً، أدرك باحثو الذكاء الاصطناعي أن الرقائق الإلكترونية المتخصصة التي تسمى وحدات معالجة الرسومات
graphics processing units، أو GPUs، كانت وسيلة فعالة لإجراء هذا النوع من تحليل البيانات. صممت شركات مثل شركة تصنيع الرقائق في وادي السيليكون إنفيديا هذه الرقائق في الأصل لتقديم رسومات لألعاب الفيديو على الكمبيوتر. لكن وحدات معالجة الرسومات كانت لديها أيضاً موهبة في تشغيل معادلات الرياضيات التي تعمل على تشغيل الشبكات العصبية.
مع قيام الشركات بتعبئة المزيد من وحدات معالجة الرسومات في مراكز بيانات الكمبيوتر الخاصة بها، يمكن لأنظمة الذكاء الاصطناعي الخاصة بها تحليل المزيد من البيانات.
لكن أفضل وحدات معالجة الرسومات تكلف نحو 40 ألف دولار. كما أنها تحتاج إلى كميات هائلة من الكهرباء، إذ يمكن أن يستهلك إرسال البيانات بين الرقائق طاقة كهربائية أكبر من تشغيل الرقائق نفسها.
ديب سيك تخفض التكاليف
- كيف تمكنت ديب سيك من خفض التكاليف؟ فعلت الشركة العديد من الأشياء. وأبرزها أنها تبنت طريقة تسمى مزيج الخبراء mixture of experts.
كانت الشركات عادة ما تنشئ شبكة عصبية واحدة تتعلم جميع الأنماط في جميع البيانات على الإنترنت. وكان هذا مكلفاً، لأنه يتطلب كميات هائلة من البيانات للانتقال بين رقائق وحدة معالجة الرسوميات.
إذا كانت إحدى الرقاقات تتعلم كيفية كتابة قصيدة وكانت أخرى تتعلم كيفية كتابة برنامج كمبيوتر، فلا يزال يتعين عليهما التحادث مع بعضهما بعضاً، فقط في الحالة التي يوجد فيها بعض التداخل بين الشعر والبرمجة.
مزيج الخبراء – خبير لكل مجال
باستخدام طريقة مزيج الخبراء، حاول الباحثون حل هذه المشكلة عن طريق تقسيم النظام إلى العديد من الشبكات العصبية: واحدة للشعر، وواحدة لبرمجة الكمبيوتر، وواحدة لعلم الأحياء، وواحدة للفيزياء، وهكذا. قد يكون هناك 100 من هذه الأنظمة من الخبراء الأصغر. ويمكن لكل خبير التركيز على مجاله الخاص.
وقد واجه العديد من الشركات صعوبة في استخدام هذه الطريقة، لكن ديب سيك كانت قادرة على القيام بذلك بشكل جيد. كانت حيلتها هي إقران هذه الأنظمة من الخبراء الأصغر بنظام عام.
كانت هذه الأدوات من الخبراء لا تزال بحاجة إلى تبادل بعض المعلومات فيما بينها، وكان الخبير العام -الأداة التي تتمتع بفهم لائق ولكن غير مفصل لكل موضوع- قادرةً على المساعدة في تنسيق التفاعلات بين الخبراء.
الأمر أشبه إلى حد ما بقيام محرر بالإشراف على غرفة أخبار مليئة بالمراسلين المتخصصين.
كفاءة رياضيات أكثر
- هل حقق هذا كفاءة أكثر؟ ولكن هذا ليس الشيء الوحيد الذي فعلته ديب سيك فقد أتقنت أيضاً خدعة بسيطة تتضمن الأعداد العشرية التي يمكن لأي شخص يتذكر فصل الرياضيات في المدرسة الابتدائية أن يفهمها.
هل شمل ذلك الرياضيات؟ هل تتذكر مدرس الرياضيات الذي شرح لك مفهوم النسبة الثابتة ط، أو باي Pi التي يشار إليها أيضاً بالرمز π، وهي رقم لا ينتهي أبداً: 3.14159265358979.
يمكنك استخدام π لإجراء حسابات مفيدة، مثل تحديد محيط الدائرة. عندما تقوم بهذه الحسابات، فإنك تختصر π إلى بضعة أعداد عشرية فقط: 3.14. إذا استخدمت هذا الرقم الأبسط، فستحصل على تقدير جيد جداً لمحيط الدائرة.
لقد فعلت شركة ديب سيك شيئاً مشابهاً، لكن على نطاق أوسع كثيراً، في تدريب تقنية الذكاء الاصطناعي الخاصة بها.
إن الرياضيات التي تسمح للشبكة العصبية بتحديد الأنماط في النص هي في الحقيقة مجرد عمليات ضرب – الكثير والكثير والكثير من الضرب – إننا نتحدث عن أشهر من الضرب عبر آلاف الرقائق الحاسوبية.
عادةً ما تقوم الرقائق بضرب الأرقام التي تتسع لـ 16 بت من الذاكرة. لكن ديب سيك ضغط كل رقم في 8 بت فقط من الذاكرة، نصف المساحة، أي أنه قام في الأساس بحذف عدة أرقام عشرية من كل رقم.
هذا يعني أن كل حساب كان أقل دقة. لكن هذا لم يكن مهماً. كانت الحسابات دقيقة بما يكفي لإنتاج شبكة عصبية قوية حقاً.
مهارة وإبداع صينيان
*إذن، هل يمكن لأي طالب في المدرسة الثانوية أن يفعل هذا؟ لا. أظهر مهندسو ديب سيك في ورقتهم البحثية أنهم كانوا أيضاً جيدين جداً في كتابة التعليمات البرمجية المعقدة للغاية للكمبيوتر والتي تخبر وحدات معالجة الرسوميات بما يجب القيام به. لقد عرفوا كيفية استخراج المزيد من الكفاءة من هذه الرقائق.
قليل من الناس لديهم هذا النوع من المهارة. لكن مختبرات الذكاء الاصطناعي الجادة لديها المهندسون الموهوبون اللازمون لمضاهاة ما فعلته ديب سيك.
إذن، لماذا لم يفعل الآخرون ذلك بالفعل؟ قد تستخدم بعض مختبرات الذكاء الاصطناعي بعض الحيل نفسها بالفعل، إلا أن الشركات مثل أوبن إيه آي لا تكشف دائماً عما تفعله خلف الأبواب المغلقة.
لكن الآخرين فوجئوا بوضوح بعمل ديب سيك، إذ إن القيام بما فعلته الشركة الناشئة ليس بالأمر السهل. وتتضمن التجربة اللازمة لإيجاد اختراق مثل هذا ملايين، إن لم يكن المليارات، من الدولارات للإنفاق على الطاقة الكهربائية.
وأضاف: لهذا السبب لا نرى الكثير من الإبداع. يخشى الناس خسارة ملايين عدة لمجرد تجربة شيء لا يعمل.
مشاركة الباحثين الصينيين إبداعاتهم
أشار عدد من الخبراء إلى أن مبلغ 6 ملايين دولار الذي حصلت عليه شركة ديب سيك غطى فقط ما أنفقته الشركة الناشئة عند تدريب النسخة النهائية من النظام.
وفي ورقتهم البحثية، قال مهندسو ديب سيك إنهم أنفقوا أموالاً إضافية على البحث والتجريب قبل الجولة التدريبية النهائية. ولكن الأمر نفسه ينطبق على أي مشروع ذكاء اصطناعي متطور.
لقد أجرت شركة ديب سيك تجارب، وأثمرت. والآن، نظراً لأن الشركة الناشئة الصينية تشاركت بأساليبها مع باحثين آخرين في مجال الذكاء الاصطناعي، فإن طرقها التكنولوجية مؤهلة لتقليل تكلفة بناء أدوات الذكاء الاصطناعي بشكل كبير.
وتشهد الصين تطورات علمية وتقنية متلاحقة في كل المجالات