كيف يجعل الحاسوب العملاق الجديد لشركة IBM النماذج الأساسية للذكاء الاصطناعي أكثر ملاءمة لميزانية المؤسسة
تحقق من جميع الجلسات عند الطلب من قمة الأمن الذكي هنا.
تعمل نماذج الأساس على تغيير طريقة استخدام الذكاء الاصطناعي (AI) والتعلم الآلي (ML). كل هذه القوة تأتي مع تكلفة ، حيث أن بناء النماذج الأساسية للذكاء الاصطناعي هو مهمة كثيفة الاستخدام للموارد.
أعلنت شركة IBM اليوم أنها قامت ببناء حاسوبها الفائق الذكاء الاصطناعي الخاص بها ليكون بمثابة الأساس الحرفي لمبادرات البحث والتطوير الخاصة بتدريب النموذج الأساسي. تم تسميته بـ Vela ، وقد تم تصميمه كنظام سحابي أصلي يستخدم الأجهزة المتوافقة مع معايير الصناعة ، بما في ذلك x86 silicon و Nvidia GPUs والشبكات القائمة على الإيثرنت.
تستخدم حزمة البرامج التي تتيح التدريب على النموذج الأساسي سلسلة من التقنيات مفتوحة المصدر بما في ذلك Kubernetes و PyTorch و Ray. في حين أن شركة IBM تكشف رسميًا الآن فقط عن وجود نظام Vela ، إلا أنها كانت في الواقع متصلة بشبكة الإنترنت بقدرات مختلفة منذ مايو 2022.
قالت تاليا غيرشون ، مديرة أبحاث البنية التحتية السحابية الهجينة في شركة IBM ، لموقع VentureBeat: “نعتقد حقًا أن هذا المفهوم التكنولوجي حول نماذج التأسيس لديه إمكانات تخريبية هائلة وهائلة”. “لذلك ، بصفتنا قسمًا وكشركة ، فإننا نستثمر بكثافة في هذه التكنولوجيا.”
حدث
قمة أمنية ذكية عند الطلب
تعرف على الدور الحاسم للذكاء الاصطناعي وتعلم الآلة في الأمن السيبراني ودراسات الحالة الخاصة بالصناعة. شاهد الجلسات عند الطلب اليوم.
مشاهدة هنا
مؤسسة الذكاء الاصطناعي والصديقة للميزانية داخل الفيلا
شركة IBM ليست غريبة على عالم الحوسبة عالية الأداء (HPC) وأجهزة الكمبيوتر العملاقة. أحد أسرع أجهزة الكمبيوتر العملاقة على هذا الكوكب اليوم هو الكمبيوتر العملاق ساميت الذي صنعته شركة آي بي إم وتم نشره حاليًا في مختبر أوك ريدج الوطني.
ومع ذلك ، فإن نظام Vela لا يشبه أنظمة الحواسيب العملاقة الأخرى التي بنتها شركة IBM حتى الآن. بالنسبة للمبتدئين ، تم تحسين نظام Vela للذكاء الاصطناعي ويستخدم أجهزة سلعة x86 ، على عكس المعدات الأكثر غرابة (والمكلفة) الموجودة عادةً في أنظمة HPC.
على عكس Summit ، الذي يستخدم معالج IBM Power ، تحتوي كل عقدة Vela على زوج من معالجات Intel Xeon Scalable. تقوم شركة IBM أيضًا بالتحميل على وحدات معالجة الرسومات Nvidia ، حيث يتم تعبئة كل عقدة في الكمبيوتر العملاق بثمانية وحدات معالجة رسومات A100 بسعة 80 جيجابايت. فيما يتعلق بالاتصال ، يتم توصيل كل من عقد الحوسبة عبر واجهات شبكة إيثرنت متعددة 100 جيجابت في الثانية.
تم تصميم Vela أيضًا خصيصًا للسحابة الأصلية ، مما يعني أنه يدير Kubernetes والحاويات لتمكين أعباء عمل التطبيق. وبشكل أكثر تحديدًا ، تعتمد فيلا على Red Hat OpenShift ، وهي منصة Kubernetes التابعة لشركة Red Hat. تم تحسين Vela أيضًا لتشغيل PyTorch لتدريب ML واستخدام Ray للمساعدة في قياس أعباء العمل.
قامت IBM أيضًا ببناء نظام جديد لجدولة عبء العمل لحاسوبها العملاق الجديد السحابي الأصلي. بالنسبة للعديد من أنظمة HPC الخاصة بها ، استخدمت IBM منذ فترة طويلة Spectrum LSF (مرفق مشاركة الأحمال) للجدولة ، لكن هذا النظام ليس ما يستخدمه كمبيوتر Vela الجديد العملاق. قامت شركة IBM بتطوير برنامج جدولة جديد يسمى MCAD (مرسل التطبيق متعدد المجموعات) للتعامل مع جدولة المهام السحابية الأصلية لتدريب الذكاء الاصطناعي للنموذج الأساسي.
محفظة نموذج الأساس المتنامي لشركة IBM
كل تلك الأجهزة والبرامج التي جمعتها شركة IBM من أجل Vela يتم استخدامها بالفعل لدعم جهود نموذج الأساس لشركة IBM.
قال غيرشون: “جميع عمليات البحث والتطوير الخاصة بنماذجنا الأساسية تعمل جميعها على تشغيل السحابة الأصلية على تلك المجموعة على نظام Vela و IBM Cloud”.
في الأسبوع الماضي فقط ، أعلنت شركة IBM عن شراكة مع وكالة ناسا للمساعدة في بناء نماذج أساسية لعلوم المناخ. تعمل IBM أيضًا على نموذج أساسي يسمى MoLFormer-XL لعلوم الحياة يمكن أن يساعد في إنشاء جزيئات جديدة في المستقبل.
يمتد عمل النموذج التأسيسي أيضًا إلى تكنولوجيا المعلومات للمؤسسات مع جهود Project Wisdom التي تم الإعلان عنها في أكتوبر 2022. ويجري تطوير Project Wisdom لدعم تقنية تكوين Red Hat Ansible IT. عادة ، يمكن أن يكون تكوين نظام تكنولوجيا المعلومات عملية معقدة تتطلب معرفة المجال للقيام بشكل صحيح. يهدف Project Wisdom إلى جلب واجهة لغة طبيعية إلى Ansible ، حيث سيكتب المستخدمون ببساطة ما يريدون وسيفهمه النموذج الأساسي ثم يساعد في تنفيذ المهمة المطلوبة.
ألمح غيرشون أيضًا إلى نموذج تأسيسي جديد لشركة IBM للأمن السيبراني لم يتم تفصيله علنًا بعد ويتم تطويره باستخدام كمبيوتر Vela الفائق.
قال غيرشون عن النموذج الأساسي للأمن السيبراني: “لم نتحدث كثيرًا عن هذا الأمر خارجيًا ، أعتقد عن قصد”. “نعتقد أن هذه التكنولوجيا ستكون تحويلية من حيث اكتشاف التهديدات.”
بينما تقوم شركة IBM ببناء مجموعة من نماذج التأسيس ، فإنها لا تنوي التنافس بشكل مباشر مع بعض نماذج الأساس العامة المعروفة ، مثل OpenAI’s GPT-3.
قال غيرشون: “نحن لا نركز بالضرورة على بناء ذكاء اصطناعي عام ، في حين أن بعض اللاعبين الآخرين يقولون إن هذا هو الهدف”. “نحن مهتمون بنماذج التأسيس لأننا نعتقد أن لها قيمة تجارية هائلة لحالات استخدام المؤسسات.”
مهمة VentureBeat هو أن تكون ساحة المدينة الرقمية لصناع القرار التقنيين لاكتساب المعرفة حول تكنولوجيا المؤسسات التحويلية والمعاملات. اكتشف إحاطاتنا.
اكتشاف المزيد من إشراق التقنية
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.