إعادة تصور مركز البيانات لعصر الذكاء الاصطناعي التوليدي
توجه إلى مكتبتنا عند الطلب لعرض الجلسات من VB Transform 2023. سجل هنا
هذه المقالة جزء من إصدار خاص لـ VB. اقرأ السلسلة الكاملة هنا: مستقبل مركز البيانات: التعامل مع متطلبات أكبر وأكبر.
اليوم ، لا بد أن تتضمن أي محادثة حول الذكاء الاصطناعي ظهور ChatGPT ، وهو روبوت محادثة في كل مكان مبني على سلسلة GPT من OpenAI’s GPT لنماذج اللغات الكبيرة (LLMs). ولكن كيف يمكنك تلبية متطلبات هذا النوع من تكنولوجيا الذكاء الاصطناعي التوليدية في مركز البيانات الخاص بك؟
تم إطلاق برنامج chatbot في أواخر العام الماضي ويحدث موجات من خلال إمكاناته في إنشاء المحتوى. يستخدم الأشخاص ChatGPT والروبوتات المنافسة من البائعين الآخرين للحصول على إجابات للأسئلة المعقدة وكذلك لأتمتة المهام مثل كتابة كود البرنامج وإنتاج نسخة تسويقية.
ولكن مع كل الاحتمالات الكامنة في هذه التكنولوجيا التوليدية للذكاء الاصطناعي ، كان استخدام النماذج التأسيسية لإمكانياتها الكاملة أمرًا صعبًا. تم تدريب معظم النماذج الموجودة على البيانات المتاحة للجمهور ، مما يجعلها أقل من مثالية لتطبيقات مؤسسة معينة مثل الاستعلام عن المستندات الداخلية الحساسة.
حدث
VB Transform 2023 حسب الطلب
هل فاتتك جلسة من VB Transform 2023؟ سجل للوصول إلى المكتبة عند الطلب لجميع جلساتنا المميزة.
سجل الان
تريد الشركات أن تعمل هذه النماذج على بيانات الشركة الداخلية. لكن هل يعني ذلك أن عليهم أن يتدخلوا ويبنيوها من الصفر؟ دعنا نتعمق.
بناء نماذج لغوية كبيرة: أمر مكلف داخل مراكز البيانات
تتطلب مهمة بناء LLM ، مثل GPT-3 أو GPT-4 ، خطوات متعددة ، بدءًا من التدريب الثقيل على الحوسبة الذي يتطلب المئات ، إن لم يكن الآلاف ، من وحدات معالجة الرسومات باهظة الثمن المجمعة معًا في خوادم مركز البيانات لعدة أسابيع أو أشهر.
“يتطلب التدريب الأولي قدرًا كبيرًا جدًا من قوة الحوسبة. على سبيل المثال ، يتطلب نموذج BLOOM ، وهو بديل مفتوح المصدر بقيمة 176 مليار معلمة لـ GPT-3 ، 117 يومًا من التدريب على مجموعة 384-GPU. قال جوليان سيمون ، كبير المبشرين في Hugging Face ، لـ VentureBeat ، إن هذا يعادل تقريبًا 120 عامًا من GPU.
مع زيادة حجم النموذج ، يزداد عدد وحدات معالجة الرسومات المطلوبة لتدريبه وإعادة تدريبه. Google ، على سبيل المثال ، اضطرت إلى توصيل 6144 شريحة لتدريب نموذج PaLM المكون من 540 مليار متغير. تتطلب العملية أيضًا خبرة في تقنيات وأدوات التدريب المتقدمة (مثل Microsoft DeepSpeed و Nvidia MegaTron-LM) ، والتي قد لا تكون متاحة بسهولة في المنظمة.
بمجرد الانتهاء من التدريب ، تكون هذه الشرائح مطلوبة بعد ذلك لتشغيل الاستدلال على النموذج بشكل مستمر ، مما يزيد من التكلفة. لوضعها في منظورها الصحيح ، فإن استخدام 500 فقط من خوادم Nvidia’s DGX A100 متعددة وحدات معالجة الرسومات ، والتي تُستخدم بشكل شائع لتدريب LLM والمؤتمرات ، عند 199000 دولار للقطعة الواحدة يعني إنفاق حوالي 100 مليون دولار على المشروع. علاوة على ذلك ، فإن سحب الطاقة الإضافي والإخراج الحراري الناشئ عن الخوادم سيضيف إلى التكلفة الإجمالية للملكية.
يعد هذا استثمارًا كبيرًا في البنية التحتية لمركز البيانات ، خاصة بالنسبة للشركات التي ليست مؤسسات مخصصة للذكاء الاصطناعي وتبحث فقط عن LLM لتسريع حالات استخدام أعمال معينة.
النهج المثالي لمركز بيانات لعصر الذكاء الاصطناعي
ما لم يكن لدى الشركة مجموعات بيانات فريدة عالية الجودة يمكنها إنشاء نموذج بميزة تنافسية قوية تستحق الاستثمار ، فإن أفضل طريقة للمضي قدمًا هي ضبط LLMs الحالية مفتوحة المصدر لحالات استخدام محددة على بيانات المؤسسة – مستندات الشركة ، رسائل البريد الإلكتروني للعملاء ، إلخ.
مثال مضاد جيد هو نموذج BloombergGPT ، 50 مليار بارامتر [model] تدربت من قبل بلومبرج من البداية … كم عدد المنظمات التي يمكنها أن تدعي بثقة أن لديها نفس القدر من البيانات الفريدة عالية الجودة؟ قال سيمون من Hugging Face.
“الضبط الدقيق ، من ناحية أخرى ، هو عملية خفيفة الوزن تتطلب فقط جزءًا بسيطًا من الوقت والميزانية والجهد. يستضيف Hugging Face hub حاليًا أكثر من 250000 نموذج مفتوح المصدر لمجموعة واسعة من معالجة اللغة الطبيعية ورؤية الكمبيوتر والمهام الصوتية. هناك احتمالات بأن تجد واحدة تمثل نقطة انطلاق جيدة لمشروعك “.
إذا كانت المؤسسة ترى قيمة في بناء LLM من البداية ، فيجب أن تبدأ صغيرة وتستخدم البنية التحتية السحابية المدارة وخدمات التعلم الآلي (ML) بدلاً من شراء وحدات معالجة الرسومات باهظة الثمن للنشر في الموقع على الفور.
“استخدمنا في البداية البنية التحتية MLOps المستضافة على السحابة ، والتي مكنتنا من قضاء المزيد من الوقت في تطوير التكنولوجيا بدلاً من القلق بشأن الأجهزة. مع تقدمنا واستقرار بنية الحل الذي نقدمه منذ الأيام الأولى للبحث والتطوير السريع ، أصبح من المنطقي الآن معالجة الاستضافة المحلية. [of] قال بارس جوهاس ، رئيس قسم التكنولوجيا والشريك المؤسس لمولد المحتوى Undetectable AI ، لموقع VentureBeat.
توفر السحابة أيضًا المزيد من خيارات التدريب للاختيار من بينها ، بما يتجاوز وحدات معالجة الرسومات Nvidia إلى تلك الموجودة في AMD و Intel بالإضافة إلى مسرعات العملاء مثل Google TPU و AWS Trainium.
من ناحية أخرى ، في الحالات التي تنص فيها القوانين أو اللوائح المحلية على الابتعاد عن السحابة ، سيكون النشر في الموقع باستخدام أجهزة متسارعة مثل وحدات معالجة الرسومات هو الخيار الأول الافتراضي.
لا يزال التخطيط هو المفتاح
قبل التسرع في الاستثمار في وحدات معالجة الرسومات (GPU) أو المهارات أو الشركاء السحابيين لـ LLMs الخاصة بالمجال والتطبيقات القائمة عليها ، من المهم لصناع القرار التقنيين تحديد استراتيجية واضحة من خلال التعاون مع القادة الآخرين في المؤسسة ومع الخبراء المتخصصين. من المفيد التركيز على دراسة الجدوى لاتخاذ القرار ، والحصول على فكرة تقريبية عن المتطلبات الحالية والمستقبلية لأعباء العمل هذه.
مع هذا النوع من التخطيط ، يمكن للشركات اتخاذ قرارات مستنيرة حول متى وكيف تستثمر في تدريب ماجستير. يتضمن ذلك جوانب مثل نوع الأجهزة التي يجب اختيارها ، وحيث يمكنهم استخدام النماذج الموجودة مسبقًا التي طورها الآخرون ، ومن قد يكونون الشركاء المناسبين في رحلات الذكاء الاصطناعي الخاصة بهم.
“يتحرك مشهد الذكاء الاصطناعي / التعلم الآلي بسرعة مذهلة … إذا تم التعامل مع تضمين هذه التقنيات الجديدة بالعقلية التقليدية للتدقيق في المستقبل ، فمن المحتمل أن يصبح الحل قديمًا نسبيًا. إن الطبيعة المتخصصة للتقنيات والأجهزة المعنية تعني أن الخيار الأفضل قد يكون في تطوير النظرة المستقبلية للحل أولاً ، وترقية مراكز البيانات الخاصة بهم وفقًا لذلك ، “قال جوهاز.
وقال: “قد يكون من السهل الاقتناع بالضجيج والاتجاه نحو تبني التكنولوجيا الجديدة دون سبب لائق ، لكن هذا سيؤدي بلا شك إلى خيبة أمل ورفض حالات الاستخدام الحقيقي التي يمكن أن تستفيد منها الشركة في المستقبل”. “قد يكون النهج الأفضل هو أن تظل متزنًا ، واستثمار الوقت في فهم التقنيات المعنية ، والعمل مع أصحاب المصلحة لتقييم أين يمكن جني الفوائد من التكامل.”
مهمة VentureBeat هو أن تكون ساحة المدينة الرقمية لصناع القرار التقنيين لاكتساب المعرفة حول تكنولوجيا المؤسسات التحويلية والمعاملات. اكتشف إحاطاتنا.