تقنية

يتطلب تدريب ChatGPT AI 185000 جالون من المياه: دراسة


نماذج اللغات الكبيرة الشائعة (LLMs) مثل برنامج ChatGPT الخاص بـ OpenAI و جوجل رائع تستهلك الكثير من الطاقة وتتطلب مزارع خوادم ضخمة لتوفير بيانات كافية لتدريب البرامج القوية. يؤدي تبريد نفس مراكز البيانات أيضًا إلى جعل روبوتات الدردشة المدعومة بالذكاء الاصطناعي متعطشة بشكل لا يصدق. يقترح بحث جديد التدريب لـ GPT-3 استهلك وحده 185000 جالون (700000 لتر) من المياه. وفقًا للدراسة الجديدة ، فإن تبادل محادثات المستخدم العادي مع ChatGPT يرقى أساسًا إلى إلقاء زجاجة كبيرة من المياه العذبة على الأرض. بالنظر إلى برنامج chatbot شعبية غير مسبوقةيخشى الباحثون من أن كل تلك الزجاجات المنسكبة يمكن أن تؤثر سلبًا مقلقًا على إمدادات المياه ، لا سيما وسطها حالات الجفاف التاريخية وعدم اليقين البيئي الذي يلوح في الأفق في الولايات المتحدة.

نشر باحثون من جامعة كولورادو ريفرسايد وجامعة تكساس أرلينغتون تقديرات استهلاك المياه باستخدام الذكاء الاصطناعي في ورقة مطبوعة مسبقًا بعنوان “جعل الذكاء الاصطناعي أقل عطشًا.وجد المؤلفون أن كمية المياه العذبة الصافية المطلوبة لتدريب GPT-3 تعادل الكمية المطلوبة ملء برج تبريد المفاعل النووي. لم تكشف شركة OpenAI عن طول الوقت المطلوب لتدريب GPT-3 ، مما يعقد تقديرات الباحثين ، لكن Microsoft ، التي أقامت شراكة متعددة السنوات بمليارات الدولارات مع شركة AI الناشئة وأنشأت أجهزة كمبيوتر عملاقة للتدريب على الذكاء الاصطناعي ، يقول إن أحدث حواسيبها العملاقة ، والتي تتطلب جهاز تبريد واسع النطاق ، تحتوي على 10000 بطاقة رسومية وأكثر من 285000 نواة معالج ، مما يعطي لمحة عن النطاق الواسع للعملية وراء الذكاء الاصطناعي. يمكن أن ينتج هذا العدد الهائل من الغالونات خلايا بطارية لـ 320 تسلا ، أو ، بعبارة أخرى ، يحتاج ChatGPT ، الذي جاء بعد GPT-3 ، إلى “شرب” زجاجة ماء سعة 500 مليلتر لإكمال التبادل الأساسي مع المستخدم تتكون من 25-50 سؤالًا تقريبًا.

يفترض أيضًا العدد الهائل من الغالونات اللازمة لتدريب نموذج الذكاء الاصطناعي أن التدريب يحدث في مركز بيانات أمريكي حديث من Microsoft ، تم تصميمه خصيصًا لـ OpenAI يصل إلى عشرات الملايين. إذا تم تدريب البيانات في مركز بيانات آسيا الأقل كفاءة في استخدام الطاقة التابع للشركة ، فإن التقرير يشير إلى أن استهلاك المياه يمكن أن يكون أعلى بثلاث مرات. يتوقع الباحثون أن هذه المتطلبات المائية ستزداد فقط مع الطرز الأحدث ، مثل تم إصداره مؤخرًا GPT-4التي تعتمد على مجموعة أكبر من معلمات البيانات من سابقاتها.

قال الباحثون: “البصمة المائية لنماذج الذكاء الاصطناعي لم يعد بإمكانها البقاء تحت الرادار”. “يجب معالجة البصمة المائية كأولوية كجزء من الجهود الجماعية لمكافحة تحديات المياه العالمية.”

كيف تستخدم روبوتات المحادثة الماء؟

عند حساب استهلاك المياه للذكاء الاصطناعي ، يميز الباحثون بين “سحب” المياه و “استهلاك”. المثال الأول هو ممارسة إزالة المياه فعليًا من نهر أو بحيرة أو مصدر آخر ، بينما يشير الاستهلاك تحديدًا إلى فقدان المياه عن طريق التبخر عند استخدامه في مراكز البيانات. يركز البحث حول استخدام المياه في الذكاء الاصطناعي بشكل أساسي على جزء الاستهلاك من تلك المعادلة ، حيث لا يمكن إعادة تدوير المياه.

يعرف أي شخص قضى بضع ثوانٍ في غرفة خادم الشركة أنك بحاجة إلى حزم سترة أولاً. يتم الاحتفاظ بغرف الخوادم باردة ، عادةً ما بين 50 و 80 درجة فهرنهايت لمنع تعطل المعدات. يعد الحفاظ على درجة الحرارة المثالية تحديًا مستمرًا لأن الخوادم نفسها تحول طاقتها الكهربائية إلى حرارة. غالبًا ما يتم نشر أبراج التبريد مثل تلك الموضحة أدناه لمحاولة مواجهة هذه الحرارة والحفاظ على درجة حرارة الغرف المثالية عن طريق تبخير الماء البارد.

أبراج التبريد التبخيري في عملية مركز البيانات

تقوم أبراج التبريد بإنجاز المهمة ، لكنها تتطلب كميات هائلة من المياه للقيام بذلك. يقدر الباحثون أن حوالي جالونًا من الماء يتم استهلاكه مقابل كل كيلو واط / ساعة يتم إنفاقه في مركز بيانات متوسط. لا يمكن استخدام أي نوع من المياه أيضًا. تقوم مراكز البيانات بسحب مصادر المياه العذبة النظيفة من أجل تجنب التآكل أو نمو البكتيريا التي يمكن أن تأتي مع مياه البحر. المياه العذبة ضرورية أيضًا للتحكم في الرطوبة في الغرف. وبالمثل ، يحمل الباحثون مراكز البيانات على عاتقهم مسؤولية المياه اللازمة لتوليد كميات أكبر من الكهرباء التي تستهلكها ، وهو ما أطلق عليه العلماء “الاستهلاك غير المباشر للمياه خارج الموقع”.

صور مركز بيانات جوجل

لا تقتصر مشكلات استهلاك المياه على نماذج OpenAI أو AI. في عام 2019 ، طلبت Google أكثر من 2.3 مليار جالون ماء لمراكز البيانات في ثلاث ولايات فقط. الشركة لديها حاليا 14 مركزا للبيانات منتشرة في جميع أنحاء أمريكا الشمالية والتي تستخدمها لدعم بحث Google ومجموعة منتجاتها في مكان العمل ومؤخراً لامدا و رائع نماذج اللغات الكبيرة. ووفقًا للورقة البحثية الأخيرة ، قد يتطلب LaMDA وحده ملايين اللترات من الماء للتدريب ، أكبر من GPT-3 لأن العديد من مراكز البيانات المتعطشة لشركة Google موجودة في ولايات ساخنة مثل تكساس ؛ أصدر الباحثون تحذيرًا بهذا التقدير ، على الرغم من أنهم أطلقوا عليه “نقطة مرجعية تقريبية”.

بصرف النظر عن الماء ، تتطلب LLMs الجديدة بالمثل كمية هائلة من الكهرباء. صدر تقرير ستانفورد للذكاء الاصطناعي الأسبوع الماضي الاختلافات في استهلاك الطاقة بين أربعة نماذج بارزة للذكاء الاصطناعي، بتقدير أن GPT-3 الخاص بـ OpenAI أطلق 502 طنًا متريًا من الكربون أثناء تدريبه. بشكل عام ، يمكن للطاقة اللازمة لتدريب GPT-3 أن تزود منزلًا أمريكيًا عاديًا لمئات السنين.

قال كيفين كينت ، الرئيس التنفيذي لحلول كفاءة المرافق الحرجة في مقابلة مع الوقت. “لا يمكنهم دائمًا اتخاذ أفضل الخيارات من الناحية البيئية.”

يمكن أن يؤدي تغير المناخ وتفاقم حالات الجفاف إلى تضخيم المخاوف بشأن استخدام الذكاء الاصطناعي للمياه

بالفعل ، المنتدى الاقتصادي العالمي التقديرات يفتقر حوالي 2.2 مليون مقيم في الولايات المتحدة إلى المياه والسباكة الداخلية الأساسية. يعيش 44 مليون آخرين في أنظمة مياه “غير ملائمة”. يخشى الباحثون أن مزيجًا من تغير المناخ وزيادة عدد سكان الولايات المتحدة سيجعل هذه الأرقام أسوأ بحلول نهاية القرن. بحلول عام 2071 ، ستانفورد التقديرات ما يقرب من نصف أحواض المياه العذبة البالغ عددها 204 في البلاد لن تكون قادرة على تلبية الطلب الشهري على المياه. وبحسب ما ورد يمكن أن تشهد العديد من المناطق انخفاض إمدادات المياه بمقدار الثلث في السنوات الخمسين المقبلة.

أدى ارتفاع درجات الحرارة الذي يغذيه النشاط البشري جزئيًا إلى تسجيل الغرب الأمريكي له أسوأ جفاف منذ 1000 عام التي تهدد أيضًا المياه العذبة ، على الرغم من أن الفيضانات الأخيرة ساعدت في درء بعض المخاوف الشديدة. انحسرت مستويات المياه في الخزانات مثل بحيرة ميد حتى الآن كشف بقايا بشرية عمرها عقود. كل هذا يعني أن الطلب الهائل على المياه للذكاء الاصطناعي من المرجح أن يصبح نقطة خلاف متنامية ، خاصة إذا كانت التكنولوجيا مدمجة في المزيد من القطاعات والخدمات. تزداد متطلبات البيانات الخاصة بـ LLMs ، مما يعني أنه سيتعين على الشركات إيجاد طرق لزيادة كفاءة المياه في مراكز البيانات الخاصة بهم.

يقول الباحثون إن هناك بعض الطرق الواضحة نسبيًا لخفض سعر المياه للذكاء الاصطناعي. بالنسبة للمبتدئين ، أين ومتى يتم تدريب نماذج الذكاء الاصطناعي. يمكن أن تؤثر درجات الحرارة الخارجية ، على سبيل المثال ، على كمية المياه المطلوبة لتبريد مراكز البيانات. يمكن لشركات الذكاء الاصطناعي افتراضيًا تدريب النماذج في منتصف الليل عندما يكون الجو أكثر برودة أو في مركز بيانات مع كفاءة أفضل في استخدام المياه لتقليل المياه ، فهي على حق. من ناحية أخرى ، يمكن لمستخدمي Chatbot اختيار التعامل مع الوحدات خلال “ساعات توفير المياه” ، مثلما تشجع السلطات البلدية استخدام غسالة الصحون خارج ساعات العمل. ومع ذلك ، فإن أيًا من هذه التغييرات في جانب الطلب سيتطلب مزيدًا من الشفافية من جانب شركات التكنولوجيا التي تبني هذه النماذج ، وهو أمر يقول الباحثون إنه يعاني من نقص مثير للقلق.

كتب الباحثون: “نوصي مطوري نماذج الذكاء الاصطناعي ومشغلي مراكز البيانات بأن يكونوا أكثر شفافية”. “متى وأين يتم تدريب نماذج الذكاء الاصطناعي؟ ماذا عن نماذج الذكاء الاصطناعي التي تم تدريبها و / أو نشرها في مراكز بيانات مواقع مشتركة خارجية أو سحابة عامة؟ ستكون هذه المعلومات ذات قيمة كبيرة لمجتمع البحث وعامة الناس “.

هل تريد معرفة المزيد عن الذكاء الاصطناعي وروبوتات المحادثة ومستقبل التعلم الآلي؟ تحقق من تغطيتنا الكاملة لـ الذكاء الاصطناعيأو تصفح أدلةنا إلى أفضل مولدات فنية مجانية لمنظمة العفو الدولية و كل ما نعرفه عن ChatGPT الخاص بـ OpenAI.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى