ما يمكن للمؤسسات أن تتعلمه عن البنية التحتية للبيانات من سيارات Cruise بدون سائق
انضم إلى كبار المديرين التنفيذيين في سان فرانسيسكو يومي 11 و 12 يوليو وتعلم كيف يتقدم قادة الأعمال بثورة الذكاء الاصطناعي التوليدية.. يتعلم أكثر
إن تطوير تقنية آمنة للسيارات بدون سائق هو مهمة شديدة التخصص ، ومعقدة ، ومتعددة الأوجه – أعرف هذا بشكل مباشر ، حيث عملت مؤخرًا في واحدة من عدد قليل من الشركات النشطة في هذا القطاع.
على الرغم من ذلك ، هناك العديد من الدروس التي يمكن للشركات عبر الصناعات أن تتعلمها من صناعة السيارات ذاتية القيادة ، لا سيما الشركات التي تتحرك نحو تبني الذكاء الاصطناعي التوليدي. ليس أقلها: كيفية بناء بنية تحتية قوية وآمنة للبيانات لدعم نماذج الذكاء الاصطناعي الخاصة بهم ، وفقًا لما ذكره Mo Elshenawy ، نائب الرئيس التنفيذي (EVP) للهندسة في Cruise ، وهي شركة سيارات ذاتية القيادة تابعة لشركة جنرال موتورز (GM).
أخبرني الشناوي خلال محادثتنا في مؤتمر VentureBeat Transform 2023 يوم الأربعاء: “البيانات هي شريان الحياة ، وأنت تعمل للخلف من هناك”. سوف تجد مختلفًا [data] المستهلكون عبر مؤسساتك: من يحتاج إلى البيانات وبأي شكل يحتاجون إليه ، وإلى متى؟ متى يحتاجون البيانات؟ لذلك هذا جانب مهم للغاية يجب التفكير فيه “.
>> اتبع جميع تغطية VentureBeat Transform 2023 الخاصة بنا <
حدث
تحويل 2023
انضم إلينا في سان فرانسيسكو يومي 11 و 12 يوليو ، حيث سيشارك كبار المسؤولين التنفيذيين في كيفية دمج استثمارات الذكاء الاصطناعي وتحسينها لتحقيق النجاح وتجنب المزالق الشائعة.
سجل الان
شارك الشناوي وجهة نظره من تحت غطاء المحرك في Cruise ، والتي أطلقت أول خدمة سيارات بدون سائق تواجه العملاء في مدينة رئيسية – سان فرانسيسكو – في أوائل عام 2022. اليوم ، تعد سيارة Chevy Volts بدون سائق من Cruise مشهدًا مألوفًا في City by the Bay ، تعمل على مدار الساعة طوال أيام الأسبوع ، على الرغم من أنها تقتصر في الوقت الحالي على أولئك الذين سجلوا في قائمة انتظار Cruise.
تتعامل Cruise مع بيانات أكثر من معظم المؤسسات عبر جميع أنواع القطاعات المختلفة ، مما يمنح الشركة نقطة أفضلية فريدة لما يصلح من حيث البنية التحتية للبيانات وخطوط أنابيب البيانات واختبارات الضغط.
قال الشناوي: “في أي شهر معين ، سيقوم مهندسو الرحلات البحرية لدينا بسحب 7 إكسابايت من البيانات – أي ما يعادل 150 مليون سنة من تدفق الفيديو”.
على هذا النحو ، كان على Cruise التأكد من أن بنيتها التحتية للبيانات قوية بما يكفي للتعامل مع هذا الحجم الهائل من البيانات ، ولكنها أيضًا ذكية بما يكفي لتصنيفها وجعلها في متناول الأشخاص داخل الشركة الذين يحتاجون إلى الوصول إليها ، وكل ذلك مع الحفاظ على مستوى عالٍ من البيانات. ، الأمن الحرج للسلامة.
نظرًا لأن المركبات تلتقط كميات هائلة من بيانات المستشعر في الوقت الفعلي ، كان على Cruise تصميم بنية تحتية للبيانات من الصفر يمكنها التعامل مع النطاق الهائل. تضمنت الاعتبارات الرئيسية قابلية التوسع والأمان وتحسين التكلفة والأدوات لمساعدة المهندسين على الاستفادة بشكل فعال من البيانات.
من بحيرة البيانات إلى المستودعات وهندسة البحيرة
أحد الأسئلة الأكثر إلحاحًا التي تواجه أي مؤسسة تتطلع إلى استخدام الذكاء الاصطناعي التوليفي – أو حتى تلك التي تتعامل مع أي نوع من البرامج والبيانات الرقمية – هو مكان وكيفية تخزين جميع بياناتها.
في البداية ، في الأيام الأولى للحوسبة الشخصية وتقنية المؤسسات ، كانت “المستودعات” الرقمية هي الإجابة: وهذا يعني وضع البيانات المنظمة – البيانات المنظمة مثل جدول البيانات ، أو ملف قيم مفصولة بفواصل ، أو ما شابه – في نظام واحد من أجل تتبع كل شيء.
ولكن عندما بدأت المؤسسات في جمع المزيد من البيانات غير المهيكلة والسعي إلى تحليلها – مثل تفاعلات العملاء ، والرموز ، ومحتوى الوسائط المتعددة مثل الصور ومقاطع الفيديو والصوت – أصبح من الضروري عليهم إيجاد طريقة أخرى لتخزينها جميعًا ، لا سيما بالنظر إلى السرعة. كانت تتزايد وكميات هائلة كانت تتراكم. هكذا ولدت بحيرة البيانات.
أخيرًا ، في السنوات القليلة الماضية وحدها ، انتقلت الشركات إلى بنية تخزين واسترجاع البيانات الهجينة: بنية Lakehouse ، التي تجمع بين صفات البيانات المهيكلة وغير المهيكلة وتسمح بتخزين كلا النوعين واسترجاعهما في نفس قاعدة البيانات.
قال الشناوي إن رحلة كروز الخاصة بالبنية التحتية للبيانات اتبعت في الواقع عكس هذا الاتجاه ، بدءًا من بحيرة البيانات وإضافة مستودع وبحيرة حيث انتقلت الشركة من الترميز إلى الاختبار إلى السيارات ذاتية القيادة التي تواجه الجمهور على الطرق العامة.
“في مرحلة ما ، في مرحلة حياتنا ، كان من المنطقي تمامًا بالنسبة لنا الاعتماد فقط على بحيرة البيانات لأن عملائنا الرئيسيين كانوا ML [machine learning] قال الشناوي. ثم تنتقل إلى بنية أخرى ، مستودعات البيانات. إذا كان لديك بحيرة ومستودع ، فأنت تنقل البيانات من مكان إلى آخر. وبمجرد وصولك إلى هذه النقطة ، ولديك مثل بنية بيانات ذات مستويين ، حيث تقوم بتكرار بياناتك ، فاعلم على وجه اليقين أنك ربما تريد الانتقال إلى البنية الجديدة لمنزل بحيرة ، حيث لا يزال لديك بحيرة بيانات واحدة ، ولكنك تحصل على مزايا إنشاء مستودع بيانات علاوة على ذلك ، وبالتالي ينتهي بك الأمر إلى خدمة كلا العملاء بشكل جيد حقًا “.
دعا إلى أن المؤسسات في الصناعات الأخرى تتعامل مع مهامها بعقلية مرنة مماثلة ، بدءًا من البنية التحتية للبيانات التي يحتاجونها فقط وتغييرها مع نمو المنظمة ، أو إذا كان أعضاء المنظمة بحاجة إلى أنواع مختلفة من البنية التحتية للبيانات لتحقيق أهداف المنظمة.
“لديك مهندسو تعلم الآلة يتوقعون التدفق مباشرة من بحيرة البيانات ، مقابل محللي ذكاء الأعمال ، فهم يريدون مستودع بيانات.”
التأكد من أن نماذج الذكاء الاصطناعي الخاصة بك لا تلائم حالات الاستخدام في العالم الحقيقي أو لا تلائمها
على الرغم من أن Cruise ليس في المقام الأول في مجال تطوير ، أو استخدام ، نماذج اللغات الكبيرة (LLMs) مثل Anthropic’s Claude 2 أو OpenAI’s Chat GPT ، قال الشناوي إن هناك تشابهًا رئيسيًا واحدًا من حيث التحدي الذي يواجهه مستخدمو LLM ومركبة Cruise المستقلة نماذج الذكاء الاصطناعي المشتركة: التأكد من أن النماذج لا تتناسب أو تتناسب – أي أنها مدربة بشكل مناسب للاستجابة لبيانات العالم الحقيقي الجديدة التي يواجهونها والتي لا تشبه بالضرورة بيانات التدريب الخاصة بهم. قد يشمل ذلك حالات الحافة.
النقص الملائم هو عندما لا يتعلم نموذج الذكاء الاصطناعي جيدًا بما فيه الكفاية من البيانات التي تم تدريبه عليها للتعرف على الأنماط ولا يكون قادرًا على إنتاج الاستجابات المرغوبة بشكل موثوق عند مواجهة بيانات حالة استخدام العالم الحقيقي التي تشبه بيانات التدريب إلى حد كبير – بغض النظر عن السبب. القطاع. أو صناعة. يحدث فرط التخصيص عندما يتعلم نموذج الذكاء الاصطناعي جيدًا من بيانات التدريب ، ويكون محبطًا ببيانات العالم الحقيقي الجديدة التي لا تتطابق معها ، مثل حالة الحافة – وهو حدث معتاد لا يحدث بشكل متكرر. الهدف في حالة Cruise وأولئك الذين يستخدمون LLM هو الحصول على ذكاء اصطناعي لا يتناسب ولا يتناسب مع حالة الاستخدام الخاصة به.
قال الشناوي إن كروز تحقق ذلك من خلال استخدام العديد من تقنيات علم البيانات المختلفة والتعلم الآلي ، بما في ذلك زيادة البيانات وتوليد البيانات الاصطناعية.
من خلال التنقيب عن الزيادة تحديدًا ، قدم الشناوي مثالًا على سيارات كروز التي يتم اختبارها حاليًا من خلال القيام برحلات بدون سائق في سان فرانسيسكو على الطرق العامة.
وأوضح الشناوي “لأننا بدأنا بسان فرانسيسكو … نرى الكثير من الأشياء الغريبة التي تحدث” أثناء القيادة. يمكنك أخذ أحد هذه الأمثلة وإنشاء آلاف الأشكال المختلفة [in software]… قم بتغيير ظروف الإضاءة والزوايا وسرعات السرعة لجميع المركبات الأخرى وما إلى ذلك. لذلك تقوم بإنشاء مجموعة بيانات جديدة تقريبًا مدعومة بشيء رأيته “.
أحد الأشياء الغريبة التي حدثت بشكل متكرر في الآونة الأخيرة: وضع المتظاهرون أقماعًا مرورية على مركبات كروز والمركبات ذاتية القيادة المنافسة التي تدعمها شركة Alphabet والتي يتم اختبارها في سان فرانسيسكو ، مما تسبب في توقفهم في مساراتهم.
قال الشناوي إنه حتى المتظاهرين الذين وضعوا أقماعًا على المركبات كان نوعًا من “حالة الحافة” ، فقد تم بناء نماذج Cruise AI بشكل مرن بما يكفي للتصرف بأمان حتى عند حدوث هذه الحوادث.
“هذا مثال حيث تتعامل مركباتنا مع المواقف بشكل جيد جدًا لأننا بنينا نموذجًا عامًا ، والشيء الآمن إذا قمت بتغطية جهاز استشعار أو تلف جهاز الاستشعار هو أن تتوقف السيارة ، وتنتظر شخصًا ما ليأتي. ” في وتوضيح هذا الخطر “.
AI + LLM = AGI؟
عندما سئل الشناوي عن احتمال الجمع بين أنظمة القيادة المستقلة ونماذج اللغة الكبيرة (LLMs) لإنتاج الذكاء الاصطناعي العام (AGI) ، كان الشناوي متشككًا.
“لا أعتقد أن وضعهم سويًا مع توجيه مباشر إلى الذكاء العام الاصطناعي. كلاهما رائع في أساليبهم الخاصة. يمكن أن يؤدي وضعهم معًا إلى تطورات كبيرة في تفاعلات الإنسان الآلي ، ولكن لن يؤدي ذلك عمومًا إلى ذلك … ما أنا متحمس له هو مدى سرعة تقدم كلاهما “.
كما قدم الشناوي نظرة ثاقبة لنهج Cruise الصارم للأمن السيبراني ، وهو أمر ضروري لنظام الحكم الذاتي الحرج للسلامة.
قال: “أنت حقًا بحاجة إلى فريق متعدد التخصصات ، فريق يمتد عبر مهندسي البرمجيات ، ومهندسي البيانات ، والمحللين ، وعلماء البيانات ، ومهندسي الأمن”.
قدمت الجلسة منظورًا رائعًا من الداخل حول تحديات البيانات التي تغلب عليها أحد رواد المركبات ذاتية القيادة. نظرًا لأن الذكاء الاصطناعي يتغلغل في المزيد من جوانب الأعمال والمجتمع ، فإن دروس كروز حول البنية التحتية القوية للبيانات ستزداد أهمية أكثر.
مهمة VentureBeat هو أن تكون ساحة المدينة الرقمية لصناع القرار التقنيين لاكتساب المعرفة حول تكنولوجيا المؤسسات التحويلية والمعاملات. اكتشف إحاطاتنا.