اعتماد AutoML: دعنا نجري فحصًا للواقع

0 127 6 دقائق

تحقق من جميع الجلسات عند الطلب من قمة الأمن الذكي هنا.

لا يوجد علاج لمرض الزهايمر. ولكن ماذا لو تمكنا من إيجاد طريقة لاكتشافها مبكرًا؟ أثار السؤال اهتمام العلماء في Imagia ، الذين استخدموا بعد ذلك التعلم الآلي من Google (AutoML) لتقليل وقت معالجة الاختبار من 16 ساعة إلى ساعة واحدة. حصل PayPal على مزايا مماثلة. في عام 2018 ، مع H2O’s AutoML ، زادت PayPal دقة نموذج الكشف عن الاحتيال بنسبة 6٪ وجعلت عملية تطوير النموذج أسرع بست مرات.

ألهمت قصص النجاح مثل هذه حوالي 61٪ من صناع القرار في الشركات التي تستخدم الذكاء الاصطناعي (AI) لاعتماد AutoML. سيزداد امتصاصه لأنه يمكن أن يخفف ، إلى حد كبير ، المشاكل الناجمة عن نقص علماء البيانات. أيضًا ، فإن قدرة AutoML على تحسين قابلية التوسع وزيادة الإنتاجية لا بد أن تجذب العملاء.

ولكن هل هذا يعني أن اعتماد AutoML أصبح أمرًا لا بد منه؟ حسنًا ، هذا لغز تواجهه معظم الشركات في الوقت الحالي ، وقد يكون فحص الحالات الواقعية حلاً.

بصفتي مهندس برمجيات كبير ، عملت مع العديد من الشركات الناشئة حيث لعب الذكاء الاصطناعي دورًا محوريًا. لقد رأيت إيجابيات وسلبيات وتأثير الأعمال. ولكن قبل الدخول في حالات الاستخدام ، دعنا أولاً نحدد ماهية AutoML وحالته الحالية وما يمكنه وما لا يمكنه فعله.

حدث

قمة أمنية ذكية عند الطلب

تعرف على الدور الحاسم للذكاء الاصطناعي وتعلم الآلة في الأمن السيبراني ودراسات الحالة الخاصة بالصناعة. شاهد الجلسات عند الطلب اليوم.

مشاهدة هنا

ما هو AutoML؟

AutoML (التعلم الآلي الآلي) هو قدرة النظام على تحديد النموذج الصحيح تلقائيًا وتعيين المعلمات لتقديم أفضل نموذج ممكن. سأركز فقط على الشبكات العصبية العميقة في هذه المقالة.

في الشبكات العصبية العميقة ، يمثل العثور على البنية الصحيحة دائمًا تحديًا كبيرًا. من خلال الهندسة المعمارية ، أعني لبنات البناء الأساسية (على سبيل المثال ، للتعرف على الصور ، ستكون لبنات البناء الأساسية 3X3 max pooling و 3X1 Convolution وما إلى ذلك) والترابط بينها لعدة طبقات مخفية.

البحث عن العمارة العصبية (NAS) هو تقنية لأتمتة تصميم الشبكات العصبية العميقة. يتم استخدامه لتصميم الشبكات التي تتساوى مع أو يمكنها تنفيذ البنى المصممة يدويًا. لكننا نحتاج إلى تدريب أعداد كبيرة من الشبكات المرشحة كجزء من عملية البحث للتوصل إلى البنية الصحيحة ، والتي تستغرق وقتًا طويلاً.

الوضع الحالي للمنصات المتاحة

تلعب NAS دورًا محوريًا في تشكيل إطار عمل AutoML لكل من Amazon Web Services (AWS) و Google Cloud Platform (GCP). لكن AutoML لا يزال في مرحلة بزوغ الفجر ، وهذه المنصات تتطور. دعونا نناقش هذين الإطارين المشهورين لـ AutoML.

التدفق الآلي لتعلم الآلة. صورة المؤلف

GCP AutoML

يحتوي GCP AutoML على NAS ونقل التعلم في جوهره. يبحث NAS عن الهندسة المعمارية المثلى من مجموعة من البنى بناءً على نتائج التدريب السابقة. في البداية ، تم استخدام خوارزميات التعلم المعزز لأبحاث العمارة.

ومع ذلك ، تميل هذه الخوارزميات إلى أن تكون باهظة الثمن من الناحية الحسابية بسبب مساحة البحث الكبيرة. في الآونة الأخيرة ، كان هناك تحول نموذجي نحو تطوير الأساليب القائمة على التدرج والتي أظهرت نتائج واعدة. لكن ما يحدث داخل GCP AutoML لا يزال غير واضح ، وهو أكثر من مجرد حل للصندوق الأسود.

AWS الطيار الآلي

يتمثل المفهوم الرئيسي لـ AWS Autopilot في توفير حل AutoML قابل للتكوين. يتم الكشف عن كل التفاصيل حول دورة التعلم الآلي ، من تحويل البيانات إلى تدريب النموذج وضبط المعلمات الفائقة. على عكس GCP AutoML ، فإن AWS Autopilot هو حل مربع أبيض.

تستخدم AWS Autopilot استراتيجيات مختلفة للبيانات وخطوط أنابيب التعلم الآلي (ML). تستند بعض هذه الاستراتيجيات إلى بيانات “إذا كان آخر” التي اقترحها خبراء المجال ؛ تعتمد الاستراتيجيات الأخرى على اختيار المعلمات الفائقة الصحيحة (أي معدل التعلم ، والمعلمة الزائدة ، وحجم التضمين) لخط الأنابيب.

ما يمكن أن يفعله AutoML وما لا يمكنه فعله

يقول الناس أحيانًا أن AutoML هو الكأس المقدسة لـ AI / ML ، وهي وجهة نظر لا أشاركها. لذلك دعنا نكمل:

	ما الذي يمكن أن تفعله	ما لا تستطيع فعله
تحويل البيانات	يعتني بالمعالجة المسبقة وتحويل البيانات. يحدد المتغيرات العددية والفئوية ويمكنه التعامل معها.	يمكن أن يرتكب أخطاء ، مثل التحديد الخاطئ للسمات العددية في البيانات ذات العلاقة الأساسية المنخفضة كميزة فئوية. لا يمكن تفريغ البيانات وافترض أنها ستعمل بدون السقطات.
ميزة استخراج	يستخرج الميزات إلى حد ما.	في النماذج المعتمدة على المجال ، يعد استخراج الميزات أمرًا ضروريًا. إتقان معرفة المجال لا يزال يمثل مشكلة.
النمذجة والضبط	يحدد أفضل المعلمات الفائقة. يمكن القيام بالبحث عن أفضل الهندسة المعمارية.	لا يمكن لـ AutoML العمل على كمية صغيرة من البيانات حيث يوجد حد أدنى من قيود نقاط البيانات. إنها مبالغة في التعامل مع المشكلات البسيطة حيث نستخدم الانحدار الخطي أو بعض النماذج الأساسية. إنها مهمة تستغرق وقتًا طويلاً ويمكن أن تتكبد تكاليف عالية لكل من المشكلات البسيطة والمشكلات المتعلقة بكمية كبيرة من البيانات.

اسمحوا لي أن أشارك بعض الأفكار التجريبية ، مع أمثلة من الحياة الواقعية ، لتوضيح المكان المناسب الذي كان AutoML مناسبًا وأين لم يعمل.

حالة الاستخدام 1: قم بقياس أداء تاجر في صناعة السيارات

كان علينا إنتاج مقياس لتقييم أداء التاجر بجيجابايت من البيانات التاريخية مثل المبيعات السابقة وبيانات التعداد والبيانات الدينية والبيانات الجغرافية. استخدمنا AutoML وحصلنا على أداء مشابه للإنسان.

ومع ذلك ، كنا بحاجة إلى عالم بيانات لإجراء المعالجة المسبقة للبيانات وهندسة الميزات والتحويل. استغرق الأمر الكثير من العمل لـ AutoML لمعرفة البيانات المهمة في أعمدة البيانات لدينا ، حيث كان هناك آلاف الأعمدة. حتى التجربة كان من الممكن أن تتكبد تكاليف باهظة وتضيع وقتًا ثمينًا.

حالة الاستخدام 2: توقع إيجار العقار

كان علينا تطوير أداة للتنبؤ بإيجارات العقارات ، لكن AutoML لم يكن أداءها جيدًا لأن سوق العقارات لديه الكثير من المعلومات المحلية (الحكومية). في الواقع ، فشلت محاولاتنا مع نموذج واحد لكل منطقة لأنه لم يكن لديه بيانات كافية (أقل من 500 نقطة بيانات) لتعلم الهندسة المعمارية. نوع بسيط من طراز XGBoost مع ميزات منخفضة يؤدي أداءً جيدًا مقارنةً بـ AutoML.

في الحالات التي كانت فيها البيانات جيدة بما يكفي لـ AutoML ، كان نموذج التنبؤ الخاص بنا أفضل من الحل الداخلي.

حالة الاستخدام 3: توقع تصنيف التلفزيون

في حالة التنبؤ بتصنيف التلفزيون ، حدث نفس الشيء. فشل AutoML في التقاط السلوك المستند إلى فترة اليوم عبر قنوات متعددة. على سبيل المثال ، NICK مخصص للأطفال ؛ يشاهد معظم الأطفال البرامج في فترة ما بعد الظهر ، ويشاهد الكبار في الغالب قناة MTV ولديهم ذروة مشاهدة في المساء. هذا مجرد نمط بسيط ، لكن AutoML لم يكن قادرًا على التقاط أنماط متعددة من فئات متعددة في نموذج واحد.

هل سيحل AutoML بالفعل محل DS؟

من واقع خبرتي في هذا المجال ، أقول “لا”. لا يمكن أن يحل AutoML محل علماء البيانات مباشرة. لكنها يمكن أن تكون أداة مفيدة لعلماء البيانات.

أين يجب أن نستخدم AutoML

يكون احتمال عمل AutoML جيدًا دون أي تدخل بشري أعلى في السيناريوهات التي تكون فيها المشكلات مألوفة في الأدبيات. في حالات مثل اكتشاف الكائنات للكائنات العامة أو تصنيف الصور ، يمكنك استخدام AutoML ، حيث تم ضبطها بالفعل مع كمية كبيرة من البيانات. يمكن أن يساعدك أيضًا في تطوير PoC سريعًا ، والذي قد يوفر أو لا يوفر أداءً معقولاً.

حيث لا يجب أن نستخدم AutoML

في بعض الأحيان ، نحتاج إلى هندسة ميزات بسيطة مع نموذج انحدار خطي بسيط لمشاريع ML في العالم الحقيقي. قد يتكبد AutoML تكلفة أكبر في تلك الحالات لأنه لا يدعم هندسة الميزات. داخليًا ، يستخدم شبكة عصبية عميقة ، مما يعني أن هناك بعض الميزات الهندسية ، ولكن من أجل ذلك ، سيتطلب الكثير من البيانات. كما أنه مكلف إذا قارنته بالنهج الأساسي. وسيحتاج أداء النموذج المحدد بواسطة AutoML إلى تحسين.

السيناريوهات التي تكون فيها المشكلة خاصة بالمجال وتتطلب بعض المعرفة بالمجال من المحتمل أيضًا أن تفشل مع AutoML. فيما يلي السيناريوهات التي يجب أن نستخدم فيها AutoML وتلك التي يجب أن نتجنبها:

	AutoML	نموذج مخصص
الأمن والخصوصية	لديه مشكلة أمنية لأنه يتعين علينا تحميل البيانات إلى السحابة.	هذا آمن. يمكننا تدريب النماذج المخصصة على أجهزتنا الشخصية أيضًا.
مشكلة مجال معين	لا يعمل AutoML مع مشاكل محددة.	يمكننا تدريب النموذج على المشكلات الخاصة بالمجال.
ثابت الميزانية	يعد AutoML مكلفًا في كثير من الحالات مثل الانحدار الخطي.	ميزانيتها تعتمد على المتطلبات.
بيانات أقل	يحتوي AutoML على حد أدنى لمتطلبات البيانات.	يمكن أن يؤثر على الأداء ولكن لا يوجد مثل هذا التقييد.
حان وقت التسوق	باستخدام AutoML يمكننا إكمال المهمة بسرعة.	علينا إنشاء خط أنابيب في هذه الحالة ، الأمر الذي يستغرق وقتًا طويلاً.
مشكلة قياسية	في حالة المشكلات القياسية ، يمكن لبرنامج AutoML إكماله بسرعة.	ستستغرق النماذج المخصصة مزيدًا من الوقت للعثور على الهندسة المعمارية المثلى.
هندسة الميزات	لا يمكن لـ AutoML المساعدة في هندسة الميزات حيث نحتاج إلى معرفة المجال لإنشائها.	يجب أن نعمل بشكل منفصل على هندسة الميزات ؛ ثم يمكننا إطعام AutoML.
حل	سيعطي حلولًا من الأساليب المعروفة بالفعل للمشاكل الحالية.	يمكن لعلماء البيانات تجربة مناهج جديدة تكون خاصة جدًا ببيان المشكلة.

استنتاج

AutoML ليس ذكاءً عامًا اصطناعيًا (AGI) ، مما يعني أنه لا يمكنه تحديد عبارات المشكلة وحلها تلقائيًا. ومع ذلك ، يمكن أن يحل بيانات المشكلة المحددة مسبقًا إذا قدمنا لها البيانات والميزات ذات الصلة.

يتضمن استخدام AutoML مفاضلة بين تعميم المشكلة وأداء مشكلة معينة. إذا كان AutoML يعمم حله ، فيجب عليه التنازل عن أداء مشكلة معينة (لأن هندسة AutoML ليست مضبوطة لذلك). ولا يمكن أن يساعد الحل العام في حل المشكلات الخاصة بالمجال حيث نحتاج إلى نهج جديد لحلها.

Alakh Sharma هو عالم بيانات في Talentica Software.

صانعي القرار

مرحبًا بك في مجتمع VentureBeat!

DataDecisionMakers هو المكان الذي يمكن للخبراء ، بما في ذلك الأشخاص الفنيون الذين يقومون بعمل البيانات ، مشاركة الأفكار والابتكارات المتعلقة بالبيانات.

إذا كنت تريد أن تقرأ عن الأفكار المتطورة والمعلومات المحدثة ، وأفضل الممارسات ، ومستقبل البيانات وتكنولوجيا البيانات ، انضم إلينا في DataDecisionMakers.

يمكنك حتى التفكير في المساهمة بمقال خاص بك!

قراءة المزيد من DataDecisionMakers

مرتبط

الوسوم

eshragnet

0 127 6 دقائق

اعتماد AutoML: دعنا نجري فحصًا للواقع

حدث

ما هو AutoML؟

الوضع الحالي للمنصات المتاحة

GCP AutoML

AWS الطيار الآلي

ما يمكن أن يفعله AutoML وما لا يمكنه فعله

حالة الاستخدام 1: قم بقياس أداء تاجر في صناعة السيارات

حالة الاستخدام 2: توقع إيجار العقار

حالة الاستخدام 3: توقع تصنيف التلفزيون

هل سيحل AutoML بالفعل محل DS؟

أين يجب أن نستخدم AutoML

حيث لا يجب أن نستخدم AutoML

استنتاج

صانعي القرار

مرتبط

اترك تعليقاً إلغاء الرد

روابط نصية AA50

حدث

ما هو AutoML؟

الوضع الحالي للمنصات المتاحة

GCP AutoML

AWS الطيار الآلي

ما يمكن أن يفعله AutoML وما لا يمكنه فعله

حالة الاستخدام 1: قم بقياس أداء تاجر في صناعة السيارات

حالة الاستخدام 2: توقع إيجار العقار

حالة الاستخدام 3: توقع تصنيف التلفزيون

هل سيحل AutoML بالفعل محل DS؟

أين يجب أن نستخدم AutoML

حيث لا يجب أن نستخدم AutoML

استنتاج

صانعي القرار

مرتبط

Subscribe to our mailing list to get the new updates!

كوميديا ​​CBS الخارقة للطبيعة تم تجديدها في الموسم 3

كيفية مشاهدة SpaceX's Falcon Heavy وهو يطلق قمرًا صناعيًا عسكريًا مصنفًا

مقالات ذات صلة

العرض الجوي الوطني لاسكتلندا 2014

كيف تفشي وسائل التكنولوجيا أدق أسرار حياتك؟

الثعابين تبذل جهدا كبيرا للتشبث بالأشجار

خمسة أسئلة محيرة حول مستقبل الكمبيوتر في عام 2039

اترك تعليقاً إلغاء الرد

كوميديا CBS الخارقة للطبيعة تم تجديدها في الموسم 3