Jannah Theme License is not validated, Go to the theme options page to validate the license, You need a single license for each domain name.
أخبار التقنية

ظهرت Cleanlab بمبلغ 5 ملايين دولار لأتمتة تنظيم البيانات لـ LLMs ومكدس الذكاء الاصطناعي الحديث


توجه إلى مكتبتنا عند الطلب لعرض الجلسات من VB Transform 2023. سجل هنا


أعلنت شركة Cleanlab ، وهي شركة ناشئة توفر حلاً لتنظيم البيانات لنماذج اللغات الكبيرة (LLMs) المستخدمة في الذكاء الاصطناعي المؤسسي ، اليوم أنها حصلت على 5 ملايين دولار من التمويل الأولي. وقادت Bain Capital Ventures جولة الاستثمار ، مما يمثل تصويتًا هامًا على الثقة في مهمة Cleanlab للقضاء على “مشكلة البيانات القذرة” التي ابتليت بها مساحة التعلم الآلي.

طورت الشركة الناشئة ، التي أسسها كيرتس نورثكوت وجوناس مولر وأنيش أثالي ، منتجًا مفتوح المصدر يحدد الملصقات غير الصحيحة في البيانات ويفهمها وينظفها. يعد هذا النهج الفريد بتحسين فعالية نماذج التعلم الآلي بشكل كبير ، والتي غالبًا ما تعوقها جودة البيانات الرديئة.

قال نورثكوت ، الرئيس التنفيذي لشركة Cleanlab ، في مقابلة أجريت معه مؤخرًا مع VentureBeat: “إن السر القذر للتعلم الآلي هو أن نموذجك جيد مثل بياناتك فقط”. “وإذا كانت لديك تسميات غير صحيحة في بياناتك ، وهو ما يفعله الجميع تقريبًا ، فقد يؤدي ذلك إلى إحداث فوضى في أداء نموذجك.”

أضاف نورثكوت أن تنظيم البيانات غالبًا ما يكون عملية يدوية ومملة تتطلب الكثير من الوقت والموارد من فرق البيانات. وقال إن Cleanlab يأمل في أتمتة هذه العملية وتبسيطها باستخدام طريقة اخترعها خلال الدكتوراه. دراسات في معهد ماساتشوستس للتكنولوجيا تسمى “التعلم الواثق”.

حدث

VB Transform 2023 حسب الطلب

هل فاتتك جلسة من VB Transform 2023؟ سجل للوصول إلى المكتبة عند الطلب لجميع جلساتنا المميزة.

سجل الان

التعلم الواثق هو طريقة تقدر التوزيع المشترك للتسميات الحقيقية والصاخبة ، ثم تستخدم هذه المعلومات للعثور على الأخطاء المحتملة في مجموعة البيانات. يمكنه أيضًا تقدير دقة كل تسمية وكل مثال ، وتقديم درجة ثقة لكل تسمية.

قال نورثكوت: “ما نقوم به هو بناء معلومات إحصائية حول ما هي نقطة بيانات نموذجية لفئة معينة ، ونأخذ في الاعتبار توزيع الاحتمالات التي سينتجها نموذج لهذه الفئة – سواء كان ما يتم تقديمه لهذا المثال يبدو ذا صلة إحصائية أم لا – ومن ثم نبني نموذجًا أساسيًا نظريًا يمكننا أن نعرضه سيمنحك ضمانات دقيقة من حيث اكتشاف خطأ التسمية”.

فجر جديد لجودة البيانات

قال Northcutt أن Cleanlab يقدم منتجين: Cleanlab Open Source و Cleanlab Studio. Cleanlab Open Source هي مكتبة Python مجانية ومفتوحة المصدر يمكن لأي شخص استخدامها لتطبيق التعلم الواثق على مجموعات البيانات الخاصة به. Cleanlab Studio هو منتج SaaS قائم على السحابة يوفر واجهة سهلة الاستخدام وميزات متقدمة لتنظيم البيانات. يتكامل Cleanlab Studio أيضًا مع أطر عمل وأنظمة LLM الشائعة ، مثل Hugging Face Transformers و Google Cloud AI Platform و Amazon SageMaker و Microsoft Azure Machine Learning و IBM Watson.

قالت Northcutt إن Cleanlab قد جذبت بالفعل أكثر من 10000 مستخدم لمشروعها مفتوح المصدر ، وأكثر من 100 عميل لمنتجها السحابي. وقال إن العملاء يشملون شركات Fortune 500 والهيئات الحكومية والمؤسسات البحثية والشركات الناشئة من مختلف المجالات والصناعات ، مثل التجارة الإلكترونية والرعاية الصحية ووسائل التواصل الاجتماعي والتعليم والترفيه والتمويل.

قالت Northcutt إن Cleanlab تخطط لاستخدام التمويل الجديد لتوسيع فريقها وتوسيع نطاق تطوير منتجاتها وتنمية قاعدة عملائها. وقال إنه متحمس للشراكة مع Bain Capital Ventures ، التي تتمتع بسجل حافل من الاستثمار في الشركات الناشئة في مجال الذكاء الاصطناعي.

علامة على زيادة ثقة المستثمرين في حلول الذكاء الاصطناعي المرتكزة على البيانات

قال عارف هلالى ، شريك Bain Capital Ventures ومديرها Rak Garg ، إنهما معجبان بفريق Cleanlab وتقنياتها ورؤيتها. قالوا إنهم يعتقدون أن Cleanlab يحل مشكلة ضخمة وغير مخدومة في مجال الذكاء الاصطناعي الخاص بالمؤسسة.

“Cleanlab هو الحل الرائد لتنظيم البيانات لـ LLMs ، وهي حاجة ضخمة لم تتم معالجتها في المؤسسة. يعد تنظيم البيانات أمرًا ضروريًا لأداء النموذج والموثوقية ، ويوفر للمستخدمين مزيدًا من التحكم ومنتجًا يسهل اعتماده من خلال المصدر المفتوح. نحن متحمسون للغاية لدعم كورتيس وشريكيه المؤسسين Jonas و Anish ، الذين بنوا منتجًا مذهلاً ومجتمعًا حول التعلم الواثق.

أضاف جارج أن Cleanlab جزء من تركيز أوسع على الذكاء الاصطناعي في Bain Capital Ventures ، التي تستثمر في كل من نماذج الأساس والبنية التحتية من حولها. قال إن Cleanlab هي واحدة من العديد من الشركات الناشئة في مجال الذكاء الاصطناعي التي استثمرت Bain فيها هذا العام ، مثل Contextual AI و Evenup و Unstructured.

“نحن مستثمرون نشطون للغاية في مجال الذكاء الاصطناعي ، ونبحث دائمًا عن مؤسسين ومهندسين تقنيين يمكنهم بناء حلول ذكاء اصطناعي مبتكرة. لدينا تركيز قوي على المرحلة المبكرة ، كما يتضح من BCV Labs ، حاضنة الذكاء الاصطناعي الخاصة بنا في بالو ألتو ، حيث ندعم رواد الأعمال الموهوبين في مجال الذكاء الاصطناعي ونشارك في إنشائه. قال جارج: “لدينا أيضًا نهج متعدد المراحل ، حيث يمكننا مساعدة شركات محفظتنا في مواجهة تحديات الوصول إلى السوق والمواهب والتوسع”.

تشكيل مستقبل LLM للمؤسسة

Cleanlab هي واحدة من العديد من الشركات الناشئة الناشئة التي تستفيد من الطلب المتزايد على حلول الذكاء الاصطناعي للمؤسسات ، خاصةً بالنسبة إلى LLMs. وفقًا لتقرير Gartner الأخير ، سيتم أتمتة 69 ٪ من الأعمال الروتينية التي يقوم بها المديرون حاليًا بالكامل بحلول عام 2024 ، والتي من المحتمل أن تتضمن استخدام LLM لمهام مثل الجدولة وإعداد التقارير واتخاذ القرار. واحدة من أكبر العقبات التي تؤثر على اعتماد ونشر LLM في المؤسسة هي جودة البيانات ومعالجة البيانات.

يمكن أن يساعد حل معالجة البيانات من Cleanlab المؤسسات على التغلب على هذه التحديات وإطلاق العنان للإمكانات الكاملة لـ LLM لحالات الاستخدام والتطبيقات المختلفة. باستخدام Cleanlab ، يمكن للمؤسسات تحسين جودة وموثوقية مجموعات البيانات والنماذج الخاصة بها ، وتقليل وقت وتكلفة معالجة البيانات وضمان الاستخدام الأخلاقي والمسؤول لـ LLM. يمكن أن يساعد Cleanlab أيضًا الشركات على اكتساب ميزة تنافسية وخلق قيمة من أصول البيانات الخاصة بهم.

مهمة VentureBeat هو أن تكون ساحة المدينة الرقمية لصناع القرار التقنيين لاكتساب المعرفة حول تكنولوجيا المؤسسات التحويلية والمعاملات. اكتشف إحاطاتنا.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى