أخبار التقنية

يسهِّل Landing AI من Andrew Ng إنشاء تطبيقات رؤية الكمبيوتر باستخدام Visual Prompting


انضم إلى كبار المديرين التنفيذيين في سان فرانسيسكو يومي 11 و 12 يوليو ، لمعرفة كيف يدمج القادة استثمارات الذكاء الاصطناعي ويحسنونها لتحقيق النجاح.. يتعلم أكثر


أعلنت شركة Landing AI ، وهي شركة تقدم برامج وحلول تحول على مستوى المؤسسة لتطبيقات الذكاء الاصطناعي الصناعية ، اليوم عن إطلاق Visual Prompting ، الذي يساعد على تسهيل بناء تطبيقات الرؤية الحاسوبية على المستخدمين.

اجتمع VentureBeat مع Andrew Ng ، المؤسس والرئيس التنفيذي لشركة Landing AI والمعروف في جميع أنحاء العالم بمعرفته وخبرته في مجال الذكاء الاصطناعي. بالإضافة إلى معرفة المزيد عن أداة Visual Prompting الجديدة من Landing AI ، ناقشنا كيف أن الذكاء الاصطناعي التوليفي يلهم الابتكارات في مجالات أخرى من الذكاء الاصطناعي ، وخاصة التعلم الآلي.

قال إن جي إن قدرة الشركة على التعجيل المرئي تبسط وتسرع إنشاء نماذج رؤية الكمبيوتر. مع هذا التحول الكبير في سير عمل تطوير الذكاء الاصطناعي ، يمكن للمطورين الاستفادة من الإشارات المرئية لتسمية البيانات بسرعة وكفاءة ، مما يقلل الوقت اللازم لهذه الخطوة الحاسمة.

كيف يعمل Visual Prompting

في سير العمل الفوري ، يمكنك التوصل إلى “موجه مرئي” بسيط ، وفي ثوانٍ ، يمكنك البدء في الحصول على تنبؤات. هذا يتيح سرعة تطوير التطبيقات بشكل أسرع بكثير ، “قال نج لـ VentureBeat. “لحظة GPT-3 – حيث تسهل المطالبة تطوير تطبيقات جديدة – ليست موجودة بعد من أجل رؤية الكمبيوتر ، لكنني أعتقد أن المطالبات المرئية ستقربنا.”

حدث

تحويل 2023

انضم إلينا في سان فرانسيسكو يومي 11 و 12 يوليو ، حيث سيشارك كبار المسؤولين التنفيذيين في كيفية دمج استثمارات الذكاء الاصطناعي وتحسينها لتحقيق النجاح وتجنب المزالق الشائعة.

سجل الان

وأوضح أن تقنية التحفيز المرئي تمكن المستخدمين من تحديد موجه مرئي من خلال الرسم فوق فئات الكائنات التي يرغبون في أن يكتشفها النظام ، باستخدام صورة واحدة فقط أو بضع صور. ثم تبدأ الخوارزمية فورًا في عمل استنتاجات بناءً على الموجه المقدم من المستخدم. إذا كانت النتائج الأولية دون المستوى ، يمكن للمستخدمين إعادة إدخال الموجه على الفور لتحسين نماذجهم ، وتوجيه نظام الذكاء الاصطناعي نحو التعرف بشكل أفضل من خلال إبراز وحدات البكسل المحددة التي يرغبون في تحسينها.

لقطة شاشة لإصدار “Cell” من العرض التوضيحي لـ Landing AI’s Visual Prompting. مصدر الصورة: Landing AI.

يعد Visual Prompting إحدى ميزات LandingLens ، المنتج الرئيسي للشركة الذي يجعل رؤية الكمبيوتر سهلة التنفيذ للجميع. LandingLens هي عبارة عن منصة برمجية بديهية تتيح للمستخدمين إنشاء ونشر وتوسيع نطاق تطبيقات الرؤية الحاسوبية الصناعية التي تعمل بالذكاء الاصطناعي – مثل اكتشاف العيوب – بشكل أسرع وبدقة أعلى.

التكنولوجيا الجديدة مستوحاة من التطورات الحديثة في واجهات نصوص الذكاء الاصطناعي التوليدية مثل ChatGPT ، والتي تبسط عملية تكرار النص لاكتساب رؤى قيمة.

تقليديا ، كان بناء نماذج الذكاء الاصطناعي (AI) مسعى معقدًا وطويلًا ، وغالبًا ما يتضمن خطوات متعددة مثل وسم البيانات ، والتدريب على النموذج والنشر قبل الحصول على أي تنبؤات. ولكن تم إنشاء Visual Prompting لتغيير طريقة إنشاء أنظمة الرؤية الحاسوبية.

قال نج “هذه الوظيفة القوية تمكن المستخدمين من ضبط نماذجهم بسهولة ، مما ينتج عنه تكرارات أسرع ودقة أكبر”. “إذا بدت النتائج جيدة ، يمكنك أيضًا النشر إلى نقطة نهاية واجهة برمجة التطبيقات السحابية في السحابة ، ربما في غضون عشرات الثواني. هذا يعني أنه يمكنك الحصول على النموذج الأول وتشغيله ربما في دقائق أو ، على الأكثر ، في عدد قليل من الساعات ، واستخدام ذلك لمواصلة التكرار وتحسين أدائه “.

ما وراء ChatGPT: تطبيق البرمجة اللغوية العصبية على رؤية الكمبيوتر

يعتقد Ng أن نجاح تحفيز النص في تحويل معالجة اللغة الطبيعية (NLP) قد مهد الطريق للابتكار المتفجر في مجال رؤية الكمبيوتر.

تستكشف العديد من المجموعات في رؤية الكمبيوتر كيفية أخذ أفكار النص المحفزة وتكييفها مع الرؤية. على سبيل المثال ، كان عمل Meta الأخير على SAM (Segment Anything Model) عملاً رائعًا على استخدام التحفيز لمهمة تجزئة الصورة. “لا يزال هناك الكثير من العمل في المستقبل ، وأتوقع أن تستمر هذه التكنولوجيا في التحسن سريعًا من خلال عملنا وعمل العديد من الآخرين.”

كجزء من هذا العمل التوسعي ، تختبر Landing AI أداة Visual Prompting الخاصة بها عبر صناعات متعددة لحالات استخدام مختلفة. في أحد الأمثلة ، استخدمت شركة أدوية رائدة متعددة الجنسيات هذه التقنية لتقدير شكل البلورات والنمو من الصور المختبرية. وقد مكنهم ذلك من تطوير نماذج على مجموعة بيانات صغيرة أثناء إزالة عبء التعليقات التوضيحية.

في الآونة الأخيرة ، استخدمت شركة OmniAb للاكتشافات العلاجية للأجسام المضادة منصة LandingLens مع Visual Prompting لتحليل الخلايا الفردية في أقراص العسل ؛ عملية كانت في الماضي تتطلب عمومًا ساعات لإكمالها عن طريق لصق مئات الأشكال السداسية يدويًا.

قال بوب تشين ، كبير المديرين في OmniAb ، في بيان صحفي: “كان التأثير الأكبر للتوجيه المرئي في حالات الاستخدام حيث سيكون من الصعب تصنيف جميع الميزات بشكل شامل ، مثل الخلايا في نظامنا للفحص عالي الإنتاجية”. بفضل الواجهة السريعة البديهية لـ Visual Prompting ، يمكننا تحقيق نتائج عالية الجودة في جزء صغير من الوقت وبجهد أقل بشكل ملحوظ.

التحديات الحالية وخطط الهبوط المستقبلية للذكاء الاصطناعي

يقول Ng أن البرنامج لا يعمل على كل شيء لأنه إصدار تجريبي. ومع ذلك ، من بين 40 حالة استخدام قامت Landing AI بتحليلها ، كانت Visual Prompting وقدراتها اللاحقة للمعالجة كافية لأكثر من ثلثيها.

“أحد قيود نظامنا الحالي هو أنه أفضل في التمييز بين الفئات ذات القوام / الألوان المختلفة من ميزات الشكل ؛ وقال إن هذا يعكس قيودًا على محولات الرؤية المعدة مسبقًا التي نستخدمها. “نحن مستمرون في العمل على تحسين النظام”.

قال نج: “سنستمر في تحسين Visual Prompting ونحرص على المشاركة مع المجتمع لمواصلة تطوير هذه التكنولوجيا معًا”. “مع تحسن محولات الرؤية ، سنواصل أيضًا النظر في كيفية دمج أحدث الأفكار لمساعدة عملائنا بشكل أكبر.”

أداة Landing AI’s Visual Prompting متاحة كإصدار تجريبي عام الآن. تدعو الشركة الأشخاص إلى عرض الأداة على موقعها على الويب ومعرفة كيفية عملها على نماذج الذكاء الاصطناعي المحسّنة.

تمت مراجعة هذه القصة في 4/25/23 الساعة 2:25 مساءً بالتوقيت الشرقي.

مهمة VentureBeat هو أن تكون ساحة المدينة الرقمية لصناع القرار التقنيين لاكتساب المعرفة حول تكنولوجيا المؤسسات التحويلية والمعاملات. اكتشف إحاطاتنا.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى