Meta تطلق أداة جديدة لتجزئة الصور تعتمد على الذكاء الاصطناعي للجميع
لدى Meta بعض الطموحات الكبيرة في مجال الذكاء الاصطناعي ، على الرغم من أنه يبدو أنه يلعب منذ فترة طويلة اللحاق بركب OpenAI و Microsoft و حتى جوجل. لإثارة القليل من الإثارة ، عرضت الشركة يوم الأربعاء نموذجها الجديد Segment Anything Model القائم على الذكاء الاصطناعي والذي يكون قادرًا بشكل مدهش على القيام به. تحديد وفصل كائنات معينة في الصور والفيديو. هذا هو الكيكر ، ميتا تطلقه لأي شخص بجعل برامجه الجديد مفتوح المصدر.
هناك عدد غير قليل تطبيقات جيدة لمحو الأشياء غير المرغوب فيها من الصور، وجميعهم يستخدمون بالفعل نماذج الذكاء الاصطناعي للعثور على الأشياء واستبدالها في الصور. في اختباراتي الخاصة لـ الجزء أي شيء تجريبي، خطت Meta خطوة إلى الأمام من خلال عرضها الخاص. يقدم النظام التجريبي نوعًا من أداة ‘Magic Wand’ الخاصة بـ Photoshop على المنشطات. جربته باستخدام بعض الصور المزدحمة ، مثل صورة مجموعة Rivendell الضخمة من Lego. لم يقتصر الأمر على تخمينه بشكل جماعي أنني كنت أحاول تحديد صور مصغرة معينة من الخلفية ، ولكن عندما التقطت بضع وحدات بكسل ضاربة ، تمكنت بسرعة من إخبارها بحذف أي شيء لم يكن ملك الخواتم بنقرة واحدة فقط.
بعد حساب صورة جديدة ، يقوم النظام بعمل قوي يميز كائنات مختلفة في الصورة. في صورة أنا جالس على كرسي تدليك ضيق للغاية، كان قادرًا على تحديد هويتي ، والكرسي ، وحتى لحيتي بشكل فردي. بالطبع ، فإن Meta ليست وحدها التي تنشئ خوارزميات التعلم الآلي لتحديد جوانب الصور. لقد تحدثت شركة آبل عن ذلك تقنية تجزئة الصور بالذكاء الاصطناعي منذ عام 2021.
ولكن ما قد يميز Meta عن غيره هو الوظيفة وسهولة الاستخدام. في اختباراتي الخاصة ، وجدت أن SAM أفضل في اختيار الكائنات الصغيرة من الصور المزدحمة من Magic Eraser من Google أو الأداة المجانية عبر الإنترنت Inpaint ، على الرغم من عدم وجود وظيفة لإزالة جوانب الصورة واستبدال خلفيتها.
قد تحصل G / O Media على عمولة
قال Meta إن SAM قادر على إخراج أقنعة متعددة حتى عندما يكون هناك “غموض” حول الكائن. حتى ذلك الحين ، وصفت الشركة هذا بأنه مجرد “نموذج أساسي” مفيد لتجزئة الصور ، تفاعلية وتلقائية. يوصف النظام بأنه “سريع” بمعنى أنه يمكن أن يتلقى مدخلات مثل نظرة المستخدمين إلى سماعة رأس VR أو من خلال النقرات وحتى النص.
ربما يكون الأمر الأكثر إثارة للدهشة من Meta ، هو أنها تطلق SAM بموجب ترخيص مفتوح ، وتقدم المزيد تفاصيل كاملة عن مجموعة بيانات القناع التي تبلغ 1 مليار، والتي ادعت الشركة أنها كانت “أكبر مجموعة بيانات تجزئة على الإطلاق”. هذا SA-1B هو أ التجزئة الدلالية مجموعة البيانات التي تصنف كل بكسل في الصورة ، مما يسهل أسلوب أو إزالة الكائنات من الصور. وفقًا لـ Meta ، يتم تدريب النظام نفسه على 11 مليون صورة بمتوسط 100 قناع لكل صورة.
وفق ورقة بحث ميتا عن SAM، فإن مجموعة البيانات تستخدم صورًا “من موفر يعمل مباشرة مع المصورين” ، على الرغم من أنها لم تحدد مقدم الخدمة. تتضمن بعض تلك الصور التي تم تدريب النظام عليها وجوهًا ولوحات ترخيص ، على الرغم من أن الورقة تقول إن Meta طمس تلك الصور عندما أصدرت مجموعة البيانات.
إنه لأمر رائع أن ترى Meta على استعداد لفتح مصدر واحد من نماذجها وبياناتها ، على الرغم من أن الأمر لا يعني أننا يجب أن نتوقع المزيد من الأشياء مجانًا. جعلت Meta مؤخرًا محورًا صعبًا لـ منظمة العفو الدوليةلدرجة أن رئيس قسم metaverse الخاص بالشركة أندرو بوسورث والمديرين التنفيذيين الآخرين يتحدثون عن كيفية تخطيط الشركة لاستخدام الذكاء الاصطناعي التوليدي من أجل إنشاء الإعلانات بجانب المنتجات التجارية الأخرى. لا تزال الشركة تعمل على إصدار بيان عام لها دعا منافس ChatGPT LLaMAعلى الرغم من تسريبه بالفعل عبر الإنترنت.
بالتأكيد ، يمكن استخدام SAM في إمكانية AR أو VR لتحديد الكائنات من خلال نظرة المستخدم ، وهو شيء مهم جدًا لطموحات Meta لسماعات الرأس والنظارات AR. لا يزال هناك متسع كبير لسوء المعاملة. لقد أثبت نظام الكشف عن الذكاء الاصطناعي DeepMind من Google فعاليته في تحديد الخلايا السرطانية، ولكن تم استخدام أنظمة مماثلة للتعرف على الوجه. كشف اتحاد الحريات المدنية الأمريكي مؤخرًا عن ملف قام مكتب التحقيقات الفيدرالي FBI باختبار برنامج التعرف على الوجه على المواطنين الأمريكيين لسنوات. نظرًا لأن هذه التكنولوجيا أصبحت أكثر تعقيدًا ، فإن الولايات المتحدة بحاجة ماسة إلى الحظر الفيدرالي للوجه والقياسات الحيوية أو في حد ذاته الأقل أكثر أنظمة.
هل تريد معرفة المزيد عن الذكاء الاصطناعي وروبوتات المحادثة ومستقبل التعلم الآلي؟ تحقق من تغطيتنا الكاملة لـ الذكاء الاصطناعيأو تصفح أدلةنا إلى أفضل مولدات فنية مجانية لمنظمة العفو الدوليةو أفضل بدائل ChatGPTو و كل ما نعرفه عن ChatGPT الخاص بـ OpenAI.
اكتشاف المزيد من إشراق التقنية
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.