تقنية

تُعيق مُولدات الفن بالذكاء الاصطناعي النص الفنانين أكثر مما تساعدهم


صور تم إنشاؤها بواسطة الذكاء الاصطناعي لكلاب شبعا إينو ولوحة الموناليزا

يمكن أن يكون الحصول على الصورة المرغوبة تمرينًا طويلاً في التجربة والخطأ.
لقطة شاشة: أوبن إيه آي

صنع الفن باستخدام الذكاء الاصطناعي ليس بالأمر الجديد. إنه قديم قدم الذكاء الاصطناعي نفسه.

الجديد هو أن موجة من الأدوات تتيح الآن لمعظم الأشخاص إنشاء صور عن طريق إدخال رسالة نصية. كل ما عليك فعله هو كتابة “منظر طبيعي بأسلوب فان جوخ” في مربع نص ، ويمكن للذكاء الاصطناعي إنشاء صورة جميلة حسب التعليمات.

تكمن قوة هذه التقنية في قدرتها على استخدام اللغة البشرية للتحكم في توليد الفن. لكن هل هذه الأنظمة تترجم بدقة رؤية الفنان؟ هل يمكن أن يؤدي إدخال اللغة في صناعة الفن حقًا إلى اختراقات فنية؟

المخرجات الهندسية

لقد عملت مع الذكاء الاصطناعي التوليدي كفنان وعالم كمبيوتر لسنوات ، وأنا أزعم أن هذا النوع الجديد من الأدوات يقيد العملية الإبداعية.

عندما تكتب مطالبة نصية لإنشاء صورة باستخدام الذكاء الاصطناعي ، فهناك احتمالات لا حصر لها. إذا كنت مستخدمًا عاديًا ، فقد تكون سعيدًا بما يولده لك الذكاء الاصطناعي. والشركات الناشئة والمستثمرون سكبوا المليارات في هذه التقنية ، حيث ينظر إليها على أنها طريقة سهلة لإنشاء رسومات للمقالات وشخصيات ألعاب الفيديو والإعلانات.

يُنظر إلى الذكاء الاصطناعي التوليدي على أنه أداة واعدة لابتكار شخصيات ألعاب الفيديو.

يُنظر إلى الذكاء الاصطناعي التوليدي على أنه أداة واعدة لابتكار شخصيات ألعاب الفيديو.
لقطة شاشة: Benlisquare / ويكيميديا ​​كومنز ، CC BY-SA

في المقابل ، قد يحتاج الفنان إلى كتابة مقال كما يُطلب منه إنشاء صورة عالية الجودة تعكس رؤيته – بالتركيب الصحيح والإضاءة المناسبة والتظليل الصحيح. هذا الموجه الطويل ليس بالضرورة وصفيًا للصورة ولكنه يستخدم عادةً الكثير من الكلمات الرئيسية لاستدعاء نظام ما يدور في ذهن الفنان. هناك مصطلح جديد نسبيًا لهذا: الهندسة السريعة.

بشكل أساسي ، يتم تقليل دور الفنان الذي يستخدم هذه الأدوات إلى الهندسة العكسية للنظام للعثور على الكلمات الرئيسية الصحيحة لإجبار النظام على إنشاء الإخراج المطلوب. يتطلب الأمر الكثير من الجهد ، والكثير من التجربة والخطأ ، للعثور على الكلمات الصحيحة.

الذكاء الاصطناعي ليس ذكيًا كما يبدو

لمعرفة كيفية التحكم بشكل أفضل في المخرجات ، من المهم أن ندرك أن معظم هذه الأنظمة تم تدريبهم على الصور والتعليقات التوضيحية من الإنترنت.

فكر فيما تخبره التسمية التوضيحية للصورة النموذجية عن الصورة. تتم كتابة التسميات التوضيحية عادةً لتكمل التجربة المرئية في تصفح الويب.

على سبيل المثال ، قد يصف التعليق اسم المصور الفوتوغرافي وصاحب حقوق النشر. في بعض مواقع الويب ، مثل Flickr ، يصف التعليق عادةً نوع الكاميرا والعدسة المستخدمة. في المواقع الأخرى ، تصف التسمية التوضيحية محرك الرسوم والأجهزة المستخدمة لعرض الصورة.

لذلك لكتابة نص مفيد ، يحتاج المستخدمون إلى إدخال العديد من الكلمات الأساسية غير الوصفية لنظام الذكاء الاصطناعي لإنشاء صورة مقابلة.

أنظمة الذكاء الاصطناعي الحالية ليست ذكية كما تبدو ؛ إنها في الأساس أنظمة استرجاع ذكية لها ذاكرة ضخمة وتعمل عن طريق الارتباط.

فنانين محبطين بسبب انعدام السيطرة

هل هذا حقًا نوع الأداة التي يمكن أن تساعد الفنانين في إنشاء أعمال رائعة؟

في Playform AI ، وهي منصة فنية مولدة للذكاء الاصطناعي أسستها ، نحن أجرت مسحا لفهم تجارب الفنانين بشكل أفضل مع الذكاء الاصطناعي التوليدي. جمعنا ردودًا من أكثر من 500 فنان رقمي ورسامين تقليديين ومصورين ورسامين ومصممي رسومات ممن استخدموا منصات مثل DALL-E و Stable Diffusion و Midjourney ، من بين آخرين.

وجد 46٪ فقط من المستجيبين أن هذه الأدوات “مفيدة جدًا” ، بينما وجدها 32٪ مفيدة إلى حد ما ولكنهم لم يتمكنوا من دمجها في سير العمل. باقي المستخدمين – 22٪ – لم يجدوها مفيدة على الإطلاق.

كان أبرز الفنانين والمصممين المحددين هو الافتقار إلى السيطرة. على مقياس من 0 إلى 10 ، مع كون 10 هي الأكثر تحكمًا ، وصف المشاركون قدرتهم على التحكم في النتيجة بين 4 و 5. وجد نصف المستجيبين أن المخرجات مثيرة للاهتمام ، ولكنها ليست عالية الجودة بما يكفي لاستخدامها في يمارس.

عندما يتعلق الأمر بالمعتقدات حول ما إذا كان الذكاء الاصطناعي التوليدي سيؤثر على ممارساتهم ، يعتقد 90٪ من الفنانين الذين شملهم الاستطلاع أن ذلك سيؤثر ؛ يعتقد 46٪ أن التأثير سيكون إيجابيًا ، بينما توقع 7٪ أنه سيكون له تأثير سلبي. واعتقد 37٪ أن ممارستهم ستتأثر لكنهم لم يكونوا متأكدين بأي طريقة.

أفضل فن بصري يتجاوز اللغة

هل هذه القيود أساسية ، أم أنها ستختفي مع تحسن التكنولوجيا؟

بالطبع ، ستمنح الإصدارات الأحدث من الذكاء الاصطناعي التوليدي المستخدمين مزيدًا من التحكم في المخرجات ، جنبًا إلى جنب مع دقة أعلى وجودة صورة أفضل.

لكن بالنسبة لي ، فإن القيد الرئيسي ، فيما يتعلق بالفن ، هو أساسي: إنها عملية استخدام اللغة كمحرك رئيسي في تكوين الصورة.

الفنانون المرئيون ، بحكم التعريف ، هم المفكرين البصريين. عندما يتخيلون عملهم ، فإنهم عادة ما يستمدون من المراجع المرئية ، وليس الكلمات – من ذكرى ، أو مجموعة من الصور الفوتوغرافية أو غيرها من الأعمال الفنية التي صادفوها.

عندما تكون اللغة في مقعد السائق لتوليد الصور ، أرى حاجزًا إضافيًا بين الفنان واللوحة الرقمية. سيتم عرض وحدات البكسل فقط من خلال عدسة اللغة. يفقد الفنانون حرية التعامل مع وحدات البكسل خارج حدود الدلالات.

يمكن أن يؤدي نفس الإدخال إلى مجموعة من المخرجات العشوائية.

يمكن أن يؤدي نفس الإدخال إلى مجموعة من المخرجات العشوائية.
لقطة شاشة: أوبن إيه آي / ويكيميديا ​​كومنز

هناك قيود أساسية أخرى في تقنية تحويل النص إلى صورة.

إذا أدخل فنانان نفس الموجه بالضبط ، فمن غير المرجح أن يقوم النظام بإنشاء نفس الصورة. هذا ليس بسبب أي شيء فعله الفنان. النتائج المختلفة هي ببساطة بسبب الذكاء الاصطناعي بدءًا من صور أولية عشوائية مختلفة.

بعبارة أخرى ، فإن إنتاج الفنان يتلخص في الصدفة.

ما يقرب من ثلثي الفنانين الذين شملهم الاستطلاع لديهم مخاوف من أن أجيال الذكاء الاصطناعي الخاصة بهم قد تكون مشابهة لأعمال فنانين آخرين وأن التكنولوجيا لا تعكس هويتهم – أو حتى تحل محلها تمامًا.

تعتبر مسألة هوية الفنان أمرًا بالغ الأهمية عندما يتعلق الأمر بصنع الفن والتعرف عليه. في القرن التاسع عشر ، عندما بدأ التصوير الفوتوغرافي في الانتشار ، كان هناك نقاش حول ما إذا كان التصوير الفوتوغرافي شكلاً من أشكال الفن. نزلت إلى قضية محكمة في فرنسا عام 1861 لتقرير ما إذا كان التصوير الفوتوغرافي محميًا بحقوق الطبع والنشر كشكل من أشكال الفن. اعتمد القرار على ما إذا كان يمكن التعبير عن هوية الفنان الفريدة من خلال الصور.

تظهر هذه الأسئلة نفسها عند التفكير في أنظمة الذكاء الاصطناعي التي يتم تدريسها بالصور الموجودة على الإنترنت.

قبل ظهور مطالبة تحويل النص إلى صورة ، كان إنشاء الفن باستخدام الذكاء الاصطناعي عملية أكثر تفصيلاًعادةً ما يقوم الفنانون بتدريب نماذج الذكاء الاصطناعي الخاصة بهم بناءً على صورهم الخاصة. سمح لهم ذلك باستخدام أعمالهم كمراجع مرئية والاحتفاظ بمزيد من التحكم في المخرجات ، مما يعكس أسلوبهم الفريد بشكل أفضل.

قد تكون أدوات تحويل النص إلى صورة مفيدة لبعض منشئي المحتوى والمستخدمين العاديين العاديين الذين يرغبون في إنشاء رسومات لعرض تقديمي للعمل أو منشور على وسائل التواصل الاجتماعي.

ولكن عندما يتعلق الأمر بالفن ، لا أستطيع أن أرى كيف يمكن لبرامج تحويل النص إلى صورة أن تعكس بشكل مناسب النوايا الحقيقية للفنان أو تلتقط الجمال والرنين العاطفي أو الأعمال التي تجذب المشاهدين وتجعلهم يرون العالم من جديد.


هل تريد معرفة المزيد عن الذكاء الاصطناعي وروبوتات المحادثة ومستقبل التعلم الآلي؟ تحقق من تغطيتنا الكاملة لـ الذكاء الاصطناعيأو تصفح أدلةنا إلى أفضل مولدات فنية مجانية لمنظمة العفو الدولية و كل ما نعرفه عن ChatGPT الخاص بـ OpenAI.

احمد الجمالأستاذ علوم الحاسب ومدير معمل الفن والذكاء الاصطناعي ، جامعة روتجرز

تم إعادة نشر هذه المقالة من محادثة بموجب رخصة المشاع الإبداعي. إقرأ ال المقالة الأصلية.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى