عاصفة 'غيبلي' الرقمية: عندما تهب رياح الذكاء الاصطناعي على الفن

اجتياح صور بالأسلوب الساحر للاستوديو الياباني لوسائل التواصل الاجتماعي بعد تحديث جديد لـ "تشات جي بي تي" يثير نقاشات حول حقوق النشر والملكية الإبداعية، خاصة مع إمكانية محاكاة أساليب فنية مميزة.

واشنطن – ضجت وسائل التواصل الاجتماعي مؤخرا بصور تبدو وكأنها مأخوذة من أحد أفلام "استوديو غيبلي". صور السيلفي، والصور العائلية، وحتى الميمات، أُعيد تخيلها بلوحة الألوان الناعمة التي تميز شركة الرسوم المتحركة اليابانية التي أسسها هاياو ميازاكي.

يأتي هذا بعد آخر تحديث لـ "تشات جي بي تي" من "أوبن أيه آي"، الذي حسّن بشكل كبير قدراته في إنشاء الصور، مما مكّن المستخدمين من توليد صور بأسلوب "غيبلي" في ثوانٍ معدودة.

ويجدر هنا الإشارة الى ان تسمية "غيبلي" (Ghibli) تأتي من الكلمة الإيطالية "Ghibli" (تنطق: غيبلي)، ذات الأصول العربية هي كلمة تعني الرياح الحارة التي تهب من الصحراء الكبرى باتجاه شمال إفريقيا وجنوب أوروبا.

واستخدم الاسم في الأصل للإشارة إلى طائرة الاستطلاع الإيطالية "Caproni Ca.309 Ghibli" خلال الحرب العالمية الثانية.

واخذ استوديو غيبلي (Studio Ghibli) اسمه من هذه الكلمة ليعكس فكرة جلب "نسيم جديد" إلى عالم صناعة الأنمي. اذ أراد مؤسسو الاستوديو، وأبرزهم هاياو ميازاكي وإيساو تاكاهاتا، أن يكون الاستوديو بمثابة رياح تغيير تُنعش صناعة الرسوم المتحركة اليابانية.

بدأت قصة الانتشار الواسع لهذه الرسوم عندما قام شخص يدعى جانو لينجيسواران بتجربة مولد الصور الجديد في "شات جي بي" وتحويل صورة قطته إلى صورة بنمط غيبلي. كانت النتيجة مذهلة حيث أبدت القطة تشابها كبيرا مع القطط المرسومة في أعمال ميازاكي، ولاقت الصورة رواجا واسعا لدى المستخدمين مما دفعهم لتجربة الأمر.

 وقد لقي هذا التحديث شعبية هائلة، إلى درجة أن النظام تعطل بسبب الإقبال الكبير من المستخدمين.

تُفهم أنظمة الذكاء الاصطناعي التوليدي، مثل "تشات جي بي تي"، على أنها "محركات أسلوب". وما نراه الآن هو أن هذه الأنظمة توفر للمستخدمين دقة وتحكمًا غير مسبوقين.

لكن هذا يثير أيضًا أسئلة جديدة تمامًا حول حقوق النشر والملكية الإبداعية.

كيف يُنشئ "تشات جي بي تي" الجديد الصور

تعمل برامج الذكاء الاصطناعي التوليدية عبر إنتاج مخرجات استجابةً لمطالب المستخدم، بما في ذلك إنشاء الصور.

كانت الأجيال السابقة من مولدات الصور بالذكاء الاصطناعي تعتمد على نماذج الانتشار، حيث تقوم هذه النماذج بتكرير بيانات عشوائية وضوضاء تدريجيًا إلى أن تُنتج صورة واضحة. لكن التحديث الأخير لـ "تشات جي بي تي" يستخدم خوارزمية تُعرف باسم "الخوارزمية التلقائية التراجعية".

تعامل هذه الخوارزمية الصور كما لو كانت لغة، حيث تفككها إلى "رموز" (tokens). تمامًا كما يتنبأ "تشات جي بي تي" بالكلمات الأكثر احتمالًا في الجملة، يمكنه الآن توقع العناصر المرئية المختلفة في الصورة بشكل منفصل.

تُمكّن هذه العملية الخوارزمية من فصل بعض ميزات الصورة بشكل أفضل، إلى جانب علاقتها بالكلمات الواردة في المطلب النصي. ونتيجة لذلك، أصبح "تشات جي بي تي" أكثر قدرة على إنشاء صور دقيقة بناءً على مطالب المستخدم، مقارنة بالأجيال السابقة من مولدات الصور. كما يمكنه تعديل أو استبدال ميزات معينة مع الحفاظ على بقية الصورة، فضلًا عن تحسينه المستمر في كتابة النصوص داخل الصور بشكل صحيح.

واحدة من أقوى مزايا إنشاء الصور داخل نموذج لغوي ضخم هي القدرة على الاستفادة من المعرفة الواسعة المخزنة مسبقًا في النظام. وهذا يعني أن المستخدمين ليسوا بحاجة إلى وصف كل تفاصيل الصورة بدقة متناهية، إذ يمكنهم ببساطة الإشارة إلى مفاهيم مثل "استوديو غيبلي"، وسيفهم الذكاء الاصطناعي المرجع تلقائيًا.

بدأت موجة صور "استوديو غيبلي" الأخيرة من "أوبن أيه آي" نفسها، قبل أن تنتشر بين مهندسي البرمجيات في وادي السيليكون، ثم حتى بين الحكومات والسياسيين – بما في ذلك استخدامات غير متوقعة، مثل قيام البيت الأبيض بإنشاء صورة بأسلوب "غيبلي" لامرأة تبكي أثناء ترحيلها، والحكومة الهندية باستخدام هذا الأسلوب للترويج لرؤية رئيس الوزراء ناريندرا مودي لـ "الهند الجديدة".

ومؤخرا اجتاحت الموجة مواقع التواصل العربية.

فهم الذكاء الاصطناعي كمحركات أسلوب

أنظمة الذكاء الاصطناعي التوليدية لا تخزن المعلومات بالمعنى التقليدي، بل تشفر النصوص والحقائق وأجزاء الصور على شكل أنماط – أو "أساليب" – داخل شبكاتها العصبية.

عبر التدريب على كميات هائلة من البيانات، تتعلم نماذج الذكاء الاصطناعي التعرف على الأنماط بمستويات متعددة. الطبقات الأدنى من الشبكة قد تلتقط ميزات أساسية مثل العلاقات بين الكلمات أو القوام البصري، بينما الطبقات العليا تخزن مفاهيم أكثر تعقيدًا أو عناصر بصرية متقدمة.

وهذا يعني أن كل شيء – من الأشياء إلى الخصائص إلى الأنواع الأدبية إلى الأصوات المهنية – يتحول إلى أساليب. عندما يتعلم الذكاء الاصطناعي عن أعمال ميازاكي، فإنه لا يخزن إطارات فعلية من "استوديو غيبلي" (على الرغم من أن بعض مولدات الصور قد تنتج أحيانًا تقليدًا قريبًا جدًا من الصور الأصلية)، بل يقوم بتشفير "روح غيبلي" على شكل نمط رياضي – أسلوب يمكن تطبيقه على صور جديدة.

وينطبق الأمر نفسه على الموز، والقطط، ورسائل البريد الإلكتروني الرسمية. يتعلم الذكاء الاصطناعي "جوهر الموز"، و"جوهر القطة"، و"جوهر البريد الإلكتروني المهني" – أي الأنماط التي تحدد ما يجعل شيئًا ما يُعرف على أنه موزة، أو قطة، أو رسالة احترافية.

لطالما كان تشفير ونقل الأساليب هدفًا صريحًا في الذكاء الاصطناعي البصري. والآن أصبح لدينا مولد صور يحقق ذلك على نطاق غير مسبوق وبمستوى تحكم عالٍ.

يتيح هذا النهج إمكانيات إبداعية مذهلة عبر كل من النصوص والصور. فإذا كان كل شيء مجرد أسلوب، فيمكن دمج هذه الأساليب بحرية ونقلها. لهذا السبب نطلق على هذه الأنظمة اسم "محركات أسلوب". جرّب مثلًا إنشاء كرسي بذراعين على شكل قطة، أو بأسلوب مستوحى من الجان.

جدل حقوق النشر: عندما يصبح الأسلوب هو الهوية

رغم أن القدرة على العمل بالأساليب هي ما يجعل الذكاء الاصطناعي التوليدي قويًا، إلا أنها أيضًا جوهر الجدل المتزايد. فبالنسبة لكثير من الفنانين، هناك شيء مزعج للغاية في رؤية أساليبهم الفنية الفريدة تُختزل إلى مجرد "أسلوب" آخر يمكن لأي شخص تطبيقه بمجرد إدخال نص.

لم يعلق هاياو ميازاكي علنًا على الاتجاه الأخير لاستخدام "تشات جي بي تي" لإنشاء صور بأسلوب "استوديو غيبلي"، لكنه كان ناقدًا للذكاء الاصطناعي في السابق.

وانتشر فيديو يعود لعام 2016 يُظهر ميازاكي ينتقد الذكاء الاصطناعي واصفا إياه بأنه إهانة للحياة نفسها، وقال إنه لن يرغب أبدا في دمج هكذا تقنية في أعماله على الإطلاق.

وهذا الأمر دفع ميازاكي إلى سرد قصة، حيث قال: "كل صباح -وليس في الأيام الأخيرة- أرى صديقي الذي يعاني من إعاقة شديدة في ذراعه لدرجة أنه لا يستطيع حتى مصافحتي، وعندما أفكر فيه لا يمكنني مشاهدة هذه الأشياء واعتبارها مثيرة للاهتمام، فمن يصنع هذه الأشياء لا يعرف معنى الألم".

كل هذا يثير أسئلة جديدة حول حقوق النشر والملكية الإبداعية.

تقليديًا، لا تحمي قوانين حقوق النشر الأساليب – بل تحمي التعبيرات المحددة فقط. لا يمكنك مثلًا تسجيل حقوق النشر لنوع موسيقي مثل "السكّا"، أو لحركة فنية مثل "الانطباعية".

وهذا القيد موجود لسبب وجيه: لو تمكن شخص ما من احتكار أسلوب كامل، فسيعيق ذلك الإبداع للجميع.

لكن هناك فرق بين الأساليب العامة والأساليب الفريدة للغاية التي تصبح مرادفة لهوية شخص معين. عندما يتمكن الذكاء الاصطناعي من إنشاء أعمال "على طريقة غريغ روتكوفسكي" – وهو فنان بولندي ورد اسمه في أكثر من 93,000 طلب في مولد الصور "ستايبل ديفيوجن" – فقد يشكل ذلك تهديدًا لمصدر رزقه وإرثه الفني.

بعض المبدعين اتخذوا بالفعل إجراءات قانونية.

في دعوى قضائية قُدمت أواخر 2022، شكل ثلاثة فنانين مجموعة لرفع دعوى ضد عدة شركات ذكاء اصطناعي، بحجة أن مولدات الصور الخاصة بها تدربت على أعمالهم الأصلية دون إذنهم، والآن تتيح للمستخدمين إنتاج أعمال مشتقة تحاكي أساليبهم المميزة.

ومع تطور التكنولوجيا بسرعة تفوق القوانين، يجري العمل حاليًا على تشريعات جديدة لمحاولة تحقيق توازن بين الابتكار التكنولوجي وحماية الهويات الإبداعية للفنانين.

أياً كان المآل، فإن هذه النقاشات تسلط الضوء على الطبيعة التحويلية لمحركات الأسلوب بالذكاء الاصطناعي – والحاجة إلى التفكير في إمكانياتها الإبداعية غير المستغلة، إلى جانب توفير حماية أكثر دقة للأساليب الفنية المميزة.