ثورة الذكاء الاصطناعي البصري: لماذا نهوى صور الابداع الرقمي؟

مع التطور المتسارع في نماذج الذكاء الاصطناعي التوليدي، لم تعد الصورة مجرد عنصر مكمل للنص، بل تحولت إلى العملة الأكثر قيمة في الاقتصاد الرقمي الجديد.

في عام 2014، نشر باحثو معهد ماساتشوستس للتكنولوجيا (MIT) دراسة في مجلة أتنشن بيرسيبشن آند سايكوفيزيكس، كشفت أن الدماغ البشري قادر على معالجة صورة كاملة في 13 ملي ثانية فقط، أي في لمح البصر الحرفي، وهذا الرقم كان صادما لأن الدراسات السابقة كانت تقدر المدة بـ100 ملي ثانية على الأقل.

وتكشف الأبحاث الأحدث أن المعالجة البصرية واللغوية تسيران في قنوات متوازية لكنها مختلفة في الدماغ، فقناة البصر تمر عبر القشرة البصرية الأولية ثم المناطق الترابطية بسرعة هائلة دون الحاجة إلى ترجمة رمزية، في حين تحتاج اللغة المكتوبة إلى مراحل تفكيك رمزي إضافية، وبعبارة أبسط، فإن الصورة تصل إلى الفهم مباشرة، أما النص فيحتاج إلى ترجمة داخلية أولا.

كما يشير الباحثون إلى ما يعرف بـ "تأثير تفوق الصورة"، وهي ظاهرة موثقة في علم النفس المعرفي، فبعد 3 أيام من قراءة نص، يتذكر الإنسان نحو 10% من المعلومات، لكن حين تقرن المعلومة بصورة ترتفع نسبة التذكر إلى 65%.

وهذا ما يجعل المنتجات البصرية للذكاء الاصطناعي تلامس وترا عميقا، حيث إنها لا تنتج محتوى فحسب، بل تنتج محتوى ذا قابلية استثنائية للبقاء في الذاكرة.

وقبل الذكاء الاصطناعي التوليدي، كان الإنتاج البصري الاحترافي محجوزا لأصحاب المهارة التقنية أو المال الكافي للاستعانة بالمصممين، حيث تشير نتائج تقرير كانفا للاقتصاد البصري لعام 2024، الذي استطلع اراء 3700 قائد اعمال في 12 دولة، إلى أن 82% منهم استخدموا ادوات ذكاء اصطناعي لانتاج محتوى بصري، وأن 77% يرون أن التواصل البصري حسن اداءهم التجاري.

لماذا تتفوق الصورة تقنيا؟

فالصورة هي اللغة الوحيدة التي لا تحتاج إلى ترجمة، ووفقا لتقارير المنتدى الاقتصادي العالمي حول مهارات المستقبل، فإن "التواصل البصري" اصبح مهارة عابرة للحدود، إذ سمح الذكاء الاصطناعي لشخص في اليابان بإنتاج محتوى بصري يفهمه شخص في البرازيل دون الحاجة إلى قاموس، ما جعل المنتجات البصرية الأداة المثالية للعولمة الرقمية.

كيف وقعنا في حب "البكسلات الذكية"؟

لم يات هذا الحب من فراغ، بل هو نتيجة تطور تقني مذهل في معمارية النماذج، فالتقنية تقف خلف اغلب الصور المذهلة اليوم، حيث تعمل هذه النماذج عبر ازالة "الضجيج" من صورة مشوشة تدريجيا حتى تصل إلى شكل نهائي مبهر، وهذا التدرج في البناء يحاكي طريقة عمل العقل في صياغة الذكريات أو الأحلام.

واضاف ان انتاج صورة سينمائية في السابق كان يتطلب كاميرات بالاف الدولارات وخبرة في الاضاءة، اما الان، وبفضل تقنيات مثل ستيبل ديفيوجن (Stable Diffusion)، يمكن لاي جهاز حاسوب متوسط القوة انتاج جودة تضاهي اعمال هوليوود.

لماذا الصورة أهم من النص في سياق الذكاء الاصطناعي؟

في عالم البيانات الضخمة، تعد الصور "بيانات غنية"، وذلك لعدة اسباب تقنية وعملية، اهمها:

التحقق والمصداقية البصرية: ففي مجالات مثل الصحافة والتحقيق الجنائي الرقمي، الصورة هي الدليل الاول، ورغم مخاطر "التزييف العميق"، فان الذكاء الاصطناعي البصري يساهم ايضا في بناء ادوات لكشف التزييف عبر تقنيات مثل "سي2بي ايه" (C2PA) التي تعني معايير منشا المحتوى وتوثيقه، وتدعمها شركات مثل ادوبي ومايكروسوفت.

التدريب المتبادل: يتم تدريب نماذج اللغات الكبيرة (LLMs) بشكل متزايد على الصور لفهم العالم المادي بشكل افضل، اي ان الذكاء الاصطناعي لا يصبح ذكيا حقا الا عندما "يرى".

مستقبل الصور في التطبيقات

وبين ان العالم اليوم ينتقل من مرحلة "توليد الصور للمتعة" إلى مرحلة "الوظيفية البصرية الكاملة"، حيث سيغير ذلك مستقبل التطبيقات، فلن تكون واجهات التطبيقات ثابتة، بل سيقوم الذكاء الاصطناعي بتوليد واجهة مستخدم بصرية مخصصة لكل فرد بناء على حالته المزاجية أو حاجته اللحظية، وإذا كان المستخدم يفضل النمط التبسيطي، سيعيد التطبيق رسم نفسه بصريا فورا.

واوضح ان التجارة الالكترونية الغامرة ستنتقل تطبيقات التسوق من عرض صور المنتجات إلى توليد "تجربة بصرية مخصصة"، وذلك بفضل تقنيات مثل القياس الافتراضي، حيث سيرى المستخدم صورا لنفسه وهو يرتدي الملابس بدقة مذهلة، ما يقلل معدلات الارجاع بنسبة كبيرة.

واضاف ان ذلك سيحدث ثورة في التعليم والطب، ففي الطب، سيساعد تحويل بيانات الرنين المغناطيسي المعقدة إلى صور ثلاثية الابعاد مولدة بالذكاء الاصطناعي الاطباء على شرح الحالات للمرضى بدقة اكبر، وفي التعليم، سيتحول النص التاريخي الجاف إلى "فيلم بصري" تفاعلي داخل الفصل الدراسي.

التحديات والاخلاقيات

ولا يمكن الحديث عن حب الصور دون ذكر المخاوف، فوفقا لمنظمة هيومن رايتس ووتش، فإن سهولة توليد الصور تزيد من خطر التضليل الرقمي، كما ان حقوق الملكية الفكرية للفنانين الذين استخدمت اعمالهم لتدريب هذه النماذج تظل نقطة صراع قانوني كبرى في محاكم الولايات المتحدة والاتحاد الاوروبي.

وعليه يقول الخبراء إن وقوعنا في حب المنتجات البصرية للذكاء الاصطناعي هو اعتراف بعجزنا السابق عن التعبير الكامل عن خيالنا، حيث منحنا الذكاء الاصطناعي "عيونا رقمية" نرى بها افكارنا، وفي المستقبل، لن تكون الصورة مجرد اداة للتوضيح، بل ستصبح هي الواجهة الاساسية للتفاعل بين الانسان والالة، حيث تتلاشى الحدود بين ما نتخيله وما يمكننا رؤيته حقيقة.