أعلنت «ميدجورني» (Midjourney) المعروفة بريادتها في مجال الصور المُنشأة بالذكاء الاصطناعي، رسمياً دخولها إلى عالم الفيديو. وكشفت الشركة عن نموذج الفيديو «V1» الذي يتيح للمستخدمين تحويل الصور الساكنة إلى مقاطع فيديو قصيرة تنبض بالحركة. ويُعد هذا الإعلان خطوة استراتيجية تتماشى مع رؤية الشركة الأوسع نحو بناء عوالم افتراضية تفاعلية في الزمن الحقيقي.
Introducing our V1 Video Model. It's fun, easy, and beautiful. Available at 10$/month, it's the first video model for *everyone* and it's available now. pic.twitter.com/iBm0KAN8uy
— Midjourney (@midjourney) June 18, 2025
آلية الاستخدام بسيطة وبديهية
- ينشئ المستخدم صورة أو يحمّلها داخل «Midjourney» (عبر Discord أو الويب).
- يضغط على زر «Animate»، مع إمكانية الاختيار بين حركة تلقائية أو وصف يدوي لكيفية تحرك العناصر.
- يختار المستخدم نمط الحركة: حركة منخفضة (ناعمة) أو عالية (ديناميكية).
وتنتج كل عملية توليد أربعة مقاطع مدتها 5 ثوانٍ، ويمكن للمستخدم تمديد الفيديو حتى 21 ثانية عبر خطوات قدرها 4 ثوانٍ.
إنها أداة مرنة وسهلة تُضيف الحياة للعمل الفني.
تكلفة معقولة للحركة
رغم أن إنتاج الفيديو يتطلب طاقة حوسبة أكبر، فإن «ميدجورني» صمّمت النموذج ليكون اقتصادياً. كل ثانية من الفيديو تعادل تقريباً 8 أضعاف تكلفة إنشاء صورة، أي ما يعادل رصيد صورة واحد لكل ثانية فيديو. وتعمل الشركة حالياً على تجربة وضع جديد باسم «Video Relax Mode» يتيح لمشتركي الخطط الأعلى توليد الفيديوهات بسرعة أقل ولكن بتكلفة أرخص. ويصف ديفيد هولتز، مؤسس «ميدجورني» النموذج «V1» بأنه حجر الأساس في مشروع أكبر يجمع بين الصور والحركة والتفاعل ثلاثي الأبعاد والمحاكاة الحية. الهدف النهائي هو بناء عوالم رقمية قابلة للاستكشاف تتجاوز مجرد العرض البصري لتتحوّل إلى بيئات ديناميكية.
ساحة مزدحمة بالمنافسين
تشهد ساحة الفيديو بالذكاء الاصطناعي منافسة محتدمة خاصة مع دخول لاعبين كبار مثل «فاير فلاي» من «أدوبي» و «سورا» من «أوبن إيه آي» و «فيو3» من «غوغل» و«لوما لابس» و«ران واي». هذه النماذج غالباً ما تركز على الجودة السينمائية وإضافة مؤثرات صوتية تلقائية. وفي المقابل، تركّز «ميدجورني» على بساطة التجربة والتحكم الإبداعي والتكلفة المعقولة. فرغم أن النموذج لا يدعم الصوت أو أدوات التحرير المتقدمة، فإنه يوصف بأنه «سهل وممتع وجميل، ومناسب للفنانين والهواة.
تحديات قانونية في الأفق
يتزامن إطلاق «V1» مع تصاعد التحديات القانونية التي تواجهها الشركة. فقد رفعت شركتا «ديزني» و«يونيفيرسال» دعاوى قضائية ضد «ميدجورني»، متهمةً إياها بانتهاك حقوق الملكية الفكرية عبر نماذجها التي تم تدريبها على بيانات مأخوذة من الإنترنت دون ترخيص. هذه القضايا تُسلّط الضوء على تساؤلات حاسمة حول البيانات المستخدمة لتدريب النماذج، وحقوق المبدعين، وحدود الذكاء الاصطناعي في إعادة إنتاج المحتوى.
استقبال المستخدمين الأولي
جاءت ردود الفعل الأولية إيجابية للغاية حيث وصف البعض النموذج بأنه يشبه «كتاب الصور المتحركة السحري»، في حين قال منشئ الفيديوهات بالذكاء الاصطناعي، في هو آنغ، إن النموذج «فاق كل توقعاته». ورغم أن «V1» لا يزال في نسخته التجريبية، ويعاني من بعض القيود، فإنه يُقدم متعة حقيقية وسرعة في الإبداع، ويُعد خطوة مهمة نحو ديمقراطية صناعة الحركة.
إلى أين تتجه «ميدجورني»؟
تعمل الشركة حالياً على توسيع قدرات النموذج، مثل إنتاج مقاطع أطول، دعم الصوت، وإضافة تفاعل ثلاثي الأبعاد في الزمن الحقيقي. وفي الوقت ذاته، عليها أن تُوازن بين الابتكار والمخاطر القانونية، وأن تتعامل بمسؤولية أخلاقية مع ما تقدّمه.
يمثّل النموذج الجديد نقلة نوعية في مجال المحتوى الإبداعي المُولّد بالذكاء الاصطناعي. فهو لا يضيف مجرد ميزة جديدة، بل يفتح الباب نحو عصر جديد من التعبير البصري الديناميكي. ويبقى السؤال الأهم: «هل يحق للآلة أن تتحرك... دون أن نسأل من يملك هذه الحركة؟».