تحول شگفت‌انگیز ویدیو‌های هوش مصنوعی با سورا

شرکت هوش مصنوعی اوپن اِی آی (OpenAI) به تازگی ابزاری را معرفی کرده که می تواند از پیام‌های متنی ویدیو تولید کند و کیفیت ویدیو‌ها در اندازه‌ای است که بسیاری ممکن است آن را با ویدیو‌های واقعی اشتباه بگیرند.

این ابزار که سورا (Sora) نام دارد، براساس الگوی چت جی بی تی (ChatGPT)، در کمتر از یک دقیقه و بر اساس موضوع و دستورالعمل های کاربران طراحی یک متن را به ویدیو تبدیل می کند.

اسم این ابزار جدید از کلمه ژاپنی «سورا» به معنای «آسمان» گرفته شده است. این ابزار در حالی که به دستور العمل‌های کاربر در مورد موضوع و سبک پایبند است می‌تواند فیلم‌های واقعی یک دقیقه‌ای تولید کند.

این ابزار همچنین می‌تواند بر اساس یک تصویر ثابت، یک ویدیو تولید کند.

طبق اعلام «اوپن اِی آی»، این سازمان تحقیقاتی درصدد است تا هوش مصنوعی را قادر به درک و شبیه‌سازی دنیای فیزیکی در حال حرکت کند با این هدف که این ابزارها به انسان در حل مشکلاتی که در دنیای واقعی نیاز به تلاش فراوان دارد، کمک کنند.

یکی از ویدیوهای موجود در میان چندین نمونه اولیه از ابزار سورا، ویدیویی بر اساس این دستور العمل است: «ساخت صحنه‌هایی از یک فیلم، شامل ماجراهای فضانورد ۳۰ ساله با کلاه موتورسیکلت، بافتنی قرمز پشمی، آسمان آبی، صحرا، به سبک سینمایی، فیلم ۳۵ میلی‌متری، رنگ های زنده.»

این شرکت اعلام کرد که امکان دسترسی به سورا را برای چند محقق و سازنده ویدیو ایجاد کرده است.


کارشناسان این محصول را توسط «رد تیم» برای شناسایی نادیده گرفتن شرایط خدمات «اوپن‌ اِی آی»، که شامل «محتوای خشونت شدید، جنسی، تصاویر نفرت انگیز، شباهت به افراد مشهور» است را آزمایش می کنند.

در حال حاضر این شرکت اجازه دسترسی محدود به ابزار سورا را به محققان، هنرمندان تجسمی و فیلمسازان داده است. سم آلتمن، مدیر عامل شرکت اوپن اِی آی، پس از اعلام این خبر با کلیپ های ویدیویی که به گفته او با ابزار سورا ساخته شده است، به درخواست‌های کاربران در اکس پاسخ داد.

اوپن اِی آی، اولین شرکت تولید کننده تصویر ثابت که ابزار Dall-E را در سال ۲۰۲۱ و ربات چت هوش مصنوعی، مولد «چت جی بی تی» را در نوامبر ۲۰۲۲ معرفی کرد که به سرعت ۱۰۰ میلیون کاربر را به خود اختصاص داد.

سایر شرکت‌های هوش مصنوعی نیز ابزارهایی را برای تولید ویدیو معرفی کرده‌اند، اگرچه این مدل‌ها تنها قادر به تولید چند ثانیه فیلم‌اند که اغلب ارتباط چندانی با درخواست‌های کاربران ندارد.

گوگل و متا گفته‌اند که در حال توسعه ابزارهای مولد ویدیو هستند، اگرچه تا کنون این ابزارها را برای عموم منتشر نکرده‌اند.

هنوز مشخص نیست که اوپن اِی آی از چه مقدار فیلم برای آموزش سورا استفاده کرده است یا اینکه منابع این ویدیوهای آموزشی از کجا هستند، هرچند این شرکت به نیویورک تایمز گفته است که ویدیوهای آموزشی سورا، مجموعه‌ای از ویدیوها است که هم در دسترس عموم بوده و هم از صاحبان مجوز حق چاپ دارند.