تحول شگفتانگیز ویدیوهای هوش مصنوعی با سورا
شرکت هوش مصنوعی اوپن اِی آی (OpenAI) به تازگی ابزاری را معرفی کرده که می تواند از پیامهای متنی ویدیو تولید کند و کیفیت ویدیوها در اندازهای است که بسیاری ممکن است آن را با ویدیوهای واقعی اشتباه بگیرند.
این ابزار که سورا (Sora) نام دارد، براساس الگوی چت جی بی تی (ChatGPT)، در کمتر از یک دقیقه و بر اساس موضوع و دستورالعمل های کاربران طراحی یک متن را به ویدیو تبدیل می کند.
اسم این ابزار جدید از کلمه ژاپنی «سورا» به معنای «آسمان» گرفته شده است. این ابزار در حالی که به دستور العملهای کاربر در مورد موضوع و سبک پایبند است میتواند فیلمهای واقعی یک دقیقهای تولید کند.
این ابزار همچنین میتواند بر اساس یک تصویر ثابت، یک ویدیو تولید کند.
طبق اعلام «اوپن اِی آی»، این سازمان تحقیقاتی درصدد است تا هوش مصنوعی را قادر به درک و شبیهسازی دنیای فیزیکی در حال حرکت کند با این هدف که این ابزارها به انسان در حل مشکلاتی که در دنیای واقعی نیاز به تلاش فراوان دارد، کمک کنند.
یکی از ویدیوهای موجود در میان چندین نمونه اولیه از ابزار سورا، ویدیویی بر اساس این دستور العمل است: «ساخت صحنههایی از یک فیلم، شامل ماجراهای فضانورد ۳۰ ساله با کلاه موتورسیکلت، بافتنی قرمز پشمی، آسمان آبی، صحرا، به سبک سینمایی، فیلم ۳۵ میلیمتری، رنگ های زنده.»
این شرکت اعلام کرد که امکان دسترسی به سورا را برای چند محقق و سازنده ویدیو ایجاد کرده است.
کارشناسان این محصول را توسط «رد تیم» برای شناسایی نادیده گرفتن شرایط خدمات «اوپن اِی آی»، که شامل «محتوای خشونت شدید، جنسی، تصاویر نفرت انگیز، شباهت به افراد مشهور» است را آزمایش می کنند.
در حال حاضر این شرکت اجازه دسترسی محدود به ابزار سورا را به محققان، هنرمندان تجسمی و فیلمسازان داده است. سم آلتمن، مدیر عامل شرکت اوپن اِی آی، پس از اعلام این خبر با کلیپ های ویدیویی که به گفته او با ابزار سورا ساخته شده است، به درخواستهای کاربران در اکس پاسخ داد.
اوپن اِی آی، اولین شرکت تولید کننده تصویر ثابت که ابزار Dall-E را در سال ۲۰۲۱ و ربات چت هوش مصنوعی، مولد «چت جی بی تی» را در نوامبر ۲۰۲۲ معرفی کرد که به سرعت ۱۰۰ میلیون کاربر را به خود اختصاص داد.
سایر شرکتهای هوش مصنوعی نیز ابزارهایی را برای تولید ویدیو معرفی کردهاند، اگرچه این مدلها تنها قادر به تولید چند ثانیه فیلماند که اغلب ارتباط چندانی با درخواستهای کاربران ندارد.
گوگل و متا گفتهاند که در حال توسعه ابزارهای مولد ویدیو هستند، اگرچه تا کنون این ابزارها را برای عموم منتشر نکردهاند.
هنوز مشخص نیست که اوپن اِی آی از چه مقدار فیلم برای آموزش سورا استفاده کرده است یا اینکه منابع این ویدیوهای آموزشی از کجا هستند، هرچند این شرکت به نیویورک تایمز گفته است که ویدیوهای آموزشی سورا، مجموعهای از ویدیوها است که هم در دسترس عموم بوده و هم از صاحبان مجوز حق چاپ دارند.