گوگل با معرفی ابزاری قدرتمند برای تولید ویدیو با هوش مصنوعی رقبای خود در این زمینه را به چالش جدی کشیده است.
در حالی که OpenAI با پروژهی Sora حسابی سر و صدا به پا کرده، گوگل هم بیکار ننشسته و از جدیدترین دستاورد خود با نام Veo 2 رونمایی کرده که مدلی قدرتمند برای تولید ویدیو با هوش مصنوعی است. بر اساس بازخوردهای اولیه، مدل جدید عملکردی فراتر از Sora ارائه میدهد.
مدل قدرتمند Sora اوایل ماه عرضه شده اما Veo 2 همچنان در مرحله پیشنمایش اولیه قرار دارد. با این حال بر اساس مقایسههایی که کاربران از عملکرد این دو مدل منتشر کردهاند، Veo 2 در پاسخ به دستورات یکسان کاملا دست بالا را دارد.
«بیلاوال سیدو»، از میزبانهای TED و یکی از کاربران اولیه این ابزار مقایسهای جذاب میان دو مدل Veo 2 و Sora در پلتفرم X به اشتراک گذاشت. او پرامپتی یکسان با موضوع «خوردن سوپ به سبک قدیمی اروپایی» به هر دو مدل داده است. Sora در پاسخ ویدیویی عجیب و بیمعنی تولید کرده که در آن سر سوژه در کاسه سوپ فرو رفته است:
از سوی دیگر Veo 2 ویدیوهای بسیار واقعی و چشمنواز تولید کرده که انگار توسط تیمی حرفهای تولید شده است.
در نمونهای دیگر سیدو درخواست «مارکوس براونلی» یوتیوبر معروف را برای هر دو مدل امتحان کرده: «نمای جانبی از یک کرگدن که در یک دشت خشک با علفهای کوتاه قدم میزند».
در این مورد هر دو مدل از نظر ظاهری عملکرد خوبی دارند اما فیزیک حرکات کرگدن در ویدیو Veo 2 بسیار واقعیتر و دقیقتر درآمده است.
«روبن هاسید»، بنیانگذار EasyGen نیز با تولید چند ویدیو مختلف از برش سبزیجات، جستوخیز یک سگ و حرکات خودرو برتری گوگل را تایید کرده است. برای مثال در ویدیو Sora حین برش سبزیجات چاقو از دست سوژه رد میشود اما هوش مصنوعی گوگل اینکار را کاملا طبیعی انجام میدهد.
هرچند اینها نمونههای گلچینشده هستند اما از نظر اکثر علاقهمندان به هوش مصنوعی Veo 2 در دقت و واقعگرایی عملکرد بهتری دارد.
دلیل اصلی برتری Veo 2 نسبت به Sora، استفاده از دادههای بیپایان و متنوع یوتیوب است. پلتفرمی که تحت مالکیت گوگل قرار دارد و نقشی کلیدی در آموزش مدلهای هوش مصنوعی این شرکت ایفا کرده است.
گوگل آشکارا اعلام کرده است که از دادههای یوتیوب برای آموزش مدلهای هوش مصنوعی خود استفاده میکند، اما به دیگران اجازه نمیدهد از این دادهها استفاده کنند. پیش از این نیویورک تایمز گزارش داده بود که OpenAI نیز برای آموزش مدلهای خود از برخی دادههای یوتیوب استفاده کرده است. «نیل موهان»، مدیرعامل یوتیوب در واکنش به این گزارش اعلام کرد که این کار OpenAI نقض قوانین گوگل است.