
Самая современная модель искусственного интеллекта от Google теперь умеет создавать аудио для сопровождения видео. Благодаря этому можно создавать сцены с полными диалогами.
Вчера во время конференции разработчиков Google I/O 2025 компания представила Veo 3. По словам компании, ИИ может генерировать звуковые эффекты, фоновые шумы и даже диалоги для сопровождения создаваемых ею видеороликов. По словам Google, Veo 3 также превосходит своего предшественника Veo 2 с точки зрения качества создаваемых кадров.
Veo 3 доступен в приложении чат-бота Gemini от Google для подписчиков тарифного плана AI Ultra стоимостью 249,99 долларов в месяц. «Мы выходим из безмолвной эпохи создания видео», — заявил Демис Хассабис, генеральный директор Google DeepMind, подразделения Google по исследованиям и разработкам в области искусственного интеллекта. «[Вы можете дать Veo 3] подсказку, описывающую персонажей и окружающую среду, и предложить диалог с описанием того, как вы хотите, чтобы он звучал», — заявил он.
В соцсетях уже появились ролики пользователей с использованием технологии — например, нарезка кадров (в самых разных стилях от нуарного кино до анимации), в которой герои говорят друг другу “Мы можем говорить!”.