Google Omni видео в Gemini

23 мая, 2026

Время прочтения: ~8 минут

ИИшница №102

Всем привет! Это «ИИШНИЦА», 10 новостей про нейросети, контент и заработок. Сегодня в выпуске: Google Omni в Gemini громко показали как новую видеомодель, но в тестах она пока не держит лица и сцены. Chloe VS History делает длинные AI-влоги из прошлого, а через Syntx можно собрать похожий исторический ролик, HeyGen Custom Motion наконец даёт управлять жестами и эмоциями аватара и другие интересные новости.

#1. Google Omni красиво показали, но тест не вывез

Google показала Gemini Omni Flash — новую видеомодель внутри Gemini, которая умеет генерировать и редактировать ролики из текста, изображений, видео и части аудио-входов. Главная ставка сделана на multi-turn editing: сцену можно менять поэтапно через диалог, не пересобирая клип с нуля. Google отдельно продвигает world understanding — модель должна лучше держать физику, причинно-следственные связи и контекст по сравнению с обычными video models. В Gemini доступны 10-секундные ролики, работа с несколькими фото-референсами, вертикальный и горизонтальный формат, а также AI avatar. Все видео получают SynthID-водяной знак.

На практике тесты пока выглядят слабее презентации. Да, генерация быстрая, а сам диалоговый формат редактирования удобный, но стабильность персонажей остаётся проблемой: даже с загруженным референсом лицо заметно меняется от сцены к сцене. В тесте с генерацией сцены про Петра I модель не удержала образ и выдала типичный “нейрослоп” вместо цельного ролика. Тайминг сцен вручную не настраивается — паузы, движение камеры и смены действий приходится описывать текстом. Озвучка речи персонажей в тестах также не проявилась. Бесплатный доступ заявлен на ограниченный период с небольшим лимитом генераций, после чего требуется подписка Gemini.

Источник: https://x.com/EHuanglu/status/2056798387647987941?s=20

#2. Персонаж Chloe VS History создала новый ai-формат

Chloe VS History — AI-канал с историческими видео в формате влога от лица девушки, которая будто путешествует во времени. Вместо коротких роликов здесь выходят длинные видео на 12–14 минут: с сюжетом, образом персонажа, юмором и погружением в исторический контекст.

Самый заметный пример — ролик про Titanic: Chloe попадает в 1912 год, ходит по кораблю, комментирует быт и детали эпохи не как диктор, а как блогер внутри события. Ролик уже набрал около 2 млн просмотров, а у канала больше 200 тыс. подписчиков. На странице проекта в Instagram указана студия Utopia, поэтому за образом Chloe, вероятно, стоит команда авторов. По данным VidIQ, канал может зарабатывать около $75 тыс. в месяц только на монетизации YouTube. Формат показывает, что AI-контент постепенно уходит от коротких генераций к полноценным сюжетным шоу с персонажем и повторяемой концепцией.

Источник: https://www.youtube.com/watch?v=HZRdKlOHogk

#3. Как поместить себя в прошлое? Полный туториал.

Видео собрарано через связку из трёх AI-сервисов: одна модель пишет промпты, вторая генерирует изображения, а третья превращает всё это в полноценную сцену с анимацией и атмосферным аудио. В примере используется Syntx: сначала в разделе “Текст” через Claude загружается лицо персонажа и несколько референсов, после чего нейросеть получает задачу подготовить промпт именно под анимацию в Seedance 2.0. Автор рекомендует использовать отдельный системный промпт для более точной структуры сцен и движения камеры.

Дальше в разделе “Дизайн” используется GPT Image 2, куда загружаются те же референсы и готовые промпты. На выходе получаются изображения персонажа уже в историческом сеттинге. После этого из всех кадров собирается единый storyboard с разбивкой сцен и таймингом примерно на 15 секунд. Финальный этап — генерация видео через Seedance 2.0: туда загружается storyboard, вставляется промпт для анимации, а через @ указывается привязка действий к конкретным изображениям. Видео можно сразу делать с атмосферным аудио, а затем при необходимости переводить через HeyGen или Sync. По сравнению с Google Omni, Seedance в таких сценах показал более стабильный результат и уже выглядит как рабочий инструмент для production-контента.

#4. ElevenLabs сделал удобные шаблоны для контента

ElevenLabs запустили Templates внутри ElevenCreative — готовые креативные пайплайны для повторяемого производства контента. Пользователь выбирает шаблон, загружает входной файл, нажимает Run и получает ассет по одной и той же логике без ручной настройки всех шагов заново.

Главная часть — возможность создавать собственные Templates через Flows. Это нодовый редактор, где собирается цепочка из входного файла, текстового поля, LLM, генерации или редактирования изображения и финального результата. В примере показан шаблон для локализации YouTube-обложек: пользователь загружает thumbnail, указывает язык, а LLM пишет промпт для перевода текста на изображении, не трогая названия брендов вроде ElevenLabs и ElevenCreative. Затем Edit Image выдаёт локализованную обложку, а всю цепочку можно сохранить как Template. Так ElevenLabs расширяет ElevenCreative от голосового сервиса к системе для производства контента с голосом, изображениями, видео, музыкой, SFX и автоматизированными шаблонами.

Источник: https://www.youtube.com/watch?v=ff3hisEMqpU

#5. В HeyGen у Avatar V теперь можно управлять жестами и эмоциями.

В HeyGen у Avatar V появилась функция Custom Motion: теперь цифровому аватару можно задавать эмоции, жесты и направление взгляда прямо в нужных фрагментах текста. Например, аватар может показать палец вверх, убрать жест в следующем блоке и продолжить говорить уже с другой подачей.

Настройки находятся в AI Studio: в текстовом блоке нужно выбрать Motion Engine, поставить Avatar V и открыть параметры движения. Expression отвечает за эмоции вроде Calm или Enthusiastic, Gesture — за жесты от Wave до Shrug, Point или Hand on heart, а Gaze задаёт направление взгляда, например Looking ahead или Looking at camera. Эти параметры можно комбинировать в один motion-пресет, но лучше тестировать вручную: слишком активная эмоция, указание пальцем и постоянный взгляд в камеру могут сделать аватара неестественным. Avatar V требует Premium-токены поверх подписки, зато превращает аватара из говорящей головы в более управляемого ведущего.

Источник: https://x.com/HeyGen/status/2056416387757990032?s=20

#6. Hakam Kiki чинит фильмы через AI

Hakam Kiki — AI-креатор из Кувейта, который встраивает себя в культовые сцены из фильмов, сериалов и спорта. Его формат строится не просто на появлении в кадре: он меняет исход сцены и «чинит» моменты, которые давно стали фанатской травмой.

В роликах по Game of Thrones он ловит Bran Stark до падения с башни, спасает Ned Stark от казни и вмешивается в сцену Oberyn Martell против Gregor Clegane. Механика работает за счёт уже знакомого контекста: зритель помнит сцену, понимает ставку и сразу видит альтернативный исход. Такие видео набирают десятки миллионов просмотров на его аккаунтах и активно расходятся по другим площадкам. Hakam Kiki также продаёт курс за $125 и раньше указывал прайс на AI-рекламу: 15–30 секунд стоили около $5000, но на момент записи страница с услугами была отключена.

Источник: https://www.instagram.com/reel/DYHwRmKolMF/

#7. Google Pics метит в Canva

Google показала Pics — AI-инструмент для создания и редактирования изображений внутри Workspace. По сути, это ответ Canva, но встроенный в экосистему Google: визуалы можно править там, где уже лежат документы, слайды и файлы.

Pics работает на Nano Banana 2 и Gemini. Главная функция — точечное редактирование объектов: можно выбрать свитер и поменять цвет, выделить фон и убрать его, сдвинуть предмет, изменить размер, поправить заголовок или перевести текст внутри изображения. При этом картинка не должна пересобираться с нуля. Инструмент также поддерживает совместную работу в логике Google Docs и интеграцию со Slides и Drive. Пока Pics доступен тестерам, летом Google обещает открыть его для Google AI Pro, Ultra и бизнес-аккаунтов Workspace в превью. Цены отдельно не объявлены.

Источник: https://x.com/smasithick/status/2056964760269389990?s=20

#8. Google Flow стал AI-студией

Google обновила Flow: теперь это не просто генератор, а AI-студия с агентом, batch-правками и кастомными инструментами. Идея в том, чтобы держать в одном рабочем пространстве идею, референсы, визуалы, видео, правки и финальные ассеты без постоянных переходов между сервисами.

Flow Agent помогает с брейнштормом, сценарными развилками, вариациями сцен и массовым редактированием, а также собирает ассеты в коллекции и переименовывает их. Через Flow Tools можно создавать собственные инструменты на natural language: например, ресайзер видео, image editor, storyboard studio, text overlay или пост-процессинг. У Flow появилась подписная лестница: free tier с 50 ежедневными кредитами, Google AI Plus за $7.99, Pro за $19.99 и две ступени Ultra за $99.99 и $199.99. В Plus и выше входят Omni Flash, video-to-video editing, avatars и creation-режим для Tools.

Источник: https://x.com/FlowbyGoogle/status/2056810760056254718?s=20

#9. Runway Aleph 2.0 бьёт Google Omni?

Runway показал Aleph 2.0 внутри нового Edit Studio — обновлённую video editing model для правки уже готовых роликов. Главная фишка — редактирование через keyframe: пользователь выбирает кадр на таймлайне, меняет его, смотрит preview, а затем этот вариант становится визуальным ориентиром для обработки всего видео.

С keyframe можно работать не только промптом: к нему добавляются reference image и отдельная модель для правки кадра, включая Nano Banana Pro, GPT Image 2 и Gen-4 Image. Aleph 2.0 поддерживает видео от 2 до 30 секунд, а ролики длиннее 30 секунд автоматически обрезаются. Модель позволяет менять персонажей, продукты, объекты, фон, одежду, погоду, свет, стиль, VFX и удалять лишние элементы. По логике это ближе к контролируемому AI-композитингу, чем к обычному video-to-video. Прямого честного бенчмарка против Google Omni пока нет, поэтому сравнивать их лучше после живых тестов.

Источник: https://x.com/AleRVG/status/2057700249179758899?s=20

#10. Higgsfield режет YouTube на Shorts сам

Higgsfield выкатил Personal Clipper внутри Supercomputer: агент принимает ссылку на YouTube и сам нарезает длинное видео на вертикальные Shorts, Reels и TikTok в формате 9:16, с субтитрами и без ручного монтажа.

Внутри Supercomputer можно выбрать скилл для нарезки интервью на несколько вертикальных фрагментов и модель для обработки: доступны Grok, GPT Pro, Gemini Flash и Claude Opus, а по умолчанию стоит свежий Gemini. В тесте часовой ролик обработался примерно за 20 минут, после чего сервис выдал пять клипов и транскрипцию каждого. Агент сам выбрал цепляющие моменты, собрал кадр под вертикаль и добавил ровные титры. Personal Clipper также подключается к Claude, Cursor и Manus через MCP, поэтому может работать внутри уже привычного рабочего стека.

Источник: https://x.com/higgsfield/status/2057172304074043475?s=20

Смотреть на YouTube: https://youtu.be/W3-1CmDNKkM?si=xHpqdelkbEv_6VwV

Смотреть на Rutube: https://rutube.ru/video/749e754b7f91e5ec186e0f57b5eefbf8/

* * *

Если вы AI-креатор и хотите быть в курсе самых актуальных новостей про нейросети, AI-видео и цифровых аватаров, подписывайтесь на мой Telegram-канал «Гари ИИ-Аватар».
Там — больше новостей, разборов инструментов и моего практического опыта: https://t.me/gari_azat

Если вы уже работаете с нейросетями, создаёте AI-контент и видео для себя или клиентов и хотите получать больше заказов, выстроить системную работу, научиться делегировать и со временем создать собственный видеопродакшн, приходите на мой авторский курс:
https://aiavatar.school
Это про мышление креатора в AI-видеоиндустрии: от хаотичных заказов к понятной модели роста и работе с командой.

В нашем видеопродакшене мы используем сервис Syntx AI для создания нейросетевых видео в коммерческих проектах.
По моей ссылке вы можете получить подарочные токены и скидку 15% на подписку по промокоду GARI:
https://syntx.ai/welcome/jbgz60nM

Google Omni 5 лайфхаков

AI-Аватары