Google Nano Banana 2 рвёт GPT-Image? - Видеопродакшн Zilant Pro

Google Nano Banana 2 рвёт GPT-Image?


ИИшница №95



Всем привет! Это «ИИШНИЦА», 10 новостей про нейросети, контент и заработок.

Сегодня в выпуске: сравнение Nano Banana 2, GPT Image, CDream 5 Lite, тест реальных промптов, генерация изображений в 2K и 4K, экономика генерации и влияние на AI-продакшен. А ещё Soul 2.0 (AI-фотосессии с LoRA и color transfer), SVCH X — замена фона без изменения лица, генерация музыки в Gemini (Lyria 3), Sedence 2 в CapCut и новый AI-инструмент Arrow 1.0 для SVG-графики.



#10. Soul 2.0 создаёт потрясающие фото с вами


Higgsfield выпустила Soul 2.0 — обновлённый AI-инструмент для генерации персональных фото. Несмотря на обсуждения проблем на платформе, сервис продолжает развиваться и добавлять функции. Soul 2.0 создаёт реалистичные изображения с лицом конкретного человека: модель обучается на 40–50 фотографиях одного человека с разными ракурсами и хорошо видимым лицом.

Обучение одной LoRA-модели стоит 25 токенов. После создания на тарифе Creator доступно 5000 генераций, далее работа идёт через текстовые промпты. Можно выбрать формат и качество 1.5K или 2K, включить улучшение промпта и добавить референс-фото для большего сходства с текущей внешностью. Доступны пресеты настроения, стиля и типа камеры; консистентность персонажа сохраняется за счёт LoRA.

Также появился инструмент Color Transfer: система извлекает палитру из загруженного изображения в HEX-кодах и формирует цветовую карточку. Эти карточки можно переключать и использовать при генерации, фиксируя визуальный стиль через заданную цветовую гамму.



Источник: https://x.com/higgsfield_creo/status/2024562515871469605?s=20



#9. Google Pomelli делает фотосессии за вас?



Google внедрила в свой маркетинговый сервис Pomelli функцию AI-фотосъёмки, которая помогает автоматизировать создание визуального контента. Инструмент анализирует сайт и материалы компании, формируя «ДНК бренда» — фирменные цвета, шрифты и стиль, на основе чего генерирует изображения в едином визуальном ключе.

Функция Photoshoot позволяет загрузить обычное фото товара и с помощью модели Nano Banana получить студийный или лайфстайл кадр без водяных знаков. Можно менять фон текстом, редактировать детали и использовать референс-стили. Далее Pomelli помогает собрать рекламную кампанию: пишет тексты, создаёт обложки и креативы с учётом бренд-профиля, при этом все элементы можно донастроить вручную.

Сервис Pomelli был представлен в октябре 2025 года и сейчас доступен в бесплатной бета-версии только в США, Канаде, Австралии и Новой Зеландии; в других регионах он пока недоступен. Это шаг Google к тому, чтобы встроить продакшн контента как функцию маркетинговой платформы, а не как отдельную услугу.




Источник: https://blog.google/innovation-and-ai/models-and-research/google-labs/pomelli-photoshoot/



#8. Runway и LTX становятся агрегаторами?



Runway и LTX Studio, похоже, переходят к стратегии хаба моделей. Runway начал интегрировать сторонние решения — Kling, Wan, GPT-4.2 Pro и другие, а LTX Studio подключает Kling 3.0 Pro внутри своей платформы. Это не просто расширение функций, а смена подхода: вместо конкуренции «модель против модели» сервисы дают доступ к разным движкам из одного интерфейса.

Интегрируемые модели считаются одними из самых сильных на рынке, особенно китайские видеогенераторы, которые часто отмечают за качество и динамику сцен. В такой конфигурации пользователю не нужно оформлять отдельные подписки — запуск разных моделей происходит внутри одного продакшн-контура. Вероятно, ставка делается на удержание текущей аудитории и контроль над рабочим процессом, а не только на развитие собственной нейросети.

Если стратегия сработает, конкуренция сместится с уровня «чья модель мощнее» к уровню экосистем и ежедневного workflow. Побеждать будет не отдельная технология, а платформа, через которую выстроен весь производственный цикл.





Источник: https://x.com/runwayml/status/2024955482935525398?s=20



#7. Gemini теперь пишет музыку?




Google добавила в Gemini раздел генерации музыки на базе модели Lyria 3. Инструмент работает в бета-режиме и позволяет создавать 30-секундные треки по текстовому описанию или на основе загруженного изображения как референса. Модель формирует структуру композиции, текст и вокал. Поддерживаются английский, немецкий, испанский, французский, хинди, японский, корейский и португальский языки; русского языка пока нет.

Каждый трек автоматически получает обложку, сгенерированную Nano Banana, и маркируется цифровым водяным знаком SynthID. Также добавлен детектор AI-музыки: можно загрузить аудиофайл и проверить, был ли он создан в Gemini. Lyria 3 стала доступна пользователям YouTube в разделе Dream Track — ранее тестирование проходило только в США.

Генерация музыки становится частью единого производственного контура: текст, изображение, видео и звук создаются внутри одного интерфейса, что упрощает сборку контента под конкретную сцену и настроение.


Источник: https://x.com/GoogleAI/status/2024154215182926027?s=20



#6. SwitchX меняет мир вокруг вас



Beeble представила SwitchX — video-to-video инструмент, который меняет окружение в ролике, сохраняя внешность и мимику героя. Система автоматически отделяет персонажа от фона, показывает маску и позволяет при необходимости доработать её вручную. После этого можно задать новую среду: освещение, атмосферу, локацию. При простых задачах, например смене света в помещении, результат выглядит цельно — без эффекта наложенного фильтра, с корректным взаимодействием света с кожей и одеждой.

При более сложных изменениях, таких как замена одежды или динамичная сцена, стабильность может снижаться, и итог не всегда совпадает с ожиданиями даже при аккуратном референсе. По стоимости три попытки по 7 секунд обходятся примерно в 14 долларов; 28 секунд фактически исчерпывают подписку за 19 долларов. Это дороже, чем Kling Motion Control при сопоставимой длине, но подход отличается: SwitchX работает как инструмент постпродакшн-композитинга, а не полной перегенерации сцены.

Также доступна локальная версия по подписке с расширенными VFX-функциями и более сложным пайплайном. Запрос на сохранение лица и микроэмоций актёра при смене окружения очевиден, и дальнейшая конкуренция будет зависеть от качества, скорости и модели ценообразования.




Источник: https://beeble.ai/


#5. Seedream 5.0 Lite против Banana



Seedream 5.0 Lite официально вышла и уже интегрирована в агрегаторы вроде FLORA, Syntx, Higgsfield и Freepik. Разработчики заявляют стабильную работу с множественными референсами — до 10–14 изображений в одном окне, сохранение лиц, корректные логотипы и аккуратный текст. Модель активно сравнивают с Nano Banana, которая также используется в тех же экосистемах.

В тесте через Syntx изображения генерировались по одинаковым промптам, подготовленным в ChatGPT, с фокусом на рекламную эстетику под iPhone 15 Pro. Сравнивались Seedream 4.5, новая 5.0 Lite и Nano Banana. Seedream 4.5 выдала более глянцевую и драматизированную картинку, тогда как 5.0 Lite показалась более синтетичной по визуалу. Nano Banana в тех же условиях дала более сдержанный и естественный результат, без выраженной гиперэстетики.

Итог зависит от задачи и точности промпта, однако в текущем сравнении более «живой» коммерческий визуал получился у Nano Banana. Разница особенно заметна в работе с тоном кожи, светом и общей пластикой сцены.



Источник: https://x.com/BytePlusGlobal/status/2026265861531541863?s=20



#4.  HeyGen меняет образ и добавляет товар



HeyGen представила обновление для кастомизации аватаров: теперь можно менять одежду, фон и добавлять объекты прямо в кадр. Пользователь выбирает своего аватара, открывает шаблоны сцен — офисные, lifestyle и другие — или вводит ключевые слова для генерации новых вариантов окружения и внешнего вида. Образ редактируется через готовые пресеты или текстовое описание, после чего система предлагает несколько вариантов на выбор.

Можно детально задать элементы одежды и аксессуары, изменить фон и добавить предмет через кнопку «элемент» — объект интегрируется в сцену с учётом света и перспективы. Новый образ поддерживается в Studio и совместим с Avatar IV и Avatar III (безлимитная модель). Также доступно управление подачей речи — от экспертного формата до спокойной беседы — и выбор движка генерации, включая Kling и Runway. На каждый запрос предлагается три варианта.

Из ограничений: 30 fps пока не поддерживается, а при серии генераций возможны небольшие изменения в чертах лица. Тем не менее инструмент расширяет контроль над образом и сценой без отдельной съёмки и продакшна.




Источник: https://x.com/HeyGen/status/2024891799643586924?s=20



#3. Seedance 2 от CapCut: сбой или хайп?



CapCut на короткое время открыл доступ к Seedance 2 в Dreamina, после чего функция так же быстро исчезла без официальных комментариев. Пользователи сообщали, что успели увидеть активную вкладку и запустить генерации, однако процесс останавливался примерно на 19% с ошибкой. По их словам, кредиты затем возвращались. Ни CapCut, ни Seedance 2, ни ByteDance публичных разъяснений не дали.

Параллельно в X распространялись сообщения о «сливе весов» Seedance 2 на торрентах, однако пользователи утверждают, что это фейк: рабочей версии для локального запуска в открытом доступе нет. Те, кто получил доступ через сервисы Jimeng или Mitte, пишут об очередях до четырёх часов на одну генерацию. Интерес к модели объясняют высоким качеством результата и потенциальными юридическими рисками, связанными с авторскими правами и узнаваемыми персонажами.

Ситуация показывает высокий спрос на технологию при отсутствии прозрачных условий релиза и масштабирования доступа.



Источник: https://x.com/AngryTomtweets/status/2024110775703413032?s=20


#2. QuiverAI : SVG теперь генерятся как код



На рынке появился QuiverAI — стартап, который предлагает генерировать не пиксельные изображения, а сразу векторный код. Компания привлекла $8,3 млн в сид-раунде под лидерством a16z, а её продукт Arrow-1.0 уже доступен в бете. Модель создаёт SVG по текстовому описанию или на основе изображения, формируя структуру из слоёв, групп и контуров.

Ключевая идея в том, что результат — это редактируемый визуальный код. Цвета, толщины линий и отдельные элементы можно менять напрямую в SVG, без необходимости пересобирать картинку с нуля. В тесте генерация четырёх вариантов заняла около семи минут: итог не идеален, но файлы пригодны для доработки вручную. Такой подход сближает дизайн-процесс с логикой работы LLM, где правка происходит на уровне структуры, а не поверх готового изображения.


Источник: https://x.com/joanrod_ai/status/20266933563


#1. Google Nano Banana 2 рвёт GPT-Image?




Google представила Nano Banana 2 — модель Gemini 3.1 Flash Image Preview, которая быстро вышла в лидеры Artificial Analysis Image Arena, обогнав GPT-Image-1.5 и собственную Pro-версию. Компания сделала ставку не на максимальную мощность, а на скорость при качестве, близком к Pro. В интерфейсе поддерживается генерация до 2K, через API заявлено до 4K. При этом модель работает заметно быстрее, чем Nano Banana Pro.

Стоимость составляет около $0,067 за изображение — почти вдвое дешевле Pro. При больших объёмах генерации разница становится ощутимой. В модели улучшены анатомия и работа со сложными сценами, стало меньше фоновых артефактов. Текст внутри изображения воспроизводится стабильнее, включая длинные фразы, что делает её пригодной для обложек и инфографики.

В практических тестах через Higgsfield новая версия показала преимущество в скорости, при этом различия в качестве заметны только при детальном сравнении. На фоне конкурентов Google усиливает позиции в сегменте генерации изображений за счёт сочетания цены, скорости и стабильности.




Источник: https://x.com/Google/status/2027051657163391104?s=20




Смотреть на YouTube: https://youtu.be/GWxVjmDEe44?si=SI5R0HrhhA5K81vm


Смотреть на Rutube: https://rutube.ru/video/private/88da6074f592dae0fd227a1758ab54e6/?r=wd



* * *

Если вы AI-креатор и хотите быть в курсе самых актуальных новостей про нейросети, AI-видео и цифровых аватаров, подписывайтесь на мой Telegram-канал «Гари ИИ-Аватар».
Там — больше новостей, разборов инструментов и моего практического опыта: https://t.me/gari_azat

Если вы уже работаете с нейросетями, создаёте AI-контент и видео для себя или клиентов и хотите получать больше заказов, выстроить системную работу, научиться делегировать и со временем создать собственный видеопродакшн, приходите на мой авторский курс:
https://aiavatar.school
Это про мышление креатора в AI-видеоиндустрии: от хаотичных заказов к понятной модели роста и работе с командой.

В нашем видеопродакшене мы используем сервис Syntx AI для создания нейросетевых видео в коммерческих проектах.
По моей ссылке вы можете получить подарочные токены и скидку 15% на подписку по промокоду GARI:
https://syntx.ai/welcome/jbgz60nM

AI-Аватары
Обсудить проект