ИИшница №96
Всем привет! Это «ИИШНИЦА», 10 новостей про нейросети, контент и заработок. Сегодня в выпуске: AI-новости недели: Seedance 2.0: как обойти блокировки на генерацию лица в AI-видео HappyHorse 1.0 — новый лидер видеогенерации, HeyGen + Seedance 2.0: как создавать реалистичные Avatar Shots без потери лица
#1. Как обойти запрет Seedance 2.0 при генерации
Seedance 2.0 остаётся одной из самых сильных видеомоделей, но при загрузке конкретного лица часто выдаёт отказ. Это встроенный фильтр: модель детектит прямую биометрию, особенно на крупных планах, и блокирует генерацию из-за рисков персональных прав. В тестах показаны три способа, которые позволяют обойти это ограничение и всё же получить сцены с узнаваемым лицом.
Первый вариант — превратить фото в скетч через Syntx AI (раздел Design, режимы Nano Banana 2 или Pro). После загрузки изображения и промпта получается набор ракурсов — фас, профиль, полный рост, который модель воспринимает уже как персонажа, а не конкретного человека. Второй способ — карта персонажа с несколькими ракурсами на одном изображении: это повышает консистентность, но Seedance 2.0 пропускает такой формат нестабильно. Третий подход — ухудшение качества исходного кадра: добавление шума, лёгкого блюра и зерна (примерно до 1K) снижает точность биометрии, но сохраняет узнаваемость, и такие кадры модель принимает заметно чаще.
На практике лучше всего работает комбинация: скетч персонажа вместе с ухудшенным кадром. В генерации видео через Seedance 2.0 (режим Pro) именно такой вход даёт наиболее стабильный результат и удерживает лицо без отказов, тогда как «чистые» фото блокируются чаще
Источник:
#2. Netflix VOID переписывает реальность в кадре
Netflix представила модель VOID, которая не просто удаляет объекты из видео, а пересчитывает физику сцены так, будто их изначально не существовало. При удалении человека или предмета меняются не только пиксели, но и поведение окружения: объекты продолжают движение, свет и тени перестраиваются, а взаимодействия между элементами сцены пересобираются с учётом новых условий.
По демонстрациям, если убрать человека с гитарой, инструмент падает; при удалении рук предметы, с которыми они взаимодействовали, продолжают движение самостоятельно. Это выходит за рамки классической сегментации и ретуши: модель учитывает причинно-следственные связи внутри сцены и пересобирает её логику. Ранее подобные правки требовали сложного VFX и ручной доработки, теперь значительная часть процесса автоматизирована. Сообщается, что Netflix распространяет VOID как open-source решение.
Такие инструменты могут упростить постпродакшн, где раньше требовались пересъёмки или сложные правки. Одновременно это снижает порог для изменения уже снятых сцен и архивных материалов, поскольку видео можно адаптировать под новый контекст без полной пересборки.
Источник: https://x.com/minchoi/status/2040805620677304558?s=20
#3. HappyHorse 1.0 новый лидер ai-видеогенерации
HappyHorse 1.0 — новая видеомодель от Alibaba (команда Taotian), которая за короткое время вышла в лидеры рейтингов Artificial Analysis по направлениям Text-to-Video и Image-to-Video. Разработку возглавляет Чжан Ди, ранее связанный с проектом Kling в Kuaishou. Модель пока остаётся относительно закрытой по деталям, но уже привлекла внимание за счёт результатов в бенчмарках.
По демонстрациям, HappyHorse 1.0 показывает стабильную физику сцен, согласованные движения и удержание персонажей, а также встроенный звук с синхронизацией под происходящее. Это отличает её от многих конкурентов, где аудио либо отсутствует, либо добавляется отдельно. По качеству генерации модель сравнивают с Seedance 2.0: в субъективных оценках визуал может уступать, но в слепых тестах показатели выглядят выше.
На фоне усиления ограничений у закрытых решений вроде Seedance 2.0, появление альтернатив с меньшими барьерами может изменить баланс: чуть более слабые по качеству модели компенсируют это гибкостью и доступом без жёстких API-ограничений
Источник: https://x.com/xiaojietongxue/status/2041796399860158540?s=20
#4. Wan2.7 от Alibaba режиссёр внутри нейросети
Wan 2.7 от Alibaba выходит как обновление, которое расширяет возможности сразу в генерации изображений и видео. По описанию, модель удерживает стабильные лица, аккуратно работает с цветами и текстом, а также поддерживает до девяти референсов с генерацией вплоть до 4K. Отмечается высокая консистентность: объекты и детали не «прыгают» между кадрами, что остаётся частой проблемой в подобных системах.
В видео ключевой функцией стал режим instruction editing — редактирование сцены через текстовые команды без пересъёмки или полной пересборки. Также добавлен рестайлинг, позволяющий менять визуальный стиль уже готового ролика с минимальным влиянием на движение и содержание. При этом Wan 2.7 не распространяется как open-source, в отличие от предыдущих версий линейки Wan, и делает ставку на контролируемый доступ и качество.
На фоне других решений от Alibaba модель выглядит как попытка собрать инструменты продакшна внутри одной системы, но по качеству и возможностям пока уступает лидерам сегмента
Источник: https://x.com/Alibaba_Wan/status/2040051865581469704?s=20
#5. HeyGen + Seedance = Avatar Shots
HeyGen интегрировал Seedance 2.0, запустив формат Avatar Shots — генерацию сцен с участием собственного аватара. Связка решает ключевое ограничение Seedance: модель блокирует «чистые» лица из-за биометрии, но у HeyGen есть встроенная верификация, поэтому система пропускает такие кейсы и позволяет использовать аватар без отказов.
Теперь вместо классического talking head можно помещать своего аватара в любые сцены с высокой консистентностью. Поддерживается до трёх персонажей в кадре, что даёт возможность собирать диалоги и взаимодействие. При этом важно загружать фоны без присутствия человека — иначе Seedance может отклонить генерацию. Также остаётся ограничение по озвучке: при попытке русского языка речь может искажаться, что, по наблюдениям, связано именно с Seedance, а не с HeyGen.
В результате связка HeyGen и Seedance 2.0 показывает один из первых стабильных сценариев, где можно интегрировать себя в генеративное видео без обходных приёмов и с сохранением внешности, хотя часть ограничений по языку и обработке сцен пока сохраняется
Источник: https://x.com/HeyGen/status/2041212383205716436?s=20
#6. FLORA Batch Node автоматизирует вариации
FLORA обновила Batch Node, упростив работу с вариациями при генерации изображений. Теперь можно задать список промптов с переменными — например, разными цветами продукта — и загрузить их напрямую или через CSV. Система автоматически разбивает данные и запускает генерацию сразу по всей пачке, без необходимости обрабатывать каждый вариант отдельно.
Внутри FLORA результаты отображаются последовательно: после завершения можно быстро пролистывать варианты и сравнивать их без повторных запусков. Также поддерживается единый референс-фон, через который прогоняются все версии, что сохраняет общую сцену при изменении деталей. Это снижает количество ручных операций и ускоряет подбор нужного результата, особенно при работе с сериями однотипных изображений.
Обновление Batch Node фактически переносит рутинные задачи в автоматический режим, позволяя быстрее тестировать гипотезы и получать готовые вариации в одном проходе.
Источник: https://x.com/floraai/status/2041269595680420185?s=20
#7. Google выпустили AI Edge Eloquent
Google выпустила AI Edge Eloquent — офлайн-диктовку внутри приложения Google AI Edge Gallery, доступного на iOS и Android. Решение работает без интернета и подписки, а данные обрабатываются локально и не покидают устройство. Модель принимает естественную речь и автоматически «очищает» текст: убирает паузы и оговорки, структурирует фразы и приводит их к читабельному виду.
Функции включают сжатие и расширение текста, а также генерацию кратких выжимок прямо на устройстве. Можно добавлять собственные слова, имена и термины, чтобы повысить точность распознавания в конкретном контексте. По тестам, на английском язык работает стабильно и точно, тогда как поддержка русского пока отсутствует. Вся обработка выполняется локально, без обращения к облаку, что делает сценарий подходящим для заметок и быстрых записей без передачи данных наружу.
Источник: https://thenextweb.com/news/google-offline-dictation-app-ios
#8. LTX Studio учит ИИ-видео не обрываться
LTX Studio добавила функцию продолжения клипов: теперь можно расширять удачный фрагмент кусками до 12 секунд и доводить общий хронометраж примерно до минуты. Это позволяет не пересобирать сцену заново, если первые секунды уже получились — камера, свет и композиция сохраняются, а генерация продолжается в том же визуальном ключе.
Вместо повторной генерации с риском смены стиля или темпа, пользователь просто «дотягивает» тот же шот. Такой подход помогает собирать более цельные сцены, удерживать один сетап дольше и избегать резких склеек между разными клипами. Однако качество исходника остаётся критичным: если в начале есть артефакты или нестабильная физика, продление лишь повторит эти проблемы на следующих секундах.
Функция фактически закрывает одну из частых проблем AI-видео — разрыв коротких удачных генераций, позволяя превращать их в более длинные и согласованные фрагменты без потери визуальной логики
Источник: https://x.com/LTXStudio/status/2041509021711307203?s=20
#9. HeyGen сделал Avatar V
HeyGen представил Avatar V — новую модель цифровых аватаров, обучаемую по 15-секундному видео вместо одной фотографии. Такой подход позволяет захватывать не только внешность, но и динамику: мимику, микродвижения, работу губ и общий ритм поведения в кадре. Это решает проблему «дрейфа личности», когда аватар со временем теряет сходство и начинает выглядеть иначе.
По описанию, Avatar V сохраняет идентичность в разных ракурсах, при смене сцен и в более длинных роликах. Улучшена синхронизация губ, точность выражений лица и поддержка динамических сцен. Достаточно один раз записать короткий референс, после чего можно использовать аватар в разных форматах видео без повторной съёмки .
Обновление делает упор на стабильность и воспроизводимость поведения, а не только на визуальное сходство, что отличает Avatar V от предыдущих решений с обучением по статичным изображениям.
Источник: https://youtu.be/OGbsSuHLuMc?si=X_mUuEzUishe
#10. Higgsfield открыл Seedance 2.0 — но не для всех
Higgsfield добавил интеграцию Seedance 2.0 и связал её с Grok Imagine. Сценарий работы двухэтапный: сначала создаётся референс в одном из доступных стилей, затем Seedance превращает его в видео с уровнем качества image-to-video. На странице сервиса заявлены мультимодальность, поддержка нескольких входов и нативная генерация аудио.
Доступ к Seedance 2.0 внутри Higgsfield ограничен: функция открыта только в Business-плане с бизнес-верификацией, а не для всех пользователей. Такой тариф стартует от двух рабочих мест, где токены распределяются между участниками. Это делает модель доступной в командной работе, но повышает порог входа по сравнению с обычными планами.
Интеграция усиливает позиционирование Higgsfield как платформы, объединяющей генерацию изображений и видео в одном пайплайне, однако ключевые возможности остаются привязанными к более дорогим тарифам и проверенным аккаунтам.
Источник: https://x.com/higgsfield/status/2041897632097038830?s=20
Смотреть на YouTube: https://youtu.be/tJiDCRAiS3U
Смотреть на Rutube: https://rutube.ru/video/30b8c6c85fd340e63a2b806946d5f9f8/?r=wd
* * *
Если вы AI-креатор и хотите быть в курсе самых актуальных новостей про нейросети, AI-видео и цифровых аватаров, подписывайтесь на мой Telegram-канал «Гари ИИ-Аватар».
Там — больше новостей, разборов инструментов и моего практического опыта: https://t.me/gari_azat
Если вы уже работаете с нейросетями, создаёте AI-контент и видео для себя или клиентов и хотите получать больше заказов, выстроить системную работу, научиться делегировать и со временем создать собственный видеопродакшн, приходите на мой авторский курс:
https://aiavatar.school
Это про мышление креатора в AI-видеоиндустрии: от хаотичных заказов к понятной модели роста и работе с командой.
В нашем видеопродакшене мы используем сервис Syntx AI для создания нейросетевых видео в коммерческих проектах.
По моей ссылке вы можете получить подарочные токены и скидку 15% на подписку по промокоду GARI:
https://syntx.ai/welcome/jbgz60nM
