Компания «Опен Эй Ай» представила Сору 2 — новую флагманскую модель для создания видео и звука. Она стала более реалистичной, достоверной и управляемой с физической точки зрения по сравнению с предыдущими версиями.
Эта технология открывает путь к созданию фильмов, роликов и обучающих видео, где всё выглядит естественно: объекты отбрасывают тени, реагируют на движение и взаимодействуют друг с другом, как в настоящем мире.
Что такое Сора 2 и чем она выделяется
В версии Сора 2 улучшено понимание физики мира: теперь сцены выглядят убедительно, объекты взаимодействуют естественно — например, мяч действительно отскакивает от стены, а не исчезает и появляется заново.
Повышена точность управления: модель умеет следовать сложным инструкциям, разбитым по кадрам, и сохраняет логическую целостность между сценами.
Поддерживаются разные художественные стили — от кинематографического до мультипликационного.
Главное новшество: синхронизированные звуковые эффекты и речь. Теперь модель не просто показывает изображение, а «оживляет» его звуком и голосом.
Можно вставить в ролик реальные элементы — например, снять себя на видео и добавить в сгенерированную сцену, сохранив внешность и голос.
Компания Мидджорни начинает альфа-тест седьмой версии своего графического движка. По заявлениям создателей, новая модель гораздо лучше работает с фразами для генераций, а качество генерируемых изображений заметно выше. Тела, руки, предметы — всё стало куда более точным и согласованным по деталям.
Новые функции V7: персонализация, драфт-режим и больше возможностей
V7 — первая модель, в которой персонализация включена по умолчанию. Чтобы начать её использовать, нужно пройти быструю активацию — это займёт около 5 минут. После этого вы сможете включать и выключать персонализацию в любое время. В компании уверены, что именно персонализация сделает взаимодействие с моделью более точным, индивидуальным и чувственным — она лучше понимает, что для вас красиво и важно.
Вторая большая новинка — это драфт-режим. Он работает в 10 раз быстрее и стоит в 2 раза дешевле, чем обычный рендер. Скорость настолько высокая, что в компании даже ввели «разговорный режим» в веб-интерфейсе: нужно просто сказать голосом, например, «замени кота на сову» или «сделай ночь», — и модель тут же подстроит подсказку и запустит генерацию.
Чтобы воспользоваться голосовым управлением, активируйте драфт-мод и нажмите на значок микрофона — говорите вслух, и изображения будут появляться, как будто оживают из ваших слов.
Вы также можете запустить черновую генерацию вручную — просто добавьте --draft в конец вашей подсказки. Это особенно удобно при работе с вариациями (--repeat и другие случаи), когда нужно быстро проверить разные идеи.
Итерации и доработка
Драфт-режим идеально подходит для быстрой генерации идей. Если вы нашли удачный вариант — нажмите “enhance” для повышения качества или “vary” для создания нескольких вариаций. Обратите внимание: в черновом режиме итоговые изображения ниже по качеству, чем в стандартном, но стиль и поведение модели сохраняются — это делает его отличным инструментом для итераций.
Режимы запуска: турбо и релакс
Модель V7 доступна в двух режимах — турбо и релакс. Стандартный рендер пока проходит стадию оптимизации и появится чуть позже. Напомним: задачи в режиме турбо стоят в два раза дороже, чем обычные задачи в V6, а генерация в драфт — в два раза дешевле.
Текущая поддержка и планы
На данный момент, через модель V6 продолжают работать: масштабирование, редактирование и ретекстуринг. Обновление будет позже. Но moodboards и SREF уже доступны и будут становиться всё лучше с последующими обновлениями.
Компания Мидджорни официально открыла для всех пользователей возможность генерировать изображения через обычный веб сайт. При этом, компания дарит всем новым пользователям 25 бесплатных генераций.
Напомню, что ранее, генерировать изображения можно было только через Дискорд. Сейчас же генерация доступна как через мессенджер, так и через новый и удобный сайт. Открытие сайта делает процесс генерации несколько проще и доступнее для широкой аудитории.
Для использования сервиса можно зарегистрироваться либо через аккаунт Гугл, либо через Дискорд. Если вы уже ранее создавали изображения через Дискорд, ваши прошлые работы будут доступны на сайте. Платформа предлагает функции для доработки запросов, редактирования изображений, а также инструменты для увеличения, панорамирования и повышения качества изображений.
Более разумное и логически правильное изображение рук, ног, кистей, тел, растений, животных и т. д.
Значительно улучшенное качество изображений: уменьшение пиксельных артефактов, улучшение текстур, кожи и т. д.
Более точные, детализированные и корректные мелкие элементы изображений: глаза, небольшие лица, руки в перспективных искажениях и т. д.
Новые 2-кратные увеличители с улучшенным качеством изображения/текстур.
Увеличение скорости выполнение стандартных задач на 25%.
Улучшена точность отрисовки текста (при рисовании слов с использованием «кавычек» в запросах)
Новая модель персонализации с улучшенной нюансировкой, неожиданными элементами и точностью
Управление версиями кода персонализации (используйте любой код персонализации из старых заданий, чтобы использовать модель персонализации и данные из этого задания).
Новый режим —q 2, который (иногда) требует на 25% больше времени для добавления текстуры за счет снижения разумности и логичности изображения.
В общем, изображения должны выглядеть «в целом более красивыми».
Изображение сгенерировано нейросетью Кандинский 3.1. Запрос: Девушка на городской улице. Ночная сцена. На заднем плане огни большого города и след от фонарей проезжающей мимо машины. 35мм пленка. Киноэффект. Высокая детализация. 8К.
Сбер ЭйАй (англ. Sber AI) — это исследовательское подразделение «Сбера», занимающийся разработкой инструментов т.н. искусственного интеллекта, в т.ч. открытых моделей ИИ для изображений, языка, аудио и видео. Главный офис находится в Москве. Релиз первой версии «Кандинский» состоялся в ноябре 2021 года.
Кандинский (англ. Kandinsky) — это нейросеть (модель ИИ), позволяющая генерировать изображения на основе текстовых фраз для генерации. Разработана компанией «Сбер» и понимает текстовые запросы на русском языке. Нейросеть абсолютно бесплатна
Продолжая использовать наш сайт, вы даете согласие на обработку файлов Cookie, пользовательских данных (адреса электронной почты; сведения о местоположении; тип и версия ОС; тип и версия Браузера; тип устройства и разрешение его экрана; источник откуда пришел на сайт пользователь; с какого сайта или по какой рекламе; язык ОС и Браузера; какие страницы открывает и на какие кнопки нажимает пользователь; ip-адрес) в целях функционирования сайта, проведения ретаргетинга и проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.