Компания «Опен Эй Ай» представила Сору 2 — новую флагманскую модель для создания видео и звука. Она стала более реалистичной, достоверной и управляемой с физической точки зрения по сравнению с предыдущими версиями.
Эта технология открывает путь к созданию фильмов, роликов и обучающих видео, где всё выглядит естественно: объекты отбрасывают тени, реагируют на движение и взаимодействуют друг с другом, как в настоящем мире.
Что такое Сора 2 и чем она выделяется
В версии Сора 2 улучшено понимание физики мира: теперь сцены выглядят убедительно, объекты взаимодействуют естественно — например, мяч действительно отскакивает от стены, а не исчезает и появляется заново.
Повышена точность управления: модель умеет следовать сложным инструкциям, разбитым по кадрам, и сохраняет логическую целостность между сценами.
Поддерживаются разные художественные стили — от кинематографического до мультипликационного.
Главное новшество: синхронизированные звуковые эффекты и речь. Теперь модель не просто показывает изображение, а «оживляет» его звуком и голосом.
Можно вставить в ролик реальные элементы — например, снять себя на видео и добавить в сгенерированную сцену, сохранив внешность и голос.
Компания Мидджорни начинает альфа-тест седьмой версии своего графического движка. По заявлениям создателей, новая модель гораздо лучше работает с фразами для генераций, а качество генерируемых изображений заметно выше. Тела, руки, предметы — всё стало куда более точным и согласованным по деталям.
Новые функции V7: персонализация, драфт-режим и больше возможностей
V7 — первая модель, в которой персонализация включена по умолчанию. Чтобы начать её использовать, нужно пройти быструю активацию — это займёт около 5 минут. После этого вы сможете включать и выключать персонализацию в любое время. В компании уверены, что именно персонализация сделает взаимодействие с моделью более точным, индивидуальным и чувственным — она лучше понимает, что для вас красиво и важно.
Вторая большая новинка — это драфт-режим. Он работает в 10 раз быстрее и стоит в 2 раза дешевле, чем обычный рендер. Скорость настолько высокая, что в компании даже ввели «разговорный режим» в веб-интерфейсе: нужно просто сказать голосом, например, «замени кота на сову» или «сделай ночь», — и модель тут же подстроит подсказку и запустит генерацию.
Чтобы воспользоваться голосовым управлением, активируйте драфт-мод и нажмите на значок микрофона — говорите вслух, и изображения будут появляться, как будто оживают из ваших слов.
Вы также можете запустить черновую генерацию вручную — просто добавьте --draft в конец вашей подсказки. Это особенно удобно при работе с вариациями (--repeat и другие случаи), когда нужно быстро проверить разные идеи.
Итерации и доработка
Драфт-режим идеально подходит для быстрой генерации идей. Если вы нашли удачный вариант — нажмите “enhance” для повышения качества или “vary” для создания нескольких вариаций. Обратите внимание: в черновом режиме итоговые изображения ниже по качеству, чем в стандартном, но стиль и поведение модели сохраняются — это делает его отличным инструментом для итераций.
Режимы запуска: турбо и релакс
Модель V7 доступна в двух режимах — турбо и релакс. Стандартный рендер пока проходит стадию оптимизации и появится чуть позже. Напомним: задачи в режиме турбо стоят в два раза дороже, чем обычные задачи в V6, а генерация в драфт — в два раза дешевле.
Текущая поддержка и планы
На данный момент, через модель V6 продолжают работать: масштабирование, редактирование и ретекстуринг. Обновление будет позже. Но moodboards и SREF уже доступны и будут становиться всё лучше с последующими обновлениями.
В этом году мы видели многое, как фотобанки разрешали грузить ии, как фотобанки запрещали грузить ии, как фотобанки чистили базы от ии, как фотобанки не принимали ии, как авторы жаловались на то, что фотобанки не принимают ии и проч.
Я также наблюдал факт роста количества видео на ютубе, где рассказывается и буквально кричится о «халявных» методах заработка на фотобанках с помощью ии. «Я потратил 60 долларов на Мидджорни и заработал 5000!!!», говорилось в них. Волна этих материалов была большой, как мини-цунами. Конечно же она привела большое количество новых «творцов» на наш рынок. Все это немного мне напомнило хайп с НФТ, когда люди как ошпаренные бегали со своими токенами и все хотели снять сливки с рынка. Где сейчас тема с НФТ? Тю-тю.
Tom Nevesely. Коллекция Адоб Сток.
Я вижу как некоторые люди пытаются полностью автоматизировать все, подчеркну, все процессы с помощью ии. Поиск ниш —» Создание фраз для генерации —» Генерация —» Подбор ключей —» Загрузка.
Давайте порассуждаем, что в итоге мы получим, если все это будет продолжаться дальше. Тут все просто. Количество генерируемых материалов будет стремится к бесконечности. Ведь не человек участвует в этом? Труд не затрачивается. А это значит, что ии материалов будет создано очень много и они очень быстро обесценятся. С законом природы не поспоришь.
Компания Мидджорни официально открыла для всех пользователей возможность генерировать изображения через обычный веб сайт. При этом, компания дарит всем новым пользователям 25 бесплатных генераций.
Напомню, что ранее, генерировать изображения можно было только через Дискорд. Сейчас же генерация доступна как через мессенджер, так и через новый и удобный сайт. Открытие сайта делает процесс генерации несколько проще и доступнее для широкой аудитории.
Для использования сервиса можно зарегистрироваться либо через аккаунт Гугл, либо через Дискорд. Если вы уже ранее создавали изображения через Дискорд, ваши прошлые работы будут доступны на сайте. Платформа предлагает функции для доработки запросов, редактирования изображений, а также инструменты для увеличения, панорамирования и повышения качества изображений.
Более разумное и логически правильное изображение рук, ног, кистей, тел, растений, животных и т. д.
Значительно улучшенное качество изображений: уменьшение пиксельных артефактов, улучшение текстур, кожи и т. д.
Более точные, детализированные и корректные мелкие элементы изображений: глаза, небольшие лица, руки в перспективных искажениях и т. д.
Новые 2-кратные увеличители с улучшенным качеством изображения/текстур.
Увеличение скорости выполнение стандартных задач на 25%.
Улучшена точность отрисовки текста (при рисовании слов с использованием «кавычек» в запросах)
Новая модель персонализации с улучшенной нюансировкой, неожиданными элементами и точностью
Управление версиями кода персонализации (используйте любой код персонализации из старых заданий, чтобы использовать модель персонализации и данные из этого задания).
Новый режим —q 2, который (иногда) требует на 25% больше времени для добавления текстуры за счет снижения разумности и логичности изображения.
В общем, изображения должны выглядеть «в целом более красивыми».
Продолжая использовать наш сайт, вы даете согласие на обработку файлов Cookie, пользовательских данных (адреса электронной почты; сведения о местоположении; тип и версия ОС; тип и версия Браузера; тип устройства и разрешение его экрана; источник откуда пришел на сайт пользователь; с какого сайта или по какой рекламе; язык ОС и Браузера; какие страницы открывает и на какие кнопки нажимает пользователь; ip-адрес) в целях функционирования сайта, проведения ретаргетинга и проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.