Буквально на днях Яндекс представил миру свою собственную разработку – нейросеть по генерации изображений под названием «Шедеврум», о чем я кстати своевременно сообщил в своем Телеграм-канале (если еще не подписались — крайне рекомендую). Работает она, как и другие аналоги типа Midjourney, Kandinsky, Dall-E, Stable Diffusion и пр., по следующему алгоритму: вы описываете текстом сюжет, а нейросеть на основе него создает уникальную картинку.
Шедеврум работает на данный момент в тестовом режиме, и чтобы воспользоваться нейросетью, надо установить приложение (скачать на Android, скачать на iOS), подать заявку, указав свой логин в системе Яндекс, и дождаться её одобрения. Сколько ждать? Моя заявка была одобрена за пару дней, я уже успел протестировать данную разработку Яндекс и готов рассказать вам о ней.
Что представляет собой нейросеть от Яндекс
Интерфейс приложения Шедеврум прост и незатейлив. На экране вы увидите следующие элементы:
- Лента картинок – это шедевры, созданные другими пользователями. Каждый пользователь может не только создавать картинки, но также выставлять их на всеобщее обозрение, отправляю в общую ленту. Каждую картинку можно лайкнуть и поделиться ей, отправив кому-либо через интернет.
- Ссылка для перехода в профиль. На этой страничке будут отображаться ваши посты в общей ленте, а также те изображения, которым вы поставили лайк.
- Ссылка перехода на страничку для написания текстового описания картинки.
Сама страничка ввода текста выглядит совсем аскетично:
Как пользоваться Шедеврум
При составлении описания (промта) разработчики Яндекс рекомендуют указать как можно больше подробностей о том, что вы хотите увидеть на картинке. Для уточнения промта вы также можете использовать модификаторы, как на скриншоте ниже:
Шедеврум генерирует сразу четыре картинки на основе заданного промта, а поделиться в общей ленте вы можете только одной.
Приведу несколько собственноручно составленных промтов и сгенерированных из них изображений в Шедеврум:
Ну что ж, учитывая то, что нейросеть Шедеврум находится в бета-режиме, и её обучение идет полным ходом – всё выглядит совсем неплохо. Это даже гораздо лучше, чем было в первых ревизиях Midjourney. Я думаю, что у Яндекс всё получится, и их нейросеть займет достойное место среди других нейросетей по созданию арта. По крайней, мере Kandinsky 2.1, которая также является отечественной разработкой, мне очень понравилась.
При составлении запросов я также столкнулся с тем, что Шедеврум отказывается обрабатывать некоторые из них, ссылаясь на определенные ограничения, или принципы. Среди них:
- Не должно быть отсылок к конкретным людям, потому что создатели нейросети не хотят превращать своё творение в средство для создания дипфейков.
- Запросы не должны быть связаны с политикой и религией
- Должны соблюдаться требования категории «18+»
- Запросы не должны касаться тем жестокости и насилия
С точки зрения логики и здравого смысла можно согласиться со всем этим, однако на практике абсолютно нейтральные промты почему-то подпадают под эти ограничения. Например, нейросеть отказывается генерировать картинки по следующим запросам: «монах на луне», «конь на фоне стен кремля», «мальчик в противогазе» и некоторые другие, ссылаясь на данные ограничения. Но что они нарушают? Политика, религия, жестокость и насилие? Непонятно…
Примеры картинок, созданных в Яндекс Шедеврум
Приведу примеры интересных работ, созданных другими пользователями, которые я нашел в ленте приложения.
Итог
Подведу итог и перечислю плюсы и минусы Шедеврум, исходя из собственного опыта работы с данным приложением.
ПЛЮСЫ:
- Можно вводить запросы на русском языке.
- Качество генерируемых картинок весьма достойное, и оно намного лучше, чем у первых версий самых популярных сейчас нейросетей.
- По одному промту генерируются сразу четыре картинки, и вы можете выбрать наиболее понравившуюся.
- Можно делиться своими творениями в общей ленте с другими пользователями, получать обратную связь в виде сердечек (лайков). Это классная фишка, которой не хватает в аналогичных проектах, потому что художнику всегда важно мнение о своих шедеврах со стороны.
- Скорость генерации картинок весьма приемлемая, редко приходится ожидать более нескольких минут.
МИНУСЫ:
- Очень унылый аскетичный интерфейс.
- Шедеврум доступен только в виде мобильного приложения, нет сайта в интернете.
- Некоторые абсолютно нейтральные запросы не обрабатываются с отсылкой на необходимость соблюдения определенных правил.
Не будем однако забывать, что на данный момент Шедеврум находится в стадии бета-тестирования, поэтому надеюсь, что большинство обозначенных недостатков будут исправлены в дальнейшем. А я призываю вас присоединяться к этой разработке, творить и создавать абсолютные шедевры, а также делиться ими со всеми, кому эта тема интересна!