Брусничный блог / Читать

Нейросети от Яндекса:
«Шедеврум» и «Балабоба»

10.05.2023
Яндекс разработал две нейросети, с помощью которых можно сгенерировать текст и изображение.
Нейросеть семейства YaLM, которая может сгенерировать текст на любую тему или короткую заметку по ключевым словам. «Балабоба» создает предложения, сохраняя связность текста и стиль.

Нейросеть постоянно учится и запоминает правила русского языка. Для этого используются параметры внутри языковой модели YaLM, которые меняются от предложенного слова. Для большей стилистической вариативности «Балабоба» обучалась на терабайтах текстов рунета, включая Википедию, новостные статьи, книги и открытые записи пользователей социальных сетей.

«Балабоба» предлагает написать:
  • текст,
  • комментарий к спортивным новостям,
  • инструкцию по применению,
  • рецепт,
  • народную мудрость,
  • короткую историю,
  • определение слова,
  • синопсис фильма,
  • предсказание.

Приступим к работе
Перед работой с нейросетью необходимо выбрать стилизацию текста. Далее, начать писать предложение или указать ключевые слова. «Балабоба» подскажет, что нужно ввести в поле по каждому разделу. Если сгенерированный текст покажется вам грубым, внизу есть кнопка «это оскорбительно», и нейросеть будет избегать подобных предложений.

Наши результаты
Нейросеть предложила нам народную мудрость:
Такой синопсис мы получили на фильм «Служебный роман»:
Используя разделы «без стиля» и «короткая история», у нас получился такой текст про кота:
Нейросеть в мобильном приложении, которая генерирует изображения по текстовому описанию. Сейчас «Шедеврум» доступен на Google Play и App Store и находится на стадии бета-тестирования.

Внешне приложение напоминает соцсеть: можно просматривать ленту, ставить лайки и пересылать сгенерированные изображения или сохранить их в телефон. Увидеть работы других пользователей можно в разделах: «недавние изображения» или «лучшие изображения».

Для обучения «Шедеврума» разработчики использовали 240 миллионов картинок. Что позволило приложению воспроизводить не только художественные стили, но и манеру конкретных художников. Нейросеть генерирует изображения по методу каскадной диффузии: создает картинки по запросу, а затем постепенно увеличивает их разрешение, добавляя детали.

Несмотря на развитие, у «Шедеврума» есть ограничения, которые разработчики установили, чтобы избежать запрещенного и оскорбительного контента.

Вам не удастся создать изображения, которые содержат:
  • прототипы конкретных людей,
  • политические и религиозные мотивы,
  • изображения категории «18+»,
  • сцены насилия или жестокости.

Если вы пытаетесь отправить запрос подобного содержания, приложение пришлет уведомление об отказе.

Приступим к работе
Для создания изображения необходимо ввести текст на русском или английском языке. Чем подробнее будет описание, тем точнее нейросеть сгенерирует картинку. Если вы хотите, чтобы изображение было в каком-либо стиле, то добавьте его название в конце.

«Шедеврум» по одному запросу создаст четыре варианта. Количество попыток не ограничено. Из-за большого числа пользователей генерация изображения может занимать больше минуты. В таком случае приложение пришлет пуш-уведомление, когда картинка будет готова.

Наши результаты
Сгенерировали картинки к нашему рассказу от «Балабобы»:
Посмотрели как будет выглядеть сосновый лес в стиле М. А. Врубеля:
Нейросети от Яндекса постоянно обучаются и дорабатываются. Они могут помочь при создании визуального контента, или тем, кто работает с текстом.