Программы на базе ИИ используется во многих сферах. Нейронки сравнивают рентгеновские снимки, чтобы упростить для врачей выявление схожих симптомов болезней у разных пациентов. Анализируют большие объемы данных и составляют финансовые прогнозы. Пишут тексты и тестируют программный код. А еще создают настоящее AI-искусство.
Если мечта научиться рисовать так и не исполнилась, то можно попросить ИИ, и нейросеть создаст именно то, что хочет пользователь. От примитивных зарисовок в стиле детского рисунка, до настоящей картины. Как это сделать – давайте разбираться.
Генерация картинок в ChatGPT, как языковой модели ИИ невозможна. Этот бот может визуализировать графики, обрабатывать большие массивы данных, писать программный код, преобразовывать текст в таблицы. Но рисовать не умеет. ChatGPT только распознает изображения. Ему можно дать задание составить описание по фотографии. Например, блюда для блога в соцсетях или для меню на сайте ресторана.
Но использовать Chat GPT для генерации картинок все-таки можно, с Dall-E 3, тоже разработанной OpenAI для преобразования текста. Работает это так пользователь пишет текстовый запрос, чат GPT перерабатывает его по своей инструкции, а Dall-E 3 выводит графику, арт или фото на монитор. Плюс в том, Dall-E 3 “понимает” русский язык (в отличие от ГПТ, который лучше справляется с обработкой запросов на английском) и естественную речь.
Например, она одинаково точно интерпретирует запрос “нарисуй мне абстрактную картину с зеленым енотом” или набор ключей “енот, абстракция, зеленый”. Если творчество ИИ не устроит, можно попросить внести правки, добавив деталей, которые хотите получить. То есть, чтобы работать с этим инструментом не нужно учиться промптингу, и изучать синтаксис, как, например, с той же Midjourney.
Получить доступ к Dall-E 3 можно, если:
Во втором случае нужно просто ввести описание и нажать кнопку “Создать” или, если интересно проверить, на что способен искусственный интеллект попросить удивить. Чтобы дать нейросети полную свободу действий.
Обе версии выдают 1-4 арта на один запрос. Количество зависит от формулировки. Если ИИ посчитает, что пользователь хочет получить что-то неэтичное, то нейронка выполнять задание откажется.
В бесплатной версии даются ускорения, применить которые можно не больше 25 раз в день. После обработка задач замедлится. Но это решаемо путем регистрации нескольких аккаунтов или выхода-захода в профиль. Только удачные арты перед выходом нужно сохранить (такая опция есть), иначе они автоматически удалятся.
Все, что не подпадает под определение оскорбительного, шокирующего или контента, призывающего, демонстрирующего насилие. Использовать ChatGPT для генерации фото знаменитостей тоже нельзя. Такие ограничения OpenAI ввела из соображений безопасности. Чтобы исключить появление постов в социальных сетях с реалистичной фотографией Папы Римского пуховике Баленсиага или Дональда Трампа в наручниках.
Еще компания OpenAI уважает авторское право, поэтому нейросеть откажется рисовать логотипы брендов, персонажей игр. Также в технической документации указано, что ИИ не будет воспроизводить картины в стиле художников, творивших в последние 100 лет.
В остальном можно сделать генерацию через chat gpt изображения:
Нейронка не пропускает слова, поскольку языковая модель переводит с человеческого на машинный так, чтобы генератору изображений было “понятнее”, что от него требуется.
Сначала об определении промпта. По сути, это текстовая команда. Чем подробнее прописать, тем точнее алгоритм выполнит задание. GPT-4 показывает пользователю, как будет выглядеть переписанный текст. Иногда одно слова может превратиться в абзац. Возможно, для других задача это и удобно, но в случае с рисованием детализация может увести от первоначальной идеи. Поэтому можно попросить алгоритм создать лаконичный промпт или вообще не модифицировать пользовательскую версию.
В Bing Image Creator (какая здесь версия языковой модели неизвестно) повлиять на взаимодействие алгоритмов не выйдет. Остается хорошо продумывать слова промпта.
Чтобы получилась хорошая картинка в описании сначала указывайте центральный объект, после добавляйте к нему прилагательные, эффекты, какие хотите получить. Нейросеть обучалась на огромных базах данных и, чем больше будет вводной информации, тем лучше она справится.
Итак, языковые модели не умеют рисовать, но они могут передавать данные алгоритмам, генерирующим изображения. Все вместе – это мощный инструмент, который можно использовать и для развлечения, и для работы.