Логотип Зефирнет

Надрать задницу в середине пути с По – KDnuggets

Дата:

Надрать задницу в середине пути с По

 

Poe — это платформа, которая обеспечивает доступ к многочисленным чат-ботам и LLM — как одновременно, так и индивидуально — через единый интерфейс. Помимо некоторых обычных подозрительных LLM, таких как ChatGPT, Llama и других, По имеет доступ к многочисленным настраиваемым чат-ботам, например, к тем, которые перефразируют ваш ввод в смайлики; отсутствие какого-либо интереса к тому, о чем вы его спрашиваете (правда); считает, что все, что вы делаете, является преступлением; и многое другое. На сайте есть как бесплатная версия, так и подписка. Poe был создан Quora.

Середина пути — это платный сервис создания изображений с использованием искусственного интеллекта. Вероятно, самая мощная модель, позволяющая создавать изображения самого высокого качества, доступные на данный момент, совершенствовать подсказки Midjourney и получать наилучшие результаты — это само по себе искусство, часто требующее множества итераций и много времени. И тут в дело вступает По.

Одним из наиболее популярных ботов на Poe является бот Midjourney. Нет, бот не предоставляет доступ к моделям Midjourney; вместо этого он принимает ваше грубое приглашение в качестве входных данных и переписывает его, чтобы с самого начала увеличить ваши шансы на создание приемлемых изображений.

В этой статье мы попробуем несколько итераций этого процесса и сравним результаты, что даст нам представление о том, как этот бот Poe может позволить нам улучшить наши изображения с самого начала.

Для каждого из этих сравнений автор выполнял только те сравнения, которые показаны ниже, выполнял ровно один прогон генерации изображения для каждого запроса и не занимался никаким отбором результатов. Все субъективные призывы были сделаны автором самостоятельно. Обратите внимание, что любые дополнительные параметры Midjourney, которые Poe мог добавить к своему новому приглашению, для лучшего сравнения, аналогичны фруктам. я добавил --ar 16:9 на все подсказки, поскольку 16:9 — единственное приемлемое соотношение сторон изображения, конец истории.

Начнем с одного из самых знаковых и легко узнаваемых мест на планете: Старого города Иерусалима. Мне не нужно что-то конкретное, никаких конкретных достопримечательностей, мне просто нужно изображение, которое отражает и напоминает особый вид Старого города.

Моя основная подсказка и результаты:

абстрактное художественное изображение Старого города Иерусалима – ар 16:9.

 

Изображения созданы автором с помощью Midjourney.
Изображения созданы автором с помощью Midjourney.
 

Подсказка и результаты с помощью Poe:

цветная фотография абстрактного художественного изображения Старого города Иерусалима. Сюжет представляет собой яркую и динамичную интерпретацию древнего города, отражающую его богатую историю и духовное значение. Фотография демонстрирует шквал смелых мазков и ярких цветов, вызывающих ощущение энергии и движения. Окружающая среда наполнена аурой мистики: узкие улочки, древние стены и шумные рынки сливаются в гармоничный хаос. Настройки камеры экспериментальны и авангардны, расширяя границы традиционной фотографии. Используется объектив Hasselblad X1D II 50C в сочетании с объективом Lensbaby Velvet 56, позволяющий создавать творческие эффекты размытия и мягкого фокуса. Техника двойной экспозиции и намеренное движение камеры используются для придания изображению неземного и сказочного качества. Вряд ли в этой сцене соавторами будут Алехандро Гонсалес Иньярриту, режиссер-визионер, известный своим захватывающим повествованием, Эммануэль Любецки, известный оператор, известный своими поэтическими визуальными эффектами, Давид Лашапель, провокационный фотограф, известный своими сюрреалистическими и яркими композициями, и Ирис ван Херпен. , модельер-новатор, прославившаяся своими футуристическими и скульптурными моделями – 16:9

 

Изображения созданы автором с использованием Midjourney и Poe.
Изображения созданы автором с использованием Midjourney и Poe.
 

Во-первых, посмотрите, насколько подробнее является приглашение, сгенерированное Poe. Обратите внимание на некоторые особенности, включая спорные «по стилю» формулировки.

Теперь вы можете завязать мне глаза, и я смогу более или менее ориентироваться в Старом городе Иерусалима, и могу сказать вам, что ни одно из сгенерированных изображений не имеет никакого реального местоположения там. Но мы не можем судить о сгенерированных изображениях по этому показателю; вместо этого нам приходится использовать субъективные стандарты художественной ценности.

 
Примечание. Хотя вы можете спорить с использованием термина «художественная ценность» (или «художественного» чего-либо) при обсуждении изображений, созданных искусственным интеллектом, я считаю, что это лучшее слово, чтобы выразить то, что я пытаюсь донести. этот сценарий. Расстройство? Представьте, что я написал «имитировал художественную ценность». Все еще расстроены? Что ж, изображения, сгенерированные ИИ, уже здесь, и они никуда не денутся, и хотя разумные люди могут расходиться во мнениях относительно того, как мы относимся к процессу и конечным результатам создания изображений ИИ, это не та дискуссия, которую я хочу вести прямо здесь, верно? сейчас. Я просто демонстрирую, как люди, которые склонны попытаться улучшить свои подсказки для создания изображений с помощью ИИ, могут попытаться это сделать.
 

Я считаю, что оригинальные изображения немного скучны, и в них нет по-настоящему интересных изображений, привлекающих мое внимание, кроме первого взгляда. Второй раунд, которому помогает По, более красочный и заслуживает дополнительного рассмотрения, помимо беглого взгляда, по крайней мере, на мой взгляд. Красота в глазах смотрящего и все такое, поэтому мнения здесь будут различаться, но в обоих случаях я выбрал верхнее правое изображение как «лучшее» представительное для обоих прогонов генерации изображений. Я увеличил оба изображения и поделился ими ниже.

 

«Лучшее» изображение из изображений, созданных Midjourney с использованием базовой подсказки.
«Лучшее» изображение из созданных Midjourney с использованием базовой подсказки.

 

«Лучшее» изображение из созданных Midjourney с использованием подсказки По
«Лучшее» изображение из созданных Midjourney с помощью подсказки По
 

Опять же, это полностью субъективно, но в конечном итоге меня больше впечатляет «лучший» результат при использовании подсказки По. Подводя итог, я считаю, что изображения, сгенерированные подсказкой По, в совокупности лучше, чем изображения исходной подсказки, и я также считаю, что все усилия По превосходят все усилия моей исходной подсказки.

Давайте попробуем что-нибудь другое, немного образов с людьми. Давайте сделаем несколько профессиональных снимков головы.

Моя без излишеств подсказка:

профессиональная выстрел в голову женщине на улице

Изображения созданы автором с помощью Midjourney.
Изображения созданы автором с помощью Midjourney.
 

Сравните их с расширенной подсказкой По:

цветная фотография профессиональной фотографии женщины на улице. Объект съемки — уверенная в себе и уравновешенная женщина, излучающая профессионализм и элегантность на фоне городского пейзажа. На снимке ее головы запечатлена ее сияющая улыбка и теплый характер, демонстрирующий ее доступность и профессионализм. Окружающая среда представляет собой шумную городскую улицу с размытыми пешеходами и движением транспорта на заднем плане, что подчеркивает женщину как фокус. Настройки камеры тщательно выбраны, чтобы подчеркнуть ее черты и передать ее сущность. Используется Nikon D850 в сочетании с портретным объективом, например Nikon AF-S NIKKOR 85mm f/1.4G, для достижения малой глубины резкости и создания приятного эффекта боке. Фотография оформлена в сбалансированную композицию, в которой используются ведущие линии окружающей архитектуры, чтобы добавить визуальный интерес. Вряд ли в этой сцене соавторами будут София Коппола, известный режиссер, известный своим интимным повествованием, Дариус Хонджи, известный кинематографист, прославившийся своим атмосферным освещением, Энни Лейбовиц, культовый фотограф, известный своими захватывающими портретами, и Стелла Маккартни, влиятельная модница. дизайнер, признанный за ее вневременные и экологичные проекты

Изображения созданы автором с использованием Midjourney и Poe.
Изображения созданы автором с использованием Midjourney и Poe.
 

Опять же, сравните различия между деталями формулировок подсказок. Теперь, оставив в стороне тот факт, что все сгенерированные женщины кажутся белыми (это совершенно другое обсуждение, заслуживающее отдельного внимания), ниже приведены два «лучших» изображения, на мой взгляд, по одному из каждой подсказки.

 
Примечание. Для прозрачности, из любопытства, после этого я запустил подсказку По еще 4 раза, и из 16 дополнительных несуществующих женщин, которые она сгенерировала, 5 из них оказались небелыми. Делайте с этой информацией что хотите, но я подумал, что стоит попробовать и сообщить о результатах.
 

«Лучшее» изображение из изображений, созданных Midjourney с использованием базовой подсказки.
«Лучшее» изображение из созданных Midjourney с использованием базовой подсказки.
 
«Лучшее» изображение из созданных Midjourney с использованием подсказки По
«Лучшее» изображение из созданных Midjourney с помощью подсказки По
 

Опять же, я считаю, что подсказки с помощью По выглядят более реалистично. Кажется, они кажутся более «естественными», и определение того, что они сгенерированы искусственным интеллектом, занимает немного больше времени, чем это делается для основных изображений-подсказок. Освещение и внешний вид кажутся более естественными, и хотя это не намного лучше, я бы сказал, что на небольшой процент лучше.

Возможно, эту статью следовало назвать «Надрать задницу в середине пути с По?Я думаю, что вопрос в том, поможет ли этот бот Poe вам окончательно создать более качественные подсказки для создания изображений, может быть неясным — и если да, то насколько? — хотя это определенно не будет решено с помощью жалких примеров из одной пары. Лучшее с помощью По мне нравилось немного больше, чем базовые подсказки, но, опять же, это одновременно субъективно и решение, принятое с использованием очень небольшого количества данных. Возможно, вывод должен заключаться в том, что оперативное проектирование — сложное и непостоянное животное, а искусство (оба реальные и созданные искусственным интеллектом) слишком субъективны, чтобы определить, когда что-то лучше, чем что-то другое.

Попробуйте Poe в своих собственных проектах по созданию изображений и посмотрите, как это сработает для вас.

 
 
Мэтью Майо (@mattmayo13) имеет степень магистра в области компьютерных наук и диплом о высшем образовании в области интеллектуального анализа данных. Будучи главным редактором KDnuggets, Мэтью стремится сделать доступными сложные концепции науки о данных. Его профессиональные интересы включают обработку естественного языка, алгоритмы машинного обучения и исследование нового искусственного интеллекта. Его миссией является демократизация знаний в сообществе специалистов по обработке и анализу данных. Мэтью занимается программированием с 6 лет.
 

Spot_img

Последняя разведка

Spot_img