Midjourney V5 може всичко това, което не сте предполагали
Midjourney, известен генератор на изображения с изкуствен интелект, наскоро направи важно съобщение относно пускането на алфа версията на алгоритъма V5.
Най-новата итерация е проектирана да поддържа по-широк спектър от естетики и да реагира по-бързо на подкани, като включва по-подробен набор от снимки и два пъти по-висока резолюция на изображенията в сравнение с предишната версия.
Преди да навлезем в последните актуализации, нека направим кратък преглед на Midjourney.
Midjourney V5, е най-новата версия на алгоритъма за преобразуване на текст в изображение, разработен от компанията.
Предишните версии, включително V1, V2, V3 и V4, бяха пуснати съответно през март 2022 г., април 2022 г., юли 2022 г. и ноември 2022 г.
Въпреки че пускането на V4 се забави, чакането си заслужаваше, тъй като тя значително подобри реализма, визуалната съгласуваност и цялостната привлекателност на генерираните произведения на изкуството.
Настоящата алфа версия на Midjourney V5 все още е в процес на тестване и корекции, а окончателната версия може да се отличава с различна естетика по подразбиране.
По-голям стилов диапазон
the lighting and skin texture feels illegal in #midjourneyv5
the littlest amount of #photoshop is still in there, but nothing compared to what I usually do 👀 #synthography aka #aiphotography, now is on the next level!
and MJ used to suck at window reflections; look at her now pic.twitter.com/ezr3ewyZgy
— Julie W. Design (@juliewdesign_) March 16, 2023
Въпреки това последната версия може да се похвали с по-широк стилов диапазон, което улеснява потребителите да създават зашеметяващи изображения, които изглеждат като дело на професионалисти.
По-високо качество на изображенията
Едно от най-значимите подобрения в Midjourney V5 е подобреното качество на изображението. В сравнение с предишната версия V4, която генерираше изображения с резолюция 512 x 512 пиксела, V5 създава изображения с резолюция по подразбиране 1024 x 1024 пиксела, без да се налага увеличаване на мащаба.
Това води до по-остри и по-детайлни изображения, които са по-близо до нивото на професионалните фотографии.
Освен това има възможност за още по-високи резолюции с помощта на ъпскейлърите на V5, които могат да увеличат резолюцията до 2048 x 2048 пиксела или повече.
Това подобрение би предложило на потребителите още по-голяма гъвкавост и качество при генерирането на изображения с помощта на алгоритъма Midjourney.
GPT-4 is great.
But this midjourney V5 is special 💛
These images are generated by the new Midjourney V5 pic.twitter.com/XtrOMBcL70
— Barsee 🐶 (@heyBarsee) March 17, 2023
Изображенията са много по-детайлни
Съвместното използване на изображения и текстови подсказки в Midjourney V5 ще доведе до по-точни и предвидими резултати.
Beautiful natural results from Midjourney v5 (left) vs v4 (right) using the same image seed + simple prompt pic.twitter.com/AgpGJtJYLm
— Fyrie (@FyrieNFT) March 15, 2023
Подобрена производителност
I've been adapting my prompting for Midjourney v5 to include more natural language and it's working and freaking me out how good the results are.
🧵Examples w/ prompts in ALT tags & notes at the end pic.twitter.com/A9ndlBGfgx
— Nick St. Pierre (@nickfloats) March 16, 2023
Отново е възможен „тайлинга“
Това беше функция на V3, но V4 никога не я поддържаше. Тази опция генерира „плочки“, които могат да създадат взаимосвързан, повтарящ се модел, и е върната във V5.
За разлика от преди, създаването на впечатляващи произведения на изкуството с помощта на Midjourney вече не изисква висок клас камери, хардуер или софтуер за редактиране – необходими са само интернет връзка и абонамент за Midjourney.
I’m just reading through the @midjourney v5 release notes and noticed there’s a new –tile flag for generating infinite tiling patterns. Didn’t expect it to work reliably, but… 🤯 pic.twitter.com/hwqjauUL4B
— Zac Wasielewski (@xac) March 18, 2023
Повече варианти за съотношение на страните
Midjourney V5 може да се похвали с още едно значително подобрение – възможността да контролира съотношението на страните на генерираните изображения.
За разлика от своя предшественик V4, който при пускането си поддържаше само квадратно съотношение на страните (1:1), а по-късно разшири обхвата си до 2:3 / 3:2, V5 вече позволява на потребителите да създават изображения с резолюция до 1:2 / 2:1.
Това подобрение осигурява по-голяма гъвкавост при създаването на изображения, които отговарят на специфични изисквания или са съобразени с различни стандарти за различни платформи.
The new MidJourney model (v5) can output images in any aspect ratio – here she is generating some ultra-wide external panoramas and internal 360-degree views at 4:1 / 5:1 ! pic.twitter.com/uM927rm47W
— Guy Parsons (@GuyP) March 15, 2023
Без вградена естетика
Според екипа на Midjourney алфа версията на V5 се описва като „с по-малко мнение“. Това означава, че в сравнение с предишната версия, V4, която по подразбиране използваше определен визуален стил, V5 предлага на потребителите повече контрол и гъвкавост при генерирането на изображения.
Във V4 потребителите можеха да въвеждат прости подсказки като „щастлив“ и въпреки това да създават творчески изображения.
При по-малко категоричния подход на V5 обаче от потребителите се изисква да предоставят по-описателни подсказки, за да постигнат желания резултат.
Тази промяна дава повече власт в ръцете на потребителя и дава възможност за по-широк спектър от творчески възможности.
Ръце и длани!
Едно от основните оплаквания от предишните версии на Midjourney беше, че ръцете често се появяваха с допълнителни пръсти, под неудобен ъгъл и не можеха да взаимодействат с обикновени обекти.
Алгоритъмът V5 обаче е решил този проблем и сега създава ръце, които се появяват правилно в генерираните изображения.
Това подобрение е значителна стъпка към създаването на по-реалистични и естествено изглеждащи изображения с помощта на алгоритъма за преобразуване на текст в изображения Midjourney.
Prompt: one hundred hands waving at the haters 😅 #midjourney5 #midjourney #AiArtcommunity pic.twitter.com/K3auUSrBXh
— Trist (@tristwolff) March 16, 2023
Заключение
Освен това подобренията, направени във V5, имат за цел да направят генератора на изкуство с изкуствен интелект по-отзивчив към въведените от потребителя данни.
Усъвършенстваният набор от снимки също така позволява по-голяма креативност и гъвкавост при генерирането на изображения, с повече детайли и разделителна способност за работа.
Струва си да се отбележи, че Midjourney си е спечелил репутацията на един от най-популярните генератори на изкуство с изкуствен интелект на пазара, а с последната версия на V5 е на път да затвърди още повече позициите си.
Като цяло пускането на Midjourney V5 е значителен етап в развитието на изкуството, генерирано от изкуствен интелект, като предоставя на потребителите инструментите, от които се нуждаят, за да създават зашеметяващи изображения, без да изискват значителни технически умения или скъпо оборудване.
Тъй като технологията продължава да се развива, вълнуващо е да видим как тя ще повлияе на творческите индустрии и ще разшири границите на това, което е възможно с изкуството, генерирано от изкуствен интелект.