Minden egy egyszerű ötlettel kezdődött – mi lenne, ha egy divatmodell képét mesterséges intelligencia segítségével készítenénk úgy, hogy begépelnénk egy leírást, és a mesterséges intelligencia által hajtott képgeneráló szoftverre bíznánk a munkát? Nagy kihívásnak, talán lehetetlennek is tűnt, de a mesterséges intelligencia által támogatott eszközök napról napra fejlődnek, ezért kíváncsi voltam, mire képesek.
Részletes feladatot írtam: egy stílusos modell fekete ruhában, drámai stúdióvilágítás, lágy árnyékok és elmosódott háttér. Meg akartam próbálni egy olyan mesterséges intelligencia által létrehozott képet létrehozni, ami pont úgy néz ki, mint egy igazi profi fotó. A kollégáim, Eva és Tetiana segítettek. Különböző mesterséges intelligencia által létrehozott eszközöket próbáltunk ki, hogy lássuk, melyikkel lehet a legrealisztikusabb képet készíteni.
Rengeteg mesterséges intelligencia által támogatott képgenerátor létezik, például olyan hatalmas cégek, mint az Adobe, a Meta és a Microsoft, így a legjobb kiválasztása nem volt könnyű. Néhány mesterséges intelligencia által támogatott eszköz jó volt a kép beállításában, de rossz a részletekben. Mások szuper részletes képeket készítettek, amelyek nem tűntek valóságosnak. A kérdés az volt, hogy melyik mesterséges intelligencia tud olyan divatfotót generálni, amely úgy néz ki, mintha a Vogue címlapjára illene?**
A mesterséges intelligencia által generált képek mindenhol megtalálhatók, de felmerül egy nagy kérdés: kié a kép? Ha beírsz egy leírást, és a mesterséges intelligencia elkészíti a képet, az a tiéd, vagy ahhoz a céghez tartozik, amelyik a mesterséges intelligencia által generált képgenerátort készítette? A szabályok még nem egyértelműek, és ez problémákat okoz a művészeknek, a tervezőknek és a tartalomkészítőknek.
Néhány mesterséges intelligenciával foglalkozó cég azt állítja, hogy a képek a felhasználóhoz tartoznak, de mások megtartanak bizonyos jogokat, vagy rejtett vízjeleket adnak hozzá a mesterséges intelligencia által generált képek nyomon követéséhez. Ez problémát jelenthet azoknak a szakembereknek, akik teljes kontrollt szeretnének overtulajdonítani munkájuk felett.
Képzeld el, hogy hosszú időt töltesz egy mesterséges intelligencia által készített kép tökéletesítésével, majd kiderül, hogy a mesterséges intelligenciával foglalkozó cégnek továbbra is jogai vannak a képhez, vagy ami még rosszabb, a képet mesterséges intelligencia által készítettként jelölik meg, és eltávolítják egy weboldalról.
Mivel a mesterséges intelligencia eszközei gyorsan változnak, az embereknek óvatosnak kell lenniük. Mielőtt mesterséges intelligencia által létrehozott képeket használnánk munkához, érdemes ellenőrizni a feltételeket. Senki sem akarja elveszíteni alkotásai tulajdonjogát, vagy véletlenül olyan képet használni, amely jogi problémákat okozhat.
Az Adobe Firefly rövid idő alatt az egyik legsokoldalúbb AI-platformmá vált az alkotók számára. A többi, kizárólag képgenerálásra fókuszáló eszközzel szemben a Firefly egy komplett kreatív csomagot kínál: képgenerálást, audioeszközöket, sőt a nemrég frissített, AI-alapú videókészítést is — mindezt egy helyen.
A csapatteszt során egy stílusos, fekete outfitben lévő modell portréján dolgoztunk drámai stúdióvilágításban, lágy árnyékokkal és enyhén elmosott háttérrel. Kolléganőim, Eva és Tetiana is csatlakoztak, hogy megnézzük, melyik AI-eszköz készíti a legélethűbb fotót. A Firefly azonnal kitűnt: a Generative Fill, a Content-Aware Editing és a Style Reference funkciók rendkívül természetessé tették a fényt és a textúrákat, особенно a szöveteken és a bőrtónusokon.
A Photoshopban elérhető Adobe Firefly AI art generator most kiforrottabbnak érződik, mint valaha, és gördülékenyen ötvözi az alkotói szabadságot a realisztikus részletekkel.
Az eredmény, amit Adobe Firefly-ban kaptam
Fő Adobe Firefly jellemzők :
Árazási lehetőségek :
Teszteltem a Freepik mesterséges intelligenciával működő képgenerátorát a divatfotós kísérletünkhöz, és jó értelemben meglepett. A létrehozott modell természetes pózzal, realisztikus bőrrel és klassz stúdióvilágítással rendelkezett, pont ahogy kértem. Néhány MI eszközök tervezőknek túl simává teszi az arcokat, de a Freepik élesen tartotta a fontos részleteket, például a szemeket és az anyagot.
Azért nem volt tökéletes. Néhány rész, különösen a haj körül, kicsit homályosnak és művinek tűnt. De mivel a Freepik főleg stock stílusú képekhez készült, nagyszerű munkát végzett a gyors, stílusos képek elkészítésében, különösebb erőfeszítés nélkül.
Az eredmény, amit Freepik-ban kaptam
Fő Freepik jellemzők :
Árazási lehetőségek :
Kipróbáltam a DALL·E 3-at, és nagyszerű munkát végzett. Az AI művészeti generátor egy divatmodell portrét készített sima megvilágítással, realisztikus árnyékokkal és furcsa torzítások nélkül. A modell arca természetesnek tűnt, és még az apró részletek (mint például az anyagredők és a smink) is jól sikerültek.
Éva megpróbálta ugyanazt a feladatot más stílusban, drámai megvilágítást használva, és hasonló eredményeket ért el. De mindketten észrevettünk egy apró problémát: a DALL·E 3 néha túl simának mutatja a bőrt, szinte olyan, mint egy retusált fotó. Ezt később szerkesztéssel kijavíthatod, de érdemes észben tartani.
Fő Dall-E 3 jellemzők :
Árazási lehetőségek :
Nem voltam biztos benne, hogy Ideogram képes-e realisztikus divatportrét készíteni, mivel főként szöveges és grafikai tervezéséről ismert. De lenyűgözött! A modell ruhája kifinomultnak tűnt, a világítás pedig professzionális hatást keltett a képen.
Azonban néhány részlet nem volt tökéletes. Az arc kissé laposnak tűnt, így inkább egy CG-képre hasonlított. Bár a mesterséges intelligencia által generált képgenerátor elkerülte a hibákat (például a plusz ujjakat), a haj továbbra is túl simának és kissé műnek tűnt. Nagyszerű stílusos mesterséges intelligencia által készített portrékhoz, de még nem helyettesíti teljes mértékben a valódi divatfotózásokat.
Az eredmény, amit a Ideogram-ben kaptam
Fő Ideogram jellemzők :
Árazási lehetőségek :
Midjourney egy menő portrét készített nagy kontraszttal és teátrális megvilágítással, professzionális, filmes megjelenést kölcsönözve neki. A modell arca tökéletesen nézett ki, hibátlan bőrrel és drámai árnyékokkal, így nagyszerű volt szerkesztői képekhez, de nem túl realisztikus.
Tetiana a midjourney-ot is kipróbálta egy vintage stílusú divatfotóhoz, és ugyanazt a visszajelzést kapta – lenyűgöző a művészi képek készítéséhez. Az eredmény azonban nem mindig néz ki úgy, mint egy igazi fotó, mint amilyen nekem volt Freepik. Ha egy menő, kreatív effektet szeretnél, ez a képgeneráló mesterséges intelligencia nagyszerű, de ha egy valósághű képre van szükséged, akkor lehet, hogy retusálnod kell a Photoshop-ben.
Az eredmény, amit a Midjourney-ben kaptam
Fő Midjourney jellemzők :
Árazási lehetőségek :
Kipróbáltam egy Generated Photos nevű mesterséges intelligencia által vezérelt eszközt, hogy divatos portrét készítsek, de az eredmény nem lett valami jó. A modell arca túl merevnek tűnt, mintha nem is pózolna. A bőr természetesnek tűnt, de a szemek túl tökéletesnek, szinte műnek tűntek. A világítás szép és tiszta volt, de nem volt meg az igazi stúdiófotó drámai érzete.
Ez a mesterséges intelligencia által vezérelt képgenerátor jó üzleti portrékhoz vagy marketingprojektekhez, de divatfotózáshoz nem. Inkább egy stockfotó eszköz, mint valami kreativitáscélú eszköz.
Az eredmény, amit a Generated Photos-ban kaptam
Fő Generated Photos jellemzők :
Árazási lehetőségek :
Typeface főként márkaépítéshez és grafikai tervezéshez készült, nem realisztikus fotókhoz, de kíváncsi voltam, hogy tud-e jó hirdetéseket készíteni mesterséges intelligencia által generált képekből.
Az általa generált MI-modell modernnek és stílusosnak tűnt, de nem tűnt annyira valóságosnak, mint más MI-eszközök, például a DALL·E 3 vagy a Freepik képei. A typeface azonban jól felkészítette az eredményeket a marketingre.
Közösségi média hirdetések létrehozásához használtam a FixThePhoto-hoz, és kétszer olyan gyorsan végzett a munkámmal. Felhasználóbarát eszközökkel gyorsan módosíthattam a képméreteket és az elrendezéseket a különböző hirdetési formátumokhoz igazítva, így nem kellett magamnak elvégeznem az összes munkát.
Az eredmény, amit a Typeface-ben kaptam
Fő Typeface jellemzők :
Árazási lehetőségek :
Astria egy mesterséges intelligencia által támogatott képgeneráló szoftver, amely nagyobb kontrollt biztosít overa képek megjelenése felett. Én a divatportré elkészítéséhez használtam, és tetszett, hogy a megvilágítás és a színek megváltoztatásával személyre szabhattam a megjelenést. A kép stílusosnak tűnt, de sok mesterséges intelligencia által vezérelt eszközhöz hasonlóan a bőr egy kicsit túl sima volt, és az egész kép kissé számítógép által generáltnak tűnt.
Ha személyre szeretnéd szabni a mesterséges intelligencia által készített portréidat, a astria jó választás. De ha azt szeretnéd, hogy a kép valósághűnek tűnjön, akkor utána kicsit szerkesztened kell rajta.
Az eredmény, amit a Astria-ban kaptam
Fő Astria jellemzők :
Árazási lehetőségek :
Flux 1 egy újabb mesterséges intelligencia által támogatott eszköz, ezért kíváncsi voltam, mennyire tud divatos portrékat készíteni vele. Az eredmények igazán jók lettek. A világítás dinamikus volt, a kompozíció pedig divatos, mint egy magazinban. A ruha élesnek tűnt, az arc részletei pedig tiszták és részletgazdagok voltak, ahelyett, hogy simának tűnt volna, mint egyes mesterséges intelligencia által létrehozott képeken.
Egy apró probléma a haj volt. Néha a tincsek furcsán keveredtek, ami miatt kicsit műhatásnak tűnt. Nem volt nagy probléma, de kicsit retusálnom kellett a képet.
Az eredmény, amit a Flux-1-ben kaptam
Fő Flux 1 jellemzők :
Árazási lehetőségek :
GenApe AI elég jó munkát végzett a divatportréval. Az egyik klassz dolog, hogy apró változtatásokat lehet végezni, például az arc vagy a világítás beállítását. A kép tiszta volt, és a ruha jól nézett ki, nem volt mű és műanyag, mint néhány más mesterséges intelligencia által generált képen. De néha túl simává tette a bőrt, mint egy retusált fotón.
Az eredmény, amit a GenApe AI-ben kaptam
Fő GenApe AI jellemzők :
Árazási lehetőségek :
Narrato AI főként marketing tartalmak írására és készítésére szolgál, ezért nem számítottam rá, hogy nagyszerű lesz képek készítésében. Kipróbáltam, és a kép, amit készített, rendben volt, de nem volt elég részletes ahhoz, hogy realisztikusnak és professzionálisnak tűnjön. Messziről a modell arca valóságosnak tűnt, de közelről a bőre túl sima volt, és az árnyékok sem voltak tökéletesek.
A Narrato AI hasznosságát az adja, hogy mennyire jól működik együtt a marketingeszközökkel. Könnyű volt a képet beilleszteni a hirdetéssablonokba, így ha gyorsan szükséged van képekre hirdetésekhez vagy közösségi médiához, akkor ez egy jó lehetőség. Ha azonban szuperrealisztikus fotókat szeretnél, akkor lehet, hogy nem ez a legjobb választás.
Az eredmény, amit a Narrato AI-ben kaptam
Fő Narrato AI jellemzők :
Árazási lehetőségek :
ProductScope AI főként termékfotókhoz készült, de kíváncsi voltam, mennyire tud személyről képet készíteni. Az eredmények rendben voltak: egyes részek nagyszerűen néztek ki, például a világítás és a ruházat részletei, de az arc nem tűnt 100%-ban valóságosnak. Kicsit CGI-szerű volt, és néhány árnyék sem tűnt természetesnek.
Ennek a mesterséges intelligenciával működő képgenerátornak az egyik előnye, hogy milyen könnyen testreszabhatók az eredmények. Néhány másodperc alatt válthattam hátteret, ruhát és állíthattam be a világítást.
Az eredmény, amit a ProductScope AI-ben kaptam
Fő ProductScope AI jellemzők :
Árazási lehetőségek :
ComfyUI Web nagy felbontású képet készített éles részletekkel és lágy megvilágítással, a testreszabható munkafolyamat pedig lehetővé tette a képgenerálási folyamat egyszerű beállítását. Mivel web alapú volt, nem kellett semmit telepítenem, és nagy teljesítményű hardvert sem kellett használnom.
Amikor megpróbáltam apró módosításokat végezni az arckifejezésein, a végeredmény kiszámíthatatlan volt. A legjobb módszer az volt, ha többször is iteráltam a kimenetet.
Az eredmény, amit a ComfyUI Web-ben kaptam
Fő ComfyUI Web jellemzők :
Árazási lehetőségek :
Unreal Person szuperrealisztikus mesterséges intelligencia által létrehozott emberek létrehozására készült, így jó eredményekre számítottam, és többnyire nagyszerű munkát végzett. Az arc részletei tiszták voltak, a világítás szép volt, a bőrszínek pedig természetesnek tűntek. A szemek is élettel teltek, ami nagyszerű, mert néhány mesterséges intelligencia által létrehozott arc kissé üresnek tűnik.
Amivel azonban nem voltunk megelégedve, az az volt, hogy az arcok néha nem voltak tökéletesen kiegyenesedve. Néhány képen a vonások nem illeszkedtek teljesen rendesen, ami miatt kissé furcsának tűntek.
Az eredmény, amit a Unreal Person-ben kaptam
Fő Unreal Person jellemzők :
Árazási lehetőségek :
Leap egy menő divatportrét készített. A modell arca realisztikusnak tűnt, a megvilágításnak köszönhetően pedig a kép egy magazin oldalára hasonlított. A leap egyik legjobb tulajdonsága, hogy milyen jól kezeli a textúrákat. A ruhák tisztáknak és részleteseknek tűntek, a bőr pedig sima, de mégis természetes.
Ennek a mesterséges intelligenciával működő képgeneráló szoftvernek azonban gondjai akadtak az összetett promptokkal. Amikor megpróbáltam apró dolgokat, például az arcvonásokat megváltoztatni, nem mindig sikerült jól. A leap akkor működik a legjobban, ha hagyod, hogy tegye a dolgát, majd később szerkeszted az apró részleteket.
Az eredmény, amit a Leap-ban kaptam
Fő Leap jellemzők :
Árazási lehetőségek :
Nagyon meglepődtem, hogy mennyire professzionálisak és vizuálisan pontosak voltak az eredmények Vheer -tól. A mesterséges intelligencia által létrehozott képkészítő hangulatos megvilágítást, lágy árnyékokat és tiszta mélységélességet adott, mintha egy valódi stúdiókörnyezetben fotózták volna.
A ruhák és a modell testének textúrái nagyrészt pontosak voltak, a stílus pedig szándékosnak érződött – amit általában nem találsz meg ingyenes eszközökkel.
Az eredmény, amit Vheerben kaptam
Fő Vheer jellemzők :
Árazási lehetőségek :
Mindig is úgy gondoltam az Hypotenuse AI, mint egy eszközre, amely lehetővé teszi a termékleírások generálását és az e-kereskedelmi adatok gazdagítását, így kellemesen meglepődtem, hogy milyen sokoldalúak a vizuális eszközei. A beépített MI image editor könnyedén kezeli a háttér eltávolítását, a vágást és a felskálázást.
Ami igazán kiemelkedett, az a mesterséges intelligencia által vezérelt termékfotózási funkció: virtuálisan felöltöztetheti a modelleket a termékeidbe, meggyőzően drapériázhatja a ruhákat, és a fókuszt a terméken tarthatja, így katalóguskész, természetes hatású felvételeket készíthet. És míg a Hypotenuse AI termékkép-generáló és -szerkesztő eszközei kiválóan teljesítenek a ruházati cikkek esetében, a platform más termékkategóriáknál is ugyanolyan jól működik, például bútoroknál vagy ipari szerszámoknál.
Az eredmény, amit a Hypotenuse AI-ban kaptam
A hipotenusz fő mesterséges intelligencia funkciói :
Árazási lehetőségek :
A különböző mesterséges intelligenciával működő képalkotók összehasonlításához FixThePhoto csapatunk ugyanazon leírások alapján tesztelte őket, hogy kiderüljön, melyik készíti a legjobb képeket.
Egy tisztességes tesztelési eljárást használtunk: minden MI-eszközbe beírtuk ugyanazt a leírást, ellenőriztük az eredmények jóságát, és pontszámokat adtunk nekik aszerint, hogy mennyire valóságosak, mennyire követték a leírást, és mennyire voltak részletesek. A tesztkérdés a következő volt: egy stílusos modell fekete ruhában, drámai stúdióvilágítás, lágy árnyékok és elmosódott háttér.
Néhány mesterséges intelligencia eszköz, mint például a DALL·E 3 és a Freepik, valósághű képeket készített, mindössze néhány javításra szorulva. Másoknak azonban problémáik voltak, például műhaj, túl sima bőr és gyakran furcsán kinéző kezek.
Azt is teszteltük, hogy az egyes eszközök mennyire gyorsak és könnyen használhatóak. A Ideogram nagyszerű volt szövegek és művészi minták hozzáadásához, de nem volt olyan jó a realisztikus képek létrehozásában. A Photoshop mesterséges intelligenciája a legjobbnak bizonyult a mesterséges intelligencia által generált képek javításához a nulláról történő létrehozás helyett, így ez a legjobb választás azoknak a szakembereknek, akik szerkeszteni szeretnék munkájukat.
Összességében a mesterséges intelligencia által támogatott képgenerátorok egyre jobbak, de egyik sem tökéletes. Némelyik azonnal nagyszerű képeket készített, míg mások sok szerkesztést igényeltek. Csapatunk megállapította, hogy a mesterséges intelligencia egy hatékony eszköz, de az emberi kreativitásra továbbra is szükség van a képek előállításához.