Gyerekkorom óta hatalmas képregényrajongó vagyok – a gyors tempó, a gyönyörű művészet, a kifejező arcok – egyetlen kép is elmesélhette volna a történet felét. Egy ideje elkezdtem írni a saját képregénysorozatomat, a Neon Divide-ot, egy sci-fi történetet, amely egy disztópikus városban játszódik, ahol az emlékek fizetőeszközként szolgálnak. Befejeztem a forgatókönyvet és a párbeszédeket, de a művészet terén akadályba ütköztem.
Szeretem a professzionális rajzolási készségeket, és sajnos nem engedhettem meg magamnak egy profi művészt, hogy egy egész sorozatot illusztráljon. Ezért tűztem ki célul, hogy megtaláljam a legjobb mesterséges intelligenciával működő képregénygenerátort, amely segít elkészíteni a projektemhez szükséges képeket a minőség vagy a tónus feláldozása nélkül.
Kezdetben abban reménykedtem, hogy kiválaszthatom az első mesterséges intelligenciával teli képregénygenerátort, amit meglátok, és az majd megteszi, amire szükségem van. Azonban néhány lehetőség kipróbálása után rájöttem, hogy ez a folyamat sokkal bonyolultabb, mint gondoltam. Olyan megoldást szerettem volna, amely nem egyszerűen karaktereket generál, hanem képes megőrizni az egységes művészeti stílust több jeleneten keresztül, miközben betartja a világításra, a hangulatra és a perspektívára, valamint a párbeszédek elhelyezésére vonatkozó leírásaimat.
Olyan platformot kerestem, amely képes a forgatókönyvemet kidolgozott képregénypanelekké alakítani az elszigetelt képek helyett. Azt is reméltem, hogy kipróbálhatok különböző szögeket, arckifejezéseket és vizuális effekteket. Továbbá egy olyan mesterséges intelligenciát szerettem volna, amely fenntartja a folytonosságot a panelek között, hogy mindegyik ugyanazon képregény részének tűnjön.
Ez arra késztetett, hogy kipróbáljak egy csomó képregényes és rajzfilmes MI-generátort. Mindegyikhez hozzáadtam a Neon Divide ugyanazon jeleneteit, és értékeltem, mennyire sikeresek a tónus, a kifejezőerő, a részletesség és a vizuális konzisztencia kezelésében. Bizonyos platformok nagyszerűen kezelték az akciót, de nem sikerült megőrizniük a koherens karaktermegjelenéseket. Eközben mások nagyszerűen generáltak arckifejezéseket, de a hátterek laposnak és inspirációtlannak tűntek.
Mivel rengeteg munkám akadt, úgy döntöttem, meghívom a fixthephoto csapat kollégáimat, hogy teszteljék velem ezeket a platformokat. Együtt összeállítottunk egy listát a legnépszerűbb mesterséges intelligencia alapú képregénykészítőkről, meghatároztuk az igényeinket, és elkezdtünk képregényeket generálni különféle igényekre.
Amikor először teszteltem Adobe Firefly programot, nem számítottam rá, hogy ez lesz a lista legjobb AI képregénygenerátora. Korábban már használtam grafikai tervezéshez, de szekvenciális grafikák készítéséhez soha.
Először rövid jelenet-ötleteket adtam meg a forgatókönyveimből, például „két szereplő beszélget egy esős utcán, lágy neonfény”, és a Firefly gyönyörű paneleket készített, amelyek másodperceken belül pontosan megfeleltek az elvárásaimnak.
Különösen nagyra értékeltem a platform által biztosított stilisztikai testreszabhatóságot. Lehetővé teszi számomra a vonalvastagság és a kontraszt beállítását, valamint konkrét hangulatok kérését, beleértve a „nosztalgikus mangát” vagy a „gritty noir árnyalatokat”.
Ezenkívül könnyedén sikerült integrálnom a Firefly-t a Photoshop-be, így a későbbi szerkesztési folyamat sokkal kényelmesebb lett. Ha a célod professzionális minőségű képregény-illusztrációk készítése, miközben teljes kontrollt élvezel overminden aspektusa felett, akkor a Firefly-jal nem foghatsz mellé.
A ComicsMaker mesterséges intelligencia egy fantasztikus megoldás a hozzám hasonló történetközpontú alkotók számára. Ahelyett, hogy több eszközzel is babrálnom kellett volna, ezt a platformot használtam mind a képek, mind a panelelrendezések elkészítéséhez.
Importáltam a szkriptemet, kiválasztottam egy nekem tetsző művészeti stílust (egy félig realisztikus manga megközelítést választottam), és a ComicsMaker mesterséges intelligenciája mindössze néhány perc alatt elkészítette a projektem első 3 oldalát. Utána átrendezhettem a különböző elemeket, szerkeszthettem a párbeszédeket, vagy újrarenderelhettem a képeket anélkül, hogy a nulláról kellett volna kezdenem.
A legjobb rész? Kiválóan képes megőrizni a karakter kinézetét a panelek között, ami a túlnyomó többségében a AI művészeti generátorok hátránya. A tesztemhez egy 6 oldalas képregényt készítettem kevesebb mint két óra alatt, ami egyébként valószínűleg egy hét kézi munkát igényelne. A ComicsMaker AI küzd a komplex hátterekkel, de ha az összefüggő történetmesélés a prioritásod, akkor elégedett leszel ezzel a választással.
Ez a megoldás olyan érzést keltett bennem, mintha egy munkatársammal dolgoznék együtt, ahelyett, hogy egy képregényt próbálnék mesterséges intelligenciával létrehozni. Megadtam egy rövid jelenetleírást és a párbeszédeket, az AI Comic Factory pedig automatikusan panelekre osztotta, szövegbuborékokat generált, és gondoskodott arról, hogy az arckifejezések minden sorban relevánsak legyenek. Azt is értékeltem, hogy mennyire intelligens volt ennek a AI képgenerátornak az elrendezése, mivel ráközelített az érzelmek megjelenítésére, és szélesebb jeleneteket hozott létre az akcióhoz.
Készítettem egy fantasy harci jelenetet, és ez a platform nagyszerű munkát végzett a dinamikus mozgás renderelésében. A vonalvezetés a western képregényekre hasonlít, feltűnő, tiszta, kissé eltúlzott vonalakat hozva létre. A különálló panelek létrehozása egyszerű, de a teljesítmény kissé visszaeshet, ha nagyon bonyolult képek kezelése történik. Összességében, ha a célod egy sokoldalú, teljes ciklusú AI képregénygenerátor megtalálása, ez egy nagyszerű lehetőség.
A Dashtoon használatakor először storyboard vázlatokat és promptokat importáltam a mellékelt „Storyboard to Comic” menübe. A mesterséges intelligencia felismerte a karaktereket a kis importált referenciából, hozzáadta őket a beépített karakterkönyvtárához, és panelről panelre renderelt képeket generált egységes dizájnnal. Hihetetlenül gyors, mindössze néhány perc alatt olyan eredményeket produkál, amelyek órákig tartó Illustrator és Photoshop munkát igényelnének. A Dashtoon karakterkönyvtára és a „Stílus DNS” állításai jogosnak tűntek: a főszereplőm megőrizte frizuráját, ruházatát és arcát az összes generált panelen.
Ezután kihasználtam ennek a mesterséges intelligencia szoftvernek a szerkesztési funkcióit, módosítva a panelek méretét, alkalmazva egy cyberpunk kezelőesztétikát és szövegbuborékokat létrehozva. Ez a mesterséges intelligenciával hajtott képregénykészítő rendelkezik egy Magic Erase funkcióval is a nem kívánt elemek eltávolításához, valamint automatikus színezéssel.
A Képzeld el az Artot teljes szabadságot ad a képregények készítésében. Arra használtam, hogy karaktereket hozzak létre egy álomszerű képregénytörténethez, amelyek hasonlítottak a Paprika és a Szárnyas fejvadász hangulatához. Ez a mesterséges intelligencia által fejlesztett képregénygenerátor nagyszerű munkát végzett az általam elképzelt vizuális stílus közvetítésében, kifejező arcú és hangulatos színharmóniájú karaktereket eredményezve. Imádom a drámai effekteket, amelyeket létrehozhatsz, például filmes világítás elérésével vagy stilisztikai átfedések alkalmazásával, amelyek egy adott megjelenést kölcsönöznek a jelenetnek.
Különösen tetszett a kompozíciók létrehozásában rejlő képzelőerő. Olyan szokatlan feladatokat adtam, mint például a „lebegő város tükröződik a fényóceánban”, és ez a kép karikaturista ezeket magával ragadó, nagy felbontású képregény hátterekké alakította. Annak ellenére, hogy egy másik platformhoz kellett folyamodnom a panelek és szövegbuborékok készítéséhez, a ImagineArt fő előnye, hogy vizuálisan lenyűgöző kulcsképeket képes létrehozni.
Imádtam, hogy a Komiko milyen hatékonyan emlékszik a különböző karakterek dizájnjára, és hogy képes párbeszédbuborékokat elhelyezni az üres területeken. Ezenkívül ez rajzfilm képek alkalmazása lehetővé teszi, hogy alkotásaidat mindössze néhány kattintással online közzétegyed. Összességében a Komiko elsősorban azoknak az alkotóknak szól, akiket érdekel a történetmesélés, de hiányoznak a szükséges technikai készségek.
A CharGen nem egy kifejezetten képregénykészítő program, de nagyszerű eszköz a karakterek egységességének biztosítására, ami általában nagy probléma más eszközöknél. Segített létrehozni egy karakterkészletet, mielőtt elkezdtem volna az egyes panelek készítését. Miután véglegesítettem a stílust, és egy félig realisztikus anime esztétikát választottam, over20 arckifejezést és pózt készítettem a szereplők minden tagjának.
Megőrzi az arányokat, az öltözéket és az arcszerkezetet a különböző képeken keresztül. Utána a generált karaktereket megnyitottam a Photoshop fájlban, hogy kézzel készítsem el a paneleket. Nem lélegzetelállító, de ha a vizuális folytonosság és a részletes világépítés fontos számodra, a CharGen remek választás.
A Fantoons-t bíztam meg egy mesterséges intelligencia által vezérelt rajzfilmfigura-készlet elkészítésével egy három panelből álló humoros képregényhez, amely egy laza android baristáról szól, aki nem tud elég sokáig fennmaradni ahhoz, hogy felvegye a rendelést. Néhány rövid kérdést adtam meg a karakterrel és a hangulattal kapcsolatban – „buta android, hangulatos kávézó, eltúlzott rajzfilmstílus” –, és mindössze néhány másodperc múlva a platform olyan képeket generált, amelyek úgy néztek ki, mintha egy szombat reggeli rajzfilmből lennének kivágva.
Különösen tetszik, ahogy ez a rajzfilmgenerátor arckifejezéseket hoz létre. Az android arca tökéletes sorrendben változott álmosból pánikba esettbe, majd arrogánsba, míg a háttér, bár alapvető, illett a hangulathoz, ahelyett, hogy elvonta volna a figyelmet a jelenetről. Ez a megoldás a poénokat is megfelelően értelmezte, átadva a képregényem mögött rejlő ötletet. Ez AI fotószerkesztő lehetővé tette, hogy a színpalettát lágyabb árnyalatok eléréséhez igazítsam, amelyek illeszkedtek a közösségi oldalaim arculatához.
A legtöbb más képregényes és rajzfilmes mesterséges intelligenciával működő művészeti generátorral ellentétben ez a megoldás nyílt forráskódú modellekre épül, így a használata valamivel több erőfeszítést igényel. Több, mangaszerű művészetre optimalizált diffúziós modellt is kipróbáltam, miközben olyan lehetőségeket kerestem, amelyek jól tudnak következetes karakterdizájnokat létrehozni. A fent említett Neon Divide projektet választottam ehhez a teszthez. Azt szerettem volna látni, hogy a Hugging Face képes-e összefüggő jeleneteket létrehozni filmes, kézzel rajzolt hangulattal.
Jó néhány gyors kísérletezés után („neonfényes sikátor, fényvisszaverő felületek, mechanikus szemmel rendelkező főszereplő, alulnézet a panelről”) olyan eredményeket kaptam, amelyek szinte tökéletesen megfeleltek az elképzelésemnek. A Hugging Face lenyűgözően sokoldalú is, lehetővé téve számomra, hogy beállítsam a modell súlyait, a kezdőértékeket, sőt, még az ellenőrzőpontokat is kombináljam a stílusok keveréséhez. Mint ilyen, a hátteret az egyik modell, a karaktereket pedig egy másik felhasználásával generáltam, mielőtt a kettőt összeillesztettem a Photoshop-ben.
Ha a mesterséges intelligencia segítségével készült képregények létrehozásának vágya túlmutat a vizuális elemek generálásán, a Perchance megérdemli a figyelmet. Bár képeket nem tud előállítani, ez a platform más eszközökkel együtt használható egy teljes ciklusú folyamat felépítéséhez. Segített áttörni egy kreatív blokkot, amikor azon gondolkodtam, hogy milyen irányba vezessem a képregényemet.
Ezenkívül a Perchance segített új ötleteket találni a jelenetekhez és a karakterekhez („helyszín: futurisztikus, hangulat: melankolikus, karaktertípus: vonakodó hős, csavar: mesterséges intelligencia lázadása”), a rendelkezésre álló eszközök alapján különböző kombinációkat kínálva.
Nem minden eredmény logikus, de ha bejön, az olyan érzés, mintha aranyat ütöttél volna. Például egy ponton a Perchance inspirált egy rövid képregény elkészítésére egy idős mech pilótáról, aki egy ramen boltban dolgozik. Miután véglegesítettem a történet koncepcióját, egy másik platformot használtam a vizuális elemek létrehozásához.
Miután egy bonyolult jelenetindító feladatot adott („két űrhajós vitatkozik egy halványan megvilágított pilótafülkében, érzelmi feszültség, filmes keretezés”), Llamagen elkészítette mind a képeket, mind a párbeszédeket, amelyek illeszkedtek a történethez. Ráadásul az arckifejezések tökéletesen illeszkedtek a szövegbuborékokhoz, a történet tempója pedig organikusnak érződött. Emellett a mesterséges intelligencia által generált képregény nagyszerű munkát végzett a kameraszögek beállításával, hogy fokozza a kép érzelmi impactintenzitását.
Nyilvánvalóan nem tökéletes. A karakterek arca eltorzulhat, és a mesterséges intelligencia néha túl szó szerint értelmezi a forgatókönyvet, arra kényszerítve a felhasználót, hogy újra generálja a kimenetet. A Llamagen mesterséges intelligenciája még korai szakaszában van, de sok ígéret van benne. Ha a platform tovább fejlődik, végül lehetővé teszi majd, hogy egy képregényt teljes egészében mesterséges intelligencia segítségével készítsünk, ötvözve a képeket, a párbeszédeket és a rendezést. Már most is úgy tűnik, hogy egy érzékeny társíróról van szó, aki hatalmas művészi képességekkel rendelkezik.
Miután FixThePhoto úgy döntöttünk, hogy teszteljük a legjobb mesterséges intelligenciával teli képregénygenerátorokat, a digitális történetmesélés egy teljesen új dimenzióját fedeztük fel. A csapatunk én, Robin Owens, Eva Williams és Vadym Antypenko volt, mivel a képregényőrültek és a kíváncsi tech-kritikusok keverékét képviseltük.
Mivel mindannyian más-más szakterülettel foglalkozunk, különböző szempontokra összpontosítottunk: Robin a történetmesélésre és a párbeszédek generálására, Eva a vizuális konzisztenciára és a képminőségre, Vadym, a rezidens techzseniünk pedig a tesztelési kérdésekre, a renderelési teljesítményre és a modell stabilitására.
Azzal kezdtük, hogy képregénykészítők és mesterséges intelligencia által fejlesztett grafikus regénygenerátorok széles választékának kiválasztása – az intuitív megoldásoktól, amelyek néhány kattintással elkészítik az egész történetet, a professzionálisabb eszközökig, amelyek egyedi promptokat és szerkesztést igényelnek. Használtuk ugyanaz az alapkoncepció minden platformra – egy rövid sci-fi képregény egy alternatív valóságok között rekedt időutazóról. Megvizsgáltuk, hogy az egyes opciók hogyan kezelték a vizuális és narratív aspektusokat, valamint a karakterek következetességét és az érzelmi tónust.
Létrehoztunk egy kreatív folyamatot, amely a következőkből állt: egy rövid jelenet megírása , majd leíró promptokon keresztül hozzáadtuk a mesterséges intelligencia eszközhöz. A képek létrehozása után értékeltük, hogy mennyire volt jó a történetmesélés és a karakterdizájnok panelről panelre történő megőrzése. Mértük a renderelési sebességet is, és feljegyeztük a kimenetek szerkesztésének és újragenerálásának hatékonyságát.
Miután a tesztek befejeződtek, a megosztott munkaterületünkön több száz mesterséges intelligencia által generált panel – némelyik lenyűgöző, mások teljesen elfogadhatatlanok. Felfedeztük, hogy minden mesterséges intelligenciával működő rajzfilm- és képregénygenerátornak megvannak a saját „preferenciái”: némelyik realisztikusabb képeket készít, míg mások stílusukban közelebb állnak az animéhez/mangához. Összességében ezeknek az eszközöknek a hatékonysága hihetetlen, mivel mindössze néhány perc alatt létrehozható egy olyan jelenet, amely általában órákig tartó kézi munkát igényelne.
Ez egy érdekes folyamat, amely a művészi víziót és útmutatást ötvözi a gépi generálással. Ahogy Éva az egyik találkozónk során leírta: „A mesterséges intelligencia nem helyettesíti a képregényművészeket – csupán egy gyorsabb, őrültebb vázlatfüzetet ad nekünk.”