Z montažo videoposnetkov se ukvarjam že dolgo časa, vendar je bilo oblikovanje zvoka zame vedno najtežji del. Ure in ure lahko iščem pravi zvočni učinek – pa naj bo to dramatičen šum, prasketanje kamina ali nežen zvok v ozadju – in še vedno ne najdem ustreznega. Večina zvočnih knjižnic je predragih, preveč osnovnih ali pa preprosto niso povsem prave.
Prejšnji teden sem delal na kratkem popotniškem videu. Vizualni elementi so bili pripravljeni – barve, rezi in prehodi so bili videti dobro – ampak ko sem si ga ogledal, se je zdel dolgočasen. Ni imel vzdušja. Takrat me je zadelo: nisem potreboval samo zvoka v ozadju, potreboval sem zvok, ki je podpiral zgodbo.
Zato sem začel iskati generator zvoka z umetno inteligenco, ki bi dejansko razumel, kaj zahtevam, namesto da bi mi dajal naključne zvočne učinke.
To sem želel:
Po preizkusu več orodij sem ugotovil, da večina tako imenovanih platform z umetno inteligenco le ponovno uporablja standardne knjižnice zvokov. Vendar je eno orodje izstopalo – zvok je dejansko ustvarilo iz samega poziva. Ko sem vnesel »stara kovinska vrata se počasi odpirajo v temnem hodniku«, je ustvarilo zvok, ki se je zdel resničen, podroben in se je popolnoma ujemal z mojim prizorom.
Prvič se nisem mučil z zvokom, ki bi ustrezal mojemu videu – zvok sem oblikoval glede na svojo zgodbo.
Zdaj, namesto da ure in ure iščem po zvočnih knjižnicah, preprosto opišem želeni zvok – na primer »nežen dež, ki zvečer tapka po steklu« – in umetna inteligenca ga ustvari v nekaj sekundah.
Odločil sem se, da izberem najboljša orodja zase in jih delim v tem članku. Da bi to naredil, sem za pomoč prosil kolege iz ekipa FixThePhoto. Izbrali smo več projektov – nekatere iz mojega profesionalnega dela in nekaj videoposnetkov o življenjskem slogu za družbena omrežja, ki so jih posneli moji sodelavci.
Zapisali smo si, kaj vsak projekt potrebuje, in začeli raziskovati različne generatorje zvoka. Preverili smo forume, si ogledali priporočila in nato začeli testirati vsako orodje.
Odličen video zvok se ne začne v računalniku. Začne se v vaši glavi. Najprej, ugotovi čustva svoje zgodbe Vsak prizor ima drugačen pridih, na primer miren, energičen ali skrivnosten. Ko veste, kakšen občutek želite doseči, lahko zvok oblikujete tako, da ga ustvarite, namesto da ga dodate le kot zadnji korak.
Ustvarjanje zvoka za vaše videoposnetke je zdaj preprostejše, zahvaljujoč umetni inteligenci. Ni vam več treba iskati po neskončnih knjižnicah zvokov. Preprosto opišite čustvo, prizor ali vzdušje, ki ga poskušate ustvariti, umetna inteligenca pa bo ustvarila zvok namesto vas. Če boste opisali natančno, boste dosegli najboljše rezultate.
Isto pravilo velja za glasove. Izberite glas ki se ujema s slogom vašega videoposnetka: močan, jasen glas za vadnico; mehak, počasen glas za žalostno zgodbo; ali energičen glas za hiter posnetek. Zahvaljujoč umetni inteligenci ti glasovi zdaj zvenijo naravno in resnično ter se popolnoma ujemajo z vašim videoposnetkom.
Ko imate glasovno podajanje in zvočne učinke, se pravo delo začne med montažo. Prilagajanje glasnosti, časa in načina, kako se zvoki ujemajo z videoposnetkom, pomaga, da se vse zdi naravno in živo. Tudi majhne podrobnosti - rahel šum v ozadju, tih odmev ali rahle prilagoditve izenačevalnika - lahko ustvarijo občutek, kot da zvok resnično pripada prizoru.
Navsezadnje, za odličen zvok ni pomembno le orodje, ki ga uporabljate. Gre za to, da poznate razpoloženje in sporočilo svojega videa Ko razumete zgodbo in občutek, ki ga želite prenesti, vam umetna inteligenca preprosto pomaga, da ga izrazite. Oblikovanje zvoka preneha biti tehnični problem in postane nemoten del procesa pripovedovanja zgodbe.
| Kaj storiti | Česa ne smete storiti |
|---|---|
|
✔️ Preden ustvarite zvok, določite razpoloženje in občutek videoposnetka.
|
❌ Ne začnite ustvarjati zvoka, ne da bi vedeli, kakšno vzdušje želite.
|
|
✔️ Napišite podrobna navodila z jasnimi opisi.
|
❌ uporabljajte kratkih ali nejasnih pozivov, kot sta »glasba v ozadju« ali »glas«.
|
|
✔️ slog govora in tempo, ki ustreza vizualnim elementom in sporočilu.
|
❌ uporabljajte istega tona glasu za vsak projekt.
|
|
✔️ Pri zvoka prilagodite čas, glasnost in mešanje.
|
❌ dodajajte zvokov, ne da bi jih sinhronizirali z videoposnetkom.
|
|
✔️ Dodajte majhne ambientalne zvoke, da bo prizor videti pristen.
|
❌ Zvok naj ne bo prazen ali preveč čist.
|
|
✔️ Uporabite umetno inteligenco kot orodje za podporo svoji ustvarjalnosti.
|
❌ pričakujte, da bo umetna inteligenca opravila vse ustvarjalno delo namesto vas
|
Ko sem prvič odprl program Videoposnetek Adobe Firefly, nisem bil prepričan, kaj lahko pričakujem. Veliko sem že slišal o njem, vendar nikoli nisem zares raziskal, kaj zmore – še posebej, ker sem običajno zvoke in glasovne posnetke ročno iskal v knjižnicah shranjenih datotek.
Odločil sem se, da ga preizkusim pri projektu, ki se mi je zdel težaven: dramatičen prizor osebe, ki se ob sončnem zahodu sprehaja skozi prazno mesto. Običajno bi dolgo časa iskal po zvočnih knjižnicah korake, veter in mehko mestno vzdušje – in tudi takrat bi verjetno na koncu naletel na nekaj, kar se mi ni zdelo povsem prav.
V ta generator zvočnih učinkov sem vnesel podroben poziv: »Odmev korakov v mirni mestni ulici ob sončnem zahodu, nežen veter, v daljavi šibke sirene, filmsko vzdušje.« V samo nekaj sekundah je ustvaril več zvočnih različic. Kakovost me je presenetila – koraki so imeli realističen tempo in težo, veter je ustvaril vzdušje, ne da bi karkoli preglasil, oddaljene sirene pa so dodale subtilno napetost. Rezultat se je zdel bogat in večplasten, ne kot en kratek zvok, ki se ponavlja over in znova.
Nato sem preveril, koliko lahko prilagodim zvok. V tej brezplačni programski opremi Adobe sem lahko spremenil moč vetra, dodal ali zmanjšal odmev, da bi se koraki zdeli bližje ali dlje, in celo ločil različne dele zvočne mešanice.
Zvok, ki ga je ustvaril Firefly, sem postavil neposredno v časovnico svojega videa. Popolnoma se je ujemal z vizualnimi elementi in prizor se je takoj zdel bolj resničen. Vmesnik je olajšal preizkušanje različnih različic – zvoke sem lahko ustvarjal, poslušal, prilagajal in menjal, ne da bi zapustil svoj delovni prostor za urejanje.
ElevenLabs sem preizkusil na prizoru, ki je potreboval pripoved za kratki dokumentarec. Napisal sem kratek opis želenega tona: miren, jasen in enakomeren. V samo nekaj sekundah je ElevenLabs ustvaril glasovno naracijo, ki je zvenela zelo naravno – ritem, poudarek in celo kratki vdihi so se zdeli realistični.
Glavna stvar, ki me je navdušila, je bila, kako enostavno sem lahko prilagodil glasovne podrobnosti. Hitrost, ton in poudarek sem lahko spreminjal brez uporabe zapletene brezplačne programske opreme za urejanje zvoka ki sem jo uporabljal prej. Za zvočne učinke sem poskušal dodati stvari, kot sta veter in rahel dež.
Čeprav je ElevenLabs zasnovan predvsem za glasove, so se ambientalni zvoki, ki jih je ustvaril, dobro ujemali z mojim videoposnetkom. Na splošno je ElevenLabs odlična izbira, če vaš projekt temelji predvsem na pripovedovanju, z možnostjo dodajanja nekaterih učinkov ozadja, kadar je to potrebno.
Nisem mislil, da bo canva močan pri ustvarjanju zvoka, vendar so se njegove zvočne funkcije z umetno inteligenco izkazale za zelo enostavne za uporabo. Naložil sem kratek promocijski posnetek in potreboval sem nežen zvok v ozadju - nežen vetrič in lahke zvoke zvonjenja, ki bi se ujemali z optimističnim razpoloženjem.
canva mi je omogočil vnos kratkega opisa in hitro je ustvaril več možnosti zvoka, ki sem si jih lahko predogledal in postavil neposredno na časovnico.
Glavna prednost je, kako enostavno in povezano se vse zdi. Ne potrebujete nobenih avdio veščin – umetna inteligenca vam ponuja več že pripravljenih zvočnih možnosti, ki jih lahko vstavite neposredno v svoj projekt Canva. Ni zasnovana za podrobno urejanje zvoka, temveč za hitro in priročno delo, kjer želite, da se zvok takoj ujema z vašimi vizualnimi elementi, kar je idealno za trženje in videoposnetke za družbena omrežja.
Najboljši del je, da lahko vse naredite v enem urejevalniku. Brez izvoza, preklapljanja med aplikacijami in brez uporabe ločenih Generatorji glasbe z umetno inteligenco. Za ustvarjanje hitre družabne vsebine je to neverjetno koristno.
SFX Engine se je obnesel kot uporaba profesionalnega generatorja zvočnih učinkov. Preizkusil sem ga z ustvarjanjem večplastnih znanstvenofantastičnih zvokov - laserskih strelov, udarcev kovin in nizkega brenčanja vesoljske ladje v ozadju. Orodje mi je omogočilo spreminjanje stvari, kot so višina tona, odmev in lokacija zvoka v prostoru, kar mi je dalo raven nadzora, ki jo običajno najdem le v popolnoma brezplačnih DAW-jih.
Najbolj presenetljivo je bilo, kako pristni so bili zvoki. Številna orodja umetne inteligence ustvarjajo ponavljajoče se ali ploske učinke, toda SFX Engine je ustvaril zvok, ki je zvenel bogato in kinematografsko, kot nekaj, kar bi bilo vzeto neposredno iz profesionalne filmske glasbe.
SFX Engine ni najboljši generator glasov z umetno inteligenco za ustvarjanje hitrih posnetkov za družbena omrežja. Namenjen je ustvarjalcem, kot so filmski ustvarjalci, animatorji in razvijalci iger, ki si želijo popolnega nadzora in realističnega zvoka. Slaba stran je, da je za učenje potrebno nekaj časa in da potrebujete zmogljiv računalnik. Če pa želite zvok profesionalne kakovosti, je to eno najboljših orodij, ki so na voljo.
Uporaba LoudMe se je zdela kot pomočnik, ki že razume vzdušje, ki ga poskušam ustvariti. Montiral sem kavarno vlog in želel sem zvok v ozadju, ki bi bil pristen, a ne bi odvračal pozornosti - tihi pogovori, kavni avtomati, lahki zvoki posode.
Vtipkal sem opis okolja in v nekaj sekundah mi je LoudMe ponudil več različic, med katerimi sem lahko izbiral. Vsaka je imela drugačno raven hrupa in tona v ozadju. Izbral sem tisto, ki je zvenela najbolj naravno, in jo vstavil v svoj posnetek – popolnoma se je ujemala brez dodatnih prilagoditev.
Najboljše pri tem je bilo to, da je ta programska oprema za glasovno obdelavo samodejno predlagala pravo ravnovesje glasnosti glede na zvok mojega videa. Ni mi bilo treba ročno prilagajati zvoka v ozadju in govora.
Ni najnaprednejša možnost za podrobno urejanje zvoka, je pa odlična za hitre in realistične rezultate. Za vlogerje, ustvarjalce ali vse, ki delajo hitro, LoudMe zagotavlja čisto, naravno vzdušje skoraj brez dodatnega dela.
OptimizerAI se mi je zdel zanimiv, ker trdi, da ustvarja zvok, ki se samodejno prilega vizualnim elementom. Želel sem preveriti, ali lahko dejansko analizira videoposnetek in ustvari zvok, ki se ujema s prizorom. Na forumih sem videl tudi ljudi, ki pravijo, da dobro deluje pri ustvarjanju animiranih glasov, zato sem želel preizkusiti tudi to.
Naložil sem kratek prizor bitke iz enega od svojih projektov – hitre strele, udarce z meči in težke korake. OptimizerAI je samodejno prebral čas in gibanje v videoposnetku. Nato je, ko sem vnesel kratek poziv, kot je »intenzivno srednjeveško bojno vzdušje«, ustvaril zvočne učinke, ki so se takoj ujemali z dogajanjem.
Najbolj me je presenetilo, kako je umetna inteligenca samodejno sinhronizirala zvoke z dogajanjem – koraki so se ujemali z gibanjem, trki so natančno odmevali na gugalnicah, odmev v ozadju pa se je naravno spreminjal. Skoraj mi ni bilo treba ničesar prilagajati.
KlingAI je narejen za ustvarjalce, ki si želijo zvoka, ki se zdi domiseln in neresničen. Preizkusil sem ta generator glasov z umetno inteligenco overgenerator na sanjski animaciji in potreboval zvok, ki se zdi mehak in lebdeč. Napisal sem kratek poziv: »nežni zvončki z globokimi brenčečimi toni in počasnimi, valovitimi impulzi.«
Nekaj sekund kasneje je KlingAI proizvedel zvoke, ki so bili skoraj živi. Niso zveneli kot običajni učinki, ki bi jih našli na tipičnih spletnih mestih z glasbo brez avtorskih honorarjev. Namesto tega so imeli globino in vzdušje. Združil sem nekaj ustvarjenih posnetkov in končni rezultat se je zdel izviren – nekaj, kar nisem mogel dobiti iz standardne zvočne knjižnice.
KlingAI ni zasnovan za naravna ali dobesedna zvočna okolja – osredotoča se na izrazen, atmosferski zvok. Najbolje deluje za umetniške uvodne posnetke, prehode razpoloženja ali eksperimentalne filme, kjer želite nekaj čustvenega in izrazitega.
Kompromis je v tem, da se rezultati lahko razlikujejo in boste morda morali nekajkrat ponoviti postopek, da dobite točno želeni občutek. Ko pa se rezultat poravna, je rezultat nekaj resnično posebnega.
Genny sem preizkusil med delom na 2D animacijskem projektu, ki je imel več kratkih prizorov. Potreboval sem vrsto zvokov, kot so koraki, odpiranje vrat, smeh in mestni hrup v ozadju, vendar nisem imel časa, da bi ustvaril vsak zvok posebej.
Gennyjeva funkcija paketnega ustvarjanja me je resnično presenetila. Vnesel sem več pozivov hkrati in v enem samem prehodu je ustvaril veliko zvočnih učinkov. Vsi zvoki so se dobro ujemali in so bili že uravnoteženi in jasni, kar je redko pri uporabi programske opreme za umetniško inteligenco brez dodatnega urejanja.
Zasnovan je za hitro in gladko delovanje. Preklapljanje med različnimi zvočnimi različicami ni vzelo skoraj nič časa, tako da sem lahko preizkusil možnosti, ne da bi prekinil postopek urejanja.
Genny ni namenjen poglobljenemu, podrobnemu urejanju zvoka, je pa odličen za animatorje, YouTuberje in manjše ustvarjalce, ki potrebujejo veliko kakovostnega zvoka v nekaj minutah. Je enostaven za uporabo, zanesljiv in prihrani veliko časa.
Ta generator zvoka z umetno inteligenco me je navdušil bolj, kot sem pričakoval. Vmesnik je preprost in se osredotoča le na pretvorbo besedila v zvok. Vtipkal sem preprost opis, »dež na kovinski strehi z nežnim grmenjem v daljavi«, in v samo nekaj sekundah je ustvaril verjeten, uporaben zvočni posnetek.
Najbolj mi je bila všeč enostavna uporaba – brez namestitve, brez zapletenih kontrol. Deluje kar v brskalniku, tako da lahko vsakdo začne takoj. Zvok, ki ga je ustvaril, je bil jasen in naraven, z dobro globino in ravnovesjem tonov.
Vsekakor ni zasnovan za celovito oblikovanje zvoka ali kompleksno miksanje - bolj je namenjen ustvarjalcem, ki potrebujejo hiter, takojšen zvok. Na koncu sem ga uporabljal za hitre montaže, kratke družabne videoposnetke in začasne zvočne nadomestke v večjih projektih.
V bistvu je to najlažji način za začetek uporabe umetne inteligence za zvok. Idealno za začetnike ali vse, ki si želijo hitrih rezultatov in ne poglobljenega nadzora. In če ga uporabljate skupaj z DAW-jem za začetnike, lahko postane presenetljivo močna postavitev.
Na FixThePhoto smo preizkusili najbolj priljubljene programe za ustvarjanje zvočnih učinkov z umetno inteligenco, da bi ugotovili, kateri dejansko delujejo tako dobro, kot je oglaševano. Ideja je bila preprosta – ugotoviti, ali lahko ta orodja realno skrajšajo čas, porabljen za ročno oblikovanje in urejanje zvoka, z uporabo umetne inteligence za učinkovitejše ustvarjanje zvoka.
postopek testiranja je bil mešanica tehničnega preverjanja in ustvarjalne presoje. Vsak član naše ekipe (Nataly Omelchenko, Tata Rossi in Kate Debela) je orodja preizkusil s svojega profesionalnega vidika.
Nataly, specializirana za montažo videoposnetkov in vizualno pripovedovanje zgodb, se je osredotočila na to, kako dobro se je zvok, ki ga ustvari umetna inteligenca, ujemal z dejanskimi posnetki. Naložila je različne posnetke, kot so popotniške sekvence, posnetki življenjskega sloga, čustveni mini filmi, in ocenila, ali se zvoki ujemajo s tempom, razpoloženjem in dogajanjem na zaslonu.
Tata se je osredotočila na to, kako realistični in uravnoteženi so bili zvoki. Poslušala je, kako so različne plasti delovale skupaj, ali sta glasnost in ton zvenela naravno in ali se zvok ujema z videom brez veliko dodatnega popravljanja. Opazila je tudi, katera orodja so bila boljša za ustvarjanje splošnega vzdušja v ozadju in katera so bila bolj uporabna za ostre, podrobne zvočne učinke.
Kate pa se je osredotočila na to, kako enostavno je uporabljati orodja. Preverila je, kako hitro vsako orodje za zvok umetniške ustvarilo zvok, ali so bili kontrolniki preprosti za razumevanje in kako gladko je bilo mogoče zvoke dodati programom za urejanje videa. Ogledala si je tudi, kako dobro orodja delujejo za začetnike, ki nimajo izkušenj z oblikovanjem zvoka.
Skupaj smo preizkusili vsak generator zvoka z umetno inteligenco v resničnih, vsakodnevnih montažnih situacijah. Uporabili smo iste videoposnetke (od tihih uličnih prizorov do hitrih, akcijskih posnetkov) in primerjali, kako se vsako orodje odziva na isti opis ali razpoloženje. Nekateri generatorji so nas navdušili z bogatim, večplastnim, kinematografskim zvokom, drugi pa so izstopali predvsem zaradi hitrosti in enostavnosti uporabe.
Med testiranjem nismo ocenjevali le, kako dobro je zvenel končni zvok. Preverili smo tudi, kako enostavno se vsako orodje vključi v običajni delovni proces ustvarjalca. Razlike so bile zelo očitne: Firefly se je gladko zlival z drugimi programi Adobe, ElevenLabs je ustvaril glasove, ki so zveneli neverjetno realistično, SFX Engine je omogočal zelo natančen nadzor zvoka, medtem ko se je Canva osredotočil na hitro in preprosto ustvarjanje zvoka z minimalnim naporom.
Ko smo končali s testiranjem, je bilo očitno, da ni enega popolnega orodja umetne inteligence za vsako situacijo – vsako deluje najbolje za različne potrebe. Kar je resnično izstopalo, je to, kako napreden je postal zvok umetne inteligence. Rezultati so bili pogosto presenetljivo naravni in ustvarjalni, zato smo bili navdušeni nad tem, kako se bodo ta orodja v prihodnosti še izboljševala.