אני עובד עם עריכת וידאו כבר הרבה זמן, אבל עיצוב סאונד תמיד היה החלק הקשה ביותר עבורי. אני יכול לבלות שעות בחיפוש אחר אפקט הסאונד הנכון - בין אם זה סוווש דרמטי, פצפוץ אח או צליל רקע עדין - ועדיין לא למצוא אחד שמתאים. רוב ספריות הסאונד יקרות מדי, בסיסיות מדי, או פשוט לא ממש מתאימות.
בשבוע שעבר עבדתי על סרטון טיולים קצר. הוויזואליה הייתה מוכנה - הצבעים, החיתוכים והמעברים כולם נראו טוב - אבל כשצפיתי בו, הוא הרגיש שטוח. לא הייתה בו אווירה. ואז זה הכה בי: לא הייתי צריך רק אודיו ברקע, הייתי צריך סאונד שיתמוך בסיפור.
אז התחלתי לחפש מחולל צלילים מבוסס בינה מלאכותית שיוכל באמת להבין מה אני מבקש, במקום לתת לי אפקטים קוליים אקראיים.
הנה מה שרציתי:
לאחר שבדקתי מספר כלים, הבנתי שרוב פלטפורמות ה"בינה מלאכותית" (AI) פשוט משתמשות בספריות צלילים מקוריות. אבל כלי אחד בלט - הוא למעשה יצר את הצליל מההנחיה עצמה. כשנכנסתי ל"דלת מתכת ישנה שנפתחת באיטיות במסדרון חשוך", הוא יצר צליל שהרגיש אמיתי, מפורט ותאם בצורה מושלמת לסצנה שלי.
בפעם הראשונה, לא התקשיתי להתאים סאונד לסרטון שלי - עיצבתי את הסאונד לסיפור שלי.
עכשיו, במקום לבזבז שעות בחיפוש בספריות צלילים, אני פשוט מתאר את הצליל שאני רוצה - כמו "גשם רך שמקיש על זכוכית בערב" - והבינה המלאכותית יוצרת אותו תוך שניות.
החלטתי לבחור את הכלים הטובים ביותר עבורי ולשתף אותם במאמר זה. לשם כך, ביקשתי מעמיתיי מ- צוות FixThePhoto לעזור. בחרנו מספר פרויקטים - חלקם מעבודתי המקצועית וכמה סרטוני לייף סטייל למדיה חברתית שיצרו עמיתיי לעבודה.
רשמנו מה נדרש מכל פרויקט והתחלנו לחקור מגוון מחוללי צליל. בדקנו פורומים, בחנו המלצות, ואז התחלנו לבדוק כל כלי.
סאונד וידאו מעולה לא מתחיל במחשב. זה מתחיל בראש שלך. ראשית, להבין את הרגש של הסיפור שלך לכל סצנה יש אווירה שונה, כמו רוגע, אנרגיה או מסתורין. כשאתם יודעים את התחושה שאתם רוצים להשיג, אתם יכולים לעצב את הצליל כדי ליצור אותה, במקום רק להוסיף אותה כצעד אחרון.
יצירת סאונד לסרטונים שלכם פשוטה יותר עכשיו, הודות לבינה מלאכותית. אתם כבר לא צריכים לחפש בספריות סאונד אינסופיות. פשוט תאר את הרגש, הסצנה או האווירה שאתה מנסה ליצור, והבינה המלאכותית תבנה עבורך את הצליל. תיאור ספציפי ייתן לך את התוצאות הטובות ביותר.
אותו כלל עובד גם לגבי קולות. בחר קול שמתאים לסגנון הסרטון שלך: קול חזק וצלול להדרכה; קול רך ואיטי לסיפור עצוב; או קול אנרגטי לקליפ מהיר. הודות לבינה מלאכותית, הקולות האלה נשמעים כעת טבעיים ואמיתיים, ומתאימים בצורה מושלמת לסרטון שלך.
אחרי שסיימתם את הקריינות ואפקטים הקוליים, העבודה האמיתית מתרחשת במהלך העריכה. כוונון עוצמת הקול, התזמון וההתאמה של הצלילים לסרטון עוזר לגרום להכל להרגיש טבעי וחי. פרטים קטנים - רעש רקע קל, הד חלש או התאמות קלות ב-EQ - יכולים לגרום לאודיו להרגיש כאילו הוא באמת שייך לסצנה.
בסופו של דבר, קבלת סאונד מעולה אינה תלויה רק בכלים שבהם אתם משתמשים. זה עניין של להבין את האווירה והמסר של הסרטון שלך כשמבינים את הסיפור ואת התחושה שרוצים להעביר, בינה מלאכותית פשוט עוזרת לכם לבטא אותו. עיצוב הפסקול מפסיק להיות בעיה טכנית והופך לחלק חלק מתהליך סיפור הסיפור.
| מה לעשות | דברים שאסור לעשות |
|---|---|
|
✔️ החליטו על האווירה והתחושה של הסרטון שלכם לפני שאתם יוצרים את הסאונד.
|
❌ תתחילו לייצר אודיו בלי לדעת איזו אווירה אתם רוצים.
|
|
✔️ כתוב הנחיות מפורטות עם ברורים.
|
❌ תשתמשו בהנחיות קצרות או מעורפלות כמו "מוזיקת רקע" או "קול".
|
|
✔️ סגנון קולי וקצב שמתאימים לוויזואליה ולמסר.
|
❌ תשתמשו באותו טון דיבור לכל פרויקט.
|
|
✔️ כוונן את התזמון, עוצמת הקול והערבוב בעת עריכת צליל.
|
❌ תוסיף צלילים מבלי לסנכרן אותם עם הסרטון.
|
|
✔️ צלילי סביבה קטנים כדי לגרום לסצנה להרגיש אמיתית.
|
❌ תותירו את האודיו ריק או נקי מדי.
|
|
✔️ השתמשו בבינה ככלי לתמיכה ביצירתיות שלכם.
|
❌ תצפו שהבינה המלאכותית תעשה את כל העבודה היצירתית בשבילכם
|
כשפתחתי סרטון של אדובי פיירליי, בפעם הראשונה, לא הייתי בטוח למה לצפות. שמעתי הרבה דיבורים על זה, אבל אף פעם לא באמת חקרתי מה זה יכול לעשות - במיוחד מכיוון שבדרך כלל חיפשתי צלילים וקריינות באופן ידני בספריות קבצים.
בחרתי לנסות את זה בפרויקט שהיה לי קשה: סצנה דרמטית של אדם שהולך בעיר ריקה בשקיעה. בדרך כלל, הייתי מבלה זמן רב בחיפוש בספריות סאונד אחר צעדים, רוח ואווירה רכה של העיר - וגם אז, סביר להניח שהייתי מוצא משהו שלא הרגיש לי ממש נכון.
הזנתי הנחיה מפורטת לתוך מחולל אפקטי הקול הזה: "צעדים מהדהדים ברחוב עירוני שקט בשקיעה, רוח עדינה, סירנות חלשות מרחוק, אווירה קולנועית." תוך שניות ספורות בלבד, הוא יצר גרסאות צליל מרובות. האיכות הפתיעה אותי - לצעדים היה קצב ומשקל ריאליסטיים, הרוח יצרה אווירה מבלי להטביע דבר, והסירנות הרחוקות הוסיפו מתח עדין. התוצאה הרגישה עשירה ורב-שכבתית, לא כמו צליל קצר אחד שחוזר על עצמו over ומעלה.
ואז בדקתי כמה אני יכול להתאים את הסאונד. הצלחתי לשנות את מידת העוצמה של הרוח ב תוכנת אדובי חינמית זו, להוסיף או להפחית הד כדי לגרום לצעדים להיראות קרובים יותר או רחוקים יותר, ואפילו להפריד בין חלקים שונים של מיקס האודיו.
שמתי את הסאונד שנוצר על ידי Firefly ישירות בציר הזמן של הסרטון שלי. זה התאים בצורה מושלמת לוויזואליה, והסצנה הרגישה מיד אמיתית יותר. הממשק הקל על ניסיון גרסאות שונות - יכולתי ליצור, להאזין, להתאים ולהחליף צלילים מבלי לצאת מסביבת העבודה של העריכה שלי.
בדקתי את ElevenLabs על סצנה שדרשה קריינות לסרט תיעודי קצר. כתבתי הנחיה קצרה שתיארה את הטון שרציתי: רגוע, צלול ויציב. תוך שניות ספורות, ElevenLabs יצר קריינות שנשמעה טבעית מאוד - הקצב, הדגש ואפילו הנשימות הקטנות הרגישו מציאותיות.
הדבר העיקרי שהרשים אותי היה כמה בקלות יכולתי להתאים את פרטי הקול. יכולתי לשנות את המהירות, הטון והדגש מבלי להשתמש ב תוכנת עריכת אודיו בחינם מסובכת שהשתמשתי בה בעבר. לאפקטים קוליים, ניסיתי להוסיף דברים כמו רוח וגשם קל.
למרות ש-ElevenLabs מיועד בעיקר לקולות, צלילי הסביבה שהוא יצר התאימו היטב לסרטון שלי. בסך הכל, ElevenLabs היא בחירה מצוינת אם הפרויקט שלכם מסתמך בעיקר על קריינות, עם אפשרות להוסיף אפקטים ברקע בעת הצורך.
לא חשבתי ש קנבה תהיה חזקה ביצירת סאונד, אבל תכונות האודיו הבינה המלאכותית שלה התגלו כקלות מאוד לשימוש. העליתי סרטון פרומו קצר והייתי זקוקה לאודיו רקע עדין - בריזה רכה וצלילי צלצול קלים שיתאימו לאווירה האופטימית.
canva אפשר לי להזין תיאור קצר, והוא יצר במהירות מספר אפשרויות צליל שיכולתי לצפות בהן בתצוגה מקדימה ולמקם אותן ישירות על ציר הזמן.
היתרון העיקרי הוא כמה קל ומחובר הכל מרגיש. אינכם זקוקים למיומנויות שמע - הבינה המלאכותית נותנת לכם מספר אפשרויות סאונד מוכנות מראש שתוכלו למקם ישירות בפרויקט Canva שלכם. היא לא מיועדת לעריכת סאונד מפורטת, אלא לעבודה מהירה ונוחה שבה אתם רוצים שהאודיו יתאים לוויזואליה שלכם באופן מיידי, וזה מושלם לסרטוני שיווק ומדיה חברתית.
החלק הטוב ביותר הוא שאתה יכול לעשות הכל בתוך עורך אחד. אין ייצוא, אין החלפת אפליקציות ובלי שימוש נפרד גנרטורים של מוזיקה מבוססת בינה מלאכותית. ליצירת תוכן חברתי מהיר, זה מועיל להפליא.
מנוע SFX הרגיש כמו שימוש במחולל אפקטים קוליים מקצועי. ניסיתי אותו על ידי בניית צלילי מדע בדיוני מרובים - יריות לייזר, פגיעות מתכת וזמזום חללית חללית חללית חללית חללית. הכלי אפשר לי לשנות דברים כמו גובה צליל, הד, והיכן הצליל נמצא בחלל, מה שנתן לי רמת שליטה שאני בדרך כלל מוצא רק ב- DAWs בחינם.
החלק הבולט ביותר היה עד כמה הצלילים הרגישו אותנטיים. כלי בינה מלאכותית רבים מייצרים אפקטים חוזרים או שטוחים, אבל SFX Engine יצר אודיו שנשמע עשיר וקולנועי, כמו משהו שנלקח היישר מפסקול סרט מקצועי.
מנוע SFX אינו מחולל הקול הטוב ביותר מבוסס בינה מלאכותית ליצירת קליפים מהירים למדיה חברתית. הוא מיועד ליוצרים כמו יוצרי סרטים, אנימטורים ומפתחי משחקים שרוצים שליטה מוחלטת וסאונד ריאליסטי. החיסרון הוא שלוקח זמן ללמוד ודורש מחשב חזק. אבל אם אתם רוצים סאונד באיכות מקצועית, זהו אחד הכלים הטובים ביותר שקיימים.
השימוש ב-LoudMe הרגיש כמו עוזר שכבר מבין את האווירה שאני מנסה ליצור. ערכתי בית קפה vlog ורציתי אודיו ברקע שירגיש אמיתי אבל לא יסיט את תשומת הלב - שיחות שקטות, מכונות קפה, צלילי צלחות קלות.
הקלדתי תיאור של הסביבה, ובתוך כמה שניות, LoudMe נתן לי כמה גרסאות לבחור מהן. לכל אחת מהן הייתה רמת רעש רקע וטון שונים. בחרתי את זו שנשמעה הכי טבעית ושמתי אותה בעריכה שלי - היא התאימה בצורה מושלמת ללא התאמות נוספות.
החלק הטוב ביותר היה ש תוכנת קריינות הזו הציעה אוטומטית את איזון הווליום הנכון בהתבסס על האודיו של הסרטון שלי. לא הייתי צריך להתאים באופן ידני את צליל הרקע והדיבור.
זוהי לא האפשרות המתקדמת ביותר לעריכת סאונד מפורטת, אבל היא נהדרת לתוצאות מהירות וריאליסטיות. עבור וולוגרים, יוצרים או כל מי שעובד מהר, LoudMe מספק אווירה נקייה וטבעית כמעט ללא עבודה נוספת.
OptimizerAI בלטה לי במיוחד משום שהיא טוענת שהיא יוצרת אודיו שמתאים אוטומטית לוויזואליה. רציתי לראות אם היא באמת יכולה לנתח סרטון ולייצר צליל שמתאים לסצנה. ראיתי גם אנשים בפורומים שאומרים שהיא עובדת היטב כדי ליצור קולות מונפשים, אז רציתי לבדוק גם את זה.
העליתי סצנת קרב קצרה מאחד הפרויקטים שלי - יריות מהירות, מכות חרבות וצעדים כבדים. OptimizerAI קרא אוטומטית את התזמון והתנועה בסרטון. לאחר מכן, לאחר שהזנתי הנחיה קצרה כמו "אווירת קרב ימי-ביניימית אינטנסיבית", הוא יצר אפקטים קוליים שתואמים את הפעולה באופן מיידי.
מה שהפתיע אותי יותר מכל היה איך הבינה המלאכותית סנכרנה את הצלילים עם הפעולה בעצמה - צעדים התאימו לתנועה, ההתנגשויות פגעו בדיוק בנדנדות, והד הרקע השתנה באופן טבעי. כמעט ולא הייתי צריך לכוונן דבר.
KlingAI נועד ליוצרים שרוצים צליל שמרגיש דמיוני ולא מציאותי. ניסיתי את מחולל הקול over של בינה מלאכותית על אנימציה חלומית והייתי זקוק לאודיו שמרגיש רך וצף. כתבתי הנחיה קצרה: "צלצולים עדינים עם צלילי זמזום עמוקים ופעימות איטיות דמויי גל".
כמה שניות לאחר מכן, KlingAI הפיק צלילים שהרגישו כמעט חיים. הם לא נשמעו כמו אפקטים נפוצים שתמצאו ב אתרי מוזיקה ללא תמלוגים. במקום זאת, היו להם עומק ואווירה. שילבתי כמה מהקליפים שנוצרו, והתוצאה הסופית הרגישה מקורית - משהו שלא הצלחתי להשיג מספריית סאונד סטנדרטית.
KlingAI אינו מיועד לסביבות שמע טבעיות או מילוליות - הוא מתמקד בצליל אקספרסיבי ואטמוספרי. הוא עובד בצורה הטובה ביותר עבור פתיחות אמנותיות, מעברים בין מצבי רוח או סרטים ניסיוניים שבהם אתם רוצים משהו רגשי וייחודי.
החיסרון הוא שהתוצאות יכולות להשתנות, וייתכן שתצטרכו לבצע עיבוד מחדש מספר פעמים כדי לקבל את התחושה המדויקת הרצויה. אבל כשהפלט מתיישר, הוא מספק משהו באמת מיוחד.
ניסיתי את Genny בזמן שעבדתי על פרויקט אנימציה דו-ממדי שכלל כמה סצנות קצרות. הייתי צריך מגוון צלילים כמו צעדים, פתיחת דלתות, צחוק ורעשי רקע של העיר, אבל לא היה לי זמן ליצור כל צליל בנפרד.
תכונת האצווה של ג'ני באמת הפתיעה אותי. הזנתי כמה הנחיות בבת אחת, וזה הפיק אפקטים קוליים רבים במעבר אחד. כל הצלילים התאימו היטב וכבר היו מאוזנים וברורים, דבר נדיר כשמשתמשים ב בתוכנה בינה מלאכותית ללא עריכה נוספת.
הוא נועד לעבוד במהירות ובחלקות. המעבר בין גרסאות סאונד שונות לקח כמעט זמן קצר, כך שיכולתי לבדוק אפשרויות מבלי להפריע לתהליך העריכה שלי.
Genny לא מיועדת לעריכת סאונד עמוקה ומפורטת, אבל היא מושלמת לאנימטורים, יוטיוברים ויוצרים קטנים שצריכים הרבה אודיו באיכות טובה תוך דקות. היא קלה לשימוש, אמינה וחוסכת הרבה זמן.
מחולל הצלילים הזה, המבוסס על בינה מלאכותית, הרשים אותי יותר משציפיתי. הממשק פשוט ומתמקד רק בהפיכת טקסט לצליל. הקלדתי תיאור פשוט, "גשם על גג מתכת עם רעם רך במרחק", והוא יצר קטע שמע אמין ושימושי תוך שניות ספורות בלבד.
מה שאהבתי במיוחד היה כמה קל היה להשתמש בו - ללא התקנה, ללא פקדים מסובכים. הוא פועל ישירות בדפדפן, כך שכל אחד יכול להתחיל באופן מיידי. האודיו שהוא הפיק נשמע צלול וטבעי, עם עומק ואיזון צלילים טובים.
הוא בהחלט לא מיועד לעיצוב סאונד בקנה מידה מלא או למיקס מורכב - הוא מיועד יותר ליוצרים שצריכים אודיו מהיר ומוכן לשימוש. בסופו של דבר השתמשתי בו לעריכות מהירות, סרטונים קצרים ברשתות חברתיות וקבצי מיקום זמניים לסאונד בפרויקטים גדולים יותר.
זוהי בעצם הדרך הקלה ביותר להתחיל להשתמש בבינה מלאכותית לסאונד. אידיאלי למתחילים או לכל מי שרוצה תוצאות מהירות במקום שליטה עמוקה. ואם משתמשים בו יחד עם דאוו למתחלים, הוא יכול להפוך למערכת חזקה באופן מפתיע.
ב-FixThePhoto, בדקנו את יוצרי אפקטי הקול הפופולריים ביותר המבוססים על בינה מלאכותית כדי לראות אילו מהם באמת עובדים טוב כמו שמפורסם. הרעיון היה פשוט - לברר אם כלים אלה יכולים באופן ריאלי לקצר את הזמן המושקע בעיצוב ועריכה ידניים של סאונד על ידי שימוש בבינה מלאכותית כדי לסייע ביצירת אודיו בצורה יעילה יותר.
ניתוח הבדיקה היה שילוב של בדיקה טכנית ושיקול דעת יצירתי. כל אחד מחברי הצוות שלנו (נטלי אומלצ'נקו, טאטה רוסי וקייט דבלה) בדקו את הכלים מנקודת המבט המקצועית שלו.
נטלי, המתמחה בעריכת וידאו וסיפור סיפורים חזותי, התמקדה ביעילות התאמת האודיו שנוצר על ידי בינה מלאכותית לצילומים בפועל. היא העלתה מגוון קליפים כמו קטעי טיולים, צילומי לייף סטייל, מיני-סרטונים מרגשים, והעריכה האם הצלילים תואמים את הקצב, מצב הרוח והפעולה המתרחשים על המסך.
טאטה התמקדה במידת התחושה האמיתית והמאוזנת של הצלילים. היא הקשיבה לאופן שבו השכבות השונות פועלות יחד, האם עוצמת הקול והטון נשמעים טבעיים, ואם האודיו משתלב בסרטון ללא הרבה תיקונים נוספים. היא גם ציינה אילו כלים היו טובים יותר ליצירת אווירת רקע כללית ואילו מהם היו שימושיים יותר לאפקטים קוליים חדים ומפורטים.
קייט, לעומת זאת, התמקדה בכמה קל היה להשתמש בכלים. היא בדקה כמה מהר כל כלי שמע של בינה מלאכותיתהפיק צליל, האם הפקדים פשוטים להבנה, וכמה בצורה חלקה ניתן להוסיף את הצלילים לתוכנות עריכת וידאו. היא גם בדקה עד כמה הכלים עבדו עבור מתחילים שאין להם ניסיון בעיצוב סאונד.
עבדנו יחד כדי לבחון כל מחולל צליל מבוסס בינה מלאכותית במצבי עריכה אמיתיים ויומיומיים. השתמשנו באותם קטעי וידאו (מסצנות רחוב שקטות ועד צילומים מהירים ועמוסי אקשן) והשווינו כיצד כל כלי הגיב לאותו תיאור או מצב רוח. חלק מהמחוללים הרשימו אותנו עם צליל עשיר, רב-שכבתי וקולנועי, בעוד שאחרים בלטו בעיקר בזכות המהירות והקלות בשימוש.
במהלך הבדיקות, לא רק הערכנו את איכות הצליל הסופי. בדקנו גם כמה בקלות כל כלי יכול להשתלב בתהליך העבודה הרגיל של היוצר. ההבדלים היו ברורים מאוד: Firefly השתלב בצורה חלקה עם תוכנות אחרות של Adobe, ElevenLabs ייצרה קולות שנשמעו מציאותיים להפליא, SFX Engine אפשר שליטה מדויקת מאוד בסאונד, בעוד ש-Canva התמקדה ביצירת סאונד מהירה ופשוטה במאמץ מינימלי.
עד שסיימנו את הבדיקה, היה ברור שאין כלי בינה מלאכותית אחד מושלם לכל סיטואציה - כל אחד מהם עובד בצורה הטובה ביותר עבור צרכים שונים. מה שבאמת בלט הוא עד כמה מתקדם האודיו באמצעות בינה מלאכותית. התוצאות היו לעתים קרובות טבעיות ויצירתיות באופן מפתיע, וזה גרם לנו להתרגשות לראות כיצד הכלים הללו ימשיכו להשתפר בעתיד.