ฉันทำงานตัดต่อวิดีโอมานานแล้ว แต่การออกแบบเสียงเป็นส่วนที่ยากที่สุดสำหรับฉันเสมอ ฉันใช้เวลาหลายชั่วโมงในการหาเอฟเฟกต์เสียงที่ใช่ ไม่ว่าจะเป็นเสียงหวือหวา เสียงเตาผิงแตก หรือเสียงพื้นหลังเบาๆ แต่ก็ยังหาเสียงที่ใช่ไม่ได้อยู่ดี ไลบรารีเสียงส่วนใหญ่มีราคาแพงเกินไป พื้นฐานเกินไป หรือบางทีก็ไม่ค่อยตรงใจ
สัปดาห์ที่แล้ว ฉันกำลังทำวิดีโอท่องเที่ยวสั้นๆ อยู่ ภาพพร้อมแล้ว ทั้งสี ตัดต่อ และทรานซิชั่นดูดี แต่พอได้ดูแล้วกลับรู้สึกจืดชืด ไม่มีบรรยากาศอะไรเลย นั่นแหละคือจุดที่ทำให้ฉันคิดได้ว่า ฉันไม่ได้ต้องการแค่เสียงประกอบ แต่ฉันต้องการเสียงที่ช่วยเสริมเรื่องราว
ฉันจึงเริ่มค้นหาเครื่องกำเนิดเสียง AI ที่สามารถเข้าใจสิ่งที่ฉันต้องการได้ แทนที่จะให้เอฟเฟกต์เสียงแบบสุ่ม
นี่คือสิ่งที่ฉันต้องการ:
หลังจากทดลองใช้เครื่องมือหลายอย่าง ผมก็พบว่าแพลตฟอร์มที่เรียกว่า "AI" ส่วนใหญ่ก็แค่นำไลบรารีเสียงเดิมมาใช้ซ้ำ แต่มีเครื่องมือหนึ่งที่โดดเด่นกว่า นั่นคือมันสร้างเสียงจากพรอมต์นั้นเอง เมื่อผมก้าวเข้าไปใน "ประตูโลหะเก่าๆ ที่เปิดออกอย่างช้าๆ ในโถงทางเดินมืดๆ" เสียงนั้นก็ให้ความรู้สึกสมจริง มีรายละเอียด และเข้ากับฉากของผมได้อย่างลงตัว
เป็นครั้งแรกที่ฉันไม่ต้องดิ้นรนเพื่อให้เสียงเข้ากับวิดีโอของฉัน แต่ฉันกำลังสร้างเสียงให้เข้ากับเรื่องราวของฉัน
ตอนนี้ แทนที่จะเสียเวลาหลายชั่วโมงในการค้นหาในคลังเสียง ฉันเพียงแค่บรรยายเสียงที่ฉันต้องการ เช่น "เสียงฝนกระทบกระจกเบาๆ ในตอนเย็น" และ AI จะสร้างมันขึ้นมาภายในไม่กี่วินาที
ฉันตัดสินใจเลือกเครื่องมือที่ดีที่สุดสำหรับตัวเองและแบ่งปันในบทความนี้ เพื่อให้ได้ผลลัพธ์ที่ดีที่สุด ฉันจึงขอความช่วยเหลือจากเพื่อนร่วมงานจาก ทีมงาน FixThePhoto เราเลือกโปรเจกต์หลายโปรเจกต์ บางส่วนมาจากงานประจำของฉัน และบางส่วนเป็นวิดีโอไลฟ์สไตล์สำหรับโซเชียลมีเดียที่เพื่อนร่วมงานสร้าง
เราจดบันทึกสิ่งที่แต่ละโครงการต้องการและเริ่มสำรวจเครื่องกำเนิดเสียงแบบต่างๆ เราตรวจสอบฟอรัม ดูคำแนะนำ และเริ่มทดสอบเครื่องมือแต่ละชิ้น
เสียงวิดีโอที่ยอดเยี่ยมไม่ได้เริ่มต้นจากคอมพิวเตอร์ แต่มันเริ่มต้นจากหัวของคุณ อันดับแรก ค้นหาอารมณ์ของเรื่องราวของคุณ แต่ละฉากมีบรรยากาศที่แตกต่างกันออกไป เช่น สงบ มีพลัง หรือลึกลับ เมื่อคุณรู้ถึงความรู้สึกที่ต้องการแล้ว คุณก็สามารถออกแบบเสียงเพื่อสร้างมันขึ้นมาได้ แทนที่จะเพิ่มมันเข้าไปเป็นขั้นตอนสุดท้าย
การสร้างเสียงสำหรับวิดีโอของคุณง่ายขึ้นด้วย AI คุณไม่จำเป็นต้องค้นหาจากคลังเสียงมากมายอีกต่อไป เพียงแค่ บรรยายอารมณ์ ฉาก หรือบรรยากาศที่คุณพยายามสร้าง แล้ว AI จะสร้างเสียงให้คุณเอง การระบุรายละเอียดให้ชัดเจนจะช่วยให้คุณได้ผลลัพธ์ที่ดีที่สุด
กฎเดียวกันนี้ใช้ได้กับเสียงด้วย เลือกเสียง ที่เข้ากับสไตล์วิดีโอของคุณ: เสียงที่หนักแน่นและชัดเจนสำหรับวิดีโอสอน, เสียงที่นุ่มนวลและช้าสำหรับเรื่องราวเศร้า หรือเสียงที่กระฉับกระเฉงสำหรับคลิปวิดีโอที่ดำเนินไปอย่างรวดเร็ว ด้วยระบบ AI เสียงเหล่านี้จึงฟังดูเป็นธรรมชาติและสมจริง เข้ากับวิดีโอของคุณได้อย่างลงตัว
หลังจากมีเสียงพากย์และเอฟเฟกต์เสียงแล้ว งานจริงจะเกิดขึ้นระหว่างการตัดต่อ การปรับระดับเสียง จังหวะ และความลงตัวของเสียงกับวิดีโอ ช่วยให้ทุกอย่างดูเป็นธรรมชาติและมีชีวิตชีวา แม้กระทั่ง รายละเอียดเล็กๆ น้อยๆ - เสียงรบกวนพื้นหลังเบาๆ เสียงสะท้อนเบาๆ หรือการปรับ EQ เล็กน้อย สามารถทำให้เสียงรู้สึกเหมือนเป็นส่วนหนึ่งของฉากจริงๆ
ท้ายที่สุดแล้วการได้รับเสียงที่ดีไม่ได้ขึ้นอยู่กับเครื่องมือที่คุณใช้เพียงอย่างเดียว มันเกี่ยวกับการรู้ถึงอารมณ์และข้อความของวิดีโอของคุณ เมื่อคุณเข้าใจเรื่องราวและความรู้สึกที่ต้องการถ่ายทอด AI ก็จะช่วยให้คุณถ่ายทอดออกมาได้อย่างง่ายดาย การออกแบบเสียงจะไม่เป็นปัญหาทางเทคนิคอีกต่อไป และกลายเป็นส่วนหนึ่งของกระบวนการเล่าเรื่องที่ราบรื่น
| สิ่งที่ควรทำ | สิ่งที่ไม่ควรทำ |
|---|---|
|
✔️ กำหนดอารมณ์และความรู้สึกของวิดีโอของคุณก่อนที่จะสร้างเสียง
|
❌ เพิ่งเริ่มสร้างเสียงโดยไม่รู้ว่าคุณต้องการบรรยากาศแบบใด
|
|
✔️ เขียนคำแนะนำโดยละเอียดพร้อมคำอธิบายที่ชัดเจน
|
❌ ใช้คำกระตุ้นสั้นๆ หรือคลุมเครือ เช่น "เพลงประกอบ" หรือ "เสียง"
|
|
✔️ เลือกสไตล์เสียงและจังหวะที่เหมาะสมกับภาพและข้อความ
|
❌ อย่าใช้โทนเสียงเดียวกันในทุกโครงการ
|
|
✔️ ปรับจังหวะ ระดับเสียง และการผสมเสียงเมื่อแก้ไขเสียง
|
❌ อย่าใส่เสียงโดยไม่ซิงค์กับวิดีโอ
|
|
✔️ เพิ่มเสียงรอบข้างเบาๆ เพื่อให้ฉากดูสมจริง
|
❌ อย่าปล่อยให้เสียงรู้สึกว่างเปล่าหรือสะอาดเกินไป
|
|
✔️ ใช้ AI เป็นเครื่องมือเพื่อสนับสนุนความคิดสร้างสรรค์ของคุณ
|
❌ อย่าคาดหวังว่า AI จะทำทุกอย่างที่สร้างสรรค์แทนคุณ
|
ตอนที่ผมเปิด วิดีโอ Adobe Firefly ขึ้นมาครั้งแรก ผมไม่แน่ใจว่าจะคาดหวังอะไรได้บ้าง ผมเคยได้ยินคนพูดถึงมันมาเยอะ แต่ไม่เคยได้สำรวจว่ามันทำอะไรได้บ้าง โดยเฉพาะอย่างยิ่งเมื่อปกติผมต้องค้นหาเสียงและคำบรรยายด้วยตนเองในคลังภาพ
ฉันเลือกที่จะลองถ่ายโปรเจกต์ที่ยากสำหรับฉันมาตลอด นั่นคือฉากดราม่าของคนเดินในเมืองร้างยามพระอาทิตย์ตกดิน ปกติแล้วฉันจะใช้เวลาค้นหาเสียงฝีเท้า เสียงลม และบรรยากาศเมืองอันนุ่มนวลในคลังเสียงนานมาก ถึงอย่างนั้น ฉันก็ยังรู้สึกว่ามันไม่ค่อยลงตัวอยู่ดี
ผมใส่คำใบ้โดยละเอียดลงในเครื่องสร้างเอฟเฟกต์เสียงนี้: "เสียงฝีเท้าสะท้อนบนถนนในเมืองที่เงียบสงบยามพระอาทิตย์ตกดิน ลมพัดเอื่อยๆ เสียงไซเรนแผ่วเบาอยู่ไกลๆ ให้อารมณ์แบบภาพยนตร์" ในเวลาเพียงไม่กี่วินาที เสียงก็สร้างเสียงได้หลายเวอร์ชัน คุณภาพเสียงทำให้ผมประหลาดใจ เสียงฝีเท้ามีจังหวะและน้ำหนักที่สมจริง เสียงลมสร้างบรรยากาศโดยไม่กลบเสียงใดๆ และเสียงไซเรนที่อยู่ไกลๆ ก็เพิ่มความตึงเครียดอย่างละเอียดอ่อน ผลลัพธ์ที่ได้ให้ความรู้สึกที่เข้มข้นและมีหลายชั้น ไม่เหมือนเสียงสั้นๆ ซ้ำๆ กัน overand ซ้ำๆ กัน
จากนั้นฉันก็ตรวจสอบว่าฉันสามารถปรับเสียงได้มากแค่ไหน ฉันสามารถเปลี่ยนความแรงของเสียงลมใน Adobe ฟรี เพิ่มหรือลดเสียงสะท้อนเพื่อทำให้เสียงฝีเท้าดูเหมือนใกล้หรือไกลออกไป และแม้แต่แยกส่วนต่างๆ ของมิกซ์เสียง
ฉันใส่เสียงที่สร้างโดย Firefly ลงในไทม์ไลน์วิดีโอของฉันเลย เสียงมันเข้ากับภาพได้อย่างลงตัว และฉากก็ดูสมจริงขึ้นทันที อินเทอร์เฟซทำให้การลองใช้เวอร์ชันต่างๆ เป็นเรื่องง่าย ฉันสามารถสร้าง ฟัง ปรับแต่ง และสลับเสียงได้โดยไม่ต้องออกจากพื้นที่ทำงานตัดต่อเลย
ฉันทดสอบ ElevenLabs ในฉากหนึ่งที่ต้องมีคำบรรยายสำหรับสารคดีสั้น ฉันเขียนคำอธิบายสั้นๆ อธิบายโทนเสียงที่ต้องการ นั่นคือ สงบ ชัดเจน และหนักแน่น ในเวลาเพียงไม่กี่วินาที ElevenLabs ก็สร้างเสียงบรรยายที่ฟังดูเป็นธรรมชาติมาก ทั้งจังหวะ การเน้นเสียง และแม้แต่ลมหายใจเบาๆ ก็ให้ความรู้สึกสมจริง
สิ่งสำคัญที่ทำให้ฉันประทับใจคือฉันสามารถปรับรายละเอียดเสียงได้ง่ายเพียงใด ฉันสามารถเปลี่ยนความเร็ว โทนเสียง และการเน้นได้โดยไม่ต้องใช้ การตรวจสอบแก้ไขเสียงฟรี ที่ซับซ้อนใดๆ ที่ฉันเคยใช้มาก่อน สำหรับเอฟเฟกต์เสียง ฉันลองเพิ่มสิ่งต่างๆ เช่น ลมและฝนปรอยๆ
แม้ว่า ElevenLabs จะออกแบบมาสำหรับเสียงเป็นหลัก แต่เสียงแวดล้อมที่สร้างขึ้นก็เข้ากันได้ดีกับวิดีโอของฉัน โดยรวมแล้ว ElevenLabs เป็นตัวเลือกที่ยอดเยี่ยมหากโปรเจกต์ของคุณเน้นการบรรยายเป็นหลัก พร้อมตัวเลือกในการเพิ่มเอฟเฟกต์พื้นหลังเมื่อจำเป็น
ฉันไม่คิดว่า แคนวา จะแข็งแกร่งในการสร้างเสียง แต่ฟีเจอร์เสียง AI กลับกลายเป็นว่าใช้งานง่ายมาก ฉันอัปโหลดคลิปโปรโมตสั้นๆ และต้องการเสียงพื้นหลังที่นุ่มนวล เสียงลมเบาๆ และเสียงระฆังเบาๆ เพื่อให้เข้ากับอารมณ์ที่สนุกสนาน
canva อนุญาตให้ฉันป้อนคำอธิบายสั้นๆ และสร้างตัวเลือกเสียงหลายรายการอย่างรวดเร็วซึ่งฉันสามารถดูตัวอย่างและวางไว้บนไทม์ไลน์ได้เลย
ข้อดีหลักคือทุกอย่างเชื่อมต่อกันได้อย่างง่ายดาย คุณไม่จำเป็นต้องมีทักษะด้านเสียงใดๆ เพราะ AI มีตัวเลือกเสียงสำเร็จรูปมากมายให้คุณเลือกใช้ได้ทันทีในโปรเจกต์ Canva ของคุณ AI ไม่ได้ออกแบบมาเพื่อการตัดต่อเสียงอย่างละเอียด แต่ออกแบบมาเพื่องานที่รวดเร็วและสะดวกสบาย ที่คุณต้องการให้เสียงตรงกับภาพของคุณทันที ซึ่งเหมาะอย่างยิ่งสำหรับการทำการตลาดและวิดีโอโซเชียลมีเดีย
ส่วนที่ดีที่สุดคือคุณสามารถทำทุกอย่างได้ภายในโปรแกรมแก้ไขเดียว ห้ามส่งออก ห้ามสลับแอป และห้ามใช้ เครื่องกำเนิดเพลง AI สำหรับการสร้างเนื้อหาโซเชียลที่รวดเร็วนั้นมีประโยชน์อย่างเหลือเชื่อ
SFX Engine ให้ความรู้สึกเหมือนใช้เครื่องกำเนิดเอฟเฟกต์เสียงระดับมืออาชีพ ฉันลองใช้โดยสร้างเสียงไซไฟเป็นชั้นๆ เช่น ภาพเลเซอร์ การกระแทกของโลหะ และเสียงฮัมพื้นหลังของยานอวกาศต่ำ เครื่องมือนี้ให้ฉันเปลี่ยนสิ่งต่าง ๆ เช่น ระดับเสียงก้อง เสียงก้อง และตำแหน่งของเสียงในอวกาศ ทำให้ฉันมีระดับการควบคุมที่ปกติแล้วฉันจะพบได้เฉพาะใน DAW ฟรี
สิ่งที่โดดเด่นที่สุดคือเสียงที่ให้ความรู้สึกสมจริง เครื่องมือ AI จำนวนมากสร้างเอฟเฟกต์ซ้ำๆ หรือแบนๆ แต่ SFX Engine สร้างเสียงที่ฟังดูเข้มข้นและเหมือนภาพยนตร์ ราวกับเสียงที่นำมาจากซาวด์แทร็กภาพยนตร์ระดับมืออาชีพโดยตรง
SFX Engine ไม่ใช่เครื่องมือสร้างเสียง AI ที่ดีที่สุดสำหรับการสร้างคลิปโซเชียลมีเดียแบบรวดเร็ว แต่เหมาะสำหรับผู้สร้างภาพยนตร์ แอนิเมเตอร์ และนักพัฒนาเกมที่ต้องการการควบคุมที่ครบครันและเสียงที่สมจริง ข้อเสียคือต้องใช้เวลาเรียนรู้และต้องใช้คอมพิวเตอร์ที่ทรงพลัง แต่ถ้าคุณต้องการเสียงคุณภาพระดับมืออาชีพ นี่คือหนึ่งในเครื่องมือที่ดีที่สุดที่มีอยู่
การใช้ LoudMe ให้ความรู้สึกเหมือนมีผู้ช่วยที่เข้าใจบรรยากาศที่ฉันพยายามสร้างอยู่แล้ว ฉันกำลังตัดต่อร้านกาแฟ vlog และต้องการเสียงพื้นหลังที่ให้ความรู้สึกสมจริงแต่ไม่ดึงความสนใจไป เช่น เสียงสนทนาเบาๆ เสียงเครื่องชงกาแฟ เสียงจานเบาๆ
ฉันพิมพ์คำอธิบายสภาพแวดล้อมลงไป แล้วไม่กี่วินาที LoudMe ก็มีให้เลือกหลายเวอร์ชัน แต่ละเวอร์ชันมีระดับเสียงรบกวนและโทนเสียงพื้นหลังที่แตกต่างกัน ฉันเลือกเวอร์ชันที่ฟังดูเป็นธรรมชาติที่สุดแล้วนำไปใส่ในไฟล์ตัดต่อของฉัน ซึ่งเข้ากันได้อย่างลงตัวโดยไม่ต้องปรับแต่งอะไรเพิ่มเติม
ส่วนที่ดีที่สุดก็คือ ล่องเรือในทะเลเสียง จะแนะนำความสมดุลของระดับเสียงที่เหมาะสมตามเสียงของวิดีโอของฉันโดยอัตโนมัติ ฉันไม่จำเป็นต้องปรับเสียงพื้นหลังและคำพูดด้วยตนเอง
แม้จะไม่ใช่ตัวเลือกขั้นสูงที่สุดสำหรับการตัดต่อเสียงอย่างละเอียด แต่ก็เหมาะอย่างยิ่งสำหรับผลลัพธ์ที่รวดเร็วและสมจริง สำหรับวล็อกเกอร์ ครีเอเตอร์ หรือใครก็ตามที่ทำงานเร็ว LoudMe มอบบรรยากาศที่สะอาดตาและเป็นธรรมชาติโดยแทบไม่ต้องทำอะไรเพิ่มเติมเลย
OptimizerAI โดดเด่นสำหรับฉันเพราะมันอ้างว่าสร้างเสียงที่เหมาะกับภาพโดยอัตโนมัติ ฉันอยากจะดูว่ามันสามารถวิเคราะห์วิดีโอและสร้างเสียงที่เข้ากับฉากได้จริงหรือไม่ ฉันยังเห็นคนในฟอรั่มบอกว่ามันทำงานได้ดีกับ สร้างเสียงการเคลื่อนไหว ฉันก็เลยอยากทดสอบเหมือนกัน
ฉันอัปโหลดฉากต่อสู้สั้นๆ จากโปรเจกต์หนึ่งของฉัน ซึ่งมีทั้งฉากยิงเร็ว ฉากฟันดาบ และเสียงฝีเท้าหนักๆ OptimizerAI จะอ่านจังหวะและการเคลื่อนไหวในวิดีโอโดยอัตโนมัติ จากนั้นหลังจากที่ฉันใส่คำสั่งสั้นๆ เช่น "บรรยากาศการต่อสู้ยุคกลางที่เข้มข้น" ระบบจะสร้างเสียงประกอบที่เข้ากับฉากต่อสู้ได้ทันที
สิ่งที่ทำให้ฉันประหลาดใจที่สุดคือการที่ AI ซิงค์เสียงเข้ากับฉากแอ็กชั่นโดยอัตโนมัติ เสียงฝีเท้าสอดคล้องกับการเคลื่อนไหว เสียงปะทะกระทบกับจังหวะการแกว่งพอดี และเสียงสะท้อนพื้นหลังก็เปลี่ยนไปอย่างเป็นธรรมชาติ ฉันแทบไม่ต้องปรับอะไรเลย
KlingAI สร้างขึ้นสำหรับครีเอเตอร์ที่ต้องการเสียงที่ให้ความรู้สึกเปี่ยมจินตนาการและเหนือจริง ผมได้ลองใช้ AI voice overgenerator นี้กับแอนิเมชันแสนฝัน และต้องการเสียงที่นุ่มนวลและล่องลอย ผมเขียนข้อความสั้นๆ ไว้ว่า "เสียงระฆังเบาๆ ที่มีเสียงฮัมทุ้มต่ำและเสียงพัลส์ช้าๆ เหมือนคลื่น"
ไม่กี่วินาทีต่อมา KlingAI ก็สร้างเสียงที่ให้ความรู้สึกเหมือนมีชีวิต ฟังดูไม่เหมือนเอฟเฟกต์ทั่วไปที่คุณพบใน เว็บเพลงใน ทั่วไป แต่กลับมีความลึกและบรรยากาศ ฉันรวมคลิปที่สร้างขึ้นสองสามคลิปเข้าด้วยกัน และผลลัพธ์สุดท้ายก็ให้ความรู้สึกแปลกใหม่ ซึ่งเป็นสิ่งที่ฉันไม่สามารถหาได้จากคลังเสียงมาตรฐาน
KlingAI ไม่ได้ออกแบบมาสำหรับสภาพแวดล้อมเสียงที่เป็นธรรมชาติหรือตามตัวอักษร แต่เน้นเสียงที่สื่ออารมณ์และบรรยากาศได้อย่างชัดเจน เหมาะที่สุดสำหรับเสียงเปิดแบบมีศิลปะ การเปลี่ยนอารมณ์ หรือภาพยนตร์แนวทดลองที่คุณต้องการอะไรที่ให้ความรู้สึกซาบซึ้งและโดดเด่น
ข้อเสียคือผลลัพธ์อาจแตกต่างกันไป และคุณอาจต้องสร้างใหม่หลายครั้งเพื่อให้ได้ผลลัพธ์ที่ต้องการ แต่เมื่อผลลัพธ์ออกมาสอดคล้องกัน มันจะมอบผลลัพธ์ที่พิเศษอย่างแท้จริง
ฉันลองใช้ Genny ตอนที่ทำโปรเจกต์แอนิเมชัน 2 มิติที่มีฉากสั้นๆ หลายฉาก ฉันต้องการเสียงที่หลากหลาย เช่น เสียงฝีเท้า เสียงเปิดประตู เสียงหัวเราะ และเสียงพื้นหลังเมือง แต่ฉันไม่มีเวลาสร้างเสียงแต่ละเสียงแยกกัน
คุณลักษณะแบบกลุ่มของ Genny ทำให้ฉันประหลาดใจจริงๆ ฉันป้อนข้อความแจ้งหลายรายการพร้อมกัน และสร้างเอฟเฟกต์เสียงมากมายในรอบเดียว เสียงทั้งหมดเข้ากันได้ดีและมีความสมดุลและชัดเจนอยู่แล้ว ซึ่งหาได้ยากเมื่อใช้ ฮาร์ดแวร์ของปัญญาประดิษฐ์ โดยไม่มีการแก้ไขเพิ่มเติม
มันถูกออกแบบมาให้ทำงานได้รวดเร็วและราบรื่น การสลับระหว่างเวอร์ชันเสียงต่างๆ ทำได้รวดเร็วมาก ดังนั้นฉันจึงสามารถทดสอบตัวเลือกต่างๆ ได้โดยไม่ต้องรบกวนกระบวนการตัดต่อ
Genny ไม่ได้ออกแบบมาเพื่อการตัดต่อเสียงที่ละเอียดและลุ่มลึก แต่เหมาะสำหรับแอนิเมเตอร์ ยูทูบเบอร์ และครีเอเตอร์รายย่อยที่ต้องการเสียงคุณภาพดีจำนวนมากภายในไม่กี่นาที ใช้งานง่าย เชื่อถือได้ และประหยัดเวลาได้มาก
เครื่องสร้างเสียง AI นี้สร้างความประทับใจให้ฉันมากกว่าที่คิดไว้ อินเทอร์เฟซใช้งานง่ายและเน้นแค่การแปลงข้อความเป็นเสียง ฉันพิมพ์คำอธิบายแบบง่ายๆ ว่า "ฝนตกบนหลังคาโลหะ มีเสียงฟ้าร้องเบาๆ อยู่ไกลๆ" และมันก็สร้างคลิปเสียงที่น่าเชื่อถือและใช้งานได้ภายในไม่กี่วินาที
สิ่งที่ฉันชอบที่สุดคือความใช้งานง่าย ไม่ต้องติดตั้ง ไม่ต้องควบคุมอะไรให้ยุ่งยาก ใช้งานได้ทันทีบนเบราว์เซอร์ ใครๆ ก็ใช้งานได้ทันที เสียงที่ได้ออกมาชัดเจน เป็นธรรมชาติ มีความลึกและสมดุลของโทนเสียงที่ดี
แน่นอนว่ามันไม่ได้ออกแบบมาสำหรับการออกแบบเสียงเต็มรูปแบบหรือการมิกซ์เสียงที่ซับซ้อน แต่เหมาะสำหรับครีเอเตอร์ที่ต้องการเสียงที่รวดเร็วและพร้อมใช้งานมากกว่า สุดท้ายผมใช้มันสำหรับการตัดต่อแบบรวดเร็ว วิดีโอสั้นๆ บนโซเชียลมีเดีย และการใช้เสียงชั่วคราวในโปรเจกต์ใหญ่ๆ
โดยพื้นฐานแล้วมันเป็นวิธีที่ง่ายที่สุดในการเริ่มใช้ AI สำหรับเสียง เหมาะสำหรับผู้เริ่มต้นหรือใครก็ตามที่ต้องการผลลัพธ์ที่รวดเร็วมากกว่าการควบคุมเชิงลึก และถ้าคุณใช้มันร่วมกับ DAW สำหรับการศึกษา ก็อาจกลายเป็นการตั้งค่าที่แข็งแกร่งอย่างน่าประหลาดใจ
ในงาน FixThePhoto เราได้ทดสอบโปรแกรมสร้างเอฟเฟกต์เสียง AI ยอดนิยมที่สุด เพื่อดูว่าโปรแกรมใดใช้งานได้ดีตามที่โฆษณาไว้ แนวคิดนี้ตรงไปตรงมา นั่นคือการค้นหาว่าเครื่องมือเหล่านี้สามารถลดเวลาในการออกแบบและตัดต่อเสียงด้วยตนเองได้อย่างสมจริงหรือไม่ โดยใช้ AI เพื่อช่วยสร้างเสียงได้อย่างมีประสิทธิภาพมากขึ้น
การทดสอบ เป็นการผสมผสานระหว่างการตรวจสอบทางเทคนิคและการตัดสินที่สร้างสรรค์ สมาชิกในทีมของเราแต่ละคน (Nataly Omelchenko, Tata Rossi และ Kate Debela) ทดสอบเครื่องมือจากมุมมองทางวิชาชีพของตนเอง
นาตาลี ผู้เชี่ยวชาญด้านการตัดต่อวิดีโอและการเล่าเรื่องด้วยภาพ ให้ความสำคัญกับประสิทธิภาพของเสียงที่สร้างโดย AI ว่าสอดคล้องกับภาพจริงหรือไม่ เธออัปโหลดคลิปต่างๆ เช่น ฉากการเดินทาง ภาพไลฟ์สไตล์ มินิฟิล์มอารมณ์ และประเมินว่าเสียงสอดคล้องกับจังหวะ อารมณ์ และฉากแอ็กชั่นที่ปรากฏบนหน้าจอหรือไม่
ทาทาเน้นที่ความสมจริงและความสมดุลของเสียง เธอฟังว่าเลเยอร์ต่างๆ ทำงานร่วมกันอย่างไร เสียงและโทนเสียงฟังดูเป็นธรรมชาติหรือไม่ และเสียงนั้นเข้ากับวิดีโอโดยไม่ต้องปรับแต่งอะไรมากนัก เธอยังสังเกตว่าเครื่องมือใดดีกว่าสำหรับการสร้างบรรยากาศพื้นหลังโดยรวม และเครื่องมือใดมีประโยชน์มากกว่าสำหรับเอฟเฟกต์เสียงที่คมชัดและมีรายละเอียด
ในทางกลับกัน Kate มุ่งเน้นไปที่ความง่ายในการใช้เครื่องมือ เธอตรวจสอบว่า เครื่องมือเสียง AI แต่ละตัวสร้างเสียงได้เร็วแค่ไหน การควบคุมนั้นเข้าใจง่ายหรือไม่ และสามารถเพิ่มเสียงลงในโปรแกรมตัดต่อวิดีโอได้อย่างราบรื่นเพียงใด เธอยังพิจารณาด้วยว่าเครื่องมือเหล่านี้ทำงานได้ดีเพียงใดสำหรับผู้เริ่มต้นที่ไม่มีประสบการณ์ในการออกแบบเสียง
เราทำงานร่วมกันเพื่อทดสอบเครื่องกำเนิดเสียง AI ทุกเครื่องในสถานการณ์การตัดต่อจริงในชีวิตประจำวัน เราใช้คลิปวิดีโอเดียวกัน (ตั้งแต่ฉากถนนที่เงียบสงบไปจนถึงช็อตแอ็คชั่นที่รวดเร็ว) และเปรียบเทียบว่าเครื่องมือแต่ละเครื่องตอบสนองต่อคำอธิบายหรืออารมณ์เดียวกันอย่างไร เครื่องกำเนิดเสียงบางเครื่องสร้างความประทับใจให้เราด้วยเสียงที่เต็มอิ่ม เต็มไปด้วยเลเยอร์ และให้ความรู้สึกเหมือนภาพยนตร์ ขณะที่เครื่องกำเนิดเสียงอื่นๆ โดดเด่นในเรื่องความเร็วและความสะดวกในการใช้งานเป็นหลัก
ระหว่างการทดสอบ เราไม่ได้ประเมินแค่เพียงว่าเสียงสุดท้ายนั้นดีแค่ไหนเท่านั้น แต่ยังพิจารณาด้วยว่าเครื่องมือแต่ละอย่างสามารถเข้ากับเวิร์กโฟลว์ปกติของผู้สร้างได้ง่ายเพียงใด ความแตกต่างนั้นชัดเจนมาก: Firefly ทำงานร่วมกับโปรแกรมอื่นๆ ของ Adobe ได้อย่างราบรื่น, ElevenLabs สร้างเสียงที่สมจริงอย่างเหลือเชื่อ, SFX Engine ช่วยให้ควบคุมเสียงได้อย่างแม่นยำ ขณะที่ Canva มุ่งเน้นไปที่การสร้างเสียงที่รวดเร็วและเรียบง่ายโดยใช้ความพยายามน้อยที่สุด
เมื่อทดสอบเสร็จ ก็เห็นได้ชัดว่าไม่มีเครื่องมือ AI ที่สมบูรณ์แบบสำหรับทุกสถานการณ์ แต่ละเครื่องมือก็ทำงานได้ดีที่สุดตามความต้องการที่แตกต่างกัน สิ่งที่โดดเด่นจริงๆ คือความก้าวหน้าของเสียง AI ผลลัพธ์ที่ได้มักจะเป็นธรรมชาติและสร้างสรรค์อย่างน่าประหลาดใจ และทำให้เราตื่นเต้นที่จะได้เห็นว่าเครื่องมือเหล่านี้จะพัฒนาต่อไปอย่างไรในอนาคต