- OpenAI เปิดตัวเทคโนโลยีใหม่ Voice Engine ที่สามารถโคลนเสียงของบุคคลได้โดยใช้เวลาเพียง 15 วินาทีจากการบันทึกคำพูด
- ขณะนี้ยังไม่ได้เปิดตัวซอฟต์แวร์ในวงกว้าง เนื่องจากเกรงจะเกิดอันตรายจากการใช้งานในทางที่ผิด
- สังคมอเมริกันกังวลผลกระทบที่อาจเกิดขึ้นจากเทคโนโลยีโคลนเสียง โดยเฉพาะในการเลือกตั้งปี 2024 ซึ่งเคยเกิดกรณีการใช้ robocall เลียนแบบเสียงประธานาธิบดีโจ ไบเดน มาแล้ว
OpenAI เปิดแสดงเทคโนโลยีใหม่ที่สามารถโคลนเสียงของบุคคลได้ อึ้งใช้เสียงตัวอย่างแค่ 15 วินาที แต่บอกว่าจะยังไม่เผยแพร่สู่สาธารณะเนื่องจากปัญหาด้านความปลอดภัย
บริษัทปัญญาประดิษฐ์ OpenAI ผู้สร้าง ChatGPT ได้เปิดตัวเทคโนโลยีใหม่ล่าสุด Voice Engine เมื่อวันศุกร์ เพียงหนึ่งสัปดาห์หลังจากยื่นคำขอเครื่องหมายการค้าสำหรับชื่อนี้ บริษัทอ้างว่าสามารถสร้างเสียงของบุคคลขึ้นมาใหม่ได้โดยใช้เวลาเพียง 15 วินาทีจากการบันทึกคำพูดของบุคคลนั้น โดยบริษัทมีแผนที่จะส่งตัวอย่างกับผู้ทดสอบในช่วงแรก “แต่ยังไม่เผยแพร่เทคโนโลยี ในวงกว้างในขณะนี้” เนื่องจากเกรงจะเกิดอันตรายจากการใช้งานในทางที่ผิด
บริษัทระบุในบล็อกโพสต์ว่าได้ทดสอบ Voice Engine ในการใช้งานหลายอย่าง รวมถึงการช่วยอ่านสำหรับเด็ก การแปลภาษา และการฟื้นฟูเสียงสำหรับผู้ป่วยโรคมะเร็งแม้ผู้ใช้โซเชียลมีเดียบางรายออกมาวิจารณ์อย่างรุนแรง เพราะเกรงว่าจะมีการใช้งานในทางที่ผิด รวมถึงการฉ้อโกงที่อาจเกิดขึ้นโดยอาศัยการเลียนแบบเสียงโดยไม่ได้รับอนุญาต แต่ OpenAI กล่าวว่าขณะนี้ยังไม่ได้เปิดตัวซอฟต์แวร์ในวงกว้าง โดยกล่าวว่าได้พัฒนาผลิตภัณฑ์ดังกล่าวครั้งแรกตั้งแต่ปลายปี 2022 และได้นำไปใช้เบื้องหลังในผลิตภัณฑ์อื่นๆ บ้างแล้ว
“เรากำลังศึกษาแนวทางที่รอบคอบและหาข้อมูลก่อนจะเผยแพร่ในวงกว้าง เนื่องจากมีโอกาสที่จะมีการใช้เสียงสังเคราะห์ในทางที่ผิด” บริษัทกล่าวในโพสต์ที่ไม่ได้ลงนาม
“เราหวังว่าจะเริ่มการศึกษาเกี่ยวกับการใช้เสียงสังเคราะห์อย่างมีความรับผิดชอบ และวิธีที่สังคมจะปรับตัวเข้ากับเทคโนโลยีใหม่ๆ เหล่านี้” รายงานระบุ “จากผลลัพธ์ของการทดสอบขนาดเล็กและการแลกเปลี่ยนความคิดเห็นต่างๆ เราจะมีข้อมูลประกอบการตัดสินใจมากขึ้นว่าจะปรับใช้เทคโนโลยีนี้ในวงกว้างหรือไม่และอย่างไร”
อย่างไรก็ตาม สังคมอเมริกัน กำลังวิตกเรื่องผลกระทบที่อาจเกิดขึ้นจากเทคโนโลยีโคลนเสียง โดยเฉพาะในการเลือกตั้งปี 2024 ได้เกิดกรณีการใช้เสียงปลอมครั้งแรก ในนิวแฮมป์เชียร์ เมื่อเดือนมกราคมโดยใช้ robocall เลียนแบบประธานาธิบดีโจ ไบเดน เจ้าหน้าที่พรรคเดโมแครตยอมรับในภายหลังว่า เขาใช้เสียงปลอมโดยใช้ปัญญาประดิษฐ์ และความช่วยเหลือจากนักมายากลข้างถนนในนิวออร์ลีนส์ หลังจากการโทรครั้งนั้น Federal Communications Commission ลงมติเป็นเอกฉันท์ให้แบน robocalls AI ที่ไม่พึงประสงค์
กรณีนี้ เป็นหนึ่งในเหตุผลที่ทำให้ OpenAI รับทราบถึงความเสี่ยงทางการเมืองในบล็อกโพสต์
“เราตระหนักดีว่าการสร้างคำพูดที่คล้ายกับเสียงของผู้คนนั้นมีความเสี่ยงร้ายแรง ซึ่งเป็นเรื่องที่คำนึงถึงเป็นอันดับแรกในปีการเลือกตั้ง”
OpenAI ยืนยันว่าผู้ทดสอบ Voice Engine ในยุคแรกๆ ได้ตกลงที่จะไม่แอบอ้างเป็นบุคคลโดยไม่ได้รับความยินยอม และจะเปิดเผยว่าเสียงนั้นสร้างขึ้นจาก AI อย่างไรก็ตาม การยื่นคำขอเครื่องหมายการค้าเมื่อวันที่ 19 มีนาคม แสดงให้เห็นว่า OpenAI มีแนวโน้มที่จะเข้าสู่ธุรกิจการรู้จำเสียงพูดและระบบช่วยเสียงดิจิทัล ในที่สุด การปรับปรุงเทคโนโลยีดังกล่าวสามารถช่วยให้ OpenAI แข่งขันกับผลิตภัณฑ์ด้านเสียงอื่นๆ เช่น Alexa ของ Amazon ได้
ทั้งนี้ ผู้เชี่ยวชาญระบุว่า การหาวิธีตรวจจับและติดป้ายกำกับเนื้อหาที่สร้างโดย AI นั้นเป็นเรื่องยากสำหรับอุตสาหกรรมเทคโนโลยี วิธีแก้ปัญหาที่นำเสนอ เช่น “ลายน้ำ” ได้รับการพิสูจน์แล้วว่าสามารถลบหรือเปลี่ยนแปลงได้ง่าย
แหล่งข้อมูล