“THAI SER” แพลตฟอร์ม AI ตรวจจับความรู้สึกผ่าน “เสียงภาษาไทย” ที่ SME ใช้ประโยชน์ได้

Share

Loading

ปรบมือดังๆ ให้ความสำเร็จของคนไทยเลยค่ะ เพราะเพิ่งมีข่าวที่น่าภาคภูมิใจว่า เอไอเอส และ สถาบันวิจัยปัญญาประดิษฐ์ประเทศไทย (AIResearch) ผนึกกำลังเพื่อพัฒนา THAI SER แพลตฟอร์มตรวจจับความรู้สึกจากเสียงภาษาไทย (Speech Emotion Recognition) ที่ใช้เวลาเก็บข้อมูลโดยละเอียดถึง 2 ปี จนแล้วเสร็จเป็นโซลูชั่นใหม่แกะกล่อง และเป็น Dataset ภาษาไทยชุดแรกของประเทศ!

ก่อนจะเป็น SER Dataset ความสำเร็จของคนไทยที่พูดภาษาไทย

อราคิน รักษ์จิตตาโภค หัวหน้าฝ่ายงานขับเคลื่อนนวัตกรรม บริษัท แอดวานซ์ อินโฟร์ เซอร์วิส จำกัด (มหาชน) หรือ Head of NEXT, AIS เกริ่นถึงการใช้ภาษาไทยที่จำกัดอยู่ในกลุ่มคนไทยว่า

อราคิน รักษ์จิตตาโภค หัวหน้าฝ่ายงานขับเคลื่อนนวัตกรรม
บริษัท แอดวานซ์ อินโฟร์ เซอร์วิส จำกัด (มหาชน) หรือ Head of NEXT, AIS

“ประเทศไทยมีประชากรมากกว่า 60 ล้านคน เราไม่สามารถรอให้แพลตฟอร์มจากต่างประเทศมาทำเสียงภาษาไทยได้ เพราะไม่สามารถขยายแบบ economy of scale เราจึงสร้าง AI ตรวจจับความรู้สึกจากเสียงภาษาไทยขึ้นมา เพื่อให้คนไทยนำไปต่อยอดได้ สิ่งที่เราทำไม่ได้เอาคำพูดมาแปลงเป็นภาษาไทย แต่เราตรวจจับความรู้สึกจากเส้นเสียงเวลาพูดภาษาไทย และพัฒนาจนเป็น THAI SER ชุดข้อมูลจำแนกอารมณ์จากเสียงพูดภาษาไทย”

ปกติแล้วนักพัฒนามักจะพัฒนาโปรแกรมโดยต่อยอดจากข้อมูลที่มีการพัฒนาเอาไว้แล้ว เช่น ภาษาอังกฤษ ที่ผ่าน NLP (Natural Language Processing) หรือ การประมวลผลภาษาธรรมชาติหรือภาษามนุษย์ เพื่อให้คอมพิวเตอร์เข้าใจภาษา ไม่ว่าจะเป็นการพิมพ์หรือการพูด แต่สำหรับภาษาไทยนั้น ยังไม่มีใครหรืองค์กรใดพัฒนาโซลูชั่นเอาไว้อย่างเป็นระบบ เอไอเอส จึงร่วมกับ สถาบันวิจัยเทคโนโลยีปัญญาประดิษฐ์ประเทศไทย พัฒนาระบบประมวลผลข้อมูลด้วย AI ขึ้น

สถาบันวิจัยเทคโนโลยีปัญญาประดิษฐ์ประเทศไทย เกิดจากความร่วมมือระหว่าง สถาบันวิทยสิริเมธี (VISTEC) และ สำนักงานส่งเสริมเศรษฐกิจดิจิทัล (depa) โดยได้รับการสนับสนุนจาก บริษัท แอดวานซ์ อินโฟร์ เซอร์วิส จำกัด (AIS)

“ภาษาไทยมีลักษณะที่แปลก อธิบายง่ายๆ ก็เรื่อง การตัดคำ เราพิมพ์ติดกันโดยไม่มีการเว้นวรรคแบบภาษาอังกฤษ ไม่มีจุดจบประโยคเหมือนภาษาอังกฤษ ดังนั้น เวลาที่เราจะประมวลผลภาษาไทยจึงมีความท้าทายมาก และบางทีสระหรือวรรณยุกต์ก็หายไป เนื่องจากภาษาอื่นไม่มีสระด้านบนด้านล่างแบบเรา นี่จึงเป็น Language Barrier สำคัญ”

อราคิน อธิบายเพิ่มเกี่ยวกับการพัฒนา AI ต่อว่า ต้องเริ่มจาก 1) การเก็บ Data 2) การป้อน Data ที่มากพอ 3) Data นั้นต้องมีคุณภาพ และยังบอกด้วยว่า ถือเป็นจังหวะดีที่ได้นักวิจัยจาก MIT มาร่วมจัดระบบระเบียบหรือ Cleansing Data ให้ตั้งแต่เริ่มต้น ทำให้ลดกระบวนการในส่วนนี้ลงไป

“เราเก็บ Data จากการอัดเสียงประโยคสนทนาทั่วไปในสตูดิโอ ‘อยากกินอะไร’ ‘ขี้เกียจไปทำงาน’ ‘มาเร็วจังเลยนะ’ จากนักแสดง 200 คน มาพูดเพื่ออัดและประเมินน้ำเสียง เช่น น้ำเสียงตัดพ้อ เขินอาย ประชด จนเป็น Dataset ที่รวมแล้วมี 28,000 ประโยค”

เมื่อได้ ชุดข้อมูล (Dataset) ทีมนักวิจัยไทยก็ร่วมพัฒนา ชุดข้อมูลจำแนกอารมณ์จากเสียงพูดภาษาไทย (THAI SER : Speech Emotion Recognition) โดยพัฒนาเทคโนโลยี AI เข้าสู่กระบวนการเรียนรู้ (Deep Learning) ซึ่งในโลกของ Deep Learning มีเพียงคอมพิวเตอร์หรือ Machine ที่เห็นแพทเทิร์น และสามารถเรียนรู้เหมือนที่มนุษย์เรียนรู้ซ้ำๆ แล้วเข้าใจมากขึ้น จากนั้นประยุกต์ใช้ในการประมวลผลสัญญาณเสียง เพื่อให้ระบบเข้าใจ คุณลักษณะของเสียง ที่บ่งบอกความแตกต่างของอารมณ์จากการพูดภาษาไทย

นักพัฒนา, สตาร์ทอัพ, ผู้ประกอบการ SME, ผู้ให้บริการ องค์กรและผู้สนใจสามารถศึกษารายละเอียดและดาวน์โหลดชุดข้อมูล THAI SER ไปพัฒนาต่อยอดได้ฟรี ทางเว็บไซต์ https://airesearch.in.th

THAI SER ตรวจจับอารมณ์แบบใดบ้าง

ชุดข้อมูล THAI SER สามารถจำแนกเสียงได้ 5 อารมณ์ ได้แก่ โกรธ, เศร้า, สุข, หงุดหงิด และปกติ โดยมีความแม่นยำอยู่ที่ 70% และมีความพร้อมที่จะใช้งานสูงถึง 80% ส่วนอีก 20% องค์กรหรือนักพัฒนาสามารถใช้เป็นแบบจำลองพื้นฐานในการพัฒนาระบบวิเคราะห์ให้มีความแม่นยำมากขึ้น และปรับให้เข้ากับสภาพแวดล้อมการทำงานจริงขององค์กรที่มีบริบทแตกต่างกัน

แม้ว่ากระบวนการทำ Dataset ภาษาไทยของ SER ซึ่งเป็นภาษาท้องถิ่นและใช้ในวงจำกัด แต่ด้วยความมุ่งมั่นจริงจังในการพัฒนาเทคโนโลยี ทำให้ SER ขึ้นแท่นระบบที่พัฒนาจาก Dataset ใหญ่เป็นอันดับ 3 ของโลก (Monolingual) ตามหลังอันดับ 1 และ 2 ที่เป็นภาษาอังกฤษ (ภาษาที่มีความเป็นสากลที่สุด) จากการรวบรวม Dataset ใน Podcast และ YouTube

เสียง & เทคโนโลยี AI เสริมแกร่งให้ Telco และธุรกิจอื่นอย่างไร

ในฐานะที่เอไอเอสเป็น Digital Service Provider และเห็นความสำคัญของการพัฒนา โครงสร้างพื้นฐาน AI ภาษาไทย โดยเฉพาะการตรวจจับอารมณ์จากเสียงภาษาไทย ซึ่งต้องการความเชี่ยวชาญเฉพาะด้านเสียงภาษาไทย และ Big Data มาสร้างแพลตฟอร์มให้ใช้งานได้จริง ดังนั้น ความร่วมมือระหว่างเอไอเอสกับ AIResearch ที่เกิดขึ้นนี้ จึงถือเป็นจุดเริ่มต้นของการสร้างระบบนิเวศให้ Deep Tech ในประเทศไทยได้เติบโตอย่างแข็งแกร่งและมีความสามารถทัดเทียมกับนานาชาติ

ซันเจย์ แอนดรูว์ โทมัส หัวหน้าคณะผู้บริหารด้านเทคโนโลยีสารสนเทศ เอไอเอส

เอไอเอส ได้เรียนรู้เทคโนโลยีตรวจจับอารมณ์ ร่วมกับ AIResearch และต่อยอดเพื่อใช้ในบริบทของบริษัท รวมถึงพัฒนาเป็นเครื่องมือให้ผู้ประกอบธุรกิจชาวไทยได้ใช้กันฟรีๆ ไม่มีค่าใช้จ่ายใดๆ ในประเด็นทางธุรกิจ ซันเจย์ แอนดรูว์ โทมัส หัวหน้าคณะผู้บริหารด้านเทคโนโลยีสารสนเทศ เอไอเอส อธิบายว่า เทคโนโลยี AI ในปัจจุบันนำมาใช้งานด้านภาษาอย่างกว้างขวาง โดยเฉพาะอย่างยิ่งภาษาอังกฤษ ซึ่งมีประโยชน์มากเมื่อนำมาใช้เพื่อ การสร้างความเข้าใจลูกค้า ผ่านทางอารมณ์และความรู้สึก โดยองค์กรธุรกิจสามารถประเมินสภาวะทางอารมณ์ของลูกค้า เพื่อนำไปใช้เป็นข้อมูลในการเพิ่มประสิทธิภาพด้านงานบริการได้ดียิ่งขึ้น ด้วยการพิจารณาจาก Customer insight ด้านอารมณ์ของลูกค้าที่มาจากการให้บริการด้านต่างๆ

“ตามปกติ การรับรู้อารมณ์ความรู้สึกของมนุษย์ เช่น เช้านี้อารมณ์ดีหรือไม่ดี แฮปปี้หรือไม่แฮปปี้ มนุษย์ด้วยกันจะรับรู้ได้อย่างเป็นธรรมชาติและอาจรอเวลาเพื่อพูดคุยในภายหลัง ซึ่งในกรณีของภาษาไทย จะมีบริบทเข้ามาเกี่ยวข้องในการสื่อความหมาย แต่การพัฒนา SER ให้จดจำเสียง ตรวจจับอารมณ์จากเสียงพูดได้ เป็นความก้าวหน้าอีกขั้นที่จะทำให้ภาคธุรกิจและผู้ประกอบการไทยเดินหน้าธุรกิจได้อย่างเข้าใจและแข็งแกร่งยิ่งขึ้น” ซันเจย์กล่าว

ประโยชน์ของการนำ THAI SER ไปใช้งานจริง

  • วิเคราะห์อารมณ์ของลูกค้า จาก ‘เสียงพูด’
  • จัดลำดับการให้บริการลูกค้า จาก ‘อารมณ์’ ของลูกค้า
  • มอบหมายสายลูกค้าให้กับ CSR ตามความสามารถในการรับมืออารมณ์ต่าง ๆ
  • ฝึกสอนและเตรียมความพร้อมให้กับ CSR ในการปฏิบัติงานจริง
  • ช่วยเพิ่มความสามารถในการเข้าใจสถานการณ์และเพิ่มโอกาสในการปิดการขาย

ซันเจย์ บอกเพิ่มว่า ธุรกิจธนาคาร การดูแลสุขภาพ การแพทย์ ประกัน ผู้ประกอบการ Startup, SME, นักพัฒนา ต่างก็ใช้ประโยชน์จาก SER ได้ พร้อมทั้งยกตัวอย่างการใช้งานใน AIS Call Center ว่า

“THAI SER ช่วยให้พนักงาน Call Center เข้าใจลูกค้า รับรู้อารมณ์และความต้องการได้ดียิ่งขึ้น ทั้งยังนำเสนอบริการหรือช่วยแก้ปัญหาได้อย่างรวดเร็ว เมื่อลูกค้าพึงพอใจ ประทับใจ พนักงานรับรู้ได้ ก็จะมีกำลังใจและมีความสุขในการทำงานมากขึ้น”

จากความสามารถในการตรวจจับอารมณ์จากเสียงภาษาไทย THAI SER จึงเป็นเครื่องมือที่เข้ามาช่วยสร้างความเข้าใจให้แก่ผู้ใช้งานชาวไทยและผู้ที่เกี่ยวข้องได้ ทั้งยังช่วยให้องค์กรน้อยใหญ่รับมือทุกความท้าทายแห่งยุคได้ดียิ่งขึ้น

แหล่งข้อมูล
https://www.salika.co/2021/03/12/ai-thai-ser-first-tool/