ฝึกฝนให้ AI เรียนรู้ด้วยการดูวิดีโอ แก้ปัญหาข้อมูลไม่เพียงพอ -

โลกรู้จัก AI มาตั้งแต่ประมาณปี 1950 หรือนานกว่าเจ็ดสิบปีมาแล้ว แต่ปัญญาประดิษฐ์เพิ่งจะมีความก้าวหน้าจริงๆเมื่อประมาณสิบปีที่ผ่านมานี้เอง เหตุผลใหญ่ที่ทำให้มีการเปลี่ยนผ่านครั้งใหญ่ เป็นเพราะความก้าวหน้าของคอมพิวเตอร์ที่ทำงานได้รวดเร็วขึ้น รองรับการคำนวณของข้อมูลจำนวนมากพร้อมๆกันได้

การเรียนรู้ของ AI เรียกว่า Machine Learning Model พอจะอธิบายวิธีการเรียนรู้ของมันให้เข้าใจง่ายๆ เช่น

– AI เรียนรู้ได้โดยมีผู้สอน ให้มันได้เห็นตัวอย่าง มีคำตอบที่ถูกต้องให้มัน เอาสีส้มให้มันดูบ่อยๆ เวลามันเห็นผลส้ม มันก็รู้ว่าเป็นสีส้ม

– AI เรียนรู้ได้โดยไม่มีใครสอน มันวิเคราะห์ข้อมูล จัดกลุ่ม ศึกษาความเป็นไปได้ แล้วหาคำตอบออกมาเอง

– AI เรียนรู้ได้ด้วยการลองผิดลองถูก เวลามันทำถูกจะได้รางวัล เวลามันทำผิดจะโดนลงโทษ เมื่อได้เรียนรู้มากๆ มันก็จะเก่งขึ้นเรื่อยๆ

– AI เรียนรู้จากการเลียนแบบ สามารถให้มันศึกษาเรียนรู้วิธีการทำงานที่ถูกต้องจากผู้เชี่ยวชาญ

– AI เรียนรู้จากการปรับปรุงรูปแบบ มันลองผิดลองถูกจากงานหนึ่ง แล้วเอาไปใช้อีกงานหนึ่งได้ มันคาดเดาออกว่าสิ่งที่มันได้ทำลงไป จะมีผลลัพธ์อะไรตามมา

นักวิทยาศาสตร์ วิศวกร โปรแกรมเมอร์ ที่ทำงานกับ AI ยังเจอปัญหาใหญ่เรื่องคอขวดข้อมูล

การฝึกฝนให้ปัญญาประดิษฐ์เรียนรู้มากขึ้น เรียนรู้เร็วขึ้น ต้องใช้เวลานาน ต้องพัฒนากันอีกมาก

OpenAI ที่มี อีลอน มัสก์ เป็นผู้ร่วมก่อตั้ง และวันนี้มี ไมโครซอฟต์ เป็นผู้ถือหุ้นใหญ่ ได้ค้นพบวิธีฝึกฝนให้ AI เรียนรู้เร็วขึ้น มีประสิทธิภาพมากขึ้น โดยให้มันเรียนรู้จากการดูวิดีโอ

ถ้าปล่อยให้มันเรียนรู้ด้วยตัวเองทั้งหมด คงเป็นไปไม่ได้ หรือถ้าเป็นไปได้ก็คงต้องใช้เวลานานมากๆ การใช้วิธีการแบบผสมผสานจะได้ผลดีกว่า

การฝึกฝนให้ AI เรียนรู้ด้วยการดูวิดีโอครั้งนี้ มีรายงานผลการศึกษาทางวิชาการตามลิงก์ https://arxiv.org/abs/2206.11795

OpenAI ฝึกฝนให้ AI กลายเป็นสุดยอดผู้เล่นเกม Minecraft แต่ผลสำเร็จคราวนี้ สามารถนำไปประยุกต์ใช้สำหรับงานอื่นๆอีกมากมาย

มีศัพท์เฉพาะเรียกวิธีการนี้ว่า Video PreTraining หรือ VPT เป็นการฝึกฝนให้ AI ดูวิดีโอจากผู้เล่นเกม Minecraft ทั่วโลกจำนวนมาก โดยในช่วงเริ่มต้น มีข้อมูลบางส่วนที่ AI เรียนรู้โดยมีการสอนให้มันทำ เลียนแบบจากคนที่ทำเป็น ส่วนที่เหลือให้มันลองผิดลองถูก คาดการณ์เอาเอง

กิจกรรมบางอย่างในเกม Minecraft อย่างเช่นการสร้างเครื่องมือเพชร หรือ Craft Diamond Tools ผู้เล่นเกมทั่วไปต้องใช้เวลามากกว่า 20 นาที หรือลองทำ 24,000 ครั้ง ถึงจะทำได้ แต่ AI เรียนรู้ได้ทันที

OpenAI เริ่มให้ AI เรียนรู้วิธีการใช้คีย์บอร์ดและเมาส์ของผู้เล่นเกมที่เป็นคน ระหว่างที่มันดูคนเล่น มันก็ดูผลลัพธ์ที่เกิดขึ้นบนจอไปพร้อมๆกัน ทำให้มันรู้ว่าจะควบคุมการทำงานของคอมพิวเตอร์ให้ได้ผลลัพธ์ดีๆตามที่ต้องการได้อย่างไร

หลังจาก AI รู้วิธีใช้เครื่องมือแล้ว เวลาที่มันดูวิดีโอการเล่นเกมจากหน้าจอที่มาจากทั่วโลก มันจะรู้ทันทีว่าเป็นผลมาจากการควบคุมคอมพิวเตอร์อย่างไร กดปุ่มไหน ความเร็วเท่าไร ใช้เมาส์อย่างไร ในที่สุดมันก็กลายเป็นผู้เล่นเกม Minecraft ที่เก่งที่สุดในโลก ซึ่งเป็นผลมาจากการฝึกฝน AI แบบผสมผสาน มีข้อมูลเพียงบางส่วนที่ต้อง Label ให้มันรู้วิธีทำ และให้มันเรียนรู้ต่อเนื่องด้วยการดูวิดีโอด้วยตัวมันเอง

ลองจินตนาการต่อไปว่า ถ้าเอารูปแบบการฝึกฝนนี้ไปใช้กับหุ่นยนต์หรือระบบควบคุมต่างๆ มันก็จะประสบความสำเร็จในทิศทางเดียวกัน หมอที่ใช้อุปกรณ์ผ่าตัดแบบรีโมท หากให้ AI ได้เห็นหมอเก่งๆที่ใช้เครื่องมือ แล้วได้ดูผลลัพธ์ที่เกิดขึ้นไปพร้อมๆกัน AI ก็จะกลายเป็นสุดยอดหมอผ่าตัดได้

นักบินเก่งๆที่กำลังขับเครื่องบิน ถือพวงมาลัย และใช้ปุ่มต่างๆมากมายในสถานการณ์ต่างๆ เมื่อ AI เห็นวิธีใช้เครื่องมือของนักบินและผลที่ตามมา มันจะรู้วิธีการทำงานที่ถูกต้อง AI สามารถเรียนรู้จากวิดีโอที่มันเห็นจากนักบินเก่งๆทั่วโลก AI จะรู้วิธีควบคุมเครื่องบินจนเป็นสุดยอดนักบิน

AI เรียนรู้จาก การสอน การเลียนแบบ ลองผิดลองถูก คาดการณ์สิ่งที่จะเกิดขึ้น โดยเรียนรู้จากภาพที่มันเห็นจากวิดีโอได้

เราเห็นความมหัศจรรย์มากมายจากผลงานของ AI แต่ถ้าย้อนไปดูตรรกะที่อยู่เบื้องหลัง มันมีเหตุผลอธิบายที่สามารถทำให้เข้าใจหลักการได้!!!

แหล่งข้อมูล

https://www.facebook.com/turakij4.0/photos/a.698141950343830/2419101244914550/