ทุกวันนี้เครื่องมือช่วยเหลือที่ขับเคลื่อนด้วยปัญญาประดิษฐ์นั้นมีมากมายไม่ว่าจะเป็นงานเขียน งานภาพ หรือแม้กระทั่งวิดีโอ ล่าสุดกลุ่มวิจัยจากหลากหลายสถาบัน ประกอบไปด้วย สถาบันมักซ์พลังค์เพื่อการวิจัยข้อมูล (Max-Planck-Institut für Informatik) สถาบันเทคโนโลยีแมสซาชูเซตส์ มหาวิทยาลัยเพนซิลเวเนีย ศูนย์วิจัยซาร์บรูกเคนเพื่อการวิจัยคอมพิวเตอร์วิทัศน์ ปฏิสัมพันธ์ และปัญญาประดิษฐ์ (The Saarbrücken Research Center for Visual Computing, Interaction & AI) และห้องวิจัยปัญญาประดิษฐ์ของกูเกิล (Google) ได้เปิดตัว DragGAN AI เครื่องมือสำหรับแก้ไขภาพด้วยปัญญาประดิษฐ์ ที่ทรงพลัง และสามารถสรรค์สร้างเรื่องราวในรูปได้ใหม่ทั้งหมด
เครื่องมือดังกล่าวมีลักษณะคล้ายกับโปรแกรมโฟโต้ชอป (Photoshop) แต่นำปัญญาประดิษฐ์มาประมวลผลและสร้างภาพตามความเข้าใจของพิวเตอร์วิทัศน์ผ่านปฏิสัมพันธ์กับผู้ใช้งานแบบคลิกเมาส์ลากวาง ซึ่งผู้ใช้จะสามารถมีปฏิสัมพันธ์กับภาพถ่ายได้ราวกับว่าภาพถ่ายมีลักษณะเป็นวัตถุสามมิติ
กล่าวคือ สามารถสั่งให้สัตว์ในภาพถ่ายลุกยืนหรือนั่งลงได้ สามารถบังคับคนในภาพถ่ายให้หันซ้ายหรือขวาได้ หรือสั่งหมุนวัตถุต่าง ๆ ปรับแสงและเงาตามที่ผู้ใช้งานต้องการ
เทคโนโลยีดังกล่าวเป็นการใช้พลังการประมวลผลคอมพิวเตอร์วิทัศน์ในลักษณะปัญญาประดิษฐ์ ซึ่งก่อนหน้านี้เราจะเห็นมันผ่านการทำวิดีโอในลักษณะ Deep Fake ที่ทำให้ภาพถ่ายใบหน้าบุคคลแสดงกิริยาท่าทางตามข้อมูลที่ป้อนเข้าไปได้ แต่ DragGAN AI นั้นมีจุดเด่นตรงที่มันสามารถเข้าใจวัตถุอื่น ๆ ได้ ไม่เพียงแต่ใบหน้าของมนุษย์ แถมการมีปฏิสัมพันธ์กับผู้ใช้ผ่านการคลิกลาก ทำให้เครื่องมือตัวนี้เข้าใจง่ายและมีโอกาสนำไปสู่การใช้งานในระดับการค้าได้ในเวลาอันรวดเร็ว
ทางทีมวิจัยได้เขียนและตีพิมพ์งานวิจัยตัวนี้ในชื่อ Drag Your GAN: Interactive Point-based Manipulation on the Generative Image Manifold และเตรียมนำเสนอผลงานในงานประชุม SIGGRAPH 2023 ที่จะจัดขึ้นในเดือนสิงหาคม ค.ศ. 2023 นี้
ที่มาข้อมูล: Max-Planck-Gesellschaft
ที่มาภาพ: Max Planck Institute
“รอบรู้ ดูกระแส ก้าวทันโลก” ไปกับ Thai PBS Sci & Tech