วช.เชิดชูเกียรติ ผู้พัฒนาคลังข้อมูลไทย รศ.ดร.วิโรจน์ อรุณมานะกุล เป็นนักวิจัยดีเด่นสาขาปรัชญาปี 66

Last updated: 6 เม.ย 2566  |  202 จำนวนผู้เข้าชม  | 

วช.เชิดชูเกียรติ ผู้พัฒนาคลังข้อมูลไทย รศ.ดร.วิโรจน์ อรุณมานะกุล เป็นนักวิจัยดีเด่นสาขาปรัชญาปี 66


เมื่อวันที่ 5 เมษายน 2566 ที่ผ่านมา สำนักงานวิจัยแห่งชาติ / นายเอนก บำรุงกิจ รองผู้อำนวยการงานวิจัยแห่งชาติ ให้เกียรติเป็นประธานเปิดงาน "นักวิจัยดีเด่นแห่งชาติสาขาปรัชญา นักวิจัยดีเด่นแห่งชาติประจำปี 2566 ครั้งที่3"  โดย รองศาสตราจารย์ ดร.วิโรจน์ อรุณมานะกุล อาจารย์ประจำภาควิชาภาษาศาตร์ คณะอักษรศาสตร์ และผู้อำนวยการ สถาบันภาษาไทยสิรินธร จุฬาลงกรณ์มหาวิทยาลัย เป็นนักวิจัยดีเด่นแห่งชาติสาขาปรัชญา ประจำปี 2566 ณ ศูนย์ข้อมูลสารสนเทศกลางด้านวิทยาศาสตร์ วิจัยและนวตกรรมของประเทศ อาคาร วช.8



นายเอนก กล่าวว่า "ภายใต้กระทรวง อว. มีภารกิจที่สำคัญในการยกย่อง เชิดชู ประกาศเกียรติคุณหรือยกย่องบุคคลหรือหน่วยงานด้านการวิจัยและนวัตกรรม โดยเป็นผลงานที่เป็นประโยชน์ต่อวงวิชาการส่วนรวม ซึ่งในปีนี้ วช. ได้มอบรางวัลนักวิจัยดีเด่นแห่งชาติ สาขาปรัชญา ประจำปี 2566 ให้แก่ รองศาสตราจารย์ ดร.วิโรจน์ อรุณมานะกุล แห่งสถาบันภาษาไทยสิรินธร จุฬาลงกรณ์มหาวิทยาลัย เป็นผู้พัฒนาคลังข้อมูลภาษาไทยแห่งชาติ รวมถึงคลังข้อมูลในภาษาต่างประเทศ เพื่อเป็นประโยชน์แก่ผู้ที่ทำการศึกษาค้นคว้าในการทำงานวิจัย ซึ่งถือเป็นเครื่องมือสำคัญที่ช่วยให้นักวิจัย รวมไปถึงนักศึกษาสามารถใช้เป็นเครื่องมือในการสืบค้นข้อมูลที่ต้องการได้ วช.จึงจัดให้มีการมอบรางวัลนักวิจัยดีเด่นแห่งชาติ เพื่อเป็นกำลังใจและเชิดชูเกียรติ ให้นักวิจัยไทยมืออาชีพที่ได้อุทิศตนให้กับการสร้างผลงานวิจัยที่มีคุณประโยชน์ต่อประชาชน สังคมและประเทศชาติจนเป็นที่ประจักษ์ และที่สำคัญต้องเป็นผู้ที่ได้รับการยอมรับยกย่องว่ามีจริยธรรมของนักวิจัย สมควรเป็นแบบอย่างแก่นักวิจัยผู้อื่นได้ต่อไป

รองศาสตราจารย์ ดร.วิโรจน์ อรุณมานะกุล นักวิจัยดีเด่นแห่งชาติ กล่าวว่า 

"ขอขอบคุณทางวช.ที่มอบรางวัลนี้ให้ สนใจหัวข้อนี้จึงเริ่มต้นศึกษาพอเริ่มต้นศึกษาก็เริ่มรู้สึกว่าเรายังไม่มีความรู้พอ ณ ตอนนั้นเรียนทางด้านวิศวะคอมพิวเตอร์ ก็คิดว่าน่าจะไปหากฏของภาษา กฏพวกนี้นำมาโค๊ดเป็นภาษาคอมพิวเตอร์ ตอนนั้นก็พยายามไปหาหนังสือทางภาษาศาสตร์มานั่งอ่าน แต่ยังไม่ได้สิ่งที่ต้องการ ไปขอคำปรึกษาจากอาจารย์เขามีหลักสูตรปริญญาโท ที่ให้เรียนต่อจึงตัดสินในไปเรียนต่อทางด้านนี้เพราะเป็นสิ่งที่อยากจะรู้จึงไปต่อที่จุฬาลงกรณ์มหาวิทยาลัย จากวิศวะมาเป็นภาษาศาสตร์พอได้เข้าไปเรียนแล้วจึงไ้ด้รู้ว่าภาษาศาสตร์เป็นวิทยาศาสตร์มากๆ"

"การทำงานวิจัยผลงานรวมๆ จะเป็นสองด้านด้านแรกคือการสร้างคลังข้อมูล ที่ต้องสร้างคลังข้อมูลเพราะในการทำวิจัยทั้งหลายปกติเราต้องทำข้อมูลสิ่งที่เราคิดว่าข้อมูล ตอนนั้นยังไม่มีการรวบรวมข้อมูลให้เป็นข้อมูลกลาง พอเรียนจบออกมาจึงเริ่มทำคลังข้อมูลจึงมีคลังข้อมูลภาษาไทย ภาษาอังกฤษอย่างเช่นการแปลเพื่อให้นักศึกษาที่เรียนการแปลได้มีข้อมูล อีกอย่างหนึ่งเป็นความสนใจของตัวเองตั้งแต่แรกอยู่แล้ว เริ่มทำตั้งแต่งานพื้นฐานภาษาไทยเวลาอ่าน ถ้าต้องการให้คอมพิวเตอร์ทำงานได้ต้องแยกคำให้มันก่อน ต้องพยายามแยกคำ ในแต่ละคำต้องหาว่าเป็นคำชนิดไหน คำประธาน กิริยา พอรู้ว่าเป็นคำชนิดไหนก็จะได้วิเคราะห์ของประโยคได้ รวมถึงการทำโปรแกรมข้อมูลภาษาไทยที่เขาต้องคีย์ข้อมูลบนเครื่องอุปกรณ์ที่นำมาจากต่างประเทศและไม่สามารถรับภาษาไทยได้ก็ต้องหาโปรแกรมที่จะแปลงชื่อหรือชื่อคนไข้ให้เป็นตัวอักษรภาษาอังกฤษและป้อนเข้าไป"

"เมื่อมีความรู้ตรงนี้แล้วจะทำอย่างไรให้คอมพิวเตอร์รู้เหมือนกับเรา เพราะเราอยากจะคุยกับคอมพิวเตอร์ให้รู้เรื่อง แนวทางการทำงานเราต้องพยายามเข้าใจกฎของภาษาแล้วไปโปรแกรมให้คอมพิวเตอร์เข้าใจภาษาไทยมีความซับซ้อนเวลาใส่เข้าไปในคอมพิวเตอร์ คอมพิวเตอร์วิเคราะห์ประโยคได้หลายๆ เริ่มมองว่าคอมพิวเตอร์จะตัดสินยังไง ก็เริ่มแก้ด้วยการเอาข้อมูลออกมาดูและใช้หลักสถิติ ข้อมูลมันคิดได้หลายแบบก็จะใช้หลักสถิติมาช่วยให้คอมพิวเตอร์ คอมพิวเตอร์จะทำงานได้ดีขึ้น"

 

"อีกส่วนหนึ่งคือการใช้การต่อประสาทเหมือนเซลล์มนุษย์และให้คอมพิเตอร์เรียนรู้ข้อมูลเมื่อป้อนข้อมูลเข้าไปก็จะไปประมวนความรู้ความเข้าใจและสามารถทำงานได้ ข้อเสียคือเราไม่รู้ว่าจะเกิดอะไรขึ้นเพราะมันเหมือนสมองเรา เรารู้ว่ามันทำงานได้แต่เราไม่รู้ว่ามันคิดยังไง นักคอมพิวเตอร์เคยคิดว่าสักวันหนึ่งเราจะไม่รู้ว่าเราคุยกับคอมพิวเตอร์หรือว่ากำลังคุยกับคน ตรงนี้เป็นสิ่งที่ท้าทายคำตอบของมันเหมือนคำตอบมนุษย์ คำตอบตรงนี้แยกได้ยากว่าเป็นคนหรือคอมพิวเตอร์เป็นคนตอบ"

"คอมพิวเตอร์ทำงานได้รอบด้านมันฉลาดขึ้นและทำให้มันฉลาดขึ้นเรื่อยๆ ก็พยายามทำให้มันล้อไปกับข้อมูล ต้องดึงข้อมูลพวกบทความ นวนิยาย นักเขียนซึ่งมีขั้นตอนในการขออนุญาตนักเขียนแล้วเอาไปทำเป็นหน้าเว็บให้เข้ามาใช้งานได้เข้าไปค้นหา"

"ในภาษาไทยมีคำว่าวันหน้า วันหลังซึ่งหมายถึงวันในอนาคตเหมือนกัน ทำไมมีสองคำนี้ใช้ต่างกันยังไง ยากเหมือนกันต้องพัฒนาและออกแบบคลังข้อมูลดึงออกมาแล้วสามารถดูข้อมูลวิเคราะห์ เวลาใช้คำมันไม่เหมือนกันภาษาไทยต้องเข้าใจก็จะใช้ได้อย่างถูกต้อง ก็ต้องศึกษาและวัจัย"

 

 

"

ยังได้ร่วมกับอาจารย์ผู้เชี่ยวชาญภาษาอังกฤษในการพัฒนาและสร้างคลังข้อมูลเทียบบทภาษาไทยและภาษาอังกฤษ เพื่อให้นักวิจัย นักศึกษา หรือผู้ที่สนใจสามารถสืบค้น เข้าถึงข้อมูล และตัวอย่างการแปลได้ ซึ่งคลังข้อมูลดังกล่าวได้เปิดให้บริการในรูปแบบสาธารณะ อาทิ โปรแกรมถอดอักษรไทยเป็นอักษรโรมัน โปรแกรมตัดคำภาษาไทย โปรแกรมถ่ายเสียงภาษาไทยเป็นสัทอักษร (Thai to IPA) โปรแกรมกำกับหมวดคำ โปรแกรมตัดหน่วยปริจเฉทพื้นฐาน หรือโปรแกรมเว็กเตอร์คำไทย (Thai word2vec) ปัจจุบัน โปรแกรมต่าง ๆ ที่พัฒนาได้รวมเป็นส่วนหนึ่งของ Python Package TLTK (Thai Language Toolkit) ที่คนทั่วไปสามารถติดตั้งและเลือกใช้งานโมดูลที่ต้องการได้และยังมีการพัฒนาเพิ่มเติมโมดูลการประมวลผลภาษาไทยต่าง ๆ อยู่อย่างต่อเนื่อง

 

 

 

 

 

 

Powered by MakeWebEasy.com
เว็บไซต์นี้มีการใช้งานคุกกี้ เพื่อเพิ่มประสิทธิภาพและประสบการณ์ที่ดีในการใช้งานเว็บไซต์ของท่าน ท่านสามารถอ่านรายละเอียดเพิ่มเติมได้ที่ นโยบายความเป็นส่วนตัว  และ  นโยบายคุกกี้