
រ៉ូបូត «ជំនួយការ» និយាយតប និងបញ្ចេញសារលើអេក្រង់។ ហេង ជីវ័ន
ភ្នំពេញ: មនុស្សនិយាយថា «ជម្រាបសួរ!» រ៉ូបូតតបថា «ជម្រាបសួរ!» មនុស្សបន្ដ «ជម្រាបលា!» រ៉ូបូតតបវិញថា «លាហើយ!» មនុស្សបន្ថែមថា «សួស្ដី!» រ៉ូបូតតបថា «សួស្ដី!» មនុស្សនិយាយ «កម្ពុជា» រ៉ូបូត តបជាសារថា «ពុំមាននៅក្នុងសំណុំទិន្នន័យ» មនុស្សបន្ដថា «ប្រទេសកម្ពុជា» រ៉ូបូតតបជាសារទៀតថា «ខ្ញុំស្រឡាញ់ប្រទេសកម្ពុជា»។
នេះជាការសន្ទនារវាងបុរសម្នាក់ដែលត្រូវបានឮចេញពីផ្ទៃក្រោយនៃវីដេអូ ជាមួយប្រអប់ពណ៌សមួយ រំលេចរូបភាពទង់ជាតិកម្ពុជា និងសំណេរពាក្យ «វិទ្យាស្ថានជាតិពហុបច្ចេកទេសកម្ពុជា» ជាមួយអេក្រង់តូចមួយទំហំ ៣,២ អ៊ិញ។
និស្សិត នី វីរៈបុរា ប្រធានក្រុមស្រាវជ្រាវរ៉ូបូតដែលមានសមាជិក ៣ នាក់ទៀត ប្រាប់ ភ្នំពេញ ប៉ុស្ដិ៍ថា៖ «យើងចង់បង្កើតជាប្រព័ន្ធទទួលស្គាល់សំឡេងស្វ័យប្រវត្ដិ ជាម៉ូដែលមួយ ដែលអាចបំប្លែងសំឡេងនិយាយភាសាខ្មែរទៅជាតួអក្សរខ្មែរនៅលើអេក្រង់ ដោយមិនចាំបាច់ភ្ជាប់អ៊ីនធឺណិត»។
ដោយសារតែសិក្សាជំនាញ programming និងទាក់ទង Artificial intelligence (AI) គួបផ្សំនឹងគំនិតផ្ដួចផ្ដើមរបស់គ្រូ និស្សិតដែលមានសមាជិក ៤ នាក់ រួមទាំងនិស្សិត ចំណោមនិស្សិត ជាតិ ជា, ជីង សុឃៀង និង នី ពិសិដ្ឋ បានសម្រេចផលិតប្រព័ន្ធទទួលស្គាល់ជាសំឡេងជាភាសាខ្មែរ។
រ៉ូបូត «ជំនួយការ» ដ៏តូចកម្ពស់តែ ២,២ តឹក ប្រតិបត្ដិការស្វ័យប្រវត្ដិភ្លាមៗ ក្រោយពេលចុចប៊ូតុង power ជាមួយនឹងសមត្ថភាពសន្ទនាជាភាសាខ្មែរ CMUSphinx ជាមួយសំណុំទិន្នន័យមានកំណត់នៅក្នុងដំណាក់កាលដំបូងនេះ។

លោក នី វីរៈបុរា ប្រធានក្រុមស្រាវជ្រាវរ៉ូបូត «ជំនួយការ» ជាសាស្ដ្រាចារ្យនៅវិទ្យាស្ថានពហុបច្ចេកទេសកម្ពុជា (NPIC)។ ហេង ជីវ័ន
លោក នី វីរៈបុរា ស្ថិតក្នុងមហាវិទ្យាល័យអេឡិចត្រូនិកបានបន្ដថា៖ «រ៉ូបូតអាចធ្វើការបំប្លែងសំឡេងនៃការនិយាយទៅជាអក្សរ។ ស្របពេលនេះ រ៉ូបូតអាចឆ្លើយទៅលើសំណួរដែលយើងបាននិយាយចោទសួរដូចគ្នា។ ដូច្នេះ យើងសួរជាភាសាខ្មែរ រ៉ូបូតឆ្លើយជាភាសាខ្មែរ និងបង្ហាញតួអក្សរនៅលើអេក្រង់ផងដែរ»។
ក្រៅពីការសហការគម្រោងជាមួយដៃគូឯកជន ដែលក្រុមនិស្សិតអាចមានសមត្ថភាពបំពេញតម្រូវការក្នុងការផលិតបច្ចេកវិទ្យាស្គាល់សំឡេងបម្រើការក្នុងក្រុមហ៊ុន រ៉ូបូត «ជំនួយការ» ត្រូវបានផលិតឡើងមានបំណងដាក់ឱ្យដំណើរការក្នុងវិស័យអប់រំជាចម្បង។
លោក បុរា ដែលបច្ចុប្បន្នក៏ជាសាស្ដ្រាចារ្យម្នាក់នៅវិទ្យាស្ថានជាតិពហុបច្ចេកទេសកម្ពុជា NPIC បានឱ្យដឹងថា៖ «យើងអាចប្រើរ៉ូបូតនេះក្នុងកម្រិតថ្នាក់មតេ្តយ្យ និងបឋមសិក្សា ដោយវាអាចឆ្លើយឆ្លង និងបង្ហាញរូប ឬវីដេអូបង្រៀនផ្សេងៗទៅដល់សិស្សានុសិស្ស»។
យ៉ាងណាមិញ ជាមួយសំណុំទិន្នន័យមានកំណត់ រ៉ូបូត ទើបត្រូវបានបញ្ចូលទិន្នន័យភាសាខ្មែរ ១៥៧ ពាក្យ សម្រាប់បង្កើតជាប្រយោគនិយាយតប។
សមត្ថភាពឆ្លើយឆ្លងសំណួររបស់រ៉ូបូត វាអាស្រ័យលើ database ដែលត្រូវបាន train។ Train ក្នុងន័យនេះ គឺជាការបង្វឹកមួយប្រភេទ តែមិនមែនសំដៅលើការនិយាយទៅកាន់រ៉ូបូតនោះទេ។ វាមានសមីការគណិតវិទ្យា និងចងសរសេរជាកូដរួមបញ្ចូល ដើម្បីស្វែងយល់អំពីសំណួរដែលចោទសួរ។
លោក បុរា បន្ដថា សំណួរដែលត្រូវបានដាក់សួរនេះ គឺជាសំណួរទូទៅ ដូចជា សួស្ដី! ជម្រាបសួរ! ជម្រាបលា! និងការសួរសុខទុក្ខអីជាដើម។
ដៃកាន់អង្អែលអេក្រង់ ដែលដើរតួនាទីជាមុខរ៉ូបូត លោក បុរា បានបន្ដថា៖ «រ៉ូបូតនេះ មិនខុសពីកូនក្មេងនោះទេ។ ដើម្បីឱ្យកូនក្មេងម្នាក់ស្គាល់ពាក្យ ទី១ យើងបង្ហាញអក្សរ បន្ទាប់មកទៀត យើងនិយាយឱ្យក្មេងស្ដាប់នូវពាក្យពេចន៍ត្រូវបានបញ្ចេញយ៉ាងដូចម្ដេច។ ប៉ុន្ដែ ម៉ាស៊ីនខុសពីមនុស្ស បើមនុស្សម្នាក់និយាយជាមួយនឹងម៉ាស៊ីន វាស្គាល់តែបុគ្គលនោះប៉ុណ្ណោះ។ ដូច្នេះ យើងត្រូវការបញ្ចូលទិន្នន័យច្រើន ដើម្បីបង្កើតប្រសិទ្ធភាពនៃការស្គាល់សំឡេងមនុស្សបានច្រើន»។
ពាក្យពេចន៍ចំនួន ១៥៧ នេះ បានមកពីអ្នកស្ម័គ្រចិត្ដបង្កើតទិន្នន័យនេះចំនួន ៨៥ នាក់ ដើម្បីឱ្យពួកគេនិយាយគ្រប់ពាក្យទាំងអស់។
លោក ស្រ៊ុន ចាន់ណារ៉េត សាស្ដ្រាចារ្យមហាវិទ្យាល័យ អេឡិចត្រូនិក នៃវិទ្យាស្ថាន NPIC ដែលបានដឹកនាំគម្រោងរ៉ូបូត «ជំនួយការ» ឱ្យដឹងថា៖ «សំឡេងមនុស្សជាង ៨០ នាក់នេះ សម្រាប់បង្វឹកឱ្យរ៉ូបូតស្គាល់សំឡេងភាសានិយាយមនុស្សទូទៅ។ បើយើង train តែមនុស្សម្នាក់ រ៉ូបូតប្រាកដជាស្គាល់សំឡេងរបស់មនុស្សតែម្នាក់ប៉ុណ្ណោះ»។
ថ្វីដ្បិតរ៉ូបូតនេះទើបស្គាល់ពាក្យចំនួន ១៥៧ តួអក្សរយ៉ាងណាក៏ដោយ ក៏វាមានសុក្រឹតភាពលើស ៩០ ភាគរយ។

លោក ស្រ៊ុន ចាន់ណារ៉េត សាស្ដ្រាចារ្យមហាវិទ្យាល័យអេឡិចត្រូនិកកំពុងបង្រៀនសិស្ស។ ហេង ជីវ័ន
យុវជន វ័យ ២២ ឆ្នាំរូបនេះ បញ្ជាក់ថា៖ «អ្វីដែលពិសេសសម្រាប់រ៉ូបូតយើងមួយនេះ គឺវាដំណើរការ (offline) ដោយមិនចាំបាច់ប្រើអ៊ីនធឺណិត។ ការប្រើប្រាស់ប្រព័ន្ធ offline ដោយសារវាដំណើរការបានលឿនជាង ហើយវាជា local computing ដែលដំណើរការទិន្នន័យនៅក្នុងរ៉ូបូតស្រាប់ ដោយមិនចាំបាច់ភ្ជាប់ដំណើរការទៅកាន់ servers ទេ»។
លោក បុរា បានអះអាងថា៖ «ឆាប់ៗខាងមុខនេះ យើងនឹងបង្កើតតួម៉ូដែលរ៉ូបូតថ្មីមួយទៀត និងធ្វើការអភិវឌ្ឍសូហ្វវែរថ្មី ដែលមានមុខងារជាជំនួយការសម្រាប់ប្រើប្រាស់ក្នុងក្រុមហ៊ុន ភោជនីយដ្ឋាន និងទីតាំងផ្ដល់សេវាកម្មផ្សេងៗ។ ចំពោះម៉ូដែលថ្មី តួរ៉ូបូតអាចតូចជាងនេះ និងចល័តងាយស្រួលជាងនេះ តែពង្រីកទំហំអេក្រង់រហូតដល់ ៧ អ៊ិញ»។
ដើម្បីឱ្យរ៉ូបូតនេះមានដំណើរការល្អពេញលេញ សាស្ដ្រាចារ្យដែលទើបវិវត្ដខ្លួនពីនិស្សិតរូបនេះ បានបន្ថែមថា នៅសល់ដំណាក់កាល ២ ធំៗទៀត។ ទី១ ការធ្វើបច្ចុប្បន្នភាពសូហ្វវែរ ដើម្បីឱ្យប្រព័ន្ធដំណើរការកាន់តែលឿន ហើយទី២ បង្កើនសមត្ថភាពឱ្យវាស្គាល់ពាក្យពេចន៍កាន់តែច្រើន។
លោក ណារ៉េត បានឱ្យដឹងថា៖ «បន្ដិចទៀត យើងបំពាក់កាមេរ៉ា ដើម្បីឱ្យវាមានសមត្ថ-ភាពស្គាល់មនុស្ស និងអាចហៅឈ្មោះចំៗ។ គម្រោងយើងមានច្រើន តែអ្វីដែលយើងខ្វះ គឺការជួយឧបត្ថម្ភសម្រាប់យើងស្រាវជ្រាវបន្ថែម»។
ក្រុមការងារជួបការលំបាកច្រើន ទាំងបញ្ហាហាដវែរ និងសូហ្វវែរ រវាងទ្រឹស្ដី និងការអនុវត្ដជាក់ស្ដែងដែលទាមទារពេលវេលាច្រើន៕