Module:km-pron/testcases/data stores the testcase data.
12 of 195 tests failed. (refresh)
Text | Expected | Actual | Differs at | |
---|---|---|---|---|
ក្បាល | kɓaːl | kɓaːl | ||
ស្អែក | sʔaek | sʔaek | ||
ផ្សេង | pʰseiŋ | pʰseːŋ | 23 | |
ល្មម | lmɔːm | lmɔːm | ||
ភ្ជុំ | pʰcum | pʰcum | ||
ម្នាស់ | mnŏəh | mnŏəh | ||
ផ្ទះ | pʰtĕəh | pʰtĕəh | ||
ខ្ញុំ | kɲom | kɲom | ||
ប្ដី | pɗəj | pɗəj | ||
ឆ្វេង | cʰʋeiŋ | cʰʋeːŋ | 23 | |
ហ្វឹក | fək | fək | ||
ឡាន | laːn | laːn | ||
ឃាត់ | kʰŏət | kʰŏət | ||
ខាត់ | kʰat | kʰat | ||
ញាំ | ɲŏəm | ɲŏəm | ||
ល្ហុង | lhoŋ | lhoŋ | ||
សព្វ (respelling: សប់) | sɑp | sɑp | ||
អ្នក (respelling: នាក់) | nĕəʔ | nĕəʔ | ||
លក់ | lŭəʔ | lŭəʔ | ||
សង្កាត់ | sɑŋ.ˈkat | sɑŋ.ˈkat | ||
ទម្ងន់ | tum.ˈŋŭən | tum.ˈŋŭən | ||
ម្ញ៉ិកម្ញ៉ក់ | mɲək.ˈmɲɑʔ | mɲək.ˈmɲɑʔ | ||
ប្រយ័ត (respelling: ប្រយ៉ាត់) | prɑ.ˈjat | prɑ.ˈjat | ||
បារី (respelling: បារ៉ី) | ɓaː.ˈrəj | ɓaː.ˈrəj | ||
កន្លែង (respelling: កន្ល៉ែង) | kɑn.ˈlaeŋ | kɑn.ˈlaeŋ | ||
ស្រលាញ់ (respelling: ស្រ-ល៉ាញ់, ស្រ'-ល៉ាញ់) | srɑ.ˈlaɲ, srə.ˈlaɲ | srɑ.ˈlaɲ, srə.ˈlaɲ | ||
គំនិត | kum.ˈnɨt | kum.ˈnɨt | ||
ត្រជាក់ | trɑ.ˈcĕəʔ | trɑ.ˈcĕəʔ | ||
ជណ្ដើរ | cŭən.ˈɗaə | cŭən.ˈɗaə | ||
ទំហំ (respelling: ទំហ៊ំ) | tum.ˈhum | tum.ˈhum | ||
វិហារ (respelling: វិហ៊ា) | ʋi.ˈhiə | ʋi.ˈhiə | ||
បវត្តិ (respelling: ប៉ៈវ័ត) | paʔ.ˈʋŏət | paʔ.ˈʋŏət | ||
ចេតនា (respelling: ចេតៈន៉ា) | cei.taʔ.naː | ceː.taʔ.naː | 21 | |
វេទនា (respelling: វេទៈនា) | ʋeː.tĕəʔ.niə | ʋei.tĕəʔ.niə | 21 | |
សំស្ក្រឹត (respelling: ស័ង-ស្ក្រិត, ស័ង-សៈក្រិត) | saŋ.ˈskrət, saŋ.saʔ.krət | saŋ.ˈskrət, saŋ.saʔ.krət | ||
បន្តក់ | ɓɑn.ˈtɑʔ | ɓɑn.ˈtɑʔ | ||
សាស្ត្រា (respelling: សាស-ស្ត្រា) | saːh.ˈstraː | saːh.ˈstraː | ||
បដិសេធ (respelling: ប៉ៈដិសែត) | paʔ.ɗe.saet | paʔ.ɗe.saet | ||
បរិយោសាន (respelling: ប៉ៈរ៉ិយ៉ោសាន) | paʔ.re.jao.saːn | paʔ.re.jao.saːn | ||
ភ្នែកមាន់ (respelling: ភ្នែក មាន់) | pʰnɛːk ˈmŏən | pʰnɛːk ˈmŏən | ||
ផ្សេងៗ (respelling: ផ្សេងផ្សេង) | pʰseiŋ.ˈpʰseiŋ | pʰseːŋ.ˈpʰseːŋ | 23 | |
កញ្ញា (respelling: ក័ញ្ញ៉ា) | kaɲ.ˈɲaː | kaɲ.ˈɲaː | ||
ភ្នំពេញ (respelling: ភ្នំ ពេញ) | pʰnum ˈpɨɲ | pʰnum ˈpɨɲ | ||
រុក្ខវិថី (respelling: រុកខៈ វិថី) | ruk.kʰaʔ ʋi.tʰəj | ruk.kʰaʔ ʋi.tʰəj | ||
សហរដ្ឋអាមេរិក (respelling: សៈហៈ រ័ត អាមេរិក) | saʔ.haʔ rŏət ʔaː.meː.rɨk | saʔ.haʔ rŏət ʔaː.mei.rɨk | 38 | |
លលក (respelling: ល-លក) | lɔ.ˈlɔːʔ | lɔ.ˈlɔːʔ | ||
របស់ (respelling: រ-បស់, រ'-បស់) | rɔ.ˈɓɑh, rə.ˈɓɑh | rɔ.ˈɓɑh, rə.ˈɓɑh | ||
បរិភោគ (respelling: បរ៉ិភោក) | ɓɑː.re.pʰoːk | ɓɑː.re.pʰoːk | ||
ធំ (respelling: ថុំ) | tʰom | tʰom | ||
វចនានុក្រម (respelling: វៈ-ចៈ-ន៉ា-នុ-ក្រំ) | ʋĕəʔ.caʔ.naː.nu.krɑm | ʋĕəʔ.caʔ.naː.nu.krɑm | ||
សាសន (respelling: សាសៈន៉ៈ) | saː.saʔ.naʔ | saː.saʔ.naʔ | ||
សាសនា (respelling: សា-ស្នា) | saː.ˈsnaː | saː.ˈsnaː | ||
កិរិយា (respelling: កិរិយ៉ា) | ke.ri.jaː | ke.ri.jaː | ||
ល្អូកល្អិន | lʔouk.ˈlʔən | lʔouk.ˈlʔən | ||
ឆ្ងាញ់ | cʰŋaɲ | cʰŋaɲ | ||
ប្រធានាធិបតី (respelling: ប្រ់ធានាធិបប៉ៈដី) | prɑ.tʰiə.niə.tʰɨp.paʔ.ɗəj | prɑ.tʰiə.niə.tʰɨp.paʔ.ɗəj | ||
ឧសភា (respelling: អុសៈភា, អ៊ុសៈភា) | ʔo.saʔ.pʰiə, ʔu.saʔ.pʰiə | ʔo.saʔ.pʰiə, ʔu.saʔ.pʰiə | ||
ហ្វៃហ្វា (respelling: វ៉ៃ-វ៉ា, ហ្វៃ-ហ្វា) | ʋaj.ˈʋaː, faj.ˈfaː | ʋaj.ˈʋaː, faj.ˈfaː | ||
កម្មវិធី (respelling: ក័មវិធី, ក័ម្មៈវិធី, ក័ម្ម៉ៈវិធី) | kam.ʋi.tʰiː, kam.mĕəʔ.ʋi.tʰiː, kam.maʔ.ʋi.tʰiː | kam.ʋi.tʰiː, kam.mĕəʔ.ʋi.tʰiː, kam.maʔ.ʋi.tʰiː | ||
រថ (respelling: រត់) | rŭət | rŭət | ||
កម្ពុជា (respelling: ក័មពុជា) | kam.pu.ciə | kam.pu.ciə | ||
រុស្ស៊ី (respelling: រុស៊ី) | ru.ˈsiː | ru.ˈsiː | ||
ចក្រ (respelling: ច័ក, ច័ក-ក្រៈ-) | caʔ, caʔ.kraʔ. | caʔ, caʔ.kraʔ. | ||
អម្ពិល (respelling: អំពិល) | ʔɑm.ˈpɨl | ʔɑm.ˈpɨl | ||
ចក្រយាន (respelling: ច័ក-ក្រ់-យាន) | caʔ.krɑ.jiən | caʔ.krɑ.jiən |
Text | Expected | Actual | Differs at | |
---|---|---|---|---|
ក្បាល | ក្បាល | ក្បាល | ||
ស្អែក | ស្អែក | ស្អែក | ||
ផ្សេង | ផ្សេង | ផ្សេង | ||
ល្មម | ល្មម | ល្មម | ||
ភ្ជុំ | ភ្ជុំ | ភ្ជុំ | ||
ម្នាស់ | ម្នាស់ | ម្នាស់ | ||
ផ្ទះ | ផ្ទះ | ផ្ទះ | ||
ខ្ញុំ | ខ្ញុំ | ខ្ញុំ | ||
ប្ដី | ប្ដី | ប្ដី | ||
ឆ្វេង | ឆ្វេង | ឆ្វេង | ||
ហ្វឹក | ហ្វឹក | ហ្វឹក | ||
ឡាន | ឡាន | ឡាន | ||
ឃាត់ | ឃាត់ | ឃាត់ | ||
ខាត់ | ខាត់ | ខាត់ | ||
ញាំ | ញាំ | ញាំ | ||
ល្ហុង | ល្ហុង | ល្ហុង | ||
សព្វ (respelling: សប់) | សប់ | សប់ | ||
អ្នក (respelling: នាក់) | នាក់ | នាក់ | ||
លក់ | លក់ | លក់ | ||
សង្កាត់ | ស-ង្កាត់ | ស-ង្កាត់ | ||
ទម្ងន់ | ទ-ម្ងន់ | ទ-ម្ងន់ | ||
ម្ញ៉ិកម្ញ៉ក់ | ម្ញ៉ិក-ម្ញ៉ក់ | ម្ញ៉ិក-ម្ញ៉ក់ | ||
ប្រយ័ត (respelling: ប្រយ៉ាត់) | ប្រ-យ៉ាត់ | ប្រ-យ៉ាត់ | ||
បារី (respelling: បារ៉ី) | បា-រ៉ី | បា-រ៉ី | ||
កន្លែង (respelling: កន្ល៉ែង) | ក-ន្ល៉ែង | ក-ន្ល៉ែង | ||
ស្រលាញ់ (respelling: ស្រ-ល៉ាញ់, ស្រ'-ល៉ាញ់) | ស្រ-ល៉ាញ់, ស្រ'-ល៉ាញ់ | ស្រ-ល៉ាញ់, ស្រ'-ល៉ាញ់ | ||
គំនិត | គំ-និត | គំ-និត | ||
ត្រជាក់ | ត្រ-ជាក់ | ត្រ-ជាក់ | ||
ជណ្ដើរ | ជ-ណ្ដើរ | ជ-ណ្ដើរ | ||
ទំហំ (respelling: ទំហ៊ំ) | ទំ-ហ៊ំ | ទំ-ហ៊ំ | ||
វិហារ (respelling: វិហ៊ា) | វិ-ហ៊ា | វិ-ហ៊ា | ||
បវត្តិ (respelling: ប៉ៈវ័ត) | ប៉ៈ-វ័ត | ប៉ៈ-វ័ត | ||
ចេតនា (respelling: ចេតៈន៉ា) | ចេ-តៈ-ន៉ា | ចេ-តៈ-ន៉ា | ||
វេទនា (respelling: វេទៈនា) | វេ-ទៈ-នា | វេ-ទៈ-នា | ||
សំស្ក្រឹត (respelling: ស័ង-ស្ក្រិត, ស័ង-សៈក្រិត) | ស័ង-ស្ក្រិត, ស័ង-សៈ-ក្រិត | ស័ង-ស្ក្រិត, ស័ង-សៈ-ក្រិត | ||
បន្តក់ | ប-ន្តក់ | ប-ន្តក់ | ||
សាស្ត្រា (respelling: សាស-ស្ត្រា) | សាស-ស្ត្រា | សាស-ស្ត្រា | ||
បដិសេធ (respelling: ប៉ៈដិសែត) | ប៉ៈ-ដិ-សែត | ប៉ៈ-ដិ-សែត | ||
បរិយោសាន (respelling: ប៉ៈរ៉ិយ៉ោសាន) | ប៉ៈ-រ៉ិ-យ៉ោ-សាន | ប៉ៈ-រ៉ិ-យ៉ោ-សាន | ||
ភ្នែកមាន់ (respelling: ភ្នែក មាន់) | ភ្នែក មាន់ | ភ្នែក មាន់ | ||
ផ្សេងៗ (respelling: ផ្សេងផ្សេង) | ផ្សេង-ផ្សេង | ផ្សេង-ផ្សេង | ||
កញ្ញា (respelling: ក័ញ្ញ៉ា) | ក័-ញ្ញ៉ា | ក័-ញ្ញ៉ា | ||
ភ្នំពេញ (respelling: ភ្នំ ពេញ) | ភ្នំ ពេញ | ភ្នំ ពេញ | ||
រុក្ខវិថី (respelling: រុកខៈ វិថី) | រុក-ខៈ វិ-ថី | រុក-ខៈ វិ-ថី | ||
សហរដ្ឋអាមេរិក (respelling: សៈហៈ រ័ត អាមេរិក) | សៈ-ហៈ រ័ត អា-មេ-រិក | សៈ-ហៈ រ័ត អា-មេ-រិក | ||
លលក (respelling: ល-លក) | ល-លក | ល-លក | ||
របស់ (respelling: រ-បស់, រ'-បស់) | រ-បស់, រ'-បស់ | រ-បស់, រ'-បស់ | ||
បរិភោគ (respelling: បរ៉ិភោក) | ប-រ៉ិ-ភោក | ប-រ៉ិ-ភោក | ||
ធំ (respelling: ថុំ) | ថុំ | ថុំ | ||
វចនានុក្រម (respelling: វៈ-ចៈ-ន៉ា-នុ-ក្រំ) | វៈ-ចៈ-ន៉ា-នុ-ក្រំ | វៈ-ចៈ-ន៉ា-នុ-ក្រំ | ||
សាសន (respelling: សាសៈន៉ៈ) | សា-សៈ-ន៉ៈ | សា-សៈ-ន៉ៈ | ||
សាសនា (respelling: សា-ស្នា) | សា-ស្នា | សា-ស្នា | ||
កិរិយា (respelling: កិរិយ៉ា) | កិ-រិ-យ៉ា | កិ-រិ-យ៉ា | ||
ល្អូកល្អិន | ល្អូក-ល្អិន | ល្អូក-ល្អិន | ||
ឆ្ងាញ់ | ឆ្ងាញ់ | ឆ្ងាញ់ | ||
ប្រធានាធិបតី (respelling: ប្រ់ធានាធិបប៉ៈដី) | ប្រ់-ធា-នា-ធិប-ប៉ៈ-ដី | ប្រ់-ធា-នា-ធិប-ប៉ៈ-ដី | ||
ឧសភា (respelling: អុសៈភា, អ៊ុសៈភា) | អុ-សៈ-ភា, អ៊ុ-សៈ-ភា | អុ-សៈ-ភា, អ៊ុ-សៈ-ភា | ||
ហ្វៃហ្វា (respelling: វ៉ៃ-វ៉ា, ហ្វៃ-ហ្វា) | វ៉ៃ-វ៉ា, ហ្វៃ-ហ្វា | វ៉ៃ-វ៉ា, ហ្វៃ-ហ្វា | ||
កម្មវិធី (respelling: ក័មវិធី, ក័ម្មៈវិធី, ក័ម្ម៉ៈវិធី) | ក័ម-វិ-ធី, ក័-ម្មៈ-វិ-ធី, ក័-ម្ម៉ៈ-វិ-ធី | ក័ម-វិ-ធី, ក័-ម្មៈ-វិ-ធី, ក័-ម្ម៉ៈ-វិ-ធី | ||
រថ (respelling: រត់) | រត់ | រត់ | ||
កម្ពុជា (respelling: ក័មពុជា) | ក័ម-ពុ-ជា | ក័ម-ពុ-ជា | ||
រុស្ស៊ី (respelling: រុស៊ី) | រុ-ស៊ី | រុ-ស៊ី | ||
ចក្រ (respelling: ច័ក, ច័ក-ក្រៈ-) | ច័ក, ច័ក-ក្រៈ- | ច័ក, ច័ក-ក្រៈ- | ||
អម្ពិល (respelling: អំពិល) | អំ-ពិល | អំ-ពិល | ||
ចក្រយាន (respelling: ច័ក-ក្រ់-យាន) | ច័ក-ក្រ់-យាន | ច័ក-ក្រ់-យាន |
Text | Expected | Actual | Differs at | |
---|---|---|---|---|
ក្បាល | kbaal | kbaal | ||
ស្អែក | sʼaek | sʼaek | ||
ផ្សេង | phseing | phseeng | 23 | |
ល្មម | lmɔɔm | lmɔɔm | ||
ភ្ជុំ | phcum | phcum | ||
ម្នាស់ | mnŏəh | mnŏəh | ||
ផ្ទះ | phtĕəh | phtĕəh | ||
ខ្ញុំ | khñom | khñom | ||
ប្ដី | pdəy | pdəy | ||
ឆ្វេង | chveing | chveeng | 23 | |
ហ្វឹក | fək | fək | ||
ឡាន | laan | laan | ||
ឃាត់ | khŏət | khŏət | ||
ខាត់ | khat | khat | ||
ញាំ | ñŏəm | ñŏəm | ||
ល្ហុង | lhong | lhong | ||
សព្វ (respelling: សប់) | sɑp | sɑp | ||
អ្នក (respelling: នាក់) | nĕək | nĕək | ||
លក់ | lŭək | lŭək | ||
សង្កាត់ | sɑngkat | sɑngkat | ||
ទម្ងន់ | tumngŭən | tumngŭən | ||
ម្ញ៉ិកម្ញ៉ក់ | mñəkmñɑk | mñəkmñɑk | ||
ប្រយ័ត (respelling: ប្រយ៉ាត់) | prɑyat | prɑyat | ||
បារី (respelling: បារ៉ី) | baarəy | baarəy | ||
កន្លែង (respelling: កន្ល៉ែង) | kɑnlaeng | kɑnlaeng | ||
ស្រលាញ់ (respelling: ស្រ-ល៉ាញ់, ស្រ'-ល៉ាញ់) | srɑlañ, srəlañ | srɑlañ, srəlañ | ||
គំនិត | kumnɨt | kumnɨt | ||
ត្រជាក់ | trɑcĕək | trɑcĕək | ||
ជណ្ដើរ | cŭəndaə | cŭəndaə | ||
ទំហំ (respelling: ទំហ៊ំ) | tumhum | tumhum | ||
វិហារ (respelling: វិហ៊ា) | vihiə | vihiə | ||
បវត្តិ (respelling: ប៉ៈវ័ត) | paʼvŏət | paʼvŏət | ||
ចេតនា (respelling: ចេតៈន៉ា) | ceitaʼnaa | ceetaʼnaa | 21 | |
វេទនា (respelling: វេទៈនា) | veetĕəʼniə | veitĕəʼniə | 21 | |
សំស្ក្រឹត (respelling: ស័ង-ស្ក្រិត, ស័ង-សៈក្រិត) | sangskrət, sangsaʼkrət | sangskrət, sangsaʼkrət | ||
បន្តក់ | bɑntɑk | bɑntɑk | ||
សាស្ត្រា (respelling: សាស-ស្ត្រា) | saahstraa | saahstraa | ||
បដិសេធ (respelling: ប៉ៈដិសែត) | paʼdesaet | paʼdesaet | ||
បរិយោសាន (respelling: ប៉ៈរ៉ិយ៉ោសាន) | paʼreyaosaan | paʼreyaosaan | ||
ភ្នែកមាន់ (respelling: ភ្នែក មាន់) | phnɛɛk mŏən | phnɛɛk mŏən | ||
ផ្សេងៗ (respelling: ផ្សេងផ្សេង) | phseingphseing | phseengphseeng | 23 | |
កញ្ញា (respelling: ក័ញ្ញ៉ា) | kaññaa | kaññaa | ||
ភ្នំពេញ (respelling: ភ្នំ ពេញ) | phnum pɨñ | phnum pɨñ | ||
រុក្ខវិថី (respelling: រុកខៈ វិថី) | rukkhaʼ vithəy | rukkhaʼ vithəy | ||
សហរដ្ឋអាមេរិក (respelling: សៈហៈ រ័ត អាមេរិក) | saʼhaʼ rŏət ʼaameerɨk | saʼhaʼ rŏət ʼaameirɨk | 36 | |
លលក (respelling: ល-លក) | lɔlɔɔk | lɔlɔɔk | ||
របស់ (respelling: រ-បស់, រ'-បស់) | rɔbɑh, rəbɑh | rɔbɑh, rəbɑh | ||
បរិភោគ (respelling: បរ៉ិភោក) | bɑɑrephook | bɑɑrephook | ||
ធំ (respelling: ថុំ) | thom | thom | ||
វចនានុក្រម (respelling: វៈ-ចៈ-ន៉ា-នុ-ក្រំ) | vĕəʼcaʼnaanukrɑm | vĕəʼcaʼnaanukrɑm | ||
សាសន (respelling: សាសៈន៉ៈ) | saasaʼnaʼ | saasaʼnaʼ | ||
សាសនា (respelling: សា-ស្នា) | saasnaa | saasnaa | ||
កិរិយា (respelling: កិរិយ៉ា) | keriyaa | keriyaa | ||
ល្អូកល្អិន | lʼouklʼən | lʼouklʼən | ||
ឆ្ងាញ់ | chngañ | chngañ | ||
ប្រធានាធិបតី (respelling: ប្រ់ធានាធិបប៉ៈដី) | prɑthiəniəthɨppaʼdəy | prɑthiəniəthɨppaʼdəy | ||
ឧសភា (respelling: អុសៈភា, អ៊ុសៈភា) | ʼosaʼphiə, ʼusaʼphiə | ʼosaʼphiə, ʼusaʼphiə | ||
ហ្វៃហ្វា (respelling: វ៉ៃ-វ៉ា, ហ្វៃ-ហ្វា) | vayvaa, fayfaa | vayvaa, fayfaa | ||
កម្មវិធី (respelling: ក័មវិធី, ក័ម្មៈវិធី, ក័ម្ម៉ៈវិធី) | kamvithii, kammĕəʼvithii, kammaʼvithii | kamvithii, kammĕəʼvithii, kammaʼvithii | ||
រថ (respelling: រត់) | rŭət | rŭət | ||
កម្ពុជា (respelling: ក័មពុជា) | kampuciə | kampuciə | ||
រុស្ស៊ី (respelling: រុស៊ី) | rusii | rusii | ||
ចក្រ (respelling: ច័ក, ច័ក-ក្រៈ-) | cak, cakkraʼ | cak, cakkraʼ | ||
អម្ពិល (respelling: អំពិល) | ʼɑmpɨl | ʼɑmpɨl | ||
ចក្រយាន (respelling: ច័ក-ក្រ់-យាន) | cakkrɑyiən | cakkrɑyiən |
local tests = require('Module:UnitTests')
local km_pron = require('Module:km-pron')
local test_data = require('Module:km-pron/testcases/data')
local function tag_IPA(IPA) return '<span class="IPA">' .. IPA .. '</span>' end
local function tag_khmer(Khmer) return '<span class="Khmr" lang="km">' .. Khmer .. '</span>' end
local function link(khmer, respelling)
return tag_khmer("]") ..
(respelling and " <small>(respelling: " .. tag_khmer(respelling) .. ")</small>" or "")
end
function tests:do_test_syllabify(khmer, syllabified, respelling)
self:equals(link(khmer, respelling), tag_khmer(km_pron.syllabify(respelling or khmer)), tag_khmer(syllabified))
end
function tests:do_test_ipa(khmer, pronunciation, respelling)
self:equals(link(khmer, respelling), tag_IPA(km_pron.convert(respelling or khmer, "ipa")), tag_IPA(pronunciation))
end
function tests:do_test_transcript(khmer, transcription, respelling)
self:equals(link(khmer, respelling), tag_IPA(km_pron.convert(respelling or khmer, "tc")), tag_IPA(transcription))
end
function tests:test_syllabify()
for _, data in pairs(test_data) do
self:do_test_syllabify(data.word, data.syllabified, data.respelling)
end
end
function tests:test_ipa()
for _, data in pairs(test_data) do
self:do_test_ipa(data.word, data.ipa, data.respelling)
end
end
function tests:test_transcript()
for _, data in pairs(test_data) do
self:do_test_transcript(data.word, data.transcription, data.respelling)
end
end
return tests