Bahasa Melayu (Bahasa Indonesia mengikuti bahasa Melayu)
MALINDO Morph merupakan kamus morfologi untuk bahasa Melayu dan bahasa Indonesia. Kamus MALINDO Morph dilesenkan dengan pelesenan Creative Commons Attribution 4.0 International (CC BY 4.0). Untuk maklumat terperinci mengenai MALINDO Morph, sila rujuk makalah di bawah ini.
- Nomoto, Hiroki, Hannah Choi, David Moeljadi and Francis Bond. 2018. MALINDO Morph: Morphological dictionary and analyser for Malay/Indonesian. Kiyoaki Shirai (ed.) Proceedings of the LREC 2018 Workshop "The 13th Workshop on Asian Language Resources", 36-43.
- (bkn maklumat dasar dan lema) Nomoto, Hiroki. 2020. Towards genuine stemming and lemmatization in Malay/Indonesian. Proceedings of the Twenty-Sixth Annual Meeting of the Association for Natural Language Processing, 1033-1036.
ID [TAB] Akar [TAB] Bentuk lahir [TAB] Awalan/proklitik [TAB] Akhiran/enklitik [TAB] Apitan [TAB] Penggandaan [TAB] Sumber [TAB] Dasar [TAB] Lema
- Kolum "sumber" ditambah mulai versi 20180917.
- Kolum "dasar" dan "lema" ditambah mulai versi 20190923.
ID
terdiri daripada dua unsur, iaitu
- Jenis sumber:
cc
(core, checked),ec
(expanded, checked) atauex
(expanded, x (tidak) checked); diikuti dengan tanda sempang (-
) dan - Nombor siri
Terdapat empat jenis penggandaan yang dibezakan dalam kamus MALINDO Morph, iaitu
R-penuh
: Penggandaan penuh seperti kadang-kadang (berdasarkan kadang).R-separa
: Penggandaan separa seperti lelaki (berdasarkan laki).R-ritma
: Penggandaan berentak seperti teka-teki (berdasarkan teka).R-ritma_mjmk
: Penggandaan berentak yang merupakan kata majmuk, iaitu gabungan dua perkataan seperti asal-usul.
0
: Tidak melibatkan penggandaan.
Kamus
: Kamus Dewan (edisi keempat) dan Kamus Besar Bahasa Indonesia (edisi kelima).Leipzig
: Koleksi Korpus LeipzigFrogstory-David
: Indonesian Frog Storytelling Corpus oleh David Moeljadi.Melayu-Standard-Lisan
: Korpus Variasi Bahasa Melayu: Standard LisanMelayu-Sabah
: Korpus Variasi Bahasa Melayu: SabahMelayu-Sarawak
: Korpus Variasi Bahasa Melayu: SarawakMelayu-Brunei
: Korpus Variasi Bahasa Melayu: BruneiIndo-Jakarta-Lisan
: Korpus Variasi Bahasa Melayu: Jakarta LisanLain
+
: campur@
: atau
cc-4023 ada mengada-adakan meN- -kan 0 R-penuh Kamus ada-adakan mengada-adakan
ec-7280 ada diada-adakan di- -kan 0 R-penuh Leipzig ada-adakan mengada-adakan
ec-48506 tanggungjawab dipertanggungjawabkannya di-+per- -kan+-nya 0 0 Leipzig dia+pertanggungjawabkan dia+mempertanggungjawabkan
ec-48508 tanggungjawab kebertanggungjawabannya ber- -nya ke--an 0 Leipzig kebertanggungjawaban+dia kebertanggungjawaban+dia
cc-27899 gunting gunting 0 0 0 0 Kamus gunting gunting@menggunting
(Lema adalah "gunting" untuk kata nama dan "menggunting" untuk kata kerja.)
Versi | Jumlah garis | Butir-butir |
---|---|---|
2023 | 247,904 | cc 87,005; ec 65,031; ex 95,868 |
20221221 | 246,525 | cc 85,644; ec 65,005; ex 95,876 |
20211116 | 241,911 | cc 85,010; ec 60,634; ex 96,267 |
20200917 | 234,567 | cc 84,419; ec 53,072; ex 97,076 |
20190923 | 234,274 | cc 84,415; ec 49,686; ex 100,173 |
20190129 | 233,372 | cc 84,410; ec 48,347; ex 100,615 |
20181125 | 233,374 | cc 84,410; ec 48,274; ex 100,690 |
20180917 | 233,390 | cc 84,429; ec 48,262; ex 100,699 |
20180817 | 232,503 | cc 84,404; ec 47,400; ex 100,699 |
20180418 | 232,516 | cc 84,404; ec 47,400; ex 100,712 |
20180312 | 232,546 | cc 84,403; ec 47,399; ex 100,744 |
Bahasa Indonesia
MALINDO Morph merupakan kamus morfologi untuk bahasa Melayu dan bahasa Indonesia. Kamus MALINDO Morph dilisensikan dengan lisensi Creative Commons Attribution 4.0 International (CC BY 4.0). Untuk informasi terperinci tentang MALINDO Morph, mohon merujuk kepada makalah di bawah ini.
- Nomoto, Hiroki, Hannah Choi, David Moeljadi and Francis Bond. 2018. MALINDO Morph: Morphological dictionary and analyser for Malay/Indonesian. Kiyoaki Shirai (ed.) Proceedings of the LREC 2018 Workshop "The 13th Workshop on Asian Language Resources", 36-43.
- (ttg informasi dasar dan lema) Nomoto, Hiroki. 2020. Towards genuine stemming and lemmatization in Malay/Indonesian. Proceedings of the Twenty-Sixth Annual Meeting of the Association for Natural Language Processing, 1033-1036.
ID [TAB] Bentuk dasar (_root_) [TAB] Bentuk jadian [TAB] Prefiks/proklitik [TAB] Sufiks/enklitik [TAB] Konfiks [TAB] Reduplikasi [TAB] Sumber [TAB] Dasar ("stem") [TAB] Lema
- Kolum "sumber" ditambah mulai versi 20180917.
- Kolum "dasar" dan "lema" ditambah mulai versi 20190923.
ID
terdiri dari dua unsur, yaitu:
- Jenis sumber:
cc
(core, checked),ec
(expanded, checked), atauex
(expanded, x (tidak) checked); diikuti dengan tanda penghubung (-
) dan - Nomor seri
Terdapat empat jenis reduplikasi yang dibedakan dalam kamus MALINDO Morph, yaitu
R-penuh
: Reduplikasi penuh atau dwilingga seperti kadang-kadang (berdasarkan kadang).R-separa
: Reduplikasi sebagian atau dwipurwa seperti lelaki (berdasarkan laki).R-ritma
: Reduplikasi berubah bunyi atau dwilingga salin suara seperti teka-teki (berdasarkan teka).R-ritma_mjmk
: Reduplikasi berubah bunyi yang merupakan kata majemuk, yaitu gabungan dua kata seperti asal-usul.
0
: Tidak melibatkan reduplikasi.
Kamus
: Kamus Dewan (edisi keempat) dan Kamus Besar Bahasa Indonesia (edisi kelima).Leipzig
: Koleksi Korpus LeipzigFrogstory-David
: Indonesian Frog Storytelling Corpus oleh David Moeljadi.Melayu-Standard-Lisan
: Korpus Variasi Bahasa Melayu: Standard LisanMelayu-Sabah
: Korpus Variasi Bahasa Melayu: SabahMelayu-Sarawak
: Korpus Variasi Bahasa Melayu: SarawakMelayu-Brunei
: Korpus Variasi Bahasa Melayu: BruneiIndo-Jakarta-Lisan
: Korpus Variasi Bahasa Melayu: Jakarta LisanLain
+
: campur@
: atau
cc-4023 ada mengada-adakan meN- -kan 0 R-penuh Kamus ada-adakan mengada-adakan
ec-7280 ada diada-adakan di- -kan 0 R-penuh Leipzig ada-adakan mengada-adakan
ec-48507 tanggung jawab dipertanggungjawabkannya di-+per- -kan+-nya 0 0 Leipzig dia+pertanggungjawabkan dia+mempertanggungjawabkan
ec-48509 tanggung jawab kebertanggungjawabannya ber- -nya ke--an 0 Leipzig kebertanggungjawaban+dia kebertanggungjawaban+dia
cc-27899 gunting gunting 0 0 0 0 Kamus gunting gunting@menggunting
(Lemanya adalah "gunting" untuk nomina dan "menggunting" untuk verba.)
Versi | Jumlah baris | Rincian |
---|---|---|
2023 | 247.904 | cc 87.005; ec 65.031; ex 95.868 |
20221221 | 246.525 | cc 85.644; ec 65.005; ex 95.876 |
20211116 | 241.911 | cc 85.010; ec 60.634; ex 96.267 |
20200917 | 234.567 | cc 84.419; ec 53.072; ex 97.076 |
20190923 | 234.274 | cc 84.415; ec 49.686; ex 100.173 |
20190129 | 233.372 | cc 84.410; ec 48.347; ex 100.615 |
20181125 | 233.374 | cc 84.410; ec 48.274; ex 100.690 |
20180917 | 233.390 | cc 84.429; ec 48.262; ex 100.699 |
20180817 | 232.503 | cc 84.404; ec 47.400; ex 100.699 |
20180418 | 232.516 | cc 84.404; ec 47.400; ex 100.712 |
20180312 | 232.546 | cc 84.403; ec 47.399; ex 100.744 |