buat n-grams dan koreksi ejaan serta normalisasi kata dengan bahasa python
apa kabar ini kalian semua ?? harusnya baik dong walaupun corona sedang mengamuk diluar tapi harapannya kalian sehat walafiat :D
oke langsung pada kesempatan kali ini saya akan membagikan cara untuk buat n-grams dan koreksi ejaan serta normalisasi kata dengan bahasa python dengan library nltk+textblob...
oke langsung saja pertama yang akan kita lakukan yaitu import library yang dibutuhkan dalam hal ini nltk dan textblob , untuk lebih jelasnya dapat dilihat pada gambar dibawah ini:
output:
selanjutnya kita akan membuat koreksi ejaan serta normalisasi kata dengan library textblob
tapi sebelum perlu membuat file txt lagi untuk menampung hasil koreksi kata misal corrected.txt, untuk lebih jelasnya bisa dilihat pada gambar dibawah ini:
output:
maka kata original yang salah atau typo akan otomatis di koreksi dan hasil outputnya akan seperti pada corrected text.
sekian dari saya untuk toturial yang singkat ini wassalamualaikum warahmatullah wabarakatuh
#note app ini hanya bekerja pada kata atau kalimat yang berbahasa inggris next toturial insyaallah versi bahasa indonesia dan untuk versi lain bisa di cek digithub saya tinggal click disini Prastyo-EL
Referensi:
https://stackoverflow.com/questions/17531684/n-grams-in-python-four-five-six-grams
https://medium.com/@yudakhoirulz/create-spelling-corrector-program-using-python-585fd79de3e2



