Selasa, 07 April 2020

buat n-grams dan koreksi ejaan serta normalisasi kata dengan bahasa python
assalamualaikum warahmatullah wabarakatuh..

apa kabar ini kalian semua ?? harusnya baik dong walaupun corona sedang mengamuk diluar tapi harapannya kalian sehat walafiat :D


oke langsung pada kesempatan kali ini saya akan membagikan cara untuk buat n-grams dan koreksi ejaan serta normalisasi kata dengan bahasa python dengan library nltk+textblob...

oke langsung saja pertama yang akan kita lakukan yaitu import library yang dibutuhkan dalam hal ini nltk dan textblob , untuk lebih jelasnya dapat dilihat pada gambar dibawah ini:



oiya untuk file text atau corpusnya kita akan menggunakan file txt , kita siapkan dulu file txt dengan nama original.txt ,dapat dilihat pada gambar di bawah ini:


output:


oke generate n-gram pada suatu corpus telah selesai...

selanjutnya kita akan membuat koreksi ejaan serta normalisasi kata dengan library textblob

tapi sebelum perlu membuat file txt lagi untuk menampung hasil koreksi kata misal corrected.txt, untuk lebih jelasnya bisa dilihat pada gambar dibawah ini:


output:



maka kata original yang salah atau typo akan otomatis di koreksi dan hasil outputnya akan seperti pada corrected text.

sekian dari saya untuk toturial yang singkat ini wassalamualaikum warahmatullah wabarakatuh

#note app ini hanya bekerja pada kata atau kalimat yang berbahasa inggris next toturial insyaallah versi bahasa indonesia dan untuk versi lain bisa di cek digithub saya tinggal click disini Prastyo-EL


Referensi:
https://stackoverflow.com/questions/17531684/n-grams-in-python-four-five-six-grams
https://medium.com/@yudakhoirulz/create-spelling-corrector-program-using-python-585fd79de3e2


Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna Veniam, quis nostrud exerci tation ullamcorper suscipit lobortis nisl ut aliquip ex ea commodo consequat.

Contact Us

Phone :

+20 010 2517 8918

Address :

3rd Avenue, Upper East Side,
San Francisco

Email :

email_support@youradress.com

Diberdayakan oleh Blogger.

Advertisement

Instagram

Popular Posts