Promo Lebaran, Kelas Online CODEPOLITAN Cukup Bayar Setengah Harga KLAIM PROMO
Lebih terarah belajar coding melalui Kelas Online dan Interactive Coding Lihat Materi Belajar

Stemming Word dalam Carik Bot

Ditulis oleh Luri Darmawan, dipublikasi pada 04 Sep 2017 dalam kategori Info
Stemming Word dalam Carik Bot - CodePolitan.com

Carik: Stemming Word dalam Carik

Membuat BOT, sepertinya sudah biasa.
Membuat BOT dengan kemampuan NLP dan AI, sepertinya sudah banyak yang bisa juga.

Sebagian ada yang membuat sendiri engine-nya, sebagian ada yang menggunakan vendor-vendor yang sudah ada.
Saya sendiri dulu pernah menggunakan vendor, baik yang free maupun berbayar.

Sejak mengembangkan Carik Bot beberapa waktu lalu, saya cenderung untuk membuat NLP Engine sendiri. Memang belum bagus-bagus amat, tapi sudah cukup lumayan laahh...

Membuat NLP pun juga tidak jauh dengan teknik Stemming Word. Stemming merupakan bagian yang tidak terpisahkan dalam Information Retrieval (IR). Stemming adalah proses pemetaan dan penguraian bentuk dari suatu kata menjadi bentuk kata dasarnya. Gampangnya, proses mengubah kata berimbuhan menjadi kata dasar.
Proses stemming tidak harus ada dalam NLP, tapi jika ada pun sepertinya akan lebih baik.
Dan kemudian, saya pun membuat engine Stemming Word sendiri. Eehh.. bukan.. bukan.. saya hanya mengkode method Stemming Word ke dalam suatu bahasa pemrograman yang saya sayangi, yaitu "Pascal". Methodnya saya gunakan dari Algoritma Nazief dan Andriani, dengan sedikit memberikan tambahan kode untuk mengakomodir beberapa kata yang belum terakomodir oleh algoritma Nazief dan Andriani ini.

Tentang bagaimana algoritma Nazief dan Andriani ini, dipersilahkan untuk searching di media yang sudah banyak tersedia di era online ini.

Dari stemming word tools yang saya bangun untuk Carik ini, sudah terkumpul lebih dari 28.000 kata dalam bahasa Indonesia. Sudah terkategorikan pula dalam jenis kelompok kata-nya. Beberapa variasi kata mungkin tidak/belum terdeteksi, belum lagi kata-kata gaul maupun yang tidak gaul.

Ingin tahu kemampuan tools stemming word ini?
boleh coba dari URL
http://stemming.fastplaz.com/

Ingin tahu code stemming word ini?
silahkan download dari url github ini:
https://github.com/luridarmawan/StemmingWord

Ingin tahu kemampuan Carik Bot dalam mereprentasikan free text?
silahkan coba chat langsung dengan Carik.
Carik mudah ditemui kok, saat ini dia ada di

Catatan penting,
tools ini masih jauh dari sempurna, masih banyak hal yang harus dibenahi dan bisa dikembangkan.

Selamat mencoba dan Tetap Semangat!


background

Gabung CodePolitan Membership

Ingin belajar coding secara online dengan lebih terarah? Gabung sekarang dalam program Premium Membership di CodePolitan. Dapatkan ratusan modul belajar pemrograman premium dalam beragam format dengan materi silabus lengkap dan tersusun rapi dari awal hingga mahir.

LIHAT MATERI BELAJAR GABUNG MEMBERSHIP