Stemming Word dalam Carik Bot

Luri Darmawan 4 September 2017

Stemming Word dalam Carik Bot

Carik: Stemming Word dalam Carik

Membuat BOT, sepertinya sudah biasa. Membuat BOT dengan kemampuan NLP dan AI, sepertinya sudah banyak yang bisa juga.

Sebagian ada yang membuat sendiri engine-nya, sebagian ada yang menggunakan vendor-vendor yang sudah ada. Saya sendiri dulu pernah menggunakan vendor, baik yang free maupun berbayar.

Sejak mengembangkan Carik Bot beberapa waktu lalu, saya cenderung untuk membuat NLP Engine sendiri. Memang belum bagus-bagus amat, tapi sudah cukup lumayan laahh...

Membuat NLP pun juga tidak jauh dengan teknik Stemming Word. Stemming merupakan bagian yang tidak terpisahkan dalam Information Retrieval (IR). Stemming adalah proses pemetaan dan penguraian bentuk dari suatu kata menjadi bentuk kata dasarnya. Gampangnya, proses mengubah kata berimbuhan menjadi kata dasar. Proses stemming tidak harus ada dalam NLP, tapi jika ada pun sepertinya akan lebih baik. Dan kemudian, saya pun membuat engine Stemming Word sendiri. Eehh.. bukan.. bukan.. saya hanya mengkode method Stemming Word ke dalam suatu bahasa pemrograman yang saya sayangi, yaitu "Pascal". Methodnya saya gunakan dari Algoritma Nazief dan Andriani, dengan sedikit memberikan tambahan kode untuk mengakomodir beberapa kata yang belum terakomodir oleh algoritma Nazief dan Andriani ini.

Tentang bagaimana algoritma Nazief dan Andriani ini, dipersilahkan untuk searching di media yang sudah banyak tersedia di era online ini.

Dari stemming word tools yang saya bangun untuk Carik ini, sudah terkumpul lebih dari 28.000 kata dalam bahasa Indonesia. Sudah terkategorikan pula dalam jenis kelompok kata-nya. Beberapa variasi kata mungkin tidak/belum terdeteksi, belum lagi kata-kata gaul maupun yang tidak gaul.

Ingin tahu kemampuan tools stemming word ini? boleh coba dari URL http://stemming.fastplaz.com/

Ingin tahu code stemming word ini? silahkan download dari url github ini: https://github.com/luridarmawan/StemmingWord

Ingin tahu kemampuan Carik Bot dalam mereprentasikan free text? silahkan coba chat langsung dengan Carik. Carik mudah ditemui kok, saat ini dia ada di

Catatan penting, tools ini masih jauh dari sempurna, masih banyak hal yang harus dibenahi dan bisa dikembangkan.

Selamat mencoba dan Tetap Semangat!