Question Classification Menggunakan Support Vector Machines dan Stemming

Question Classification (QC) merupakan salah satu komponen penting dalam Question Answering System (QAS) karena akan berpengaruh langsung terhadap kinerja keseluruhan QAS. Sejauh ini metode yang disarankan oleh komunitas QAS untuk QC adalah menggunakan Support Vector Machines (SVM). Untuk melakukan klasifikasi teks dibutuhkan fitur berdimensi tinggi, banyaknya fitur dapat mengurangi performa SVM. Stemming adalah teknik yang digunakan untuk mereduksi term suatu dokumen. Penggunaan stemming akan berpengaruh terhadap sintaksis dan semantik suatu pertanyaan. Penelitian ini bertujuan untuk mengetahui pengaruh stemming terhadap akurasi SVM. Telah dilakukan dua percobaan klasifikasi pertanyaan, yaitu dengan menggunakan SVM dan SVM+stemming. Hasil rata-rata akurasi dari percobaan diperoleh sebesar 86.75% untuk SVM dan 87.48% untuk SVM+stemming sehingga telah terjadi kenaikan akurasi sebesar 0.73%. Walaupun peningkatan akurasi tidak signifikan tetapi stemming dapat mereduksi fitur tanpa menurunkan akurasi SVM.

Umumnya proses pencarian informasi di Internet biasanya menggunakan mesin pencari. Pengguna memberikan kata kunci kemudian mesin pencari akan melakukan proses crawling yaitu mencari tautan-tautan web yang ada dalam basis data mesin pencari. Hasil pencarian berupa daftar situs-situs relevan dengan kata kunci pengguna. Sayangnya, mesin pencari hanya memberikan rujukan situs-situs yang relevan, selebihnya pengguna disuruh mencari sendiri informasi yang dibutuhkan. QAS merupakan sistem yang menerima pertanyaan pengguna dalam bahasa alami dan memberikan jawaban yang tepat, misalnya ada pertanyaan “Siapa nama Presiden Indonesia?” maka secara otomatis sistem akan menjawab: “Soekarno“. Oleh sebab itu QAS merupakan sistem yang tidak hanya mencari informasi seperti mesin pencari, tetapi juga dapat memberikan jawaban langsung kepada pengguna…

Python – Chatbot “mainan”

Karena kebutuhan akhirnya saya harus belajar Python. Berbekal kemampuan pemrograman yang sedikit, saya coba menuliskan hasil belajar Python lewat blog ini. Berikut contoh koding sederhana chatbot “mainan” menggunakan Python 2.7.12, IDE Spyder:

from random import randint

print("ChatBot\r")
print("Ketik \'keluar\' untuk menghentikan chat\n")

bot = ("topiknya menarik nih", "apa iya", "betul juga ya", "mmmm...", "oke, lanjut")

while(1):
   teks = raw_input("USER\t: ")
   if(teks == "keluar"):
      print "BOT\t: bye..."
      break
   else:
      print "BOT\t:", bot[randint(0,4)], "\n"

print("\n-= Terima kasih =-")

Berikut luaran kode di atas:

>>> runfile('/home/abdiansah/.spyder2/temp.py', wdir='/home/abdiansah/.spyder2')
ChatBot
Ketik 'keluar' untuk menghentikan chat

USER: hai
BOT : oke, lanjut 

USER: oke
BOT : apa iya 

USER: keluar
BOT : bye...

-= Terima kasih =-
>>>

Yaasin Fadhilah

Yaasin Fadhilah (YF) adalah surat Yaasin yang disisipi dengan doa-doa. Info lebih lanjut terkait dengan YF silakan anda googling sendiri. Saya mencoba mencari YF di Internet yang berbentuk file dokumen dan bisa dicetak. Tapi sayangnya kebanyakan file tersebut berbentuk hasil scanning sehingga font nya jelek dan dicetakpun tidak menarik. Selain berbentuk dokumen, YF juga sudah banyak beredar dalam bentuk aplikasi untuk sistem operasi Android yang dapat diunduh di play store.

Untuk memuaskan hati maka saya coba membuat YF versi saya yang rujukannya diambil dari web ini:

Selain saya copas dari web tersebut, saya juga melakukan verifikasi dan menemukan beberapa ketidakcocokan dengan versi cetak (saya punya versi cetak terbitan TUNGGAL PERKASA PRESS – cover warna merah). Oleh karena itu YF versi saya ini disesuaikan dengan versi cetak yang saya miliki.

Untuk mengunduh file YF versi saya silakan anda klik tautan dibawah ini:

Selamat membaca dan beramal sholeh!

Aplikasi Al-Quran – Elforkane

Sebelumnya saya sudah mencoba beberapa aplikasi Al-Quran untuk sistem operasi Linux Ubuntu 14.04. Zekr merupakan salah satu aplikasi yang cukup populer dan sudah ada di dalam repositori Ubuntu. Selain Zekr, Elforkane dapat dijadikan aplikasi alternatif karena tampilan dan animasinya yang cukup bagus serta dilengkapi dengan terjemah dan suara (reciter) serta fitur-fitur lainnya. Sayangnya Elforkane belum tersedia di repositori sehingga instalasinya harus dilakukan secara manual. Berikut ini langkah-langkah instalasi Elforkane yang sudah saya coba di Linux Mint KDE – Rebecca (Core Ubuntu 14.04):

Jika anda menggunakan Ubuntu versi lain atau Sistem Operasi lain, silakan kunjungi tautan berikut ini:

Untuk menambahkan terjemahan bahasa Indonesia, silakan unduh file terjemah (tersedia 20 bahasa termasuk bahasa Indonesia) di sini:

Selanjutnya ekstrak file tarajem.ayt (bisa menggunakan ark atau aplikasi kompresi lainnya) kemudian cari file id_indonesian.ayt. Ubah nama file id_indonesian.ayt menjadi id_indonesian.db dan pindahkan file id_indonesian.db ke dalam direktori /usr/share/elforkane/translat/ (jangan lupa untuk masuk sebagai root) setelah itu ubah setelan terjemahan di Elforkane dengan cara:

  • View
  • Translation and Tefsir
  • Translation
  • Indonesian – Bahasa Indonesian (pilih item ini)

Untuk melihat hasilnya, silakan klik salah satu ayat di Elforkane maka secara otomatis akan muncul terjemahan dalam bahasa Indonesia, contohnya dapat dilihat pada gambar di bawah ini:

elforkan

Selamat mencoba!

Pada artikel berikutnya akan saya bahas cara mendownload dan mengaktifkan suara reciter (pembaca Al-Quran) sehingga kita bisa menyimak sekaligus membaca Al-Quran. So silakan pantau terus blog ini hehe…

Tutorial AHP dan k-Means Clustering

“Dibuang sayang”, mungkin istilah yang tepat untuk sesuatu yang tidak kita perlukan tetapi mungkin berguna untuk orang lain. Sewaktu jalan-jalan virtual menjelajahi isi hard-disk, buka tutup folder, buang arsip yang usang, pindahkan arsip yang “mungkin” suatu saat berguna, saya menemukan dua buah file tutorial yang terkait dengan AHP (Analytic Hierarchy Process) yaitu model sederhana yang dapat digunakan untuk Sistem Pendukung Keputusan dan k-Means Clustering yaitu metode untuk melakukan clustering (membuat label/kelas otomatis dari suatu data yang ada dalam himpunan).

Untuk lebih jelasnya tentang AHP dan k-Means Clustering silakan googling, banyak sekali tutorial yang lebih lengkap dan cadas, saya membuat tutorial ini sekedar untuk dokumentasi pribadi dan pengingat di kala lupa.

Berikut ini tautan untuk mengunduh file tutorial AHP dan k-Means Clustering:

Sedangkan ini tautan untuk membaca langsung di Scribd:

Selamat membaca!