Tuesday, March 07, 2006

Text Mining Links

Maaf, interupsi sebentar. Sebelum melanjutkan pembahasan tentang Penambangan Asosiasi, berikut ini beberapa links menarik tentang topik KDT (Knowledge Discovery in Textual databases).

  1. Untangling Text Data Mining
  2. Text Data Mining: Issues, Techniques, and the Relationship to Information Access by Marti A. Hearst
  3. Text Mining, Web Mining, Information Retrieval and Extraction from the WWW References

Penambangan Asosiasi (bagian 2)

(lanjutan dari bagian 1)

Hal semacam itu mungkin terjadi jika anda belanja di pasar swalayan yang telah menerapkan 'findings' dari teknologi Penambangan Data (Data Mining). Seorang manajer pasar swalayan berusaha untuk meningkatkan jumlah penjualan dari barang-barang yang dijual di tokonya. Bagaimana caranya? Caranya adalah dengan menyusun barang-barang yang dijual dalam susunan yang membuat orang tertarik untuk membeli barang-barang lain di samping barang-barang yang sudah dibelinya.

Maaf kalau kalimat saya yang terakhir terlalu panjang. Saya coba untuk sederhanakan agar anda lebih mudah memahami dengan memberikan sebuah contoh.

Pernahkah anda mengamati dalam sebuah pasar swalayan kadang-kadang ada promosi produk tertentu? Di mana promosi barang tersebut diletakkan? Pada umumnya di area dekat kasir. Padahal kalau anda perhatikan lagi, barang yang dipromosikan sebenarnya sudah ada alokasi raknya sendiri di area lain di toko tersebut. Mengapa promosinya diletakkan di dekat kasir? Mungkin anda menjawab, agar orang melihat promosi itu, dan sambil menunggu antrian pembayaran di kasir, manajer toko berharap anda akan mengambil salah satu produk itu untuk anda coba. Jika ini terjadi, promosi yang dilakukan berhasil, dan manajer toko berhasil mencapai tujuannya meningkatkan jumlah penjualan.

Jika diamati lebih jauh, peletakan barang-barang di toko juga dilakukan berdasarkan pemikiran yang sama. Secara mudah, manajer toko menggunakan aturan sederhana: Letakkan barang-barang yang bisa menarik pembeli di tempat yang mudah terlihat. Tapi sebenarnya tidak hanya itu yang bisa dilakukan oleh manajer toko. Barang apa saja sih (misalkan barang X, Y, atau Z) yang bisa menarik seorang pembeli ketika dia membeli sesuatu (misalkan barang A)?

Hal ini bisa diketahui dengan teknik Penambangan Data. Data penjualan yang dimasukkan oleh kasir setiap kali anda membeli barang di pasar swalayan akan tersimpan dalam basis data. Hal yang sama juga dilakukan bagi keranjang belanja milik pembeli lain selain anda. Dalam satu hari, akan terkumpul data transaksi (Transactions) yang berisi informasi barang-barang apa saja yang dibeli oleh masing-masing pembeli yang telah mengunjungi toko tersebut sepanjang hari. Tentu saja nama pembeli tidak perlu diketahui, yang diperlukan hanyalah nomor identitas transaksi (Transaction ID, atau lebih singkat TID) yang bisa diambil dari waktu pembelian dicatat ke dalam basis data. Selain TID, informasi yang diperlukan tentu saja adalah barang-barang apa saja (itemlist) yang ada dalam keranjang belanja untuk TID yang bersangkutan.

Jika anda tadi membeli barang-barang berikut ini:
1. Teh Tarik MaxTea
2. Kopi Torabika Capuccino
3. Nutrisari Florida Orange
4. Gula Rendah Kalori Tropicana Slim
5. Nutri Tea Instant Original Tea
6. Teh Poci Celup
7. Ginseng Creamer
8. Jahe Wangi
(daftar ini saya dapatkan dari mas Wisnu)

Untuk setiap TID, ada itemlist-nya masing-masing. Dan semua ini tercatat di dalam basis data.

Nah, sekarang, karena datanya sudah tercatat semua, pertanyaan manajer toko bisa dijawab dengan lebih mudah. Salah satu pertanyaan yang mungkin diajukan oleh manajer toko misalnya seperti ini: "Kalo saya mau naro Jahe Wangi, sebaiknya ditaro di mana yah, biar banyak yang beli? Apa deket sama Teh Poci? Apa ditaro deket sama Rinso?"

Kira-kira, mana yang paling masuk akal? Tentu saja diletakkan di dekat Teh Poci. Kalau ada pembeli yang hobi dengan Teh Poci, dan melihat di sebelahnya ada Jahe Wangi, kemungkinan besar dia akan mengambil satu kotak untuk dicoba di rumah. Tapi kalo orang beli Rinso?

(berlanjut di bagian ke-3)