Monday, September 17, 2007

Membangun Kamus dari Percakapan Mailing List

Sebuah mailing list yang bersifat teknis, seperti misalnya Bahtera, beranggotakan para penterjemah profesional. Seringkali mereka berbagi pengetahuan tentang padanan istilah dari satu bahasa (bahasa sumber) ke bahasa lainnya (bahasa tujuan) dengan melontarkan pertanyaan ke mailing list. Para kolega yang memiliki saran jawaban untuk pertanyaan yang diberikan mengirimkan jawabannya.

Seiring dengan bertambahnya waktu, pengetahuan tentang padanan istilah ini seringkali terlupakan. Ketika muncul pertanyaan tentang padanan istilah yang sama, maka para anggota mailing list kemungkinan besar akan kembali mengajukan pertanyaan yang kurang lebih sama. Hal ini terjadi karena sering kali arsip mailing list sulit ditelusuri. Dari pengamatan ini, muncul pemikiran, mengapa tidak bisa dibuat sebuah sistem yang memiliki kemampuan untuk menarik intisari dari sebuah thread mailing list, dan intisari ini disimpan ke dalam sebuah basis data yang bisa ditelusuri (searchable and browsable) untuk mempermudah penggunaan di masa yang akan datang.

Penelitian ini mencoba membangun sebuah sistem yang secara otomatis dan akumulatif, menambahkan kamus padanan istilah. Idenya adalah dengan mem-parsing percakapan di dalam sebuah thread mailing list untuk mengekstrak bagian-bagian penting yang menyusun kamus padanan istilah.

No comments:

Post a Comment