Mar08 t05 Ucapan Ayub
Mar08 t05 Ucapan Ayub
Mar08 t05 Ucapan Ayub
Ajub Ajulian Z.
Achmad Hidayatno
Muhammad Widyanto Tri Saksono
Abstract: Growth in Digital signal processing technology gives positives influences in human
life. One of the branch of science that gives significant influence is digital speech processing. It
can be expand into some applications that make human life easier. Digital speech processing is
appropriate to speech recognition.
Speech recognition is used to arrange the movement of remote control car. The remote control
car will move according to our speech. This final project is closely related with speech
recognition. The LPC (Linear Predictive Coding) method will extract the speech signal
features and HMM (Hidden Markov Model) to modelling the speech signal are used. It is done
by comparing model from extracting feature that is available in HMM modelling. Models will
be used in the speech recognition process, if the models have highest level of conformity.
The experiment has been done in two conditions, i.e ideal condition in room wih low noise
level and unideal condition in room with noise. Result of the experiment from the whole sistem
performace at ideal condition is 97,71% for people that have been inputed in the database, and
95,42% for people which have not been inputed in the database. Result of the experiment of
database say it regulary is 97,14%. Result of the experiment of database at unideal condition is
54,28% for inputing word at noisy area, result of the experiment of database for inputing word
at high frequency from siren voice is 98,57% and result of the experiment of inputing similar
word with database is 97,6%
Kemajuan teknologi dalam bidang Pengolahan pengendali jarak jauh, sistem pengolahan suara
Sinyal Digital (Digital Signal Processing) telah digital dapat digunakan untuk mengenali suara
membawa dampak positif dalam kehidupan masukan dan memberikan suatu keputusan
manusia. Salah satu disiplin ilmu dalam tentang arti dari ucapan tersebut. Proses ini
pengolahan sinyal digital yang memberikan sering disebut dengan proses pengenalan ucapan.
dampak yang cukup besar ialah bidang Selama ini, jika ingin menjalankan mobil
Pengolahan Suara Digital. Pengolahan suara pengendali jarak jauh perlu dilakukan penekanan
digital dapat dikembangkan berbagai aplikasi suatu tombol. Hal ini menjadi tidak efektif jika
yang dapat mempermudah kehidupan manusia. ingin menjalankan mobil pengendali jarak jauh
Salah satu aplikasi yang dapat dibuat ialah masih dengan sistem manual. Tentu saja hal
aplikasi untuk pengatur mobil dengan pengendali tersebut akan membuang waktu dan tenaga untuk
jarak jauh. Dalam proses pengatur mobil dengan menjalankan mobil pengendali jarak jauh
Ajub Ajulian Z., Achmad Hidayatno ({ajub, [email protected]}), adalah dosen di
Jurusan Teknik Elektro Fakultas Teknik Universitas Diponegoro (Undip) Semarang Jl. Prof.
Sudharto, S.H. Tembalang Semarang 50275
Muhammad Widyanto Tri Saksono adalah mahasiswa di Jurusan Teknik Elektro Fakultas
Teknik Universitas Diponegoro (Undip) Semarang Jl. Prof. Sudharto, S.H. Tembalang
Semarang 50275
21
22 Transmisi, Jurnal Teknik Elektro, Jilid 10, Nomor 1, Maret 2008, hlm 21-26
tersebut. Oleh karena itu perlu dikembangkan sebuah model yang mempunyai
suatu sistem yang dapat menjalankan mobil karakteristik bentuk statistik dari ciri-ciri
pengendali jarak jauh melalui ucapan, yang dapat pola referensi.
dijalankan dari jarak jauh. 3. Perbandingan dengan Pola Model
Dalam Tugas Akhir ini dibuat sebuah Pola uji yang akan dikenali dibandingkan
aplikasi untuk pengatur mobil dengan pengendali dengan setiap kelas pola referensi.
jarak jauh dengan menggunakan masukan berupa Kesamaan besaran antara pola uji dengan
suara dan menghasilkan keluaran yang dapat setiap pola referensi akan dihitung.
digunakan sebagai pengaktif mobil dengan 4. Logic Decision
pengendali jarak jauh Menentukan kelas pola referensi mana yang
Tujuan paling cocok untuk pola uji berdasarkan
Tujuan dari Penelitian ini ialah mengatur klasifikasi pola.
mobil dengan pengendali jarak jauh melalui
ucapan. Ekstraksi Ciri
Ciri sinyal ucapan sangat berguna pada
DASAR TEORI sistem pengenalan suara. Salah satu metode yang
Pengenalan Suara digunakan untuk proses ekstraksi ciri adalah
Pengenalan suara merupakan salah satu LPC. Analisis prediksi linear adalah suatu cara
upaya agar suara dapat dikenali atau yang digunakan untuk mendapatkan sebuah
diidentifikasi sehingga dapat dimanfaatkan. pendekatan sinyal suara. Peramalan linear secara
Pengenalan suara dapat dibedakan ke dalam tiga khusus merupakan metode yang cocok dalam
bentuk pendekatan, yaitu pendekatan akustik- pengolahan sinyal suara. Metode ini dapat juga
fonetik (the acoustic-phonetic approach), diterapkan dalam pengenalan kata. Tujuan dari
pendekatan kecerdasan buatan (the artificial digunakannya metode ini adalah untuk mencari
intelligence approach), dan pendekatan nilai koefisien LPC dari suatu sinyal. Gambar 2
pengenalan-pola (the pattern recognition menunjukkan blok diagram analisis LPC.
approach). Blok diagram pengenalan pola pada
Pembingka Metode
pengenalan suara ditunjukkan pada Gambar 1 Sinyal Penjendel Parame
ian Sinyal Autokorel
aan
Ucapan (windowi ter
(frame asi
Diskrit blocking)
ng) Keluar
(a). Blok diagram pembelajaran pola.
Gambar 2 Blok diagram analisis LPC
(b). Blok diagram pengenalan suara. Prinsip dasar dari ekstraksi ciri sinyal dengan
menggunakan LPC adalah bahwa contoh sinyal
Gambar 1 Blok diagram pembelajaran pola ucapan s(n) pada waktu ke-n dapat diperkirakan
dan pengenalan suara. sebagai kombinasi linear p sampel sinyal ucapan
sebelumnya yaitu :
Berikut ini merupakan penjelasan dari masing-
masing blok: s ( n) a1 s ( n 1) a 2 s( n 2) .... a p s( n p )
1. Pengekstraksi ciri.
Merupakan proses mendapatkan sederetan Pemodelan Dengan HMM (Hidden Markov
besaran pada bagian sinyal masukan untuk Model)
menetapkan pola pembelajaran atau pola HMM berkembang dengan cepat pada
uji. akhir tahun 1960 dan awal tahun 1970 karena
2. Pembelajaran Pola pemodelan ini sangat kaya akan struktur
Satu atau lebih pola pembelajaran yang matematika dan bisa digunakan untuk beragam
berhubungan dengan bunyi ucapan dari aplikasi. HMM merupakan salah satu bentuk
kelas yang sama, digunakan untuk membuat model Markov dengan observasi merupakan
pola representatif dari ciri-ciri kelas sebuah fungsi probabilitas dari state (keadaan)
tersebut. Hasilnya yang biasa disebut dengan model yang dihasilkan adalah sebuah
dengan pola referensi, dapat menjadi proses stokastik. Proses stokastik tidak dapat
Ajulian, Aplikasi Pengenalan Ucapan sebagai Pengatur Mobil dengan Pengendali Jarak Jauh 23
Mobil
Tindakan Proses Penerima
Remote Cont rol
Pengenalan Ucapan
Pembuatan sistem pengenalan ucapan
terdiri dari proses pengolahan basisdata, proses
ekstraksi ciri, dan proses pemodelan dan
pelatihan. Ketiga proses tersebut sering disebut
dengan proses pembelajaran. Proses pengenalan
ucapan merupakan proses pembandingan antara
suara uji dengan model suara yang didapat dari
proses pembelajaran.
Pembentukan Basisdata
Basisdata berisi perintah-perintah yang
diperlukan untuk menjalankan program ini,
seperti kata hidup, mati, satu, dua, tiga, dan Gambar 8 Bagan pemodelan parameter HMM
empat. Dalam pembuatan basisdata utama
digunakan program bantu Cool Edit Pro 2. Proses Antarmuka Sistem
Basisdata yang diambil memiliki frekuensi cuplik Proses antarmuka sistem menggunakan
8000 Hz, 16 bit, mono, yang diperoleh dari lima port paralel, tetapi sebelum bisa memakainya
orang responden yang masing-masing tiga orang terlebih dahulu port paralel tersebut perlu
berjenis kelamin pria dan dua orang yang didaftarkan. Untuk mendaftarkan port paralel
berjenis kelamin wanita dengan rentang usia 22- yang sudah tersedia di belakang panel komputer,
23 tahun. Setelah dilakukan perekaman, suara menggunakan instruksi seperti di bawah ini :
dari setiap responden akan dipotong–potong out =
dengan durasi satu detik untuk setiap kata. daqregister('parallel');
Dalam basisdata terdapat 300 potong dio =
kata yang akan diproses, yang terdiri dari digitalio('parallel','LPT1');
pengucapan kata cepat, pelan, kanan, kiri, lines =
mundur, dan mati ( tiap kata diucapkan sepuluh addline(dio,0:7,'out');
kali oleh lima responden ). putvalue(dio,[1 0 0 0 0 0 0
0]);
Ekstraksi Ciri Dengan Metode LPC
Proses pengekstraksian ciri dapat Rangkaian Blok Alat
dilakukan dengan menggunakan senarai program Rangkaian blok alat memerlukan
sebagai berikut: komponen semikonduktor berupa transistor yang
s = wavread(‘ABC.wav’); digunakan sebagai saklar. Saat transistor
X = PAR_LPC(s,p,N,M); mencapai keadaan jenuh, arus akan mengalir dari
Dengan: basis ke kolektor. Sebaliknya saat transistor
s = matrik berkas suara mencapai keadaan cut-off arus mengalir dari
p = orde LPC basis ke emitter. Gambar 9 menunjukkan
N = jumlah sample tiap frame rangkaian skematik sistem yang dibuat sebagai
M = jarak antara frame yang berurutan pengaktif peralatan elektronik.
Tabel 5 Hasil pengujian kinerja sistem dengan kinerja proses pengenalan mengalami
pengucapan kata di luar basisdata. penurunan.
Jumlah
Kata Masukan Keberhasilan
Pengujian
KESIMPULAN
Belok 10 80
Dari hasil penelitian dan pembahasan dapat
Rem 10 80 disimpulkan bahwa :
Gas 10 80 1. Hasil pengujian basisdata perintah pada
Belakang 10 80 kondisi ideal adalah 92% untuk responden
Berhenti 10 70
yang sudah memasukkan basisdata dan
88,3% untuk responden yang belum
Depan 10 70
memasukkan basisdata.
2. Hasil pengujian kinerja sistem secara
Tabel 6 Hasil pengujian basisdata dengan keseluruhan pada kondisi ideal adalah 90%.
kondisi lingkungan berderau. 3. Hasil pengujian basisdata perintah pada
Kata Masukan Jumlah Pengujian Keberhasilan kondisi tidak ideal adalah 73,33% untuk
Cepat 10 50% pengucapan kata di luar basisdata dan 55%
Pelan 10 60% untuk pengucapan kata masukan pada
Kanan 10 60% lingkungan berderau.
Kiri 10 50% 4. Hasil pengujian kinerja sistem pada kondisi
Mundur 10 50% tidak ideal adalah 76,66% untuk pengucapan
Mati 10 60% kata diluar basisdata dan 60% untuk
pengucapan masukan pada kondisi
Tabel 7 Hasil pengujian kinerja sistem dengan lingkungan berderau.
kondisi lingkungan berderau 5. Amplitude derau yang melebihi ambang
tetap terproses dan memberikan sebuah
Kata Masukan Jumlah Pengujian Keberhasilan keluaran, tetapi hasil dari pemrosesan derau
Cepat 10 50% 6. akan memberikan keluaran yang tidak dapat
Pelan 10 60% diprediksi.
Kanan 10 60% 7. Lafal pengucapan kata masukan harus jelas
Kiri 10 60% dan sesuai dengan pemenggalan kata.
Mundur 10 60%
Mati 10 70% DAFTAR RUJUKAN
Barmawi, M., Tjia, M., Elektronika Terpadu,
Dapat dilihat pada Tabel 3 dan Tabel 7 kinerja Jakarta: Erlangga, 1997.
sistem mengalami penurunan yang sangat jauh Edyanto, J., MATLAB Bahasa Komputasi
bila dibandingkan dengan pengujian dalam Teknis, Yogyakarta: Andi, 2000.
kondisi ideal. Penurunan ini dangat dipengaruhi Hapsari, J.P., Aplikasi Pengenalan Suara dalam
oleh: Pengaksesan Sistem Informasi
1. Pelafalan kata masukan. Akademik, Skripsi S-1, Universitas
Pengucapan ketika pengujian sangat Diponegoro, Semarang, 2007.
berpengaruh dalam penentuan keberhasilan Rabiner, L., Biing-Hwang Juang, Fundamentals
proses pengenalan. Untuk menghasilkan Of Speech Recognition, New Jersey:
pengenalan kata masukan sesuai dengan Prentice Hall, 1993.
yang diinginkan, perlu diperhatikan kata-kata
masukan yang diucapkan. Rabiner, L., Tutorial of Hidden Markov Models
2. Derau and Selected Application in Speech
Derau yang ditambahkan dalam proses Recognition.
pengujian sangat berpengaruh dalam proses http://www.cs.ubc.ca/~murphyk/Bayes/rabiner.p
pengenalan. Ketika derau ditambahkan pada df. Februari 1989.
saat pengucapan kata masukan, derau akan Upperman, G., Linear Predictive Coding In
merubah nilai-nilai amplitudo sinyal Voice Conversion.
masukan dan merusak sinyal suara masukan http://cnx.org/content/m12473/latest/. Desember
tersebut. Perubahan ini mengakibatkan 2004.