Mar08 t05 Ucapan Ayub

Download as pdf or txt
Download as pdf or txt
You are on page 1of 6

Aplikasi Pengenalan Ucapan

Sebagai Pengatur Mobil


Dengan Pengendali Jarak Jauh

Ajub Ajulian Z.
Achmad Hidayatno
Muhammad Widyanto Tri Saksono

Abstract: Growth in Digital signal processing technology gives positives influences in human
life. One of the branch of science that gives significant influence is digital speech processing. It
can be expand into some applications that make human life easier. Digital speech processing is
appropriate to speech recognition.
Speech recognition is used to arrange the movement of remote control car. The remote control
car will move according to our speech. This final project is closely related with speech
recognition. The LPC (Linear Predictive Coding) method will extract the speech signal
features and HMM (Hidden Markov Model) to modelling the speech signal are used. It is done
by comparing model from extracting feature that is available in HMM modelling. Models will
be used in the speech recognition process, if the models have highest level of conformity.
The experiment has been done in two conditions, i.e ideal condition in room wih low noise
level and unideal condition in room with noise. Result of the experiment from the whole sistem
performace at ideal condition is 97,71% for people that have been inputed in the database, and
95,42% for people which have not been inputed in the database. Result of the experiment of
database say it regulary is 97,14%. Result of the experiment of database at unideal condition is
54,28% for inputing word at noisy area, result of the experiment of database for inputing word
at high frequency from siren voice is 98,57% and result of the experiment of inputing similar
word with database is 97,6%

Key Words : speech recognition, LPC, HMM..

Kemajuan teknologi dalam bidang Pengolahan pengendali jarak jauh, sistem pengolahan suara
Sinyal Digital (Digital Signal Processing) telah digital dapat digunakan untuk mengenali suara
membawa dampak positif dalam kehidupan masukan dan memberikan suatu keputusan
manusia. Salah satu disiplin ilmu dalam tentang arti dari ucapan tersebut. Proses ini
pengolahan sinyal digital yang memberikan sering disebut dengan proses pengenalan ucapan.
dampak yang cukup besar ialah bidang Selama ini, jika ingin menjalankan mobil
Pengolahan Suara Digital. Pengolahan suara pengendali jarak jauh perlu dilakukan penekanan
digital dapat dikembangkan berbagai aplikasi suatu tombol. Hal ini menjadi tidak efektif jika
yang dapat mempermudah kehidupan manusia. ingin menjalankan mobil pengendali jarak jauh
Salah satu aplikasi yang dapat dibuat ialah masih dengan sistem manual. Tentu saja hal
aplikasi untuk pengatur mobil dengan pengendali tersebut akan membuang waktu dan tenaga untuk
jarak jauh. Dalam proses pengatur mobil dengan menjalankan mobil pengendali jarak jauh
Ajub Ajulian Z., Achmad Hidayatno ({ajub, [email protected]}), adalah dosen di
Jurusan Teknik Elektro Fakultas Teknik Universitas Diponegoro (Undip) Semarang Jl. Prof.
Sudharto, S.H. Tembalang Semarang 50275
Muhammad Widyanto Tri Saksono adalah mahasiswa di Jurusan Teknik Elektro Fakultas
Teknik Universitas Diponegoro (Undip) Semarang Jl. Prof. Sudharto, S.H. Tembalang
Semarang 50275

21
22 Transmisi, Jurnal Teknik Elektro, Jilid 10, Nomor 1, Maret 2008, hlm 21-26

tersebut. Oleh karena itu perlu dikembangkan sebuah model yang mempunyai
suatu sistem yang dapat menjalankan mobil karakteristik bentuk statistik dari ciri-ciri
pengendali jarak jauh melalui ucapan, yang dapat pola referensi.
dijalankan dari jarak jauh. 3. Perbandingan dengan Pola Model
Dalam Tugas Akhir ini dibuat sebuah Pola uji yang akan dikenali dibandingkan
aplikasi untuk pengatur mobil dengan pengendali dengan setiap kelas pola referensi.
jarak jauh dengan menggunakan masukan berupa Kesamaan besaran antara pola uji dengan
suara dan menghasilkan keluaran yang dapat setiap pola referensi akan dihitung.
digunakan sebagai pengaktif mobil dengan 4. Logic Decision
pengendali jarak jauh Menentukan kelas pola referensi mana yang
Tujuan paling cocok untuk pola uji berdasarkan
Tujuan dari Penelitian ini ialah mengatur klasifikasi pola.
mobil dengan pengendali jarak jauh melalui
ucapan. Ekstraksi Ciri
Ciri sinyal ucapan sangat berguna pada
DASAR TEORI sistem pengenalan suara. Salah satu metode yang
Pengenalan Suara digunakan untuk proses ekstraksi ciri adalah
Pengenalan suara merupakan salah satu LPC. Analisis prediksi linear adalah suatu cara
upaya agar suara dapat dikenali atau yang digunakan untuk mendapatkan sebuah
diidentifikasi sehingga dapat dimanfaatkan. pendekatan sinyal suara. Peramalan linear secara
Pengenalan suara dapat dibedakan ke dalam tiga khusus merupakan metode yang cocok dalam
bentuk pendekatan, yaitu pendekatan akustik- pengolahan sinyal suara. Metode ini dapat juga
fonetik (the acoustic-phonetic approach), diterapkan dalam pengenalan kata. Tujuan dari
pendekatan kecerdasan buatan (the artificial digunakannya metode ini adalah untuk mencari
intelligence approach), dan pendekatan nilai koefisien LPC dari suatu sinyal. Gambar 2
pengenalan-pola (the pattern recognition menunjukkan blok diagram analisis LPC.
approach). Blok diagram pengenalan pola pada
Pembingka Metode
pengenalan suara ditunjukkan pada Gambar 1 Sinyal Penjendel Parame
ian Sinyal Autokorel
aan
Ucapan (windowi ter
(frame asi
Diskrit blocking)
ng) Keluar
(a). Blok diagram pembelajaran pola.
Gambar 2 Blok diagram analisis LPC

(b). Blok diagram pengenalan suara. Prinsip dasar dari ekstraksi ciri sinyal dengan
menggunakan LPC adalah bahwa contoh sinyal
Gambar 1 Blok diagram pembelajaran pola ucapan s(n) pada waktu ke-n dapat diperkirakan
dan pengenalan suara. sebagai kombinasi linear p sampel sinyal ucapan
sebelumnya yaitu :
Berikut ini merupakan penjelasan dari masing-
masing blok: s ( n)  a1 s ( n  1)  a 2 s( n  2)  ....  a p s( n  p )
1. Pengekstraksi ciri.
Merupakan proses mendapatkan sederetan Pemodelan Dengan HMM (Hidden Markov
besaran pada bagian sinyal masukan untuk Model)
menetapkan pola pembelajaran atau pola HMM berkembang dengan cepat pada
uji. akhir tahun 1960 dan awal tahun 1970 karena
2. Pembelajaran Pola pemodelan ini sangat kaya akan struktur
Satu atau lebih pola pembelajaran yang matematika dan bisa digunakan untuk beragam
berhubungan dengan bunyi ucapan dari aplikasi. HMM merupakan salah satu bentuk
kelas yang sama, digunakan untuk membuat model Markov dengan observasi merupakan
pola representatif dari ciri-ciri kelas sebuah fungsi probabilitas dari state (keadaan)
tersebut. Hasilnya yang biasa disebut dengan model yang dihasilkan adalah sebuah
dengan pola referensi, dapat menjadi proses stokastik. Proses stokastik tidak dapat
Ajulian, Aplikasi Pengenalan Ucapan sebagai Pengatur Mobil dengan Pengendali Jarak Jauh 23

diobservasi langsung tetapi dapat diobservasi PERANCANGAN DAN IMPLEMENTASI SISTEM


hanya melalui rangkaian proses stokastik yang Sistem yang dibuat merupakan suatu
menghasilkan runtun observasi. sistem yang mampu mengendalikan mobil remote
control dengan ucapan. Melalui sistem ini, mobil
Tipe HMM tersebut dapat dikendalikan dengan menyebutkan
HMM dibagi menjadi dua tipe dasar perintah maju, mundur, kiri, kanan dan mati.
yaitu HMM ergodic dan HMM Kiri-Kanan Gambar 6 merupakan diagram blok dari sistem
1. HMM ergodic mobil pengendali jarak jauh dengan perintah
Pada HMM model ergodic, perpindahan suara.
state yang satu ke state yang lain semuanya
memungkinkan, hal ini ditunjukkan pada Perintah
Unit Pengolah
Proses Pemancar
Gambar 3. ( Komputer )

Mobil
Tindakan Proses Penerima
Remote Cont rol

Gambar 6 Diagram blok sistem pengaktif


Gambar 3 HMM model ergodic. Mobil Pengendali Jarak Jauh
Dengan Perintah Suara.
2. HMM Kiri-Kanan
Pada HMM Kiri-Kanan, perpindahan state Perintah dari port paralel komputer akan
hanya dapat berpindah dari kiri ke kanan saja diteruskan ke blok pemancar untuk selanjutnya
tidak dapat mundur ke belakang, hal ini ditransmisikan ke blok penerima. Blok penerima
ditunjukkan pada Gambar 4. berfungsi untuk mengolah data yang diterima
untuk kemudian diteruskan ke blok alat. Blok
alat berfungsi sebagai saklar untuk
menghidupkan atau mematikan peralatan
elektronik yang terhubung pada blok alat. Blok
pemancar dan penerima menggunakan pemancar
Gambar 4 HMM model kiri-kanan. dan penerima dari mobil remote control yang ada
di pasaran. Diagram alir dari sistem pengenalan
Konfigurasi Port Paralel ucapan sebagai pengatur mobil dengan
Port paralel adalah port yang pada pengendali jarak jauh dapat dilihat pada Gambar
umumnya digunakan sebagai port penghubung 7.
dengan printer. Port paralel juga dapat digunakan
untuk keperluan lain, karena port paralel dapat
digunakan untuk data in dan data out. Saat port
paralel mengirimkan data keluaran melalui 8
buah pin-nya, maka pin ini akan mempunyai
tegangan 5 volt, tergantung data biner yang
dikirim. Gambar 5 menunjukkan konfigurasi port
paralel DB-25 female yang dapat ditemukan di
belakang PC.

Gambar 7 Diagram alir Sistem Pengenalan


Ucapan Sebagai Pengaktif
Peralatan Elektronik.

Gambar 5 Konfigurasi Port Paralel DB-25


female.
24 Transmisi, Jurnal Teknik Elektro, Jilid 10, Nomor 1, Maret 2008, hlm 21-26

Pengenalan Ucapan
Pembuatan sistem pengenalan ucapan
terdiri dari proses pengolahan basisdata, proses
ekstraksi ciri, dan proses pemodelan dan
pelatihan. Ketiga proses tersebut sering disebut
dengan proses pembelajaran. Proses pengenalan
ucapan merupakan proses pembandingan antara
suara uji dengan model suara yang didapat dari
proses pembelajaran.
Pembentukan Basisdata
Basisdata berisi perintah-perintah yang
diperlukan untuk menjalankan program ini,
seperti kata hidup, mati, satu, dua, tiga, dan Gambar 8 Bagan pemodelan parameter HMM
empat. Dalam pembuatan basisdata utama
digunakan program bantu Cool Edit Pro 2. Proses Antarmuka Sistem
Basisdata yang diambil memiliki frekuensi cuplik Proses antarmuka sistem menggunakan
8000 Hz, 16 bit, mono, yang diperoleh dari lima port paralel, tetapi sebelum bisa memakainya
orang responden yang masing-masing tiga orang terlebih dahulu port paralel tersebut perlu
berjenis kelamin pria dan dua orang yang didaftarkan. Untuk mendaftarkan port paralel
berjenis kelamin wanita dengan rentang usia 22- yang sudah tersedia di belakang panel komputer,
23 tahun. Setelah dilakukan perekaman, suara menggunakan instruksi seperti di bawah ini :
dari setiap responden akan dipotong–potong out =
dengan durasi satu detik untuk setiap kata. daqregister('parallel');
Dalam basisdata terdapat 300 potong dio =
kata yang akan diproses, yang terdiri dari digitalio('parallel','LPT1');
pengucapan kata cepat, pelan, kanan, kiri, lines =
mundur, dan mati ( tiap kata diucapkan sepuluh addline(dio,0:7,'out');
kali oleh lima responden ). putvalue(dio,[1 0 0 0 0 0 0
0]);
Ekstraksi Ciri Dengan Metode LPC
Proses pengekstraksian ciri dapat Rangkaian Blok Alat
dilakukan dengan menggunakan senarai program Rangkaian blok alat memerlukan
sebagai berikut: komponen semikonduktor berupa transistor yang
s = wavread(‘ABC.wav’); digunakan sebagai saklar. Saat transistor
X = PAR_LPC(s,p,N,M); mencapai keadaan jenuh, arus akan mengalir dari
Dengan: basis ke kolektor. Sebaliknya saat transistor
s = matrik berkas suara mencapai keadaan cut-off arus mengalir dari
p = orde LPC basis ke emitter. Gambar 9 menunjukkan
N = jumlah sample tiap frame rangkaian skematik sistem yang dibuat sebagai
M = jarak antara frame yang berurutan pengaktif peralatan elektronik.

Pemodelan Dengan Menggunakan HMM


Parameter HMM didapatkan melalui
lima tahap, yaitu memasukkan runtun observasi
hasil dari proses ekstraksi ciri, memilih state,
inisialisasi parameter HMM, pelatihan HMM,
pelatihan HMM digunakan untuk mendapatkan
parameter yang lebih baik, dan penyimpanan
parameter. Gambar 9 Rangkaian skematik perancangan
piranti.
Ajulian, Aplikasi Pengenalan Ucapan sebagai Pengatur Mobil dengan Pengendali Jarak Jauh 25

PENGUJIAN Tabel 1 Hasil pengujian responden yang


Pengujian dilakukan dengan pengujian memasukkan basisdata.
program pengenalan ucapan. Jumlah
Responden Keberhasilan
Masukan Berhasil
Pengujian Program Utama I 60 54 90%
Pada tampilan awal terdapat beberapa II 60 60 100%
pilihan menu, salah satunya adalah menu III 60 50 83,33%
Program Utama. Menu program utama IV 60 52 86,67%
merupakan menu untuk menampilkan jendela V 60 60 100%
program utama. Untuk membuka jendela
program utama maka pada tampilan jendela awal
Tabel 2 Hasil pengujian responden yang
dipilih menu Program Utama, setelah menu
belum memasukkan basisdata.
program utama dipilih, maka akan muncul
Jumlah
jendela program utama yang ditunjukkan pada Responden Keberhasilan
Gambar 12. Masukan Berhasil
VI 60 60 100%
VII 60 47 78,33%
VIII 60 54 90%
IX 60 53 88,3%
X 60 51 85%

Tabel 3 Hasil pengujian kinerja sistem.


Kata Masukan Jumlah Pengujian Keberhasilan
Cepat 10 100%
Pelan 10 80%
Kanan 10 80%
Gambar 12 Tampilan Menu Program Utama. Kiri 10 100%
Mundur 10 80%
Pada tampilan program utama terdapat Mati 10 100%
tombol Mulai, tombol ini berfungsi untuk
menjalankan program pengenal ucapan. Bila Pengujian Dalam Kondisi Tidak Ideal
tombol ini ditekan maka program akan berjalan. Untuk selanjutnya dilakukan pengujian
Bila pada saat program berjalan terdapat sinyal dengan kondisi tidak ideal. Pengujian dengan
suara, maka sinyal suara tersebut akan diproses kondisi tidak ideal meliputi:
dengan dibandingkan dengan model parameter 1. Masukan merupakan kata yang tidak terdapat
yang tersedia. dalam basisdata. Kata sebagai masukan :
”Belok”, ”Rem”, ”Gas”, ”Belakang”,
Pengujian Program Pengenalan Ucapan ”Berhenti”,’’Depan’’.
Pengujian Dalam Kondisi Ideal 2. Pengujian dengan kondisi ruang pengujian
Pengujian dalam kondisi ideal dilakukan pada yang berderau. Derau yang digunakan dalam
kondisi ruangan yang memiliki derau rendah. pengujian ini dihasilkan dari pembangkitan
Pengujian Basisdata dilakukan dengan cara sinyal derau dengan menggunakan software
mengucapkan kata-kata ”cepat”, ”pelan”, bantu Cool Edit Pro.
”kanan”, ”kiri”, ”mundur”, ”mati” oleh 10
responden dengan masing-masing perekaman Tabel 4 Hasil pengujian basisdata dengan
sebanyak 10 kali. Pada pengujian kinerja sistem, pengucapan kata di luar basisdata.
dilakukan dengan cara menjalankan sistem secara Jumlah
Kata Masukan Keberhasilan
keseluruhan. Untuk menghitung persentase Pengujian
keberhasilan digunakan persamaan: Belok 10 70%

Jumlah ucapan total yang dikenali Rem 10 70%


(%) Pengenalan = x100 %
Jumlah ucapan total Gas 10 70%
Belakang 10 70%
Berhenti 10 80%
Depan 10 80%
26 Transmisi, Jurnal Teknik Elektro, Jilid 10, Nomor 1, Maret 2008, hlm 21-26

Tabel 5 Hasil pengujian kinerja sistem dengan kinerja proses pengenalan mengalami
pengucapan kata di luar basisdata. penurunan.
Jumlah
Kata Masukan Keberhasilan
Pengujian
KESIMPULAN
Belok 10 80
Dari hasil penelitian dan pembahasan dapat
Rem 10 80 disimpulkan bahwa :
Gas 10 80 1. Hasil pengujian basisdata perintah pada
Belakang 10 80 kondisi ideal adalah 92% untuk responden
Berhenti 10 70
yang sudah memasukkan basisdata dan
88,3% untuk responden yang belum
Depan 10 70
memasukkan basisdata.
2. Hasil pengujian kinerja sistem secara
Tabel 6 Hasil pengujian basisdata dengan keseluruhan pada kondisi ideal adalah 90%.
kondisi lingkungan berderau. 3. Hasil pengujian basisdata perintah pada
Kata Masukan Jumlah Pengujian Keberhasilan kondisi tidak ideal adalah 73,33% untuk
Cepat 10 50% pengucapan kata di luar basisdata dan 55%
Pelan 10 60% untuk pengucapan kata masukan pada
Kanan 10 60% lingkungan berderau.
Kiri 10 50% 4. Hasil pengujian kinerja sistem pada kondisi
Mundur 10 50% tidak ideal adalah 76,66% untuk pengucapan
Mati 10 60% kata diluar basisdata dan 60% untuk
pengucapan masukan pada kondisi
Tabel 7 Hasil pengujian kinerja sistem dengan lingkungan berderau.
kondisi lingkungan berderau 5. Amplitude derau yang melebihi ambang
tetap terproses dan memberikan sebuah
Kata Masukan Jumlah Pengujian Keberhasilan keluaran, tetapi hasil dari pemrosesan derau
Cepat 10 50% 6. akan memberikan keluaran yang tidak dapat
Pelan 10 60% diprediksi.
Kanan 10 60% 7. Lafal pengucapan kata masukan harus jelas
Kiri 10 60% dan sesuai dengan pemenggalan kata.
Mundur 10 60%
Mati 10 70% DAFTAR RUJUKAN
Barmawi, M., Tjia, M., Elektronika Terpadu,
Dapat dilihat pada Tabel 3 dan Tabel 7 kinerja Jakarta: Erlangga, 1997.
sistem mengalami penurunan yang sangat jauh Edyanto, J., MATLAB Bahasa Komputasi
bila dibandingkan dengan pengujian dalam Teknis, Yogyakarta: Andi, 2000.
kondisi ideal. Penurunan ini dangat dipengaruhi Hapsari, J.P., Aplikasi Pengenalan Suara dalam
oleh: Pengaksesan Sistem Informasi
1. Pelafalan kata masukan. Akademik, Skripsi S-1, Universitas
Pengucapan ketika pengujian sangat Diponegoro, Semarang, 2007.
berpengaruh dalam penentuan keberhasilan Rabiner, L., Biing-Hwang Juang, Fundamentals
proses pengenalan. Untuk menghasilkan Of Speech Recognition, New Jersey:
pengenalan kata masukan sesuai dengan Prentice Hall, 1993.
yang diinginkan, perlu diperhatikan kata-kata
masukan yang diucapkan. Rabiner, L., Tutorial of Hidden Markov Models
2. Derau and Selected Application in Speech
Derau yang ditambahkan dalam proses Recognition.
pengujian sangat berpengaruh dalam proses http://www.cs.ubc.ca/~murphyk/Bayes/rabiner.p
pengenalan. Ketika derau ditambahkan pada df. Februari 1989.
saat pengucapan kata masukan, derau akan Upperman, G., Linear Predictive Coding In
merubah nilai-nilai amplitudo sinyal Voice Conversion.
masukan dan merusak sinyal suara masukan http://cnx.org/content/m12473/latest/. Desember
tersebut. Perubahan ini mengakibatkan 2004.

You might also like