PENERJEMAH LANGSUNG PERCAKAPAN PADA SMARTPHONE BERBASIS SPEECH RECOGNITION (PKM - 2013) PDF

Title PENERJEMAH LANGSUNG PERCAKAPAN PADA SMARTPHONE BERBASIS SPEECH RECOGNITION (PKM - 2013)
Author Budi Setiawan
Pages 20
File Size 544.3 KB
File Type PDF
Total Downloads 51
Total Views 325

Summary

PROGRAM KREATIVITAS MAHASISWA PENERJEMAH LANGSUNG PERCAKAPAN PADA SMARTPHONE BERBASIS SPEECH RECOGNITION BIDANG KEGIATAN: PKM-GT Diusulkan oleh: Budi Setiawan Santoso ( 17111785 / 2011 ) Amanda Terrena Putri ( 10111660 / 2011 ) Millati Izzatillah ( 18111003 / 2011 ) Endru Reza Yubiadhitama ( 1211036...


Description

PROGRAM KREATIVITAS MAHASISWA

PENERJEMAH LANGSUNG PERCAKAPAN PADA SMARTPHONE BERBASIS SPEECH RECOGNITION

BIDANG KEGIATAN: PKM-GT

Diusulkan oleh: Budi Setiawan Santoso Amanda Terrena Putri Millati Izzatillah Endru Reza Yubiadhitama Mahisa Ajy Kusuma

( 17111785 / 2011 ) ( 10111660 / 2011 ) ( 18111003 / 2011 ) ( 12110368 / 2010 ) ( 14110180 / 2010 )

UNIVERSITAS GUNADARMA DEPOK 2013

LEMBAR PENGESAHAN

i

KATA PENGANTAR Puji syukur kami panjatkan kehadirat Tuhan Yang Maha Esa atas rahmat-nya, sehingga kami dapat menyelesaikan pembuatan Karya Tulis PKM (Program Kreatifitas Mahasiswa) yang berjudul Penerjemah Langsung Percakapan Pada Smartphone Berbasis Speech Recognition secara tepat waktu. Dalam penyusunan karya tulis ini, tidak sedikit hambatan yang kami hadapi. Namun kami menyadari bahwa kelancaran dalam penyusunan karya tulis ini tidak lain berkat bantuan, dorongan, bimbingan, serta motivasi Ibu Dr. Ana Kurniawati, S.Kom., MMSI sebagai dosen pembimbing kami, sehingga kendala-kendala yang kami hadapi dalam penulisan karya tulis ini dapat teratasi. Makalah ini berisikan tentang sebuah konsep pengembangan teknologi yang membantu masyarakat agar dapat menerjemahkan percakapan secara langsung pada smartphone yang dimilikinya. Diharapkan karya tulis ini dapat memberikan informasi kepada kita semua tentang adanya pengembangan konsep teknologi terkait yang kami kemukakan. Dalam penulisan karya tulis ini kami merasa masih banyak kekurangan, baik pada teknis penulisan maupun materi, mengingat akan kemampuan yang kami miliki. Untuk itu kritik dan saran dari semua pihak sangat kami harapkan demi menyempurnakan pembuatan karya tulis selanjutnya. Akhir kata, kami ucapkan terima kasih kepada semua pihak yang telah berperan serta dalam penyusunan karya tulis ini dari awal sampai akhir. Semoga Tuhan Yang Maha Esa selalu meridhai segala usaha kita. Amin.

Maret 2013

Penulis

ii

DAFTAR ISI HALAMAN PENGESAHAN USULAN PKM-GT ............................................. i KATA PENGANTAR .......................................................................................... ii DAFTAR ISI ........................................................................................................ iii DAFTAR GAMBAR ........................................................................................... iv RINGKASAN ........................................................................................................1 PENDAHULUAN Latar Belakang Masalah ......................................................................................2 Tujuan dan Manfaat .............................................................................................2 GAGASAN Kondisi Kekinian..................................................................................................2 Solusi yang Pernah Dilakukan..............................................................................4 Kehandalan Gagasan ............................................................................................6 Pihak yang Dipertimbangkan ...............................................................................7 Strategi Penerapan ................................................................................................8 KESIMPULAN.....................................................................................................10 DAFTAR PUSTAKA ...........................................................................................10 DAFTAR BIODATA PENELITI .......................................................................11

iii

DAFTAR GAMBAR Gambar 1. Diagram Umum Sistem Speech Recognition ........................................3 Gambar 2. Diagram Umum Konsep Speech to Speech ...........................................6 Gambar 3. Blok Diagram Speech to Speech Berdasarkan Gagasan ........................7 Gambar 4. SDLC .....................................................................................................8

iv

RINGKASAN Manusia berkomunikasi untuk dapat menyampaikan atau mengungkapkan pikiran, gagasan, keinginan maupun perasaan kepada individu lain dengan menggunakan bahasa yang dihasilkan dari alat ucap manusia. Setiap negara mempunyai bahasa masing-masing yang memiliki perbedaan baik dari segi penulisan, pelafalan maupun penamaan pada segala sesuatunya. Perbedaan tersebut terkadang menjadi kendala bagi satu individu dengan individu lainnya yang memiliki latar belakang dari negara yang berbeda dalam berkomunikasi. Aplikasi penerjemah langsung percakapan menjawab dari kendala yang ada. Aplikasi yang kini telah ada berbasis speech recognition dengan konsep speech to text atau text to speech dan speech to act. Speech recognition adalah suatu pengembangan teknik dan sistem yang memungkinkan komputer untuk menerima masukan berupa kata yang diucapkan. Dari perkembangan sistem speech recognition, muncul konsep baru yaitu speech to speech, dimana pada konsep ini akan menerjemahkan masukan dan keluaran berupa suara. Jibbigo adalah salah satu contoh aplikasi pada smartphone dengan sistem operasi Android yang menggunakan konsep speech to speech, dimana menerjemahkan masukan dan keluaran berupa suara, namun sebelum dikeluarkannya hasil penerjemahan, masukan akan diubah terlebih dahulu kedalam teks. Aplikasi ini dirancang dengan algoritma yang lebih sederhana dengan tingkat keakuratan penerjemahan yang lebih tinggi dan waktu jeda dalam penerjemahan bahasa yang lebih singkat, yakni 5 detik. Aplikasi ini dapat dijalankan tanpa menggunakan koneksi internet atau dalam keadaan offline. Selain diterapkan pada Android, aplikasi ini dapat dijalankan pada sistem operasi IOS maupun Windows Phone. Aplikasi ini juga menggunakan teknik yang mampu memperhatikan hanya suara sang pembicara dengan mengabaikan kebisingan suara sekitar.

1

PENDAHULUAN Latar Belakang Bahasa merupakan cara komunikasi untuk menyampaikan atau mengungkapkan pikiran, gagasan, keinginan maupun perasaan antar manusia yang dihasilkan dari alat ucap manusia. Bahasa juga merupakan hal yang sangat krusial dalam kemajuan dan peradaban manusia. Akan tetapi, setiap belahan dunia mempunyai bahasanya masing-masing yang mana memiliki perbedaan baik dari segi penulisan, pelafalan maupun penamaan pada segala sesuatunya. Perbedaan tersebut terkadang menjadi kendala bagi satu individu dengan individu lainnya yang memiliki latar belakang dari negara yang berbeda dalam berkomunikasi. Terdapat beragam bahasa yang ada di seluruh dunia, dimana dalam mempelajarinya tidaklah mudah dan cenderung membutuhkan waktu yang lama. Metode dalam mempelajari bahasa saat ini sudah cukup banyak, seperti yang sudah dimasukkan ke dalam dunia pendidikan formal maupun non formal berupa kursus bahasa dan sebagainya. Untuk itu, manusia membutuhkan metode baru agar mudah berkomunikasi dengan bahasa lain. Metode ini menggunakan suatu alat yang telah hadir ditengah kehidupan umat manusia, bahkan alat ini telah menjadi seperti asisten kecil yang selalu ada menemani disetiap aktivitas. Berdasarkan penjelasan diatas, alat ini dikenal dengan sebutan smartphone. Smartphone inilah yang akan menjadi media bantu dalam mempermudah komunikasi secara langsung antar individu yang menggunakan bahasa berbeda. Didalam smartphone tersebut akan terdapat suatu aplikasi yang dapat menerjemahkan bahasa dan pengguna dapat mengatur bahasa terjemahan sesuai dengan bahasa yang dikehendaki, sehingga manusia dapat berkomunikasi dengan mudah walaupun menggunakan bahasa yang berbeda. Tujuan dan Manfaat Penerjemah langsung percakapan pada smartphone yang berbasis speech recognition ini bertujuan untuk mempermudah manusia dalam berkomunikasi dengan bahasa yang berbeda. Jadi, bahasa bukan lagi kendala untuk saling berkomunikasi dan bertukar informasi satu sama lain. Selain itu, aplikasi ini mampu menjawab tantangan globalisasi dimana manusia di seluruh dunia saling berinteraksi. Aplikasi penerjemah ini dijadikan media pembelajaran yang dilakukan oleh masing-masing individu dalam hal pelafalan suatu bahasa, misalnya pada siswa-siswi di sekolah dalam pembelajaran bahasa asing. Aplikasi ini juga dapat membantu seseorang dalam perjalanannya ke berbagai negara asing dan mengalami kesulitan dalam berkomunikasi dengan warga negara tersebut, misalnya pelajar atau mahasiswa yang melanjutkan studinya ke luar negeri, pebisnis yang melakukan urusan-urusan bisnisnya, TKI yang bekerja bukan di negara asalnya dan orang yang melakukan perjalanan wisata ke luar negeri. GAGASAN Kondisi Kekinian Pada abad ke-20 arus globalisasi berkembang pesat di berbagai negara ketika mulai ditemukan teknologi informasi, transportasi dan komunikasi. Globalisasi 2

secara fisik ditandai dengan perkembangan kota yang menjadi bagian dari jaringan kota dunia. Hal ini dapat dilihat dari infrastruktur telekomunikasi, jaringan transportasi dan perusahaan-perusahaan berskala internasional beserta cabang-cabangnya. Globalisasi mengharuskan adanya interaksi sesama manusia. Manusia perlu melakukan interaksi dalam hal melangsungkan kehidupannya sebagai makhluk sosial. Interaksi dapat dilakukan dalam berbagai macam bentuk, salah satu diantaranya adalah dengan cara berkomunikasi, baik langsung maupun tidak langsung. Komunikasi berkembang secara luas dan bebas yang menjadi hal penting untuk menyampaikan suatu bentuk gagasan, pemikiran, maupun pendapat. Komunikasi memungkinkan seluruh umat manusia di dunia untuk saling bertukar informasi, baik secara langsung maupun tidak langsung. Proses pertukaran informasi lintas negara inilah yang kadang mengalami suatu kendala dalam hal bahasa, karena dalam berkomunikasi setiap warga negara memiliki ciri khas dari bahasanya masing-masing. Kendala inilah yang memacu para pakar untuk menyelesaikan masalah ini. Tercetuslah sebuah gagasan untuk membuat suatu metode teknologi dimana mampu mengenali bahasa-bahasa yang ada di dunia. Teknologi ini berbasis speech recognition. Speech recognition adalah suatu pengembangan teknik dan sistem yang memungkinkan komputer untuk menerima masukan berupa kata yang diucapkan. Teknologi ini memungkinkan suatu perangkat untuk mengenali dan memahami kata-kata yang diucapkan dengan cara digitalisasi kata dan mencocokkan sinyal digital tersebut dengan suatu pola tertentu yang tersimpan dalam suatu perangkat. Kata-kata yang diucapkan diubah bentuknya menjadi sinyal digital dengan cara mengubah gelombang suara menjadi sekumpulan angka yang kemudian disesuaikan dengan kode-kode tertentu untuk mengidentifikasi kata-kata tersebut. Hasil dari identifikasi kata yang diucapkan dapat ditampilkan dalam bentuk tulisan atau dapat dibaca oleh perangkat teknologi sebagai sebuah komando untuk melakukan suatu pekerjaan, misalnya penekanan tombol pada telepon genggam yang dilakukan secara otomatis dengan komando suara. Proses speech recognition tersebut dapat dilihat pada Gambar 1.

Gambar 1. Diagram Umum Sistem Speech Recognition ( Rabiner, 1993 )

Speech recognition menggunakan alat pengenalan ucapan, yang sering disebut dengan speech recognizer, dimana membutuhkan sampel kata sebenarnya yang diucapkan dari pengguna. Sampel kata akan didigitalisasi, disimpan dalam komputer dan kemudian digunakan sebagai basis data dalam mencocokkan kata yang diucapkan selanjutnya. Sebagian besar alat pengenal ucapan sifatnya masih tergantung kepada pengeras suara. Alat ini hanya dapat mengenal kata yang

3

diucapkan dari satu atau dua orang saja dan hanya bisa mengenali kata-kata terpisah, yaitu kata-kata yang dalam penyampaiannya terdapat jeda antar kata. Hanya sebagian kecil dari peralatan yang menggunakan teknologi ini yang sifatnya tidak tergantung pada pengeras suara. Alat ini sudah dapat mengenal kata yang diucapkan oleh banyak orang dan juga dapat mengenali kata-kata kontinu, atau kata-kata yang dalam penyampaiannya tidak terdapat jeda antar kata. Konsep speech recognition mulai diterapkan di berbagai bidang kehidupan manusia. Misalnya di bidang kesehatan terdapat alat pengenal ucapan yang digunakan untuk membantu para penyandang cacat dalam beraktivitas. Contohnya pada aplikasi Antarmuka Suara Pengguna atau Voice User Interface (VUI) yang menggunakan teknologi pengenal ucapan dimana pengendalian saklar lampu misalnya, tidak perlu dilakukan secara manual dengan menggerakkan saklar tetapi cukup dengan mengeluarkan perintah dalam bentuk ucapan sebagai saklarnya. Metode ini membantu manusia yang secara fisik tidak dapat menggerakkan saklar karena cacat pada tangan misalnya. Penerapan VUI ini tidak hanya untuk lampu saja tapi bisa juga untuk aplikasi-aplikasi kontrol yang lain. Dalam bidang militer, speech recognition digunakan pada pelatihan penerbangan. Aplikasi alat pengenal ucapan dalam bidang militer adalah pada pengatur lalu-lintas udara atau yang dikenal dengan Air Traffic Controllers (ATC) yang dipakai oleh para pilot untuk mendapatkan keterangan mengenai keadaan lalu-lintas udara seperti radar, cuaca, dan navigasi. Alat pengenal ucapan digunakan sebagai pengganti operator yang memberikan informasi kepada pilot dengan cara berdialog. Contoh lain dalam bidang militer, speech recognition telah diterapkan pada sebuah pesawat yang berbahasa Perancis namun aplikasi ini hanya menerapkan dalam bentuk aksi. Pesawat tersebut melakukan tindakan tertentu sesuai dengan perintah dari pilot. Misalnya, pilot memberikan perintah untuk menembak, maka pesawat akan langsung melakukan perintah tersebut. Dalam bidang telekomunikasi, speech recognition telah diterapkan pada smartphone yang berbasis Windows, Android, IOS dan Symbian dengan menggunakan konsep speech to act. Konsep ini bekerja dengan mengubah ucapan pengguna menjadi suatu perintah untuk menjalankan aksi tertentu seperti menulis pesan, memainkan musik, dan sebagainya. Solusi yang Pernah Dilakukan Melihat dari perkembangan teknologi berbasis speech recognition telah dijumpai beberapa aplikasi yang bekerja menggunakan suara yang dihasilkan oleh alat ucap manusia. Konsep speech recognition telah diterapkan beberapa aplikasi yakni text to speech atau speech to text dan speech to act. Dutoit (2001) mendefinisikan text to speech sebagai hasil suara dari mesin dengan jalan mengotomatisasikan artikulasi dari kalimat yang diucapkan. Pelton (1993) menyatakan bahwa tugas dari sistem text to speech adalah mengonversi teks biasa menjadi ucapan. Dalam bagian lainnya Pelton menyatakan pula “keuntungan menarik dari sistem text to speech adalah bahwa segala macam teks dapat dibaca, kosa kata tidak dibatasi untuk pengucapan yang telah diputuskan sebelumnya.”. Berdasarkan kedua sumber tersebut, suatu sistem text to speech didefinisikan sebagai sistem yang dapat mengubah teks menjadi ucapan secara otomatis dengan

4

cara fonetisasi (penyusunan fonem-fonem untuk membentuk ucapan). Sistem ini dapat mengucapkan kata apapun dan kosakatanya tidak terbatas. Konversi dari teks menjadi ucapan terdiri dari dua hal yaitu, mengubah dari teks ke fonem lalu mengubah fonem ke ucapan. Teks ke fonem mengubah kalimat yang dimasukkan dalam suatu bahasa tertentu yang berbentuk teks menjadi kodekode bunyi yang biasanya diartikan menjadi kode fonem. Pada prinsipnya, proses ini melakukan konversi dari simbol-simbol fonentik yang mempresentasikan unit bunyi terkecil dalam bahasa. Selanjutnya mengubah fonem ke ucapan dengan menggunakan speech synthesizer. Pada proses ini dilakukan penggabungan segmen bunyi berdasarkan pangkalan diphone concatenation (salah satu konverter yang dibuat oleh TCTS Lab, TTS Research Team, Belgia) yang mengubah kumpulan kode fonem menjadi suara atau ucapan. Sedangkan pada konsep speech to text merupakan kebalikan dari text to speech dimana masukannya berupa suara dan keluarannya berupa teks. Konsep speech to act menjelaskan bahwa adanya perubahan dan analisis terhadap suara yang dihasilkan oleh alat ucap manusia kemudian diterjemahkan kedalam suatu kegiatan berupa tindakan atau aksi yang langsung diterapkan pada teknologi yang digunakan (seperti pada smartphone). Tahap analisis ini diterapkan dengan terlebih dahulu mengonversikan setiap fonem dengan menulis kode menjadi sebuah informasi yang dapat dimengerti oleh mesin, sehingga mesin dapat melakukan sebuah tindakan. Contoh penerapan ini pada smartphone seperti menyalakan smartphone, memainkan musik, menurunkan atau menaikkan volume, menulis pesan dan lain-lain. Dari konsep speech recognition yang telah dijelaskan di atas, konsep tersebut telah diterapkan pada perangkat komputer personal dan perangkat mobile. Pada komputer personal ada beberapa aplikasi yang dikembangkan oleh Nuance Comunication Inc. Aplikasi digolongkan menjadi tiga katagori yaitu, untuk kebutuhan pribadi, bisnis dan kesehatan. Pada katagori untuk kebutuhan pribadi pengguna dapat memerintahkan sesuatu dan komputer melakukannya. Lalu, untuk kebutuhan bisnis konsep ini diterapkan pada sistem contact center yang bekerja dengan otomatisasi panggilan tanpa perlu bantuan manusia. Kemudian, pada bidang kesehatan konsep ini membantu menyediakan riwayat pasien dalam bentuk suara untuk meningkatkan efisiensifitas dan memberikan pelayanan kesehatan yang lebih baik. Pada smartphone konsep ini diterapkan pada sebuah aplikasi penerjemah bahasa yang ditemukan di Google Play Store pada sistem operasi Android. Aplikasi ini bernama Jibbigo. Jibbigo menerjemahkan bahasa satu ke bahasa lain dengan masukkan dan keluaran berupa suara yang terlebih dahulu diubah ke dalam teks dan menerjemahkannya kata per kata berdasarkan teks yang telah diubah. Proses penerjemahan pada aplikasi speech to speech dapat dilihat pada Gambar 2.

5

Gambar 2. Diagram Umum Konsep Speech to Speech ( Rabiner, 1993 ) Kehandalan Gagasan Seiring perkembangan zaman, konsep penerjemah bahasa yang ada masih berbasis speech to text dan speech to act. Sekalipun ada yang berbasis speech to speech, seperti aplikasi Jibbigo pada Android, aplikasi ini masih membutuhkan proses penerjemahan ke teks terlebih dahulu sebelum akhirnya berubah menjadi suara. Hal ini menghasilkan terjemahan yang tingkat keakuratannya masih rendah, dikarenakan penerjemahan dari kata ke kata, sehingga apabila penerjemahan dalam seluruh kalimat menjadi sedikit rancu. Selain kerancuan dalam penerjemahan kalimat, selang waktu yang dibutuhkan untuk menghasilkan terjemahan berupa suarapun menjadi lebih lama disebabkan oleh adanya proses penerjemahan ke teks terlebih dahulu. Demi menjawab kebutuhan manusia dalam berkomunikasi dengan perbedaan bahasa, dibutuhkan aplikasi penerjemah yang dapat berjalan secara real time. Aplikasi diterapkan pada kehidupan sehari-hari yang bekerja dengan merubah masukan dan keluaran berupa suara menjadi suara berbasis speech recognition dengan konsep speech to speech. Aplikasi penerjemah langsung percakapan adalah gabungan dari beberapa konsep teknologi yang telah ada sebelumnya namun lebih dikembangkan yang akan menambah tingkat keakuratan dan ketepatan dalam penggunaan kosakata percakapan. Aplikasi penerjemah ini dikembangkan menggunakan teknologi dengan algoritma yang lebih pendek dibandingkan dengan algoritma speech to speech yang telah ada. Algoritma dari konsep ini dimulai dengan adanya pengenalan suara menggunakan voice synthesizer yang akan dicocokkan pada database perekaman kata dan kalimat. Database tersebut didapat dari hasil kerja sama dengan Google Corporation. Pencocokkan kata dan kalimat dibagi dalam dua aspek, aspek pertama dimana akan mencocokkannya berdasarkan bahasa negara yang digunakan sedangkan pada aspek kedua berdasarkan tata bahasanya. Setelah proses pengenalan kata maupun kalimat, proses selanjutnya adalah dengan langsung mengeluarkannya kembali dalam bentuk suara sesuai dengan bahasa yang dipilih untuk penerjemahan. Terdapat empat jenis teknik yang diterapkan pada sistem ini yaitu singleended pre-recording, single-ended hiss reduction, single-ended surface noise reduction dan codec or dual-ended system. Sistem Single-ended pre-recording bekerja untuk mempengaruhi medium perekaman pada saat pemasukan suara oleh 6

pengguna. Single-ended hiss reduction bekerja dengan mengurangi kebisingan suara yang terjadi, termasuk sebelum dan sesudah proses pemasukan suara dengan b...


Similar Free PDFs