PENGOLAHAN BAHASA ALAMI

KECERDASAN BUATAN (PENGOLAHAN BAHASA ALAMI)

Kelompok 3 : 1. Firmansyah A. Harjanto

12090663

2. Irvak D. Lutvy

12010827

3. Kristanto B. Saputro

12090757

4. Sodikin

12090667

5. Sika A. Meliala

12090654

6. Tyas Widiatmo

12090689

7. Agus Supriyadi

12090675

8. Gusti Ah Ahmad Sarifudin

12090643

SEKOLAH TINGGI MANAJEMEN INFORMATIKA DAN ILMU KOMPUTER YOGYAKARTA 2011

PEMROSESAN BAHASA ALAMI Pengantar

Pemrosesan bahasa alami, disingkat PBA atau NLP (natural language processing), adalah cabang ilmu komputer dan linguistik yang mengkaji interaksi antara komputer dengan bahasa (alami) manusia . NLP sering dianggap sebagai cabang dari kecerdasan buatan dan bidang kajiannya bersinggungan dengan linguistik komputasional.

Tujuan dalam bidang Natural language ini adalah melakukan proses pembuatan model komputasi dari bahasa, sehingga dapat terjadi suatu interaksi antara manusia dengan komputer dengan perantara bahasa alami (bahasa sehari-hari).

Sebuah Natural Language System harus memperhatikan pengetahuan terhadap bahasa itu sendiri, baik dari segi kata yang digunakan, bagaimana kata-kata tersebut digabung untuk menghasilkan suatu kalimat, apa arti sebuah kata, apa fungsi sebuah kata dalam sebuah kalimat dan sebagainya. Kita juga harus mempertimbangkan kemampuan manusia untuk mengerti dan kemampuan untuk itu didapat dari pengetahuan yang didapat secara terus menerus sewaktu hidup

Peranan Pengetahuan dalam Bahasa

• Komunikasi dengan bahasa alami (teks/ucapan) bergantung pada pengetahuan dari domain pembicaraan •

Pemahaman bahasa tidak hanya ditransmisi dari kata-kata; tapi membutuhkan inferensi

tentang tujuan dan asumsi-asumsi dari pembicara dan tentang konteks interaksi •

Implementasi dari program pemahaman bahasa alami membutuhkan representasi sejumlah

besar pengetahuan dan alasan-alasan

Bidang Pengetahuan dalam Natural Language

Untuk mengatasi kompleksitas dari bahasa ini didefinisikan tingkat analisis bahasa alami : 1. Prosody, mengerjakan ritme & intonasi bahasa 2. Phonology menguji suara yang dikombinasikan untuk membentuk bahasa 3.

Morphology mengenai komponen-komponen (morfem-morfem) yang membentuk kata-

kata. Termasuk aturan-aturan pengembangan formasi kata-kata seperti efek dari prefix (un-, non-, anti-, dll), & sufiks (-ing, -ly, dll) yang memodifikasi arti dari akar kata. 4. Syntax, pemahaman tentang urutan kata dalam pembentukan kalimat dan hubungan antar

kata tersebut dalam proses perubahan bentuk dari kalimat menjadi bentuk yang sistematis. Meliputi proses pengaturan tata letak suatu kata dalam kalimat akan membentuk kalimat yang dapat dikenali. Selain itu dapat pula dikenali bagian-bagian kalimat dalam suatu kalimat yang lebih besar. Sebagai contoh kalimat S dibentuk dari noun phrase (NP) dan verb phrase (VP) Sintaksis: yaitu S  NP, VP Dan berikutnya: NP  DET, N VP  V, NP NP  N 5. Semantics, pemetaan bentuk struktur sintaksis dengan memanfaatkan tiap kata ke dalam

bentuk yang lebih mendasar dan tidak tergantung struktur kalimat. Semantik mempelajari arti suatu kata dan bagaimana dari arti kata – arti kata tersebut membentuk suatu arti dari kalimat yang utuh. 6. Pragmatics, merupakan studi pada cara dimana bahasa digunakan & efeknya pada si

pendengar 7. World Knowledge mencakup arti sebuah kata secara umum dan apakah ada arti khusus bagi

suatu kata dalam suatu percakapan dengan konteks tertentu. Selain yang sudah disebutkan di atas masih ada lagi satu masalah yang cukup menantang dalam Natural Language yaitu ambiguitas atau makna ganda dari suatu kata atau kalimat.

Pemrosesan Bahasa Alami

•

Menurut Rich [2], pemrosesan bahasa alami dapat dibagi atas beberapa proses: Morphological analysis, dimana kata secara individu dianalisis ke dalam

1.

komponen-komponennya dan yang bukan kata (seperti tanda baca) dipisahkan dari kata 2. Syntactic analysis, urutan linier dari kata ditransformasikan ke dalam struktur yang

menunjukkan bagaimana kata saling berhubungan. Urutan kata yang melanggar aturan bahasa dalam pengkombinasian kata, akan ditolak 3.

Semantic analysis, dibuat mapping antara struktur sintaksis & objek dalam domain kerja. Struktur dimana tidak ada mapping yang memungkinkan, akan ditolak.

4.

Discourse integration, dimana arti dari kalimat secara individu bergantung pada kalimat-kalimat yang mendahului & mungkin dapat mempengaruhi arti dari kalimat-kalimat yang mengikutinya

5.

Pragmatic analysis, dimana struktur yang merepresentasikan apa yang diucapkan, diintepretasikan kembali untuk menentukan apa arti sebenarnya.

Proses Sintaksis •

Proses sintaksis [2] atau disebut juga parsing , merupakan langkah dimana kalimat masukan

secara flat diubah ke dalam struktur hirarkis yang berhubungan dengan unit-unit arti dalam kalimat •

Proses sintaksis sangat berperan dalam pemahaman bahasa alami dikarenakan: -

Proses semantic harus beroperasi pada pilihan-pilihan kalimat. Jika tidak ada tahap parsing sintaksis maka sistem semantic harus memutuskan atas pilihannya sendiri. Jika parsing dilakukan, hal ini akan membatasi pilihan-pilihan dari semantic

-

Tidak selalu dimungkinkan untuk mengekstrak arti kalimat tanpa menggunakan fakta gramatikal

• Semua sistem menggunakan dua komponen: 1. Representasi deklaratif, disebut grammar, fakta sintaksis tentang bahasa 2. Prosedur, disebut parser , dimana membandingkan grammar dengan kalimat-

kalimat masukan untuk membentuk struktur yang dianalisis.

Grammar

•

Grammar direpresentasikan sebagai sekumpulan aturan-aturan produksi, seperti pada

gambar 1. Grammar merupakan suatu aturan yang menentukan apakah suatu kumpulan kata dapat diterima sebagai kalimat oleh bahasa tersebut. Sebuah grammar G dapat dibentuk dari 4 tuple yaitu : symbol non terminal, symbol terminal, symbol awal dan aturan penulisan atau rules. Definisinya adalah: 

G = (vn, vt, s, p) Sebagai contoh dapat kita lihat dari grammar G sederhana berikut ini: DictJenis = {Kata_Benda, Kata_Kerja, Frasa_Benda, Frasa_kerja, Keterangan} DictKata = {Orang, Makan, telur, Ayam, Terbang, Tinggi}

Dengan aturan : S

Frasa_Benda Frasa_Kerja

Frasa_Benda

Kata_Benda Kata_Benda

Frasa_Kerja

Kata_Kerja Keterangan

Kata_benda

{Orang, Telur, Ayam}

Kata_Kerja

{Makan, Terbang}

Keterangan

{Tinggi}

Dari grammar G dapat dibentuk kalimat : Orang Makan Ayam Ayam Terbang Tinggi Orang Terbang Tinggi Ayam Makan Orang

Dari grammar kita dapat mempelajari bahasa dari segi struktur dan bukan dari segi makna bahasa itu sendiri.

• Aturan pertama, ‘Sebuah kalimat terdiri atas kata benda (NP) diikuti kata kerja (VP)’. • I menyatakan “atau/or’, •

ε

•

Simbol-simbol yang diperluas oleh aturan-aturan disebut nonterminal symbols, sedangkan

menyatakan string kosong

simbol-simbol yang berhubungan langsung dengan string yang ditemukan pada kalimat masukan disebut terminal symbols.

Gambar 1. Grammar Untuk Bahasa Inggris Parsing •

Suatu proses menganalisa suatu kumpulan kata dengan memisahkan kata tersebut dan

menentukan struktur sintaksis dari tiap kata tersebut. Gramatika yang dipakai juga sangat berkaitan dengan proses parsing apa yang digunakan. •

Bottom-Up Parsing gramatika yang dipakai akan lebih banyak bercabang ke arah simbol

non-terminal. Hal lain yang juga berkaitan erat dengan proses parsing adalah kamus atau leksikon yang digunakan. Dalam leksikon disimpan daftar kata yang dapat dikenali sebagai symbol terminal dalam grammar dan informasi yang diperlukan untuk tiap kata tersebut untuk proses parsing yang bersangkutan. •

Pendekatan dalam mengenali struktur suatu kalimat, proses parsing dapat dibagi menjadi

dua bagian besar yaitu Top Down parsing dan Bottom Up parsing . Top Down parser memulai pemeriksaan dari simbol awal s dan mencoba untuk mencari bentuk simbol terminal berikutnya yang sesuai dengan jenis kata dari kalimat masukan. Cara sebaliknya diterapkan untuk Bottom Up parser yaitu mencari dari simbol-simbol terminal menuju ke arah pembentukan simbol awal s.

Gambar 2. Pohon Analisis Untuk Sebuah Kalimat

Automated Transition Networks (ATN) •

Automated Transition Network (ATN) merupakan prosedur top-down parsing dimana

bermacam-macam pengetahuan digabungkan ke sistem analisis sehingga dapat beroperasi lebih efisien. •

ATN (seperti pada gambar 3) menyerupai finite-state machine dimana klas label

digabungkan pada garis berarah yang mendefinisikan transisi antara suatu keadaan.

• Garis berarah ini dapat diberi label (dalam bahasa Inggris) dengan -

Kata-kata spesifik, seperti ‘in’

-

Kategori-kategori kata, seperti ‘noun’

-

Didorong ke jaringan lain untuk mengenali komponen lain pada suatu kalimat, seperti jaringan untuk mengenali prepositional phrase (PP) maka pada garis berarah ditanyakan noun phrase (NP)

-

Prosedur yang menjalankan tes pada input saat itu dan pada komponen kalimat yang telah diidentifikan

-

Prosedur-prosedur yang membangun struktur yang akan membentuk bagian akhir dari analisis

Gambar 3. : Sebuah Jaringan ATN untuk Fragmen Bahasa Inggris

• Cara kerja ATN pada kalimat:

‘The long file has printed’

1.

Mulai pada keadaan S

2.

Masuk ke NP

3.

Kerjakan tes kategori untuk melihat jika ‘the’ merupakan determiner

4.

Tes sukses, maka register DETERMINER diset ke DEFINITE lalu ke keadaan Q6

5.

Kerjakan tes kategori untuk melihat jika ‘long’ merupakan adjective

6.

Tes sukses, maka register ADJS ditambahkan ‘long’. Tetap tinggal di Q6

7.

Kerjakan tes kategori untuk melihat jika ‘file’ merupakan adjective. Tes gagal

8.

Kerjakan tes kategori untuk melihat jika ‘file’ merupakan noun. Tes sukses, register NOUN diset ke ‘file’ dan lalu ke keadaan Q7.

9.

Masuk ke PP

10.

Kerjakan tes kategori untuk melihat ‘has’ merupakan preposition. Tes gagal, sehingga keluar

11.

Tidak ada lagi yang dikerjakan di Q7, lalu keluar dan kembali ke struktur (NP(FILE(LONG)DEFINITE)), sehingga kembali ke keadaan Q1, dengan register SUBJ diset ke struktur yang dikembalikan dan register TYPE diset ke DCL

12.

Kerjakan tes kategori untuk melihat jika ‘has’ merupakan verb. Tes sukses, sehingga register AUX diset ke NIL dan register V diset ke ‘has’. Lanjut Q4

13.

Masuk ke keadaan NP, dikarenakan kata ‘printed’ bukan determiner ataupun noun murni, maka NP dikeluarkan

14.

Masih tersisa input, berarti analisis belum selesai. Lalu diperlukan backtracking .

15.

Pilihan terakhir terdapat pada Q1, sehingga kembali ke Q1. Register AUX dan V tidak diset

16.

Kerjakan tes kategori untuk melihat jika ‘has’ merupakan auxiliary. Tes sukses sehingga ‘has’ diset ke register AUX dan lalu ke Q3.

17.

Kerjakan tes kategori untuk melihat jika ‘printed’ merupakan verb. Tes sukses, maka register V diset ke ‘printed’. Lanjut ke Q4.

18.

Karena input telah habis, maka Q4 merupakan keadaan terakhir. Lalu keluar dan kembali ke struktur (S DCL (NP(FILE(LONG)DEFINITE)) HAS (VP PRINTED)) Struktur ini merupakan output dari analisis.

SISTEM PEMROSESAN BAHASA ALAMI

Suatu sistem pemrosesan bahasa alami secara lisan dapat dibentuk dari tiga sub-sistem, yaitu sebagai berikut. 1) Sub-Sistem Natural

Language

Processing

(NLP) ,

berfungsi

untuk

melakukan pemrosesan secara simbolik terhadap bahasa tulisan. Beberapa bentuk aplikasi sub- sistem ini adalah translator bahasa alami (misalnya dari Bahasa Inggris ke

Bahasa

Indonesia),

sistem pemeriksa sintaks

bahasa,

sistem yang dapat

”menyimpulkan” suatu narasi, dan sebagainya.

2) Sub-sistem

Text

to

Speech

(TTS), berfungsi

untuk mengubah

text

(bahasa

tulisan) menjadi ucapan (bahasa lisan). 3) Sub-Sistem to

Speech,

Speech

yaitu

Recognition

(SR) ,

merupakan kebalikan teknologi

Text

sistem yang berfungsi untuk mengubah atau mengenali suatu

ucapan (bahasa lisan) menjadi text (bahasa tulisan). Berbeda dengan kebanyakan sistem lain yang bersifat generik, teknik-teknik yang digunakan dalam pemrosesan bahasa alami bersifat sangat ‘language dependent’ . Suatu sistem atau teknik yang berlaku untuk suatu bahasa tidak mudah diterapkan untuk bahasa lainnya.

Sistem Speech Recognition

Sistem Speech Recognition atau Sistem Pengenalan Ucapan adalah sistem yang berfungsi untuk mengubah bahasa lisan menjadi bahasa

tulisan. Masukan sistem

adalah ucapan

manusia, selanjutnya sistem akan mengidentifikasikan kata atau kalimat yang diucapkan dan menghasilkan teks yang sesuai dengan apa yang diucapkan. Pada gambar 1. diperlihatkan konfigurasi tipikal suatu system Pengenalan Ucapan. Sinyal ucapan (s(n)) pertama kali akan dilewatkan pada bagian Penganalisis Ucapan untuk mendapatlan besaran-besaran atau ciri-ciri yang mudah diolah pada tahap berikutnya. Untuk setiap ucapan yang berbeda akan dihasilkan pola ciri yang berbeda.

Gambar 1. Diagram Blok Sistem Pengenal Ucapan Penganalisis sintaks biasanya melakukan transformasi sinyal ucapan dari domain waktu ke domain frekuensi. Pada domain frekuensi, untuk kurun waktu yang singkat, setiap sinyal dapat terlihat memiliki ciri-ciri yang unik. Namun demikian, pengucapan suatu unit bunyi ucapan (fonem) seringkali bervariasi antar orang yang berbeda, juga terpengaruh oleh fonemfonem disekitarnya, kondisi emosi, noise, dan faktor-faktor lainnya. Sistem Speech Recognition yang dapat mengenali seluruh kata dalam melakukan

pengenalan

untuk

setiap

suatu

bahasa

unit bunyi pembentuk ucapan (fonem), selanjutnya

mencoba mencari kemungkinan kombinasi hasil ucapan yang paling dapat diterima. Sistem yang lebih sederhana adalah sistem yang hanya da pat mengenal sejumlah kata yang jumlahnya terbatas. Sistem ini biasanya lebih akurat dan lebih mudah dilatih, tetapi tidak dapat mengenal kata yang berada di luar kosa kata yang pernah diajarkan. Sistem Speech Recognition biasanya dapat dioperasikan pada dua mode yang berbeda. Pertama adalah mode belajar. Pada mode ini, sistem akan dilatih menggunakan sejumlah kata atau kalimat yang memenuhi suatu kriteria tertentu. Setiap contoh kata atau kalimat ajar tersebut akan menghasilkan pola tertentu yang akan dipelajari oleh sistem dan disimpan sebagai template atau referensi. Kedua adalah mode produksi atau pengenalan ucapan. Pada mode ini, setiap kalimat yang ingin dikenali akan dianalisis polanya. Berdasarkan hasil perbandingan dengan template atau referensi, modul klasifikasi pola serta pengambil keputusan akan mengidentifikasikan kata atau kalimat yang diucapkan tersebut. Pada prinsipnya, teknik-teknik atau algoritma yang digunakan pada sistem Pengenal Ucapan tidak

bersifat

sensitif

terhadap bahasa.

Artinya,

sistem

yang

sama

dapat

digunakan untuk bahasa apapun. Namun demikian, kemampuan sistem untuk mengenali ucapan pada bahasa tertentu sangat tergantung dari template atau referensi yang diperoleh melalui proses belajar di dalam sistemnya itu sendiri. Untuk melatih sistem Pengenal Ucapan agar dapat digunakan untuk suatu bahasa yang baru, maka diperlukan korpus untuk melatih sistem

tersebut.

Korpus yang dimaksud adalah berupa rekaman ucapan yang

heterogen dalam volume yang sangat besar serta memenuhi kriteria teknis tertentu.

. Pada prinsipnya, teknik-teknik atau algoritma yang digunakan pada sistem Pengenal Ucapan tidak bersifat sensitif terhadap bahasa. Artinya, sistem yang sama dapat digunakan untuk bahasa apapun. Namun demikian, kemampuan sistem untuk mengenali ucapan pada bahasa tertentu sangat tergantung dari template atau referensi yang diperoleh melalui proses belajar di dalam sistemnya itu sendiri. Untuk melatih sistem Pengenal Ucapan agar dapat digunakan untuk suatu

bahasa yang baru, maka diperlukan korpus untuk melatih sistem

tersebut.

Korpus yang dimaksud adalah berupa rekaman ucapan yang heterogen dalam volume yang sangat besar serta memenuhi kriteria teknis tertentu.

Semakin besar korpus yang digunakan untuk melatih

sistem, akan

dihasilkan sistem

Speech Recognition yang cenderung lebih handal. Sistem yang handal, paling tidak harus dilatih dengan ratusan rekaman pembicar a.

Semakin besar korpus yang digunakan untuk melatih sistem, akan dihasilkan sistem Speech Recognition yang cenderung lebih handal. Sistem yang handal, paling tidak harus dilatih dengan ratusan rekaman pembicar a.

Sistem Text to Speech

Secara fungsional, Text to Speech atau TTS melakukan proses sebaliknya Pengenal Ucapan. Namun demikian pendekatan

implementasinya

sama

dari

sistem

sekali

berbeda.

Artinya, komponen-komponen pembentuk kedua sistem tersebut sama sekali berbeda. Pada dasarnya TTS adalah suatu sistem yang dapat mengubah text menjadi ucapan. Sistem Natural Language Processing

Seperti

telah

dijelaskan

sebelumnya

alami dan bahasa buatan.

bahwa

bahasa

dapat dibedakan menjadi bahasa

Bahasa buatan dibuat untuk memenuhi kebutuhan tertentu dan

dirancang dengan hati-hati agar mematuhi aturan-aturan yang diperlukan untuk kemudahan pemrosesannya. Di lain pihak,

bahasa

alami tumbuh

secara

alami untuk

memenuhi

kebutuhan

komunikasi antar manusia. Bahasa alami tidak dirancang dengan memperhatikan berbagai kendala untuk kemudahan pemrosesan. Sebagai

akibatnya,

pemrosesan bahasa

alami

jauh lebih sulit dilakukan dibandingkan dengan bahasa buatan. Bahkan, beberapa masalah mendasar dalam bahasa alami masih belum terpecahkan hingga kini. Pemrosesan

bahasa alami

tidak

mudah

dilakukan. Be berapa alasan yang menyulitkan

pemrosesan bahasa alami diantaranya adalah sebagai berikut. 1) Dalam bahasa alami, sering terjadi ambiguity atau makna ganda. Fenomena ini terjadi pada berbagai level implementasi bahasa, mulai dari simbol-simbol huruf dan tanda baca sebagai unit terkecil bahasa tulisan, tingkat kata, frasa, kalimat, bahkan paragraf. Simbol titik tidak selalu berfungsi sebagai tanda akhir kalimat, tetapi dapat menjadi bagian dari singkatan (misalnya Ir., Dr., Jl.) atau bagian dari

bilangan. Contoh lainnya, kata “bisa” mungkin mempunyai pengertian “racun” atau “dapat”. Fenomena ini terjadi pula dalam penentuan jenis kata ( part of speech), misalnya kata ”advanced” dapat berfungsi sebagai kata kerja aktif (bentuk lampau), kata kerja pasif, atau kata sif at. 2) Jumlah kosa kata (vocabulary) dalam bahasa alami sangat besar dan berkembang dari waktu ke waktu. Karakteristik-karakteristik

tersebut

menyebabkan

sulitnya melakukan pemrosesan bahasa

alami. Manusia sendiri menghadapi masalah ambiguitas tersebut berdasarkan analisis konteks yang didukung pengetahuan yang dimiliki di dalam otaknya. Mesin atau komputer yang tidak dilengkapi pengetahuan seperti itu menjadi sulit melakukannya. Jika NLP diterapkan untuk aplikasi bahasa lisan, kesulitan lainnya mungkin terjadi. Dalam bahasa lisan, manusia sangat sering membentuk ucapan yang tidak sesuai dengan aturan-aturan yang berlaku dalam bahasa yang digunakan. Teknologi Natural Language Processing (NLP) atau Pemrosesan Bahasa teknologi

yang

memungkinkan

bahasa alami yang

biasa

Alami

adalah

untuk melakukan berbagai macam pemrosesan terhadap

digunakan

oleh

manusia.

Sistem

ini

biasanya mempunyai

masukan dan keluaram berupa bahasa tulisan (teks). NLP mempunyai aplikasi yang sangat luas. Beberapa diantara berbagai kategori aplikasi NLP adalah sebagai berikut.

1) Natural Language Translator , yaitu translator dari

satu bahasa alami ke bahasa

alami lainnya, misalnya translator bahasa Inggris ke bahasa Indonesia, Bahasa Indonesia ke Bahasa Jawa dan sebagainya. Translator bahasa alami bukan hanya kamus yang menerjemahkan kata per kata, tetapi harus juga mentranslasikan sintaks dari bahasa asal ke bahasa tujuannya.

2) Translator bahasa alami ke bahasa buatan , yaitu translator yang mengubah perintah-perintah dalam bahasa alami menjadi bahasa buatan yang dapat dieksekusi oleh mesin atau komputer. Sebagai contoh, translator yang memungkinkan kita memberikan perintah bahasa alami kepada komputer. Dengan system seperti ini, pengguna sistem dapat memberikan perintah dengan bahasa sehari-hari, misalnya, untuk menghapus semua file, pengguna cukup memberikan perintah ”komputer, tolong hapus semua file !” Translator akan mentranslasikan

perintah

bahasa

alami tersebut menjadi perintah bahasa formal yang dipahami oleh komputer, yaitu ”dir

*.* ”.

3) Text Summarization , yaitu suatu sistem yang hal yang penting dari suatu wacana yang diberikan.

dapat ”membuat ringkasan” hal-

Aplikasi-Aplikasi Teknologi Bahasa

Banyak manfaat yang dapat dicapai dari ketersediaan Aplikasi Teknologi Bahasa, khususnya untuk Bahasa Indonesia. Berikut ini adalah beberapa contoh aplikasi yang dapat dikembangkan menggunakan teknologi bahasa. •

Alat bantu membaca untuk tunanetra. Alat bantu membaca bagi tunanetra mempunyai

masukan berupa teks tercetak (misalnya buku) dan mempunyai keluaran berupa ucapan dari teks

tercetak yang

diberikan.

Pada

prinsipnya

ada

dua komponen utamanya,

yaitu bagian “pengenal karakter” yang menggunakan teknologi OCR (Optical Character Recognition), serta bagian TTS. Dengan alat bantu ini, orang tunanetra dapat membaca suatu buku atau dokumen. Bahkan, jika teks yang ingin dibacakan sudah tersedia

di

dalam komputer, dengan teknologi Text to Speech dapat langsung diucapkan.

Alat bantu bicara untuk tunawicara. Alat bantu membaca bagi tunawicara mempunyai

masukan posisi tangan yang dideteksi oleh suatu sensor dan unit identifikasi. Rangkaian huruf yang diidentifikasikan akan disusun membentuk suatu kata yang pada akhirnya akan diumpankan pada bagian TTS.

Online translator.

Online translator yang dimaksud disini adalah translator yang secara

otomatis dapat menerjemahkan kalimat lisan

dari suatu bahasa alami (misalnya Bahasa

Inggris) menjadi ucapan hasil terjemahannya dalam bahasa alami lainnya (misalnya Bahasa Indonesia). Online translator terdiri dari 3 bagian. Bagian pertama, speech recognition, berfungsi untuk mengenali rangkaian kata dari bahasa sumber menjadi teks dalam bahasa sumber. Bagian berikutnya adalah translator teks ke teks. Hasil bagian kedua ini adalah kalimat bahasa tujuan yang masih berupa teks. Bagian ketiga berupa sistem TTS dalam bahasa tujuan. Aplikasi seperti ini mungkin untuk

dikembangkan,

karena

teknologi speech recognition

sudah banyak dikembangkan. Translator bahasa pun sudah banyak dikembangkan, termasuk translator Bahasa Inggris ke Indonesia .

•

Talking

email

atau

aplikasi

lainnya. TTS juga memungkinkan diintegrasikan

dengan berbagai program aplikasi, seperti email, web browser, aplikasi-aplikasi multimedia atau aplikasi-aplikasi lainnya. •

Aplikasi

Telephony.

TTS

dapat

digunakan

pada aplikasi telephony, seperti sistem

informasi billing atau sistem informasi lainnya yang diucapkan secara lisan. TTS juga dapat digunakan untuk konversi dari SMS (Short Message System) ke ucapan sehingga pesan SMS

dapat

didengar.

sambil melakukan

Dengan demikian memungkinkan untuk mendengar pesan SMS

aktivitas

yang

menyulitkan

untuk

membacanya, seperti

sedang

mengendarai mobil. Dengan TTS tersebut, memungkinkan pula untuk meneruskan pesan SMS ke sistem telepon biasa (PSTN).

Speech

Recognition memungkinkan pencarian

informasi secara lisan.

Referensi :

1. http://www.unisbank.ac.id/ojs/index.php/fti1/article/viewFile/82/77 2.

http://lecturer.eepis -its.edu/~entin/Kecerdasan%20Buatan/Buku/Bab

%205%20Natural%20Language%20Processing.pdf

PENGOLAHAN BAHASA ALAMI

Recommend Documents