Nhận dạ Nhậ dạng tiế tiếng Việ Việt dùng mạ mạng neuron k ết hợ p trích đặ đặcc trư trư ng ng dùng LPC và AMDF Vietnamese Speech Recognition Using Neural Networks Combined with LPC Formant Extraction and AMDF Pitch-Detection Hoàng Đ ình Chiế Chiến
Abstract: This paper describes a method of creating
neural
network
based
isolated
Vietnamese
cho k ết quả nhận dạng chính xác cao qua thử nghiệm.
speech
recognizer. The formant extraction process uses the current
II. CƠ CƠ SSỞ LÝ Ở LÝ THUYẾ THUYẾT
popular model LPC (Linear Predictive Coding) in which
1. Mã hóa dự báo ự báo tuyế tuyến tính (LPC - Linear Predictive Coding) [4]
LPC parameters are converted to cepstral coefficients. The neural network is used to estimate the word probabilities and we will choose the maximum for the target words. We also
combine
LPC
method
with
AMDF
(Average
Gọi r(k) là giá tr ị tự tươ ng ng quan của tín hiệu dờ i đi k mẫu:
Magnitude Difference Function) method to increase the
r (k ) =
accuracy. The experiments are stimulated by Matlab 6.5. The high accuracy of results leads the conclusion that the studied way is suitable. Keyword:
Vietnamese
speech
recognition, Neural
Network, LPC, AMDF.
I. GIỚ GIỚ I THIỆ THIỆU Nhận dạng tiếng nói là một k ỹ thuật có thể
ứng
ĩ nh dụng trong r ất nhiều l ĩ nh vực của cuộc sống: trong việc điều khiển (điều khiển robot, động cơ , điều khiển xe lăn cho ngườ i tàn tật...), an ninh quốc phòng...
Ở Việt Nam, trong những n ăm gần đây đã có một s ố k ết quả nghiên cứu ban đầu về nhận dạng tiếng Việt, tuy nhiên còn có giớ i hạn về độ chính xác, số từ, vấn đề thanh điệu đặc thù tiếng việt hầu như chưa đượ c đề cậ p.... Bài báo trình bày một hướ ng ng ứng dụng thanh điệu vào việc nhận dạng tiếng Việt đọc r ờ ời r ạc nhằm nâng cao độ chính xác: phươ ng ng pháp k ết hợ p trích đặc tr ưng b ằng LPC vớ i trích chu k ỳ cơ bản dùng AMDF
∞
∑ x(n) x(n + k )
(1)
n = −∞
Khi đó các hệ số LPC sẽ là nghiệm c ủa h ệ phươ ng ng trình: r (1) r ( 2) ⎡ r (0) ⎢ r (1) r (0) r (1) ⎢ ⎢ r (2) r (1) r (0) ⎢ . . ⎢ . ⎢ . . . ⎢ . . ⎢ . ⎢⎣r ( P − 1) r ( P − 2) r ( P − 3)
r ( P − 1) ⎤ ⎡ a1 ⎤
⎡ r (1) ⎤ ⎥ ⎢ ⎥ ⎢ r (2) ⎥ ⎥ ⎢ ⎥ ... r ( P − 3) ⎥ ⎢ a 3 ⎥ ⎢ r (3) ⎥ (2) ⎥⎢ ⎥ ⎢ ⎥ . ⎥⎢ . ⎥ = ⎢ . ⎥ ⎥⎢ . ⎥ ⎢ . ⎥ . ⎥⎢ ⎥ ⎢ ⎥ . ⎥⎢ . ⎥ ⎢ . ⎥ r (0) ⎥⎦ ⎢⎣a P ⎥⎦ ⎢⎣ r ( P )⎥⎦ . ...
... r ( P − 2) ⎢ a 2 ⎥
Hệ phươ ng ng trình trên
đượ c giải bằng thuật toán Levinson-Durbin. Tất cả các hệ số LPC sẽ là đặc tr ưng của tín hiệu tiếng nói. a) Thuật toán Levinson-Durbin: [4] Khở i tạo: p=1 Tính sai số bình phươ ng ng trung bình bậc nhất: E 1
= r (0)(1 − a12 (1))
(3)
a1 (1) = −
trong đó
r (1) r (0)
(4)
Mỗi neuron nhân tạo gồm một số các ngõ vào (từ dữ liệu gốc, hay từ ngõ ra các neuron khác trong mạng). Mỗi k ết nối đến ngõ vào có một tr ọng số và
Đệ qui: Vớ i p=2,3,…,P
1. Tính hệ số K p:
=−
K p
r ( p) + r pbT −1 a p −1 E p −1
một giá tr ị ngưỡ ng. Tín hiệu (5)
2. Tính các hệ số dự báo bậc p:
a p ( p) = K p
(6)
a p ( p) = a p −1 (k ) + K p a p −1 ( p − k )
(7)
vớ i k=1,2,…,p-1 3. Tính sai số bình phươ ng trung bình bậc p:
E p
III. MẠNG NEURON
= E p−1 (1 − K p2 )
đượ c truyền qua hàm kích hoạt (hay còn gọi là hàm truyền) tạo giá tr ị ngõ ra neuron. Nguyên tắc của mạng neuron là học theo mẫu và ánh xạ dữ liệu vào qua một hàm truyền để cho ra k ết quả. Kiểu mạng
đượ c sử dụng phổ biến nhất là mạng lan truyền ngượ c (back propagation) vớ i k ỹ thuật cơ bản là cậ p nhật tr ọng s ố theo hướ ng giảm gradient để tìm vị trí tốt nhất trên mặt lỗi.
(8)
4. Quay lại bướ c 1, thay p bằng p+1 nếu p ≤ P K ết thúc, thay: [a p(1) a p(2) … a p(P)]= -[a p(1) a p(2) … a p(P)] b) Hàm hiệu biên độ trung bình (AMDF - Average Magnitude Difference Function) [3] Hàm hiệu biên độ trung bình là hiệu biên độ của tín hiệu vớ i chính nó dờ i đi p mẫu.
d ( p ) =
∑
N −1− p n=0
x (n) − x (n + p )
(9)
Nếu x(n) là tín hiệu tuần hoàn vớ i chu k ỳ T (mẫu) thì AMDF sẽ đạt cực tiểu nếu tín hiệu bị dờ i đi một đoạn đúng bằng T mẫu. Nhận dạng giọng của ngườ i có tần số cơ bản từ 80Hz (tươ ng ứng vớ i số mẫu là n1=Fs / 80) đến 200Hz (tươ ng ứng n2=Fs/200, Fs là tần số lấy mẫu). Sẽ tính AMDF của tín hiệu vớ i
độ dờ i thay đổi từ n2 đến n1. Giả sử AMDF đạt cực tiểu ứng vớ i độ dờ i P0 (mẫu). Đó chính là chu k ỳ của tín hiệu (hoặc gần vớ i chu k ỳ của tín hiệu nh ất), và tần s ố cơ bản c ủa tín hiệu là F0=Fs/P0. Giá tr ị này chính là đặc tr ưng của tín hiệu về mặt thanh điệu. Do tiếng nói là tín hiệu không dừng nên cứ mỗi 30ms phải tính lại các giá tr ị mớ i. Tất cả các giá tr ị
đượ c s ẽ là đặc tr ưng c ủa một t ừ và đượ c dùng để huấn luyện mạng neuron. tính
Hình 1: C ấu trúc Neural Networks
IV. TRÍCH ĐẶC TR ƯN G 1. Trích đặc trư ng bằng LPC [4] Bướ c 1: Lọc nhiễu, sử dụng bộ lọc thông cao có hàm truyền: H ( s) =
s
(10)
s + wc
vớ i tần số cắt dướ i là 300 Hz
để lọc nhiễu tần số
thấ p do microphone gây ra.
Bướ c 2: Pre-emphasis, sử dụng b ộ lọc thông cao có đáp ứng xung: y(n) = x(n) – a*x(n-1) v ớ i 0.9
≤a≤1
(11)
Bướ c 3: Tách điểm đầu và cuối của một từ dùng hàm năng lượ ng thờ i gian ngắn: E m
=
m + N −1
∑ [ x(n) * w(n − m)]
2
(12)
n= m
Bướ c 4: Phân đoạn thành các frame (frame này khác vớ i các frame trong giai đoạn tìm điểm đầu điểm cuối), mỗi frame có N mẫu, độ chồng lấ p M mẫu,
1
thườ ng M = N .
3
Bướ c 5: Cửa sổ hóa. Hàm cửa sổ thông dụng nhất là cửa sổ Hamming đượ c định ngh ĩ a như sau: w( n ) =
⎧0.54 − 0.46 cos( 2nπ / M ) ⎨ ⎩0
0 ≤ n ≤ M n ∉ [0, M ]
(13)
Bướ c 6: Xác định các hệ số dự báo tuyến tính dùng thuật toán Levinson-Durbin. Bướ c 7: Chuyển các hệ số dự báo tuyến tính thành các hệ số cepstral.
= am +
cm
Và
cm
=
1
m 1
m −1
∑ kc a
k m − k
vớ i 1 ≤ m ≤ P
k m − k
vớ i m >P
độ cực đại của
tín hiệu.
Bướ c 5: Tín hiệu sau khi xén đượ c đưa đến hàm lấy hiệu biên độ trung bình : d ( p ) =
∑
N −1− p n=0
x (n) − x (n + p )
(20)
trong đó N là độ dài khung và p đượ c lấy trong khoảng pitch tươ ng ứng vớ i tần số cơ bản 80-200Hz. Chọn P0 có d cực tiểu, đó chính là chu k ỳ pitch và tần
(15)
số cơ bản là Fs/P0. Đối vớ i các khung có d(P0) > 0.7 dmax(p) đượ c phân loại là khung vô thanh và gán F0 =
m −1
∑ kc a
Trong đó giá tr ị C khoảng 1/3 biên
(14)
k =1
k k =1
(19)
0.
Các hệ số cepstral này có
độ tậ p trung cao hơ n và Bướ c 6: Sau khi đã xác định F0 của toàn bộ âm tiết, đáng tin cậy so vớ i các hệ số dự báo tuyến tính. Thông cần phải xử lý các khung có F0 = 0. Nếu các khung là thườ ng chọn Q =3/2P. vô thanh ở đầu hay ở cuối âm tiết, thay các khung đó bằng F0 của khung hữu thanh k ế cận. Nếu các khung Bướ c 8: Chuyển sang cepstral có tr ọng số: vô thanh ở giữa âm tiết thì thay F0 của khung đó bằng c’ m = wmcm vớ i 1 ≤ m ≤ Q (16) Hàm tr ọng số thích hợ p là bộ lọc thông dải (trong trung bình của hai khung hữu thanh ở hai bên. miền cepstral) Bướ c 7: Đườ ng nét F0 đượ c làm tr ơn bằng bộ lọc ⎡ Q ⎛ π m ⎞⎤ trung bình có tr ọng số vớ i đáp ứng xung (17) = ⎢1 + sin⎜⎜ ⎟⎟⎥ 1≤ m ≤ Q ⎣ 2 ⎝ Q ⎠⎦ Bướ c 9: Tính đạo hàm cepstral. K dc m (t ) = ∆cm (t ) ≈ µ kcm (t + k ) dt k = − K wm
∑
h=[0.1 0.2 0.4 0.2 0.1]
(18)
vớ i µ là hằng số chuẩn và (2K+1) là số lượ ng frame cần tính. K= 3 là giá tr ị thích hợ p để tính đạo hàm cấ p một. Vectơ đặc tr ưng của tín hiệu gồm Q h ệ số cepstral và Q hệ số đạo hàm cepstral.
2. Trích chu k ỳ cơ bản bằng AMDF [3] Bướ c 1, bướ c 2 và bướ c 3 giống như phươ ng pháp LPC. Đối v ớ i b ộ lọc nhiễu, s ử dụng b ộ lọc thông cao có tần số cắt là 60Hz do tần số cơ bản của ngườ i từ 80Hz đến 200Hz. Bướ c 4: Tín hiệu s ẽ đượ c xén bớ t nh ằm làm nổi rõ chu k ỳ cơ bản:
Bướ c 8: Do số ngõ vào của mạng neuron là cố định nên cần chuẩn hóa kích thướ c F0, nên cũng phải chuẩn hóa độ lớ n của F0 và chuyển qua thang log: F0n[i] = -20log(F0a[i] –min + ∆)/(max-min) vớ i i=0,1, …, L-1 max và min là giá tr ị cực
đại và cực tiểu của F0 lấy trên toàn bộ dữ liệu, ∆ là số dươ ng để tránh log0. Bướ c 9: Lấy L giá tr ị đạo hàm của logF0, ghép L giá tr ị logF0 vớ i L giá tr ị đạo hàm thành vectơ đặc tr ưng của từ. V. HUẤN LUYỆN MẠNG VÀ K ẾT QUẢ THU ĐƯỢ C 1. Huấn luyện mạng dùng LPC Tín hiệu tiếng nói sẽ đượ c trích đặc tr ưng bằng phươ ng pháp LPC-cepstrum. Vectơ đặc tr ưng của mỗi từ có 144 hệ số. Nh ư vậy m ạng neuron sẽ có 144 ngõ
vào, số nút xuất: 10 (tươ ng ứng v ớ i 10 số), s ố nút ẩn:
Đầu tiên, dùng phươ ng pháp AMDF để nhận 220. dạng xem từ thuộc nhóm nào, sau đó sẽ đưa qua mạng Tr ục dọc là chữ số đọc để nhận dạng, số k ết quả neuron thứ hai để xác định từ cụ thể. Nh ư vậy s ẽ cần nhận dạng đúng thể hiện ở đườ ng chéo, ở tr ục ngang ba mạng neuron, hai mạng nhận dạng theo phươ ng pháp AMDF và mạng thứ ba nhận dạng theo phươ ng thể hiện số lần số nhận dạng sai. Bảng 1: K ết quả nhận d ạng huấ n luyện mạng dùng LPC 0 0 1 2 3 4 5 6 7 8 9
1
98
2
3
4
5
6
7
8
“chín”.
pháp LPC. Không, một, hai, ba, b ốn, năm, sáu,
9
2 84
13
1
88
2
Phươ ng pháp AMDF: Mạng 10
12
nút nhậ p, 40 nút ẩn, 2 nút xuất
100 6
91 2
3 84
1 4
1 98 1
13 1 94
1
Một,
Không, hai, ba, b ốn, năm 1
bảy
sáu tám chín
99 100
Độ chính xác trung bình: 93,6% Ví dụ đọc nhận dạng 100 lần số 1 , nhận dạng đúng là 84 lần. Nhận dạng sai thành số 4 là 13 lần, số 6 là 1
Phươ ng pháp LPC: M ạng
Phươ ng pháp AMDF
144 nút nhậ p, 220 nút ẩn, 8
Mạng 10 nút nh ậ p,
nút xuất
40 nút ẩn, 2 nút xu ất
lần, số 8 là 2 lần . Trong cách nhận dạng dùng phươ ng pháp LPC, ta thấy có một s ố từ có phát âm gần giống nhau bị nhầm lẫn nhiều. Ví dụ, t ừ “một” và “bốn” , “hai”, và “bảy”, “năm”, và “tám”. Để khắc ph ục hi ện t ượ ng này, khảo sát giải pháp AMDF k ết hợ p LPC.
2. Huấn luyện dùng LPC k ết hợ p vớ i AMDF Vớ i ý tưở ng c ần ph ải phân chia tậ p m ẫu nh ận d ạng
để khắc phục những hạn chế của phươ ng pháp LPC, phươ ng pháp trích đặc tr ưng dùng AMDF tỏ ra có hiệu quả khi tách đượ c từ “bảy” và từ “một” ra một nhóm riêng. Như trên đã đề cậ p, phươ ng pháp AMDF chỉ trích đặc tr ưng v ề mặt thanh điệu c ủa tín hiệu nên ít bị ảnh hưở ng về mặt phát âm như phươ ng pháp LPC. Mặt khác, nếu xét về mặt thanh điệu thì thanh ngang sẽ gần giống vớ i thanh sắc, và hai thanh này khác xa so vớ i thanh nặng và thanh hỏi, nên việc tách từ “một” và từ “bảy” ra là có thể. Phươ ng pháp nhận dạng: Tậ p mẫu
đượ c chia làm hai nhóm: nhóm 1 gồm những từ thanh hỏi và thanh nặng, tươ ng ứng vớ i “một” và “bảy”, nhóm 2 gồm những từ thanh ngang và thanh sắc, tươ ng ứng vớ i các từ “không”, “hai”, “ba”, “bốn”, “năm”, “sáu”, “tám”,
Không Hai Ba Bốn NămSáu Tám Chín
Một
Bảy
Hình 2: S ơ đồ khố i phươ ng pháp nhận d ạng Bảng 2: K ết quả nhận d ạng huấ n luyện mạng dùng LPC k ết hợ p AMDF 0 1 2 3 4 5 6 7 8 9
0 97
1
2
3
96
1 99 1 1
99
4
1
1 1
4 1 1 1 90
5 2
6
7
8
9
2 5 4
1
2 1 1 94 1
2 3
95 97 1
95 100
Độ chính xác trung bình: 96,2% Ví dụ nhận dạng đúng số 1 là 99 lần , sai số nhận dạng là 1 lần . Độ chíng xác nhận dạng cao nhờ sự k ết hợ p xử lý hợ p lý. Nhận xét về phươ ng pháp AMDF: Như vậy việc k ết hợ p hai phươ ng pháp LPC và AMDF đã nâng cao xác suất nhận dạng đúng, thờ i gian huấn luyện có tăng lên không đáng k ể.
Ư u điểm của AMDF là số ngõ vào ít, kích thướ c mạng huấn
luyện nhỏ. Mặt khác, phươ ng pháp AMDF là ít phụ thuộc vào cách phát âm nên tỷ lệ
đọc sai sẽ thấ p h ơ n so vớ i phươ ng pháp LPC. Tuy nhiên, khuyết điểm của phươ ng pháp AMDF là chỉ phân biệt ti ếng nói về mặt thanh điệu, do đó khả năng ứng dụng trong thực tiễn là hạn chế. Một khuyết điểm khác là phươ ng pháp này r ất khó sử dụng trong tr ườ ng hợ p từ đọc liên tục. So vớ i AMDF, phươ ng pháp LPC cho ra k ết quả cụ thể hơ n, nhưng có khuyết điểm là số đặc tr ưng khá lớ n và dễ bị tác động bở i cách phát âm của ngườ i nói. Từ những ưu và khuyết điểm của phươ ng pháp LPC và phươ ng pháp AMDF, cho thấy hướ ng k ết hợ p hai phươ ng pháp này là hợ p lý. Tuy nhiên, cần phải có những nghiên cứu đầy đủ hơ n n ữa để có thể mở r ộng lên bộ từ vựng lớ n hơ n cũng như ứng dụng phươ ng pháp AMDF r ộng rãi hơ n trong thực tiễn. L ưu ý là số đọc r ời r ạc, mỗi ngườ i đọc huấn luyện đượ c xử lý độc lậ p. Ư u điểm của mạng neuron trong nhận dạng tiếng nói. Thứ nhất là về mặt tốc độ huấn luyện cũng như tốc độ nhận dạng, mạng neuron tỏ ra vượ t tr ội. Thứ hai là ưu thế trong việc mở r ộng bộ từ vựng , đượ c phát triển thêm cho nhận dạng từ điều khiển dướ i đây. Bảng 3: K ết quả vớ i bộ t ừ vự ng đ iề u khiể n Lên Xuố ng Trái Phải
Lên
Xuố ng
Các k ết quả khảo sát trên cho thấy việc nhận dạng có độ chính xác r ất cao. Bảng 4: K ết quả vớ i bộ t ừ vự ng đ iề u khiể n dùng mạng neuron Xoay Xoay Xoay Xoay Đi Đi Tiế p Dừ ng lên xuố ng trái phải t ới Lui t ục l ại Xoay 199 1 lên Xoay 3 194 3 xuố ng Xoay 199 1 trái Xoay 200 phải 200 Đi t ới 200 Đi Lui Tiế p 200 t ục Dừ ng 200 l ại Độ chính xác trung bình: 99,5%
VI. HƯỚ NG PHÁT TRIỂN 200 196
Phải
4 200
T ới
200
Lui Xoay
1
Dừ ng
200
Độ chính xác trung bình: 99,4%
3. Nhận dạng từ điều khiển Bài báo này cũng xây dựng bộ từ vựng nhỏ gồm một số từ nhằm mục đích điều khiển tự
động. Bộ từ vựng: lên, xuống, trái, phải, tớ i, lui, xoay, dừ ng. Việc huấn luyện bộ từ điều khiển không khác gì so vớ i huấn luyện bộ từ vựng số đượ c trình bày ở phần trên.
đượ c thử nghiệm vớ i một số từ ghép như: xoay trái, xoay phải, xoay lên, xoay xuống, đi tớ i, đi lui, dừ ng lại, tiếp tục. Mỗi t ừ đượ c đọc ngắt quảng, ví dụ từ “xoay trái” đượ c đọc có sự ngắt quãng giữa từ “xoay” và từ “trái”.
Lui Xoay Dừ ng
200
Trái
T ới
Mạng neuron cũng
− Việc k ết hợ p LPC vớ i AMDF cho k ết quả nhận dạng tiếng nói tiếng việt r ất cao nhờ k ết hợ p hợ p lý phươ ng pháp nhận dạng. Bướ c tiế p theo là phát triển bộ từ 2vựng lớ n hơ n, nâng cấ p giải thuật. 198 − Phươ 197 2ng pháp AMDF làm việc r ất t ốt v ớ i t ừ đọc r ời r ạc. Tuy nhiên, hiện nay phươ ng pháp này chưa đượ c khai thác tốt, có thể là vì nó chỉ phân biệt đượ c tiếng nói về mặt thanh điệu. Cần có những ý tưở ng để k ết hợ p phươ ng pháp này vớ i những phươ ng pháp khác nhằm nâng cao độ chính xác và nhận dạng trên nền nhiễu − Nghiên cứu khả năng k ết hợ p mạng neuron vớ i những công cụ khác trong nhận dạng tiếng Việt, ví dụ vớ i logic mờ , vớ i wavelet …
− Xây dựng bộ nhận dạng từ đọc liên tục dùng mô hình âm vị , nhiều ngườ i nói.
November 08 to November 10, 2004. [6] Cao Xuân Hạo, “Tiế ng Việt mấ y vấ n đề ng ữ âm – ng ữ
TÀI LIỆU THAM KHẢO: [1] Lê Tiến Thườ ng, Hoàng
and Computer Networks in MIT Cambidge, USA.
pháp – ng ữ nghĩ a”, Nhà xuất bản Giáo Dục, 1998.
Đình Chiến. “Vietnamese
Speech Recognition Applied to Robot Communications”.
[7] Claudio Becchetti and Lucio Prina Ricotti, “Speech
Au Journal of Technology, Volume 7 No. 3 January 2004.
recognition. Theory & C++ Implementation”, Fondazione
Published by Assumption University (ABAC) Hua Mak,
Ugo Bordoni, Rome, Italy. John Wiley and Sons, LTD.
Bangkok, Thailand. [2] Lê Tiến Thườ ng (chủ nhiệm), Hoàng
Đình Chiến, Tr ần Tiến Đức… “Ứ ng d ụng Wavelets nhận d ạng tiế ng nói tiế ng việt trong đ iề u khiể n và thông tin”. Báo cáo nghiệm thu đề tài NCKH tr ọng điểm ĐHQG TP HCM ngày 28-012004. [3] Lê Tiến Thườ ng, Tr ần Tiến
Đức, “Nhận d ạng thanh đ iệu tiế ng nói tiế ng Việt bằ ng mạng neuron phân t ầng”, Tạ p chí Tin h ọc và Điều khiển học, 2004. [4] L.Rabiner and B.H.Juang, “Fundamental of speech recognition”, Prentice-hall. Englewood Cliffs. New Jersey 07632, 1993. [5] Hoàng
Đình Chiến, Lê Tiến Thườ ng. “An Efficient
Approach Combining Wavelets And Neural Networks For Signal Procesing In Digital Communications”. Proceedings of IASTED-International Conference on Communication
SƠ LƯỢ C TÁC GIẢ HOÀNG ĐÌNH CHIẾN Sinh ngày: 17-4-1955 tại Quảng Ngãi. Tốt nghiệ p
Đại học MTYCI-Moscow 1979. Nhận bằng Thạc s ỹ Điện t ử Viễn thông, ĐH Bách khoa TP. HCM năm 1998, nhận bằng Tiến sỹ năm 2003. Hiện đang giảng dạy tại Khoa Điện- Điện tử, ĐH Bách khoa TP. HCM, L ĩ nh vực nghiên cứu: Truyền thông vệ tinh, xử lý tín hiệu số, hệ thống truyền thông, wavelets, neuron networks. Email:
[email protected]
[8] Patrick
M.Mills,
“Fuzzy
Speech
Recognition”,
University of South Carolina-1996. [9] Quách Tuấn Ngọc, “X ử lý tín hiệu s ố ”, Nhà Xuất b ản Giáo dục, 1995.
Đức, “Nhận d ạng tiế ng nói tiế ng Việt liên t ục bằ ng mạng neuron”, Tạ p chí Phát triển Khoa học và Công ngh ệ, Đại học Quốc gia TP. HCM, số 10, Tậ p 5, 2002. [10] Lê Tiến Thườ ng, Tr ần Tiến
Ngày nhận bài: 05/08/2005