Abstract
The speech recognition system has been widely used by many researchers using different
methods to fulfill a fast and accurate system. Speech signal recognition is a typical
classification problem, which generally includes two main parts: feature extraction and
classification. In this paper, a new approach to achieve speech recognition task is proposed by
using transformation techniques for feature extraction methods; namely, slantlet transform
(SLT), discrete wavelet transforms (DWT) type Daubechies Db1 and Db4. Furthermore, a
modified artificial neural network (ANN) with dynamic time warping (DTW) algorithm is
developed to train a speech recognition system to be used for classification and recognition
purposes. Twenty three Arabic words were recorded fifteen different times in a studio
by one speaker to form a database. The performance of the proposed system using this
database has been evaluated by computer simulation using MATLAB package. The result
shows recognition accuracy of 65%, 70% and 80% using DWT (Db1), DWT (Db4) and SLT
respectively.
methods to fulfill a fast and accurate system. Speech signal recognition is a typical
classification problem, which generally includes two main parts: feature extraction and
classification. In this paper, a new approach to achieve speech recognition task is proposed by
using transformation techniques for feature extraction methods; namely, slantlet transform
(SLT), discrete wavelet transforms (DWT) type Daubechies Db1 and Db4. Furthermore, a
modified artificial neural network (ANN) with dynamic time warping (DTW) algorithm is
developed to train a speech recognition system to be used for classification and recognition
purposes. Twenty three Arabic words were recorded fifteen different times in a studio
by one speaker to form a database. The performance of the proposed system using this
database has been evaluated by computer simulation using MATLAB package. The result
shows recognition accuracy of 65%, 70% and 80% using DWT (Db1), DWT (Db4) and SLT
respectively.
Keywords
Artificial Neural Network
Discrete Wavelet transform
Slantlet Transform Dynamic Time Warping
Speech recognition
Abstract
استعمل نظام تمییز الكلام بصورة واسعة بوساطة عدد من الباحثین باستخدام طرائق مختلفة لتحقیق نظام تمییز
سریع ودقیق. ان تمییز اشارة الكلام تعد مشكلة تصنیف نوعیة وھي تضم بصورة عامة جزئین اساسیین: استخلاص
المیزات والتصنیف. تضمن ھذا العمل اقتراح ثلاثة طرق لاستخلاص الخصائص وھي تحویل المویجي المتقطع(DWT ) بنوعية Db4 and Db 1 وتحویل المویل(SLT)تم تطویر نظام یعتمد على استخدام الشبكات العصبیة الاصطناعیة مع
طریقة میلان الزمن الدینامیكي لغرض التمییز. ثلاثة وعشرون كلمة عربیة بخمسة عشر ازمان مختلفة مسجلة في
الاستودیو بوساطة متكلم واحد لتشكیل قاعدة بیانات. اداء النظام المقترح تم عن طریق تمثیل قاعدة البیانات باستخدام حقیبة الـ MATLAB
بینت النتائج ان دقة التمییز ھي ( ٦٥ %،٧٠ % و ٨٠ %) باستخدام( DWT Db1, DWT Db4 and SlT)
على التوالي.
سریع ودقیق. ان تمییز اشارة الكلام تعد مشكلة تصنیف نوعیة وھي تضم بصورة عامة جزئین اساسیین: استخلاص
المیزات والتصنیف. تضمن ھذا العمل اقتراح ثلاثة طرق لاستخلاص الخصائص وھي تحویل المویجي المتقطع(DWT ) بنوعية Db4 and Db 1 وتحویل المویل(SLT)تم تطویر نظام یعتمد على استخدام الشبكات العصبیة الاصطناعیة مع
طریقة میلان الزمن الدینامیكي لغرض التمییز. ثلاثة وعشرون كلمة عربیة بخمسة عشر ازمان مختلفة مسجلة في
الاستودیو بوساطة متكلم واحد لتشكیل قاعدة بیانات. اداء النظام المقترح تم عن طریق تمثیل قاعدة البیانات باستخدام حقیبة الـ MATLAB
بینت النتائج ان دقة التمییز ھي ( ٦٥ %،٧٠ % و ٨٠ %) باستخدام( DWT Db1, DWT Db4 and SlT)
على التوالي.