يعتبر تركيب الكلام بشكل آلي من أهم المسائل المطروحة في الذكاء الصنعي منذ بداياته، حيث تتزايد الحاجة لأنظمة تركيب كلام مستقرة بحيث تنتج خطاباً ذكياً مع كيفية الكلام الطبيعي. تركيب الكلام speech synthesis يعتبر الأهم في تصنيع آلات متحدثة قادرة على التواصل مع الإنسان بطريقة فعالة وبسيطة، سواء في أنظمة الحوار الآلي Auto dialogue systems، توليد آلي للكتب الصوتية Auto generating of Audio books، متحدث مساعد لذوي الاحتياجات الخاصة different able humans، وغير ذلك من الأنظمة التي تحتاجها البشرية اعتماداً على معالجة اللغات الطبيعيةNatural language processing وفهم الكلام Language Understanding في سبيل خدمة التواصل بين الآلة والإنسان Human-computer Interaction.
No English abstract
المراجع المستخدمة
X. huang, . A. Acero and H. W. Hon, "Text-to-speech systems," in Spoken language processing, 2001, pp. 686 -840.
N. Halabi, "Modern Standard Arabic Phonetics for Speech Synthesis," UNIVERSITY OF SOUTHAMPTON, SOUTHAMPTON-United Kingdom, 2016.
R. Vanderslice, "Synthetic Elocution: Considerations in Automatic Orthographic-toPhonetic Conversion of English with Special Reference to Prosody," 1968.
N. G. M. A. Z. S. A.-M. Omayma Al-Dakkak, "EMOTION INCLUSION IN AN ARABIC TEXT-TO-SPEECH," in Signal Processing Conference, 2005 13th European, Antalya, Turkey, 2005.
J. L. A. Iain R. Murray, "Toward the simulation of emotion in synthetic speech: A review of the literature on human vocal emotion," The Journal of the Acoustical Society of America, 1993.
P. S. a. K. Rao, "Modeling pauses for Synthesis of storytelling style speech using unsupervised word features," in Second International Symposium on Computer Vision And the internet, Bengal, India, 2015.
K. Y. W. a. T. Takara, "Myanmar text-to-speech system with rule-based tone synthesis," Department of Information Engineering, University of the Ryukyus, Japan, 2011.
D. G. M. Taya, "Towards Expressive Arabic Text to Speech," FACULTY OF ENGINEERING, CAIRO UNIVERSITY, GIZA, EGYPT, 2014.
P. Taylor, "Text-to-speech synthesis," Cambridge University Press, Cambridge, United Kingdom, 2009.
S. O. Arık, M. Chrzanowski, A. Coates, G. Diamos, A. Gibiansky, Y. Kang, X. Li, J. Miller, J. Raiman, S. Sengupta and M. Shoeybi, "Deep Voice: Real-time Neural Text-to-Speech," Baidu Silicon Valley Artificial Intelligence Lab,, 2017.
P. C. A. C. L. G. A. H. Q. H. N. H. M. H. J. L. M. N. K. P. T. R. R. R. G. T. B. W. D. W. Z. W. H. Z. T. Capes, "Siri On-Device Deep Learning-Guided Unit Selection Text-to-Speech System," in Interspeech, 2017.
J. Yamagishi, "An introduction to hmm-based speech synthesis," Tokyo Institute of Technology, Tokyo, Japan, 2006.
T. N. J. Y. S. S. T. M. A. W. B. e. a. H. Zen, "The HMMbased speech synthesis system (HTS) version 2.0," in SSW,pp.294-299, 2007.
T. F. D. MÁSTER, "Design and test of an Expressive Speech Synthesis System"
S. D. H. Z. ,. S. O. V. ,. G. K. A. S. K. K. Aaron van den Oord, "WAVENET: A GENERATIVE MODEL FOR RAW AUDIO," Google DeepMind, Google, London, UK, 2016.