تصنيع كلامي

تصنيع الكلام أو اصطناع الكلام أو تخليق الكلام هو إنتاج اصطناعي للكلام البشري. ويسمى نظام الكمبيوتر المستخدم لهذا الغرض خطاب كمبيوتر أو توليف الكلام، ويمكن تنفيذها في منتجات البرامج أو الأجهزة. النص إلى كلام (TTS) نظام تحويل لغة النص العادي إلى الكلام؛ أنظمة أخرى تجعل رمزية التمثيل اللغوي مثل تحويل نسخ لفظي إلى كلام.يمكن إنتاج الكلام المركب بواسطة وصل أجزاء من الحديث المسجل والذي يتم تخزينه في قاعدة بيانات. الأنظمة تختلف في حجم وحدات تخزين الكلام. نظام مخازن الهواتف أو diphone يوفر أكبر مجموعة إنتاج صوتي، ولكن قد تفتقر إلى الوضوح. لاستخدامات محددة المجال، ولتخزين الكلمات أو الجمل بأكملها بحيث يسمح لإنتاج عالي الجودة. بدلا من ذلك يمكن للمازج الصوتي أن يدمج نموذج الجهاز الصوتي ذو خصائص أخرى للصوت البشري لإنشاء إخراج صوتي "اصطناعي" تماما. TTS أو Text-to-Speech هي تقنية تكنولوجية لمحاكاة الصوت البشري باستعمال الحاسوب أو أنظمة نطق مختلفة. المهمة الرئيسية لمحرك TTS هي تحويل الكلمات المكتوبة أو المخزنة على شكل نصوص إلى كلمات منطوقة بصوت بشري. من أشهر الشركات التي تطور تقنية للغة العربية هي شركة صخر للحاسب الآلي.

هذه المقالة أو القسم تحتاج للتنسيق. فضلًا، ساهم بتنسيقها وفق دليل الأسلوب المعتمد في ويكيبيديا. (أبريل 2019)

جودة تخليق الكلام يتم تقييمها قياساً على التشابه مع صوت الإنسان وقدرته على أن يكون مفهوماً بشكل واضح. يسمح البرنامج الذكي تحويل النص إلى كلام للناس الذين يعانون من ضعف البصر أو إعاقة قراءة للاستماع إلى الأعمال المكتوبة على كمبيوتر المنزل. وشملت العديد من أنظمة تشغيل الكمبيوتر لتخليق الكلام منذ أوائل التسعينات.

ويتألف نظام تحويل النص إلى كلام (أو "المحرك") من جزئين : و معالج الواجهة الأمامية الأمامي و معالج الواجهة الخلفي. الواجهة الأمامية واثنتين من المهام الرئيسية. أولا: أنه يحول النص الخام الذي يحتوي على رموز مثل الأرقام والمختصرات إلى مايعادل كلمات مكتوبة بها. وغالبا ما تسمى هذه العملية تطبيع النص، ما قبل المعالجة، أو ترميز' ' الواجهة الأمامية ثم يعين نسخ لفظي في علوم الكمبيوتر، التحليل المعجمي هو عملية تحويل سلسلة من الأحرف (كما هو الحال في برنامج كمبيوتر أو صفحة ويب) إلى سلسلة من الرموز (سلاسل مع "معنى" محدد) بالنسبة لكل كلمة، والأجزاء، وتحديد النص في وحدة لحنية، مثل شبه جملة شرط ، والجملة. ويطلق على عملية تعيين التدوين الصوتي لعبارة أي تحويل النص إلى صوت أو حرف من حروف اللغة -إلى صوت تحويل. التدوين الصوتي ومعلومات علم العروض التي يشكلون معا التمثيل اللغوي الرمزي الذي يتم إخراجه من قبل الواجهة الأمامية. والواجهة الخلفية، غالبا ما يشار إليها باسم المزج أو التوليف - ثم تقوم بتحويل التمثيل اللغوي الرمزي إلى صوت. في بعض الأنظمة، فإن هذا الجزء يشمل حسابات تستهدف علم العروض "" (درجة الصوت فترات الصوت), وهو بعد ذلك يحدد الخطاب المفترض على الإنتاج الصوتي.

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.