يبدو محرك النص إلى كلام AWS مثل مذيع الأخبار

يبدو محرك النص إلى كلام AWS مثل مذيع الأخبار


بفضل تقنيات التعلم الآلي الحديثة اتخذت محركات النص إلى الكلام خطوات هائلة خلال السنوات القليلة الماضية. كان من السهل للغاية معرفة أنه كان جهاز كمبيوتر كان يقرأ نصًا وليس إنسانًا. لكن هذا يتغير بسرعة. أطلقت ذراع AWS Cloud Computing Ams Amazon اليوم عددًا من نماذج النص العصبي الجديد إلى الكلام بالإضافة إلى نمط جديد للمذيع الذي يهدف إلى تقليد الطريقة ... لقد خمنت ذلك ... صوتية مذيعين.

جودة الكلام من المؤكد أنه من المهم ولكن يمكن القيام بالمزيد لجعل الصوت الصناعي أكثر واقعية وجذابة تشير الشركة إلى إعلان اليوم. ماذا عن الأسلوب؟ بالتأكيد يمكن للآذان البشرية أن تحدد الفرق بين نشرة الأخبار والكاسل الرياضي وفئة جامعية وما إلى ذلك في الواقع يتبنى معظم البشر الأسلوب الصحيح للكلام للسياق الصحيح وهذا بالتأكيد يساعد في توصيل رسالتهم. العمل بالفعل مع USA Today و Canada's Globe and Mail من بين عدد من الشركات الأخرى لمساعدتهم على التعبير عن نصوصهم.

الاستماع لنفسك:


https:/ /techcrunch.com/wp-content/uploads/2019/07/da4b9237bacccdf19c0760cab7aec4a8359010b0b0amazon_polly_29347.mp3
التي توفرها الآن AWS من خلال محرك النص إلى الكلام العصبي. هذا المحرك الجديد الذي لا يختلف عن محركات عصبية مماثلة مثل Google's Wavenet وغيرها يضم حاليًا 11 صوتًا وثلاثة لصالح اللغة الإنجليزية في المملكة المتحدة وثمانية لإنجليزية الولايات المتحدة.
https://techcrunch.com/wp-content /uploads/2019/07/5A5D2BA5-E1D6-4759-B803-5D0073A59EEF.MP3

يمكنك سماع عدد قليل من هذه الأصوات هنا.

في عصر الأخبار المزيفة بعد الحياة -على غرار أصوات الروبوت التي تبدو وكأنها مذيعين حقيقيين يشعرون بقليل من مشكلة في البداية. بالنسبة للجزء الأكبر ما إذا كان الروبوت أو الإنسان يقرأ النص لا يحدث فرقًا كبيرًا. هناك الكثير من حالات الاستخدام الجيد للأصوات وبالنظر إلى الأمثلة التي توفرها AWS ستتمكن من الاستماع إلى هذه الأصوات لفترة أطول بكثير من القديم قبل أن ترغب في قطع أذنيك.

اخلاء مسؤولية! هذا المقال لا يعبر بالضرورة عن رأي جامعة الرازي