پردازش رایانهای زبان
رایانه و زبان - ۱۳

رایانه و زبان* - ۱۳
کاربردهای پردازش رایانهای زبان
تبدیل متن به گفتار (Text to Speech)
دکتر هادی ویسی
...................................................
تبدیل متن به گفتار (یا سنتز گفتار) به فرآیند خواندن خودکار یک متن الکترونیکی توسط رایانه، مشابه خواندن متن توسط انسان، گفته میشود. این کار هرچند در ظاهر ساده به نظر میرسد، اما تولید صدای طبیعی و خواندن صحیح همه کلمات (تلفظ درست) کار دشواری است. این سامانهها برای سخنگو کردن کامپیوتر (مثلا برای خواندن متن کتابهای الکترونیکی)، استفاده در تلفن همراه (برای خواندن پیامک، اسم تماسگیرنده، و ...)، نقشهخوانها، کمک به نابینایان و افراد بیسواد و سالمند برای خواندن، و استفاده در سامانههای مختلف دیگر (مانند نوبتدهی بانکها، ترجمه گفتار به گفتار و ... ) کاربرد دارند. هرچند سابقه تولید گفتار به صورت مکانیکی به سال 1779 برمیگردد، اما تولید TTSهای الکترونیکی به اوایل ساخت کامپیوتر و دهه 40 میلادی برمیگردد و امروزه برای بسیاری از زبانها از جمله فارسی وجود دارد.
روشها: هرچند به لطف رشد یادگیری عمیق و روشهای سرتاسری (end-to-end) با حدود 20-30 ساعت گفتار میتوان یک سامانه مناسب برای زبانی مثل انگلیسی ساخت، اما بیشتر سامانههای TTS تجاری از دو بخش پردازش متن و تولید سیگنال گفتار تشکیل شدهاند. در بخش پردازش متن، کارهایی مانند بهنجارسازی و یکدست کردن متن (مثلا تبدیل (ع) به علیه السلام)، تحلیلهای زبانی برای رفع ابهام در خواندن همنگاره (مانند مُرد و مَرد) و کسره اضافه (کسره پایان برخی کلمات در فارسی) و همچنین تلفظ خودکار کلمات (به ویژه کلمات خارج از واژگان سامانه مانند کلمات یک زبان دیگر) و تحلیل نوایی (تشخیص آهنگ جمله مثلا در جملات پرسشی) انجام میشود. در بخش تولید سیگنال با روشهایی مانند سنتز پیوندی، پارامتری آماری و یادگیری عمیق از روی دنباله نویسه یا واجی متن صدا تولید میشود.
.....................................
* امروزه با همهگیر شدن نقش رایانهها در ابعاد مختلف زندگی انسان، حوزهٔ زبان (نوشتاری و گفتاری) نیز از فناوریهای مرتبط با رایانه بیبهره نبوده و رشد شتابان هوش مصنوعی منجر به خلق ابزارهای مدرنی در این حوزه شده است. «رایانه و زبان» یادداشتهای کوتاهی در مورد نقش رایانه در زبان و یا نحوه استفاده از آن برای پردازش زبان، با تاکید بر زبان فارسی، است. این یادداشتها را آقای دکتر هادی ویسی، معاون علمی مؤسسهٔ لغتنامهٔ دهخدا، تهیه کرده و هر هفته یکی از آنها در وبگاه و شبکههای اجتماعیِ مؤسسهٔ لغتنامهٔ دهخدا منتشر میشود.