پردازش رایانه‌ای زبان

رایانه و زبان - ۱۳

رایانه و زبان - ۱۳

رایانه و زبان* - ۱۳
کاربردهای پردازش رایانه‌ای زبان 
تبدیل متن به گفتار (Text to Speech)
دکتر هادی ویسی

...................................................
تبدیل متن به گفتار (یا سنتز گفتار) به فرآیند خواندن خودکار یک متن الکترونیکی توسط رایانه، مشابه خواندن متن توسط انسان، گفته می‌شود. این کار هرچند در ظاهر ساده به نظر می‌رسد، اما تولید صدای طبیعی و خواندن صحیح همه کلمات (تلفظ درست) کار دشواری است. این سامانه‌ها برای سخنگو کردن کامپیوتر (مثلا برای خواندن متن کتاب‌های الکترونیکی)، استفاده در تلفن همراه (برای خواندن پیامک، اسم تماس‌گیرنده، و ...)، نقشه‌خوان‌ها، کمک به نابینایان و افراد بی‌سواد و سالمند برای خواندن، و استفاده در سامانه‌های مختلف دیگر (مانند نوبت‌دهی بانک‌ها، ترجمه گفتار به گفتار و ... ) کاربرد دارند. هرچند سابقه تولید گفتار به صورت مکانیکی به سال 1779 برمی‌گردد، اما تولید TTSهای الکترونیکی به اوایل ساخت کامپیوتر و دهه 40 میلادی برمی‌گردد و امروزه برای بسیاری از زبان‌ها از جمله فارسی وجود دارد.
روش‌ها: هرچند به لطف رشد یادگیری عمیق و روش‌های سرتاسری (end-to-end) با حدود 20-30 ساعت گفتار می‌توان یک سامانه مناسب برای زبانی مثل انگلیسی ساخت، اما بیشتر سامانه‌های TTS تجاری از دو بخش پردازش متن و تولید سیگنال گفتار تشکیل شده‌اند. در بخش پردازش متن، کارهایی مانند بهنجارسازی و یکدست کردن متن (مثلا تبدیل (ع) به علیه السلام)، تحلیل‌های زبانی برای رفع ابهام در خواندن هم‌نگاره (مانند مُرد و مَرد) و کسره اضافه (کسره پایان برخی کلمات در فارسی) و همچنین تلفظ خودکار کلمات (به ویژه کلمات خارج از واژگان سامانه مانند کلمات یک زبان دیگر) و تحلیل نوایی (تشخیص آهنگ جمله مثلا در جملات پرسشی) انجام می‌شود. در بخش تولید سیگنال با روش‌هایی مانند سنتز پیوندی، پارامتری آماری و یادگیری عمیق از روی دنباله نویسه یا واجی متن صدا تولید می‌شود.
.....................................
* امروزه با همه‌گیر شدن نقش رایانه‌ها در ابعاد مختلف زندگی انسان، حوزهٔ زبان (نوشتاری و گفتاری) نیز از فناوری‌های مرتبط با رایانه بی‌بهره نبوده و رشد شتابان هوش مصنوعی منجر به خلق ابزارهای مدرنی در این حوزه شده است. «رایانه و زبان» یادداشت‌های کوتاهی در مورد نقش رایانه در زبان و یا نحوه استفاده از آن برای پردازش زبان، با تاکید بر زبان فارسی، است. این یادداشت‌ها را آقای دکتر هادی ویسی، معاون علمی مؤسسهٔ لغت‌نامهٔ دهخدا، تهیه کرده و هر هفته یکی از آنها در وب‌گاه و شبکه‌های اجتماعیِ مؤسسهٔ لغت‌نامهٔ دهخدا منتشر می‌شود.

کلید واژه ها: دکتر هادی ویسی پردازش رایانه‌ای زبان تبدیل متن به گفتار Text to Speech رایانه و زبان آموزش زبان فارسی موسسه دهخدا سنتز گفتار یادگیری عمیق سامانه‌های TTS