به گزارش خبرگزاری مهر، بهروز مکی مجری طرح گفت : تبدیل گوینده با استفاده از شبکه های عصبی غیر خطی یعنی صدای فرد ضبط می شود و با تغییراتی که بر روی آن اعمال می شود به نظر می رسد که فرد دیگری صحبت کرده و صدا به نوعی تغییر می کند.
مکی یاد آور شد : این نرم افزار در سیستم های تبدیل متن به گفتار استفاده می شود و به علت اینکه سطح پردازش آنها خیلی زیاد است معمولا صدا ضبط شده را با این نرم افزار تغییر داده و تبدیل به صدای فرد دیگری می شود.
مجری طرح گفت : این نرم افزار برای کسانی که مشکل گویش دارند به بهبود صدای آنها کمک کرده و گرفتگی صدا و ... را رفع می کند.
دانش آموخته دانشگاه صنعتی امیر کبیر ادامه داد : از روش فوق می توان در کارهایی که با اینترنت مرتبط می شود استفاده کرد، مثلا می توان ایمیل را با صدای فرستنده شنید.
وی گفت : در این روش صدا ضبط می شود، پارامترهای مخصوصی از آن استخراج شده و بعد پارامترها به شبکه ارسال می شود و با استفاده از شبکه های عصبی غیر خطی پارامترها تبدیل شده و به فضای سیگنال بر می گردانیم و سپس به انجام یکسری فعالیتهای جزئی کیفیت صدا بهبود می یابد.
مکی افزود : چون شبکه های عصبی یک سیستم پیوسته است تا حدودی این قابلیت را دارد که بخشی از خرابی سیگنال را دوبار ترمیم کند.
نظر شما