پیام‌نما

وَلَنْ تَرْضَى عَنْكَ الْيَهُودُ وَلَا النَّصَارَى حَتَّى تَتَّبِعَ مِلَّتَهُمْ قُلْ إِنَّ هُدَى اللَّهِ هُوَ الْهُدَى وَلَئِنِ اتَّبَعْتَ أَهْوَاءَهُمْ بَعْدَ الَّذِي جَاءَكَ مِنَ الْعِلْمِ مَا لَكَ مِنَ اللَّهِ مِنْ وَلِيٍّ وَلَا نَصِيرٍ * * * یهود و نصاری هرگز از تو راضی نمی شوند تا آنکه از آیینشان پیروی کنی. بگو: مسلماً هدایت خدا فقط هدایت [واقعی] است. و اگر پس از دانشی که [چون قرآن] برایت آمده از هوا و هوس های آنان پیروی کنی، از سوی خدا هیچ سرپرست و یاوری برای تو نخواهد بود. * * * از تو کی خوشنود گردند ای ودود! / از رهی، هرگز نصاری و یهود؟

۱۵ اردیبهشت ۱۳۹۲، ۹:۴۴

تولید ماشین ترجمه آماری/ پیکره موازی انگلیسی فارسی ارائه شد

تولید ماشین ترجمه آماری/ پیکره موازی انگلیسی فارسی ارائه شد

پیکره موازی 2 زبانه انگلیسی فارسی با نام "میزان"، با یک میلیون جمله هم‌طراز شده به عنوان پایه و اساس تولید ماشین‌های ترجمه آماری توسط دبیرخانه شورایعالی اطلاع رسانی تهیه شد که در صورت نیاز در اختیار سازمان‌ها، نهادها، دانشگاه‌ها‌، مراکز علمی و پژوهشگران قرار خواهد گرفت.

به گزارش خبرنگار مهر، یکی از بنیادی‌ترین نیازها برای تولید ماشین ترجمه آماری، تولید پیکره‌ای موازی است و دبیرخانه شورایعالی اطلاع رسانی با توجه به اهمیت موضوع در حوزه گسترش خط و زبان فارسی در محیط رایانه‌ای، تهیه پیکره موازی انگلیسی فارسی با یک میلیون جمله را در دستور کار خود قرار داد.

پیکره موازی از متونی تشکیل می‌شود که برای هر جمله از آن در یک زبان ترجمه معادل آن در زبان دیگر آورده می‌شود. مترجم ماشینی با استفاده از چنین پیکره‌ای، فرآیند ترجمه را فراگرفته و پس از گذراندن مرحله آموزش، می‌تواند برای ترجمه جملات جدید مورد استفاده قرار گیرد.

به دلیل نیاز شدیدی که به پیکره‌های موازی در تولید ماشین‌های ترجمه آماری وجود دارد، محققان علاوه بر تحقیقات فراوانی که در زمینه چگونگی یادگیری فرآیند ترجمه و الگوریتم‌های ترجمه آماری انجام داده‌اند، تلاش‌های زیادی نیز در زمینه پیکره‌های موازی و مسائل مربوط به آن‌ها انجام داده‌اند. با وجود همه تلاش‌ها و تحقیقاتی که در زمینه تولید پیکره‌های موازی صورت گرفته، متأسفانه تاکنون پیکره مناسبی که بتواند نیازهای محققان فارسی‌زبان را برآورده کند، برای زبان فارسی تهیه نشده بود.

بر این اساس در مرحله اول پروژه به امکان‌سنجی و راهکارها و منابع ممکن برای تولید چنین پیکره‌ای پرداخته شد و سپس ابزار لازم برای الکترونیکی کردن منابع و هم‌طرازی آن‌ها توسعه یافت و در انتها با به‌کارگیری افراد متخصص پیکره‌ای با یک میلیون جمله هم‌طراز شده ایجاد شد.

به گزارش مهر، راه‌اندازی سامانه ترجمه آماری پایه با عنوان "مترجم بر خط" با همکاری دانشگاه علم و صنعت و دبیرخانه شورای عالی اطلاع‌رسانی از جمله کاربردهای عملی تهیه پیکره موازی انگلیسی فارسی میزان است که اکنون به صورت آزمایشی با آدرسwww.machinetranslation.ir در دسترس علاقه‌مندان قرار گرفته است.

نتایج ارزیابی‌ها نشان می‌دهد که علیرغم ساده و پایه بودن این سامانه ترجمه، کیفیت ترجمه بر اساس شاخص‌های بین‌المللی (مانند شاخص بلو) در مقایسه با سامانه‌های مشابه ترجمه ماشینی انگلیسی به فارسی قابل قبول است.

دریافت این پیکره پس از تکمیل کاربرگ الکترونیکی در قالب تفاهم‌نامه از طریق آدرس www.dadegan.ir/catalog/mizan در اختیار سازمان‌ها، نهادها، دانشگاه‌ها‌، مراکز علمی و پژوهشگران قرار خواهد گرفت.

کد خبر 2047180

نظر شما

شما در حال پاسخ به نظر «» هستید.
  • نظرات حاوی توهین و هرگونه نسبت ناروا به اشخاص حقیقی و حقوقی منتشر نمی‌شود.
  • نظراتی که غیر از زبان فارسی یا غیر مرتبط با خبر باشد منتشر نمی‌شود.
  • captcha