به گزارش خبرگزاری مهر، پیکرههای متنی در کاربردهای پردازش زبان مانند سامانههای مترجم ماشینی نقش اساسی دارند و این سامانهها به پیکرههای دوزبانه که در آنها جملات یا عبارت معادل در دو زبان مبدا و مقصد همتراز شدهاند نیاز دارند. یکی از اقدامات دبیرخانه شورای عالی اطلاعرسانی تولید و نشر پیکره انگلیسی-فارسی میزان، برای رفع نیاز محققان فعال در حوزه مترجم ماشینی است. این پیکره حاوی یک میلیون جمله همترازشده متون ادبیات کلاسیک است.
با توجه به اینکه هرچه تنوع و گستردگی متون تحت پوشش و همچنین حجم پیکره دوزبانه بیشتر باشد، دامنه استفاده از پیکره افزایش یافته و نتایج بهتری میتوان کسب کرد، دبیرخانه شورای عالی اطلاعرسانی تصمیم دارد جهت همافزایی فعالیتهای انجام شده در تهیه پیکرههای موازی، «میز اشتراک پیکرههای دوزبانه» را با هدف تقویت زیرساختهای سامانههای ترجمه ماشینی تشکیل دهد.
میز اشتراک از نظر زبان و حجم منابع محدودیت ندارد و هر یک از مشترکین به نسبت مشارکت ذینفع خواهند بود. پیکرههای حاصل در سطح ملی و بینالمللی و با دو مجوز استفاده تحقیقاتی و تجاری منتشر خواهد شد.
بر این اساس از تمامی مؤسسات، شرکتهای خصوصی، دانشگاهها و افرادی که در تهیه پیکرههای دوزبانه موازی فعالیت داشته و دارای محصول هستند تقاضا میشود، در صورت تمایل به مشارکت در «میز اشتراک پیکرههای دوزبانه» پیشنهاد عضویت خود را به نشانی parsi@scict.ir، كارگروه خط و زبان فارسی دبیرخانه شورای عالی اطلاعرسانی ارسال کنند.
پیشنهاد عضویت باید حداقل شامل مواردی از جمله مشخصات مالک پیکره، مشخصات کمی و کیفی پیکره [مشخصات کمی مانند تعداد جملات و کلمات در زبان مبدا و مقصد، مشخصات کیفی مانند گونه یا ژانر متون، شیوه همترازی (دستی یا خودکار) و شیوه ارزیابی و کیفیتسنجی همترازی انجامشده] و وضعیت حقوق مولفین (کپیرایت) متون باشد.
مهلت ارسال پیشنهاد عضویت ۱۰ خردادماه و حداکثر زمان بررسی پیشنهاد عضویت ۲۰ خردادماه ۹۴ است؛ برای افزایش کارایی میز اشتراک از طرح ایدهها و پیشنهادات نیز استقبال میشود.
نظر شما