به گزارش خبرگزاری مهر، پیکره‌های متنی در کاربردهای پردازش زبان مانند سامانه‌های مترجم ماشینی نقش اساسی دارند و این سامانه‌ها به پیکره‌های دوزبانه که در آنها جملات یا عبارت معادل در دو زبان مبدا و مقصد هم‌تراز شده‌اند نیاز دارند. یکی از اقدامات دبیرخانه شورای عالی اطلاع‌رسانی تولید و نشر پیکره انگلیسی-فارسی میزان، برای رفع نیاز محققان فعال در حوزه مترجم ماشینی است. این پیکره حاوی یک میلیون جمله هم‌ترازشده متون ادبیات کلاسیک است.

با توجه به اینکه هرچه تنوع و گستردگی متون تحت پوشش و همچنین حجم پیکره دوزبانه بیشتر باشد، دامنه استفاده از پیکره افزایش یافته و نتایج بهتری می‌توان کسب کرد، دبیرخانه شورای عالی اطلاع‌رسانی تصمیم دارد جهت هم‌افزایی فعالیتهای انجام شده در تهیه پیکره‌های موازی، «میز اشتراک پیکره‌های دوزبانه» را با هدف تقویت زیرساختهای سامانه‌های ترجمه ماشینی تشکیل دهد.

میز اشتراک از نظر زبان و حجم منابع محدودیت ندارد و هر یک از مشترکین به نسبت مشارکت ذی‌نفع خواهند بود. پیکره‌‌های حاصل در سطح ملی و بین‌المللی و با دو مجوز استفاده تحقیقاتی و تجاری منتشر خواهد شد.

بر این اساس از تمامی مؤسسات،‌ شرکت‌های خصوصی، دانشگاه‌ها و افرادی که در تهیه پیکره‌های دوزبانه موازی فعالیت داشته و دارای محصول هستند تقاضا می‌شود، در صورت تمایل به مشارکت در «میز اشتراک پیکره‌های دوزبانه» پیشنهاد عضویت خود را به نشانی parsi@scict.ir، كارگروه خط و زبان فارسی دبیرخانه شورای عالی اطلاع‌رسانی ارسال کنند.

پیشنهاد عضویت باید حداقل شامل مواردی از جمله مشخصات مالک پیکره، مشخصات کمی و کیفی پیکره [مشخصات کمی مانند تعداد جملات و کلمات در زبان مبدا و مقصد، مشخصات کیفی مانند گونه یا ژانر متون، شیوه هم‌ترازی (دستی یا خودکار) و شیوه ارزیابی و کیفیت‌سنجی هم‌ترازی انجام‌شده] و وضعیت حقوق مولفین (کپی‌رایت) متون باشد.

مهلت ارسال پیشنهاد عضویت ۱۰ خردادماه و حداکثر زمان بررسی پیشنهاد عضویت ۲۰ خردادماه ۹۴ است؛ برای افزایش کارایی میز اشتراک از طرح ایده‌ها و پیشنهادات نیز استقبال می‌شود.