به گزارش خبرگزاری مهر، بهروز مینایی با بیان این خبر افزود: پیکره متنی قرآن کریم که با پشتیبانی شورایعالی اطلاع رسانی ایجاد شده، حاصل بهرهگیری از سامانه ای هوشمند است که در گروه پژوهشی پردازش رایانه ای قرآن کریم در دانشگاه نبی اکرم (ص) در تبریز به عنوان بخشی از سامانه متنکاو هوشمند مبین برای کاوش در متون عربی اسلامی طراحی و پیاده سازی شده است.
وی تبیین اعجاز زبانی قرآن کریم را در دستیابی به لایه های نامشهود زبانی این متن الهی دانست و گفت: دانش هوشمند متنکاوی (text mining) به عنوان جدیدترین وجه همکاری بین دانشهای فناوری اطلاعات، زبانشناسی و ادبیات در کاوش رایانه ای متون بشری قصد حصول این امر را دارد و چنین کاوشی مستلزم ایجاد پیکره های متنی برچسبگذاری شده از آن متون است که به شکل محتوایی الکترونیکی حاوی اطلاعات صرفی و نحوی متون مورد نظرند.
مینایی پایگاه اطلاعاتی حاضر را حاوی چنین پیکره متنی از قرآن کریم ذکر کرد که در قالب زبان XML پیاده سازی شده و اضافه کرد: در پیکره متنی قرآن کریم تمامی واژه های قرآن کریم به واحدهای بنیادی تر شامل بن و اجزای قبل و بعد آن تقطیع شده و در ابتدا اطلاعات جامع صرفی هر یک و سپس اطلاعات نحوی آنها با برچسبهایی (tag) در ذیل هر واژه ارائه شده است.
وی در توضیح این موضوع گفت: هر برچسب که جدول آنها در پایگاه اطلاعاتی ارائه شده حاوی دو بخش خصیصه صرفی یا نحوی (مانند باب یا اعراب) و محتوای این خصیصه (مانند استفعال یا منصوب) است که ارائه این اطلاعات صرفی و نحوی در ساختار XML این امکان را ایجاد کرده تا هر نرم افزار پردازشگر بتواند به راحتی از آنها استفاده کند.
به گفته مینایی از آنجا که این پیکره متنی به طور خودکار توسط "سامانه هوشمند مبین" تولید شده میزان صحت اطلاعات صرفی و نحوی آن در حال حاضر 98 تا 85 درصد است که این ارزیابی بر اساس فایل شاهدی از سوره "یس " انجام گرفته است.
نظر شما