به گزارش خبرگزاری مهر، شناسایی فوری واژگان کلیدی یک متن ناشناخته رویای دانشمندان متون قدیمی و است اکنون گروهی از محققان دانشگاه منچستر روشی ریاضی را ابداع کردند که می تواند این رویا را به حقیقت تبدیل کند.
این روش ریاضی قادر است به هر کلمه یک "ارزش اطلاعات مفید" بدهد و به این ترتیب اصطلاحات شاخص تر یک متن را شناسایی کند.
برای به دست آوردن این ارزش، این محققان همسانی گسترش هر واژه را هم در یک متن با واژگان عادی و هم در یک متن با واژگان ترکیبی محاسبه کردند.
سپس با مقایسه تفاوتهای دو ارزش بی نظمی هر واژه، دانشمندان به واحد اندازه گیری "ارزش اطلاعات مفید" دست یافتند.
به گفته این محققان انگلیسی توزیع واژگان در یک متن، ارزش یک واژه و نه تعداد دقیق تکرار آن را تعیین می کند.
براساس گزارش نیوساینتیست، اعتبار این واحد اندازه گیری جدید روی متن "اصل انواع" نوشته "چارلز داروین" آزمایش و تایید شد به طوریکه با استفاده از این واحد اندازه گیری مشخص شد که واژگان با ارزش بالاتر در این متن عبارتند از: گونه، تنوع، دو رگه ها، اشکال، جزایر، انتخاب و نوع.
نظر شما