المجلة العلمية لجامعة الملك فيصل: العلوم الأساسية والتطبيقية
المجلة العلمية لجامعة الملك فيصل: العلوم الأساسية والتطبيقية
تصنيف أوتوماتيكي للنصوص باسنعمال تقنية ال "ن-غرامس"
(زكريا البريشي و بدر عبداللطي)
الملخص
هذه الورقة تتناول التصنيف الأوتوماتيكي للنصوص والذي يعتمد على الإرشاد في اختيار التصنيف الملائم بناءً على عدد من جزئيات الكلمات المحددة مسبقاً. الطريقة المقترحة في هذه الورقة تعتمد على التمثيل الشعاعي للوثيقة أو النص بناءً على جزئيات الكلمات (ن غرامس) وليس على الكلمات. وقد استخدم المعامل من 2 حرف إلى 5 حروف لكل صنف ليتم احتساب جزئيات كل صنف بناءً على عدد مرات تكرار كل جزئية في الوثيقة أو النص. يتم بعـــدها إنتاج جزئيات كل صنف ومن ثم تقلص عدد هذه الجزئيات باستخدام القانون الإحصائي (كاي 2). جميع التصنيفات المرشحة تعطى أوزان نسبية باستخدام مقياس (تي أف آي دي أف) ومن ثم يحتسب الفارق بين كل صنف وآخر باستخدام طريقة (الكوساين).
المراجع