المجلة العلمية لجامعة الملك فيصل: العلوم الأساسية والتطبيقية

En

المجلة العلمية لجامعة الملك فيصل: العلوم الأساسية والتطبيقية

استخراج القواعد الدلالية من قاعدة بيانات نصيةباستخدام التنقيب في المعطيات

(أحمد بدر الدين الخضر و محمد دباس الحميد و لينا محمد فاروق بعاج)

الملخص

يعرض هذا البحث نموذجاً لتوليد القواعد الدلالية Semantic Rules من قاعدة بيانات تتضمن الكلمات الأكثر تكراراً في اللغة الانكليزية لاستخدامه في التحقق من صحة جمل اللغة الانكليزية من ناحية المعنى، ويبين الأسلوب المتبع في بناء هذا النموذج بالاعتماد على إحدى خوارزميات التنقيب في المعطيات، هذه الخوارزمية هي خوارزمية FP Growth التي تم اعتمادها لتوليد قواعد الترابط Association Rules بين الكلمات المخزنة في قاعدة البيانات، القواعد الناتجة عن الخوارزمية تتجاهل تسلسل الكلمات ضمن القواعد، لكن النظام المقترح في هذا البحث يركز على تسلسل ورود الكلمات ضمن قواعد الترابط ويعتبره مهماً لإنجاز التحليل الدلالي، لذلك تم تعديل خوارزمية FP Growth للحصول على قواعد ترابط تعطي أهمية لتسلسل ورود الكلمات ضمن هذه القواعد. وبما أن معالجة اللغات الطبيعة هي عملية متطورة بشكل مستمر فإن هذا البحث يفتح المجال نحو إنجاز التحليل الدلالي للجمل باستخدام تقنيات التنقيب في المعطيات, كما أنه يعد خطوة هامة تُظهر أهمية الأبحاث المعلوماتية في إنجاز أنظمة تهتم بمعالجة اللغات الطبيعية وتحاكي الإنسان الخبير باللغة الإنكليزية. الكلمات المفتاحية: التحليل الدلالي، التنقيب في المعطيات، القواعد الدلالية، خوارزمية FP Growth، قاعدة بيانات، قواعد الترابط.

PDF

المراجع