أ.د محمد زكي محمد خضر
المؤتمر الوطني السابع عشر للحاسب الآلي
(المعلوماتية في خدمة ضيوف الرحمن)
جامعة الملك عبد العزيز، المدينة المنورة
أبريل 2004
المستخلص تحتاج
المعالجة الدلالية الآلية للغة العربية مقدارًا كبيرًا من المعلومات عن
مختلف جوانب اللغة. وأفضل ترتيب لهذه المعلومات هو قواعد البيانات. تشمل
هذه المعلومات قواعد البيانات المتعلقة بنسق الكتابة وقاعدة بيانات الصرف
وما يتعلق بها من فصل لنواة الكلمة عن لواصقها السابقة واللاحقة وربط
النواة مع الأوزان الصرفية المعروفة. يلي ذلك قواعد بيانات النحو التي
تحتاج إلى تقسيم اللواصق إلى مكوناتها والأخذ بعين الاعتبار الضمائر
المستترة وتقديرها ، وذلك من خلال شبكة موسعة لقواعد البيانات الارتباطية.
كما أن قواعد بيانات اللفظ والنطق السليم ضرورية للغة العربية لاستكمال
المعالجات المناسبة لها. كل تلك المعالجات وقواعد البيانات تصب في قواعد
البيانات المتعلقة بالمعاني وترتبط معها بشكل تشابكي محكم.
يوضح البحث كيف يمكن أن يتم ذلك بالاستناد إلى نص القرآن الكريم ومن ثم التوطئة نحو الاقتراب من الدلالة الدقيقة في اللغة العربية.
1- المقدمة
تحتل الدلالة ضمن المعالجة الآلية
للغة العربية أهمية كبيرة، فلا يمكن أن تتم معالجات عميقة للنصوص العربية
بدون معلومات كافية عن دلالة الألفاظ المكونة لتلك النصوص.
تحتاج المعالجة الدلالية الآلية
للغة العربية مقدارًا كبيرًا من المعلومات عن مختلف جوانب اللغة. وهذه
المعلومات يجب ان تكون مرتبة ومبوبة بنسق معين. وليس هناك أفضل من ترتيب
هذه المعلومات من قواعد البيانات. وهذه المعلومات تشمل المعلومات عن
الألفاظ وما تحوي من دلالات مختلفة وصرف وما يجوز أن تستعمل معه الكلمة
وما لا يجوز والكلمات المقاربة والمضادة وكل ما يوصل إلى دقة دلالة الكلمة
من وسائل.
إن أية بداية في هذا الصدد لا بد
وأن تستند إلى نصوص رصينة ولذلك فإن دراسة مفردات القرآن الكريم هي خير
بداية لمثل هذا الجهد ، وسنناقش في هذا البحث قواعد بيانات القرآن الكريم
وكيف يمكن أن تساعد في المعالجة الدلالية للغة العربية.
سنتعرض أولاً إلى قواعد البيانات
المتعلقة بنسق الكتابة بالرسم العثماني والرسم الإملائي وما يحتاج ذلك من
معالجات مسبقة للنص القرآني. ومن ثم يتم تقسيم النص القرآني إلى جمل مفيدة
بصرف النظر عن اتفاق ذلك مع الفواصل بين الآيات من عدمه.
بعد ذلك نتعرض لقاعدة بيانات
الصرف وما يتعلق بها من فصل لنواة الكلمة عن لواصقها السابقة واللاحقة وربط
النواة مع الأوزان الصرفية المعروفة. يلي ذلك قواعد بيانات النحو الذي
يحتاج إلى تقسيم اللواصق إلى مكوناتها والأخذ بعين الاعتبار الضمائر
المستترة وتقديرها ، وذلك من خلال شبكة موسعة لقواعد البيانات الارتباطية.
كما أن قواعد بيانات اللفظ والنطق السليم ضرورية للغة العربية ( بالنسبة
للقرآن التجويد والترتيل) لاستكمال المعالجات المناسبة للغة العربية.
كل تلك المعالجات وقواعد البيانات تصب في قواعد البيانات المتعلقة بالمعاني وترتبط معها بشكل تشابكي محكم.
إن معالجة اللغة العربية حاسوبيًا
اليوم بحاجة إلى مكنز (lexicon) متكامل لتحديد المعاني المستعملة في اللغة
الحديثة وفي الأزمنة المتعاقبة التي مرت بها اللغة العربية وتبويب ذلك
بشكل منتظم. لقد كان التطور هائلاً في أبحاث معالجة اللغات الطبيعية وخاصة
الانكليزية خلال العقود الماضية ، وكان لاستخدام قواعد البيانات أثرًا
كبيرًا في هذا التقدم[1]. وقد تكونت مكانز هائلة للغات حديثة متعددة. أنظر
مثلاً المواقع على الشبكة المعلوماتية العالمية[2]. ولذلك هناك حاجة لجهد
هائل للغة العربية.
لتنزيل تتمة البحث اضغط هنا
نديم ، الحب ، برنامج ، تحميل ، دليل ، مسلسل ، انشوده ، جديد ، كامل
المنتديات للبيع : للتواصل واتساب
967772204567+