منتديات نديم الحب | Forums Nadim love |


 
الرئيسيةس .و .جبحـثالمجموعاتالتسجيلدخول
بسم الله والصلاة والسلام على رسول الله محمد صلى الله علية وسلم ونشهد ان لا اله الا الله وان محمد عبده ورسوله ...استغفر الله العظيم...ولاحول ولاقوه الابالله ...سبحان الله وبحمده سبحان الله العظيم...
شاطر | 
 

 قواعد بيانات القرآن الكريم كأساس للمعجم الآلي الموسع للغة العربية

استعرض الموضوع السابق استعرض الموضوع التالي اذهب الى الأسفل 
كاتب الموضوعرسالة
نديم الحب
مــؤسس المــوقع

مــؤسس المــوقع


::::[بيـانـات العضـو]::::
1 / 1001 / 100

مَُشَارِكآتي: 15095
ألعمــُـر: 25
نَقَّاطَيّ: 19267
سَمِعَتيََ: 141
ألقــسم ألمفــُضل: الاسلامي
دولـتـي: اليمن
جـنســي: ذكر
العمل: طالب
الهواية: الرياضه
المزاج:

عضو الجهاز الاداري الاعلى
الأ يا مطول صبـري ..اذوق المر من كأسه
أنا ياكم قسى دهـــري ..علي وكم قسو ناسه
تهنى من ســـلا قلبــه .. مشى كلٍ على دربه
وطيت الشوك انا ودي .. ولا قبلي حدٍ داسه

معلومات واضافات
Groups forum Nadim Love:







مُساهمةموضوع: قواعد بيانات القرآن الكريم كأساس للمعجم الآلي الموسع للغة العربية   الخميس مارس 31, 2011 1:26 pm

الخلاصة :

لا بد للمعجم الآلي للغة العربية أن يحتوي مفردات جامعة ونصوصًا رصينة . وليس هناك ما يحقق هاتين الخاصيتين أفضل من نصوص القرآن الكريم . هذا بالإضافة إلى أن الكلمات والتعابير الأكثر استعمالاً في اللغة العربية واردة في القرآن الكريم في غالبيتها العظمى .

يحاول البحث أن يبين أسلوب تكوين قواعد البيانات الخاصة بالقرآن الكريم بدءًا من إعداد النص القرآني من كافة جوانبه مستندين في ذلك إلى أسلوب كتابة المصحف بالرسم العثماني وإلى أسلوب كتابة الخط العربي الحديث والضرورات الطباعية الحديثة وإلى قواعد الكتابة المعروفة ومنها قواعد كتابة الهمزة وواو الجماعة والألف المقصورة والتاء المربوطة ، إضافة إلى الشواذ ، مع إعطاء فكرة عن المعالجات الآلية اللازمة لكي يدخل النص إلى قواعد البيانات . لذلك فإن قاعدة البيانات الأولى هي قاعدة بيانات الكتابة العربية.

بعد إعداد النص القرآني بشكل آيات متسلسلة يجب تحديد بدايات الجمل القرآنية ونهاياتها.

قاعدة البيانات الثانية اللازمة هي قاعدة البيانات الصرفية بما فيها من فصل للواصق السابقة واللاحقة والأفعال المشتقة منها الكلمات وأوزانها الصرفية والجذور التي تعود لها الكلمات .

أما قاعدة البيانات الثالثة فهي قاعدة البيانات النحوية والتي تستكمل تقسيم المصحف إلى جمل مستقلة وفي إعراب الكلمات وعلامات الإعراب والتشكيل ومحل أشباه الجمل والجمل من الإعراب وإلى التذكير والتأنيث والإفراد والتثنية والجمع وغير ذلك .

قاعدة البيانات الرابعة هي قاعدة بيانات المعاني والدلالة بدءًا من الجذور ثم الأفعال مع تجميع للأفعال ذات المعنى المتقارب أو المتضاد والمعاني المختلفة للكلمات مع تحديد كل استعمال ، وفيما إن كان الفعل لازمًا أو متعديًا لمفعول واحد أو لأكثر من مفعول أو متعديًا بحروف الجر ومعاني كل فعل عند تعديه بحرف الجر ومعاني العبارات المكونة من أكثر من كلمة .

قاعدة البيانات الخامسة هي قاعدة بيانات الصوت والنطق . ونظرًا لأن العناية بالقرآن الكريم في ترتيله وتجويده كانت عظيمة لا توجد في لغة أخرى غير اللغة العربية ، لذا فإن معالجة قواعد الوقف والتجويد في القرآن الكريم بشكل صوتي يمكن أن يكون نموذجًا للدراسات اللغوية الصوتية للغة العربية . وتجدر الإشارة إلى توفر ترتيل وتجويد للقرآن بأصوات مقرئين من شتى أصقاع العالم العربي والإسلامي يمكن أن يغني قاعدة البيانات هذه ، بالإضافة إلى تضمينها مختلف القراءات القرآنية .

يمكن تكوين قاعدة بيانات سادسة للخط العربي بمختلف خطوطه على مر التاريخ بما فيه النماذج الفريدة الرائعة فنيًا للخطاطين اللذين أولوا القرآن الكريم عنايةً فائقةً .

يعطي البحث أمثلةً عمليةً لبعض من المعلومات التي أدخلت إلى بعض قواعد البيانات الموصوفة أعلاه ، ويخلص إلى الإشارة إلى الجوانب والطرائق التي يمكن الاستفادة منها في مختلف الجوانب اللغوية في إعداد المعجم الآلي للغة العربية والإفادة من هذا المعجم في التعريب والترجمة وفي حوسبة النحو والصرف ونطق اللغة العربية .

1- مقدمة
تحتاج المعالجة الآلية للغة العربية معجمًا موسعًا يحوي كل ألفاظ اللغة العربية الفصحى المستعملة اليوم وجزءًا كبيرًا من اللغة العربية التي كانت مستعملة سواء قبل الإسلام أو في عصور ازدهاره. وهذا المعجم يجب أن يحوي كل المعلومات عن الألفاظ التي تحتاجها عمليات المعالجة من دلالات مختلفة وصرف وما يجوز أن تستعمل معه الكلمة وما لا يجوز والكلمات المقاربة والمضادة وكل ما يوصل إلى دقة دلالة الكلمة من وسائل.

يحتاج عمل هذا المعجم إلى أبحاث ودراسات موسعة بغية الوصول إلى تصميم مناسب له وبشكل يخدم كل ما تحتاجه المعالجة الآلية للغة من معلومات. وحيث أن الجهد اللازم لوضع المعجم هو جهد هائل يحتاج إلى مؤسسات متعاونة فيما بينها فإن إثراء المناقشة فيما يتعلق بتصميم مكونات هذ المعجم تعتبر خطوة لا بد منها.

إن دراسة مفردات القرآن الكريم هي خير بداية لمثل هذا الجهد ، وسنناقش في هذا البحث قواعد بيانات القرآن الكريم وكيف يمكن أن تساعد في مناقشات تصميم المعجم الآلي الموسع للغة العربية.

إن أهمية المعجم بالنسبة للمعالجة الآلية للغة بالغة. فالمعجم يجب أن يحوي مكونات اللغة المفردة والمركبة وتعريفاتها وما تحيل إليه من المفاهيم والقيم التي تحكم وعي المجموعة اللغوية . لذلك كان الاشتغال بمعالجة المعجم من المداخل الأولية لضروب عدة من المعالجة الحاسوبية للغة (1)
2- بين النص القرآني والكتابة العربية اليوم

يختلف التعامل مع النصوص باللغة العربية والتعامل مع نص القرآن في عدد من الأمور يمكن إيجازها على النحو الآتي :

أ‌- لا يورد النص القرآني غالبًا إلا مشكولاً . والتشكيل يسهل التعامل مع النص من نواحي متعددة حيث يذهب الالتباس والخطأ في المعالجات الآلية الصرفية والنحوية والدلالية . هذا مع العلم أن الكتابة العربية كانت تكتب قبل الإسلام وفي صدر الإسلام غير منقوطة وغير مشكولة ولم يضف التنقيط إلا في وقت متأخر عن ذلك.

ب‌-يختلف النص القرآني عن النصوص العربية في حسن الالتزام بالرسم العثماني فجمهور الفقهاء يحبذون ( بل بعضهم يعتبر ذلك ملزمًا ) كتابة المصحف بالرسم العثماني وقد أجاز بعض العلماء كتابة المصحف برسم آخر غير الرسم العثماني إن كان ذلك يحقق دقة في قراءة ولفظ القرآن في عصر من العصور أفضل مما يحقق الرسم العثماني بسبب اعتياد الناس على رسم خاص لبعض الحروف.

جـ- لغرض دقة قراءة والقرآن الكريم ولفظه بشكل صحيح ، تحتوي المصاحف على علامات للوقف والتجويد وهي خاصة بالقرآن الكريم ولا تستعمل في أية كتابة عربية أخرى .

د‌- يحتوي النص القرآني على فواصل بين آية وأخرى . أي أن بداية ونهاية الآيات محددة ( رغم وجود خلاف بين بعض المتخصصين برسم المصاحف حول مواقع بعض هذه الفواصل ) . إن هذه الفواصل لا تقع في نهاية جمل مفيدة كاملة دائمًا بل تقع أحيانا في وسط جملة أي أن الآية قد تكون جزءًا من جملة أو قد تكون جملة كاملة أو قد تحوي جملة وبعض جملة أو أنها قد تحتوي على عدد من الجمل .

هـ- إن الخطأ في التعامل مع النصوص غير القرآنية قد لا ينطوي عليه اعتراض يذكر أما الخطأ في التعامل مع القرآن الكريم فيلاقي اعتراضًا دينيًا واضحًا ، لذلك فإن مقدار الحرص على دقة التعامل مع النص القرآني يجب أن يكون فائقًا .


3- إعداد النص القرآني

قد يكون من المقبول في التعامل مع النصوص فيما عدا القرآن الكريم وجود نسبة بسيطة من الخطأ الإملائي أو الخطأ في التشكيل ( إن كان النص مشكولاً ) وقد تبلغ النسبة المقبولة من الدقة 99,9% ولكن ذلك غير مقبول على الإطلاق في نص القرآن الكريم . فهذه النسبة من الخطأ تعني وجود خطأ مقداره واحدًا بالألف . وحيث أن النص القرآني المشكول يقرب حجمه من 700 ألف بايت فوجود خطأ مقداره واحد بالألف يعني 700 خطأ في القرآن كله وهذا ما لا يقبله أحد من المسلمين .

لذلك كانت المهمة الأولى هي التأكد من النص القرآني بنسبة تقرب من 100% تمامًا وهذه المهمة ليست باليسيرة فقد استدعت المهمة قراءة النص المدخل للحاسب عشرات المرات . وليس هذا فحسب ، بل دقق في مراحل تالية بعد إجراء معالجات متعددة على النص القرآني لتدارك ما تسرب من أخطاء قليلة .

لذا كان من الضروري اعتماد بعض الأسس المتعلقة بالتعامل مع النص القرآني . أول هذه الأسس هو اعتماد الرسم العثماني للمصحف واعتماد قراءة حفص عن عاصم (كونها الأكثر شيوعًا في العالم الإسلامي اليوم ) واختيار مصحف المدينة النبوية كأساس لهذا الإدخال . واستنادًا لذلك اختيرت فواصل الآيات وعلامات الوقف والتجويد المستعملة في هذا المصحف ابتداءً .

كان من الضروري في البداية الإجابة على سؤال اختلف فيه الفقهاء الأقدمون كثيرًا وهو هل البسملة آية من الفاتحة ؟ أم هي آية من كل سورة عدا سورة التوبة ؟ أم هي ليست آية من أية سورة ، بل هي بعض آية من سورة النمل ؟ . ويمكن الرجوع إلى تفاصيل هذا الخلاف في كتب التفسير والذي فصله كثير من المفسرين في بداية تفسير سورة الفاتحة ( أنظر تفسير ابن كثير(2) وتفسير القرطبي(23 على سبيل المثال ) .

والذي اعتمدناه في قواعد البيانات هذه هو اعتبار البسملة أول آية من القرآن الكريم ( أي أول آية من سورة الفاتحة ) دون بقية السور، وقد وجدنا أن إثبات البسملة لمرة واحدة في أول سورة الفاتحة هو أفضل من تكرارها في كل سورة ( عدا سورة التوبة ) حيث أن ذلك سيطيل من تكرار لا داعي له كما أن عدم إثباتها في الفاتحة يعني أن لا تذكر البسملة إلا مرة واحدة كجزء من آية في سورة النمل

4- المعالجة الأولية للنص القرآني

مما تقدم كان لا بد من اعتماد النص القرآني آية آية . إن كل آية تعتبر قيدًا مستقلاً ( record ) أو سطرًا كاملاً . ولا يفصل بين كلمة من كلمات الآية سوى فراغ واحد . أما بين آية وأخرى فلا داعي لأية فاصلة لأن الانتقال من سطر لآخر إشارة إلى انتهاء الآية والبدء بآية جديدة وقد أدى ذلك إلى انتفاء الحاجة إلى ترقيم الآيات الواحدة تلو الأخرى أو وضع الترقيم بين آيتين . فالمعالجة الحاسوبية عند البرمجة يمكن أن تقوم بالعد والترقيم دون الحاجة إلى إثبات ذلك في النص . وعلى هذا فقد احتوى النص على ( 6236 ) سطر أو قيد .

أما الفواصل بين سورة وأخرى فكان لا بد من اختيار رمز يشير إلى ابتداء سورة جديدة . وقد اختيرت العلامة # كرمز لبداية سورة جديدة .

أما علامات الوقف والتجويد فقد اختير لكل علامة رمز من الرموز المستعملة في الحاسوب مثل $ & % + - وغيرها . كما اختيرت علامة خاصة لمواقع سجود التلاوة . وقد لوحظ أن بعض علامات الوقف والتجويد تقع بين كلمتين من كلمات المصحف وبعضها يقع في آخر الكلمة بينما وقع البعض الآخر في وسط الكلمة . وهذا جعل الكلمات بعضها غريبًا في شكله نظرًا لأن الحروف تختلف في هيأتها إن وقعت في وسط الكلمة أو أولها أو آخرها إذا ما أدخل وسط الكلمة رمز من هذه الرموز . وعلى أية حال سوف يتبين فيما بعد أن المعالجة الأخيرة كانت بحذف كل هذه الرموز عند استخلاص الكلمات كلمة كلمة وذلك لسببين : السبب الأول صعوبة استخدام هذه العلامات في برامج معالجة النصوص الشائعة حيث يستدعي ذلك استخدام بنط ( ترميز للحروف ) خاص بالمصحف لا يتوفر عند الغالبية العظمى من مستخدمي الحاسوب والسبب الثاني والأهم أن الكلمة القرآنية غالبًا تنطق بمعزل عن علامات الوقف والتجويد ( إلا إذا كانت العلامة وسط الكلمة وهي نادرة ) والتي غالبًا ما تكون بين الكلمات المتعاقبة أو نهاية الجمل أو الآيات . أما الأمر المهم الآخر في هذا المضمار فهو الألف الخنجرية التي توضع فوق بعض الحروف ولا تكتب ألفًا مثل "الرحمن" و "هذا" . وقد تم استخدام علامة التعجب ! لتنوب محل هذه الألف . وسيتبين فيما بعد أن هذه الألف كذلك قد تم الاستعاضة عنها بالألف الممدودة تارةً في مثل كلمة "العالمين" وبالفتحة تارةً أخرى في مثل كلمة "الرحمن" و "هذا" وذلك تماشيًا مع الخط العربي الشائع اليوم بكتابة هذه الكلمات خلافًا للقاعدة بدون ألف ممدودة . وكان هذا الحذف لضرورات الطباعة باستعمال معالج نصوص عادي . هذا مع الإشارة أن هذه المعالجة لم تتم في هذه المرحلة ولكن في مرحلة لاحقة كما سيتبين في ما بعد . كما استعملت علامة التعجب ؟ بدل همزة الوصل.

وعلى هذا فإن النص القرآني في هذه المرحلة كان نصًا استبعدت منه علامات الوقف والتجويد ومواقع سجود التلاوة ولكن أبقيت فيه علامات الألف الخنجرية .أي أن النص في هذه المرحلة هو نص بالرسم العثماني خال من العلامات ( عدا الألف الخنجرية وهمزة الوصل ) وليس نصًا مطابقًا للنطق ، حيث أن هناك عددًا من الكلمات القرآنية التي لا يمكن نطقها بشكل صحيح إلا بمساعدة العلامات المثبتة في المصاحف حاليًا والتي استثنيت في هذه المرحلة من المعالجة . وقد حذفت العلامات المشار إليها باستخدام أحد برامج التحرير ( edit ).

5- قاعدة بيانات رسم الكلمات

كان لا بد من البدء بتكوين قاعدة بيانات لرسم المصحف وفق الرسم العثماني . فالكلمات الأساس في قاعدة البيانات هذه هي حقل رسم الكلمة بالرسم العثماني ، محذوفًا منه علامات الوقف والتجويد فقط . ويلاحظ أن هناك كلمات في الرسم العثماني مكتوية في أماكن مختلفة في المصحف بأشكال مختلفة فقد تختلف فيما بينها في رسم التاء مرة كتاء مربوطة ومرة كتاء طويلة وكذلك في وجود ألف واو الجماعة مرة وعدم وجودها مرة أخرى وهكذا.

أما الملاحظة الثانية فهي عن رسم الهمزة . فرسم الهمزة في المصحف مختلف عن الرسم الحديث للهمزة في اللغة العربية المتداولة اليوم في كثير من المواضع.

لا شك إن معظم الكلمات القرآنية متطابقة في كتابتها بين القديم والحديث . ولكن هناك عدد لا يستهان به من الكلمات المختلفة في شكل كتابتها . ويمكن إجمال الاختلافات بما يأتي :

أ‌- استعمال الألف الخنجرية في كثير من الكلمات مثل العالمين ( تكتب العلمين ) .

ب‌-كتابة الهمزة بشكل مختلف عما هو متعارف عليه في الخط الحديث مثل ءالذكرين التي تكتب اليوم آلذكرين باستعمال المدة فوق الألف ( التي هي همزة بعدها فتحة طويلة ( أي ألف ) رغم أن المصاحف تستعمل المدة كعلامة من علامات التجويد).

ج - ألف واو الجماعة تكتب أحيانا بالألف وأحيانا بدون الألف. كما أن هناك أحيانًا واوًا أصلية في الكلمة مضافًا لها ألف مثل أدعوا.

د - كتابة التاء تارة كتاء مربوطة وتارة كتاء طويلة .

هـ - كتابة بعض الكلمات بشكل خاص مثل الربا تكتب ( الربوا ) .

و - دمج بعض الكلمات أحيانا وعدم دمجها أحيانًا أخرى مثل أم من ( تكتب أحيانا أمَّن ) وأن لا تكتب أحيانا ( ألّا ) وإن لم ( إلَّم ) .

ز - دمج بعض الكلمات بطريقة مغايرة لما متعارف عليه اليوم مثل " يا ابن أمي" ( يبنؤم ) و " فما للذين" ( فمال الذين ) .

ح - الحروف في فواتح بعض السور التي تسمى بالنورانية غير متعارف عليها في الخط الحديث. ولكنها ربما تشبه استعمال الرموز في المعادلات الرياضية أو في الأشكال الهندسية أو تبويب الفقرات هجائيًا.

وعلى هذا فإن أول خطوة في تكوين قاعدة بيانات رسم الكلمات هو إعادة كتابة الكلمات المختلف عليها برسم حديث فتتكون قاعدة البيانات هذه من حقلين الأول هو الرسم العثماني الدقيق والثاني هو الرسم الحديث .

احتوت قاعدة بيانات القرآن الكريم الرئيسة على 83829 قيدًا تحوي بينها 114 علامة # لبداية السور و6236 علامة @ لبداية الآيات حيث أن عدد كلمات المصحف بالرسم العثماني هو 77479 فيها 4 كلمات هي كلمات البسملة في بدء سورة الفاتحة. وعند استخلاص الكلمات القرآنية ووضعها في قاعدة بيانات ثانوية خاصة بالكلمات القرآنية فإن عددها سيكون 18841 كلمة. أما عند حذف تشكيل الآخر والشدّة على أول حرف إن وجدت بسبب التنوين في الكلمة السابقة فعددها ينزل إلى 15263.

وسِّعت قاعدة البيانات الثانية بخطوات متعاقبة وذلك بحذف الشدة على الحرف الأول لبعض الكلمات نتيجة وقوعها بعد كلمة محتوية على تنوين مثل تشديد اللام في ( هدىًَ لِّلمتقين ) وتشديد الميم في ( ريب مّما ) وقد تأتي هذه الشدة حتى في بداية آية إن كان في نهاية الآية التي قبلها تنوين مثل قوله تعالى ( عدواً مبيناً – رَّبكم أعلم ) وتنحصر هذه الحالات إن كانت بداية الكلمة لامًا أو ميمًا أو راءًا أو نونًا أو ياء أو واوًا وكانت الكلمة التي تسبقها منونة كما في الأمثلة السالفة . ولهذا حذفت هذه الشدة على مرحلتين المرحلة الأولى بواسطة برنامج يدقق إن كانت هناك شدة على الحرف الأول من كل كلمة تبتدئ بهذه الحروف فيقوم بفصلها والمرحلة الثانية كانت بأن تدقق يدويًا ومن ثم تحذف . وهناك مواضع أخرى للشدّة التي كان يجب أن تحذف من بداية الكلمة مثل " لهم مّا يشاؤون " نتيجة التقاء ميمين في كلمتين متعاقبتين . كما عولجت مشكلة تشكيل اللام ألف . وتجدر الإشارة هنا إلى أن معالجات النصوص الشائعة تكتب اللام إلف بشكل غريب إن كانت اللام مشكولة أو عليها شدة ( تكتب "لـَّا" أو "لـَا" وليس "لا" ) ولذلك استعيض عن تشكيل اللام بتأخير الفتحة إلى ما بعد الألف بحيث تصبح "لاَ" . وهذا خطأ كان لا بدّ من القبول به في هذه المرحلة . وبالطبع فإن المشكلة تزيد سوءًا إذا كانت الألف بعد اللام هي همزة مثل "لَأنتم" حيث كتبت "لأَنتم" أو" لَإلى الله" حيث كتبت "لإِلى الله" وقد حذفت الحركة على اللام في مثل هذه الحالات . وقد يلتقي اللام ألف والشدّة على اللام نتيجة تنوين الكلمة السابقة لها وبذلك تجتمع المسألتان أعلاه في موضع واحد .

هناك حقل ثالث مهم يجب إضافته لقاعدة البيانات هذه ، ألا وهو الرسم بالخط العادي بدون تشكيل . فالكتابة الشائعة اليوم غير مشكولة بصورة عامة ولا شك أن ذلك يحدث كثيرا من اللبس في كتابة العديد من الكلمات وهذا الحقل ضروري لكي تؤخذ إمكانية التعامل مع هذا اللبس في أي معالجة آلية للغة العربية ذات معنى .

تكوين قاعدة البيانات هذه قد مرّ بمرحلتين . مرحلة آلية وذلك باستحداث قاعدة بيانات للكلمات المتشابهة ثم يجري تعديلها إلى الرسم العادي يدويًا وفي مرحلة لاحقة يحذف منها التشكيل وتعاد هذه الحقول إلى قاعدة البيانات الرئيسة لتتكون قاعدة بيانات مكونة من نص بالرسم العثماني وآخر بالرسم الحديث ( العادي ) وثالث بدون تشكيل .

إن كتابة الهمزة بالرسم الحديث تستند إلى قواعد مقننة من قبل مجامع اللغة العربية ويمكن فصلها في قاعدة بيانات خاصة بالهمزة والتعامل معها ببرنامج وفق هذه القواعد .

كما تجدر الإشارة إلى مسألة الشواذ في الكتابة . فكلمات مثل هذا والرحمن تكتب بالرسم العادي بلا ألف كما أن واو الجماعة لا تلفظ كما أن مسألة دمج بعض الكلمات في الرسم العثماني لها ما يقابلها من كلمات منفصلة في الرسم العادي . وبذلك فإن عدد كلمات المصحف بالرسم العثماني ستختلف عن عدد كلمات المصحف بالرسم العادي أي أن تقابل هذه الكلمات بعضها تجاه البعض يحتاج إلى معالجات خاصة . أنظر شكل (1) كما يبين الشكل (2) جدولاً بالجذور الأكثر ترددًا في القرآن الكريم والتي يزيد عدد مرات تكرارها عن 120 مرة. لاحظ أن بعض الكلمات ( خاصة الحروف) قد أدرجت مع الجذور أيضاً. ومن هذا الجدول يمكن أن تستنبط الأفعال الأكثر ترددًا في اللغة العربية والتي يمكن البدء بها عند تعليم العربية لغير العرب. يبين الشكل (3) قاعدة بيانات الكلمات القرآنية .

6- قاعدة بيانات الجمل القرآنية

كما سبق ذكره فإن الجمل القرآنية متداخلة مع فواصل الآيات. أي أن الجمل القرآنية يمكن أن تكون بعض آية أو آية كاملة أو جزءًا من آية مع جزء من آية أخرى أو آية كاملة مع أجزاء من آية أخرى أو عددًا من الآيات.

لذلك كان من الضروري وضع إشارات ضمن النص تشير إلى نهاية جملة وبدء جملة جديدة . وذلك للقرآن كله. وتجدر الإشارة إلى أن علامات الوقف والتجويد قد يشير بعضها إلى مثل هذه المواضع حيث أن إشارة ( الوقف اللازم أو الوقف أولى ) تشير إلى بعض من هذه المواضع.

خذ مثلاً سورة الفاتحة ، فالجمل فيها :

بِسْمِ اللَّهِ الرَّحْمَنِ الرَّحِيمِ@

الْحَمْدُ لِلَّهِ رَبِّ الْعَالَمِينَ@الرَّحْمَنِ الرَّحِيمِ@مَالِكِ يَوْمِ الدِّينِ@

إِيَّاكَ نَعْبُدُ

وَإِيَّاكَ نَسْتَعِينُ@

اهْدِنَا الصِّرَاطَ الْمُسْتَقِيمَ@صِرَاطَ الَّذِينَ أَنْعَمْتَ عَلَيْهِمْ غَيْرِ الْمَغْضُوبِ عَلَيْهِمْ وَلاَ الضَّالِّينَ@

وهذه التجزئة هي إستقرائية لا غير. وقد تختلف مواقع تجزئة النص إلى جمل بحسب فهم من يقوم بها من المفسرين. فمثلا فاتحة سورة البقرة يمكن أن تجزأ كما يأتي:

الم@

ذَلِكَ الْكِتَابُ لاَ رَيْبَ

فِيهِ هُدًى لِّلْمُتَّقِينَ@

ويمكن أن تجزأ كالآتي:

الم@

ذَلِكَ الْكِتَابُ لاَ رَيْبَ فِيهِ

هُدًى لِّلْمُتَّقِينَ@

وهناك بعض المواضع التي تشير إليها علامات خاصة من علامات الوقف والتجويد التي تبين إمكان الوقف على أي من الكلمتين ( فيه أو هدىً) بشكل متبادل ( أي أحدهما فقط ) . ولكل من الصيغتين إعراب مختلف لكل جملة.

وهكذا تتكون قاعدة بيانات للجمل القرآنية يكون أساسًا لقاعدة بيانات النحو.

7- قاعدة بيانات الصرف

هناك من الخطوات التي ينبغي إجراءها قبل البدء بتكوين قاعدة بيانات الصرف لنص القرآن الكريم . أول هذه الخطوات هو تجزئة الكلمات القرآنية إلى لواصقها الأولى ولواصقها النهائية وأدوات التشكيل ويمكن كحد أعلى اعتبار القطع 4 لواصق أولية كحد أعلى و 2 من اللواصق الآخرية وجذع الكلمة وتشكيل للجذع وتشكيل آخر .

وبذلك فإن الكلمة يحجز لها 9 حقول . خذ مثلا كلمة " أفبالباطل " تحتوي 4 لواصق أولية هي " أ - فَـ - بِـ - الْـ " وجذعها هو باطل يعقبها كسرة في الأخير . أما كلمة " فسيكفيكهم " فتحتوي على لواصق أولية عددها 2 هما " فَـ - ـسـَ " والجذع يكفي واللواصق الأخرية هي " كـَ " و " هم " والتشكيل على الجذع هو السكون ( غير الظاهر على الياء ) وتشكيل آخر اللواصق هو السكون أيضا ( الذي يظهر أو يختفي حسب الكلمة التالية للميم )

وتجدر الإشارة إلى أن ألف لام التعريف عند حذفها يكون الحرف الأول من الكلمة مشددًا إن كان من الحروف الشمسية لذلك يجب حذف هذه الشدة من جذع الكلمة . أما إن كان من الحروف القمرية فإن اللام ( من ألف لام ) تحمل سكونًا يجب حذفه .

أما جذع الكلمة فيمكن أن تكون مشتقة من فعل ثلاثي على وزن ما . ويمكن أن يتم ذلك بواسطة برنامج خاص يقوم باستنباط الوزن الذي اشتقت منه هذه الكلمة . وهذا الاشتقاق يمكن أن يكون بسيطًا إذا كانت أحرف الجذر ليس بينها حرف علّة . أما عندما يكون أحدها ( أو أكثر من واحد ) حرف علة فإن قواعد تحويل الواو إلى ياء أو ألف أو بالعكس تجعل القواعد أكثر تعقيدا كما هو معروف .

أما إذا لم يكن الجذع مشتقًا فيعني ذلك عدم وجود جذر للكلمة . وعلى هذا فإن عدد حقول قاعدة بيانات الصرف تصبح 12 حقلا هي

الكلمة ، 4 حقول للواصق الأولية ، جذع الكلمة ، تشكيلها ، لواصق آخرية ، تشكيل الآخر ، جذر الجذع ، وزن الجذع .

يبين الشكل ( 5 ) نموذجًا لقاعدة البيانات الصرف كما يعطي الشكل (6) قاعدة بيانات اللواصق وهي قد قلصت فيها اللواصق الأولية إلى اثنين فقط ( دمجت اللواصق التي تزيد عن إثنتين إلى اثنتين وهي حالات محدودة) . هذا وقد استعين في تحديد جذور الكلمات القرآنية بالمعجم المفهرس لألفاظ القرآن الكريم (4) ولسان العرب (5).

8- قاعدة بيانات النحو

يمكن تكوين قاعدة بيانات النحو هذه مشتقة من قاعدة بيانات الصرف وتختلف قاعدة البيانات هذه عن قاعدتي البيانات السابقتين ( الكتابة والصرف ) بأن عدد كلماتها أكثر من القاعدتين السابقتين حيث أن كل جزء من أجزاء اللواصق ( الأولى والأخيرة ) هي كلمة مستقلة ، إضافة إلى جذع الكلمة . كما يلحق بكل كلمة من هذه الكلمات الجديدة تشكيلها . كما أنه من الضروري إضافة حقل خاص يحدد الكلمة القرآنية التي بعود لها جزء الكلمة هذه وموقعها التسلسلي ضمن الكلمة .

فكلمة فسيكفيكهم التي رقمها في قاعدة بيانات كتابة المصحف هو ( 2597 )

اللواصق الحركة رقم الكلمة تسلسل جزء الكلمة

فـ فتحة 2597 1

ـسـ فتحة 2597 2

يكفي سكون 2597 3

ك فتحة 2597 4

هم سكون أو ضم عند التقاء الساكنين 2597 5

وهنا بعد هذا يضاف إعراب الكلمات واحدة واحدة مع تبيان إن كانت الكلمة مبنية أو معربة وعلامة الإعراب أو أية معلومات تفصيلية عن الإعراب.

وتجدر الإشارة إلى أن بعض أجزاء الكلمة قد لا يكون له محل من الإعراب مثل ألف لام التعريف فيشار إليه بذلك .

يبقى هنا كيف يمكن التعبير عن إعراب أشباه الجمل أو الجمل ،وقاعدة البيانات المذكورة غير مناسبة لذلك فيصبح من الضروري تكوين قاعدة بيانات فرعية تحدد رقم الكلمة وتسلسل جزء الكلمة الذي تبدأ به شبه الجملة ومداها ثم موقعها من الإعراب وعلامة الإعراب مع نص شبه الجملة أو الجملة .

هناك أمر آخر على جانب من الأهمية في موضوع النحو وهو عودة الضمير . فالضمائر في اللغة العربية تعود إلى كلمة سابقة أو شبه جملة . وقد تكون الضمائر ظاهرة أو مستترة . لذلك من الضروري اعتبار الضمير المستتر كلمة فارغة بين أجزاء الكلمة ضمن تسلسلها مع إضافة حقل خاص لتبيان ما يعود له الضمير .

أن تكوين قاعدة البيانات هذه ليس أمرًا واحدًا ثابتًا كنص القرآن الكريم فهناك خلافات نحوية كثيرة بين المتخصصين في النحو في إعراب الكثير من الكلمات القرآنية واستنادًا إلى تلك الخلافات يختلف المعنى والتفسير أيضا ولغرض استيعاب مثل هذا الخلاف بالرأي يمكن أن توضع قاعدة بيانات النحو بشكل يقبل تعدد الآراء بحيث تصبح كقاعدة بيانات ثانوية تحتوي ما يأتي :

رقم الكلمة القرآنية

رقم جزء الكلمة

حركة جزء الكلمة

نوع جزء الكلمة مبنية أم معربة وهل هي اسم أو فعل أو حرف.

موقعه من الإعراب

رمز الرأي الإعرابي

عودة الضمير

ملاحظات إن وجدت

وبذلك يمكن أن يكون للكلمة الواحدة عدد من أشكال الإعراب تجمع في قاعدة بيانات واحدة ويمكن الرجوع إلى أي منها عند الحاجة .

كما أن الاصطلاحات التي يتم اعتمادها يمكن أن تكون قواعد بيانات فرعية مثل قاعدة بيانات الكلمات المبنية وقاعدة بيانات علامات الإعراب وقاعدة بيانات المواقع من الإعراب .

هذا وإن هناك حقلين آخرين تجدر إضافتهما إلى قاعدة البيانات الرئيسة أيضا وهما حقل الجنس ( التذكير والتأنيث ) إن وجد ، حقل الإفراد والتثنية أو الجمع إن وجد وبالنسبة للجمع نوع الجمع إن كان جمع مذكر سالم أو جمع مؤنث سالم أو جمع تكسير . أنظر الشكل (5)

9- قواعد بيانات المعاني والدلالة

قاعدة البيانات هذه ما هي إلا أفكار عامة تحتاج إلى مزيد من العناية والتوسيع فموضوع تقنين المعاني والدلالة على جانب كبير من الصعوبة بالنسبة للغات الحديثة فكيف باللغة العربية الواسعة المعاني والدلالة وكيف إن كان الموضوع يتعلق بصفوة البيان العربي ألا وهو القرآن الكريم .

إلا أن قاعدة البيانات هذه تكاد تكون صفوة قواعد البيانات التي يرجى إكمالها لتخدم تفسير القرآن ومعاني مفرداته.

أول قاعدة بيانات للمعاني هي قاعدة بيانات الجذور .

فالجذور من ناحية المعنى مترابطة مع بعضها فمثلا جذور مثل : جيء ، أتي ، قدم ، حضر ، وصل ، ولي ، دبر ، وكذلك : دخل ، ولج ، قبل ورد ، وصل وهذه المجموعات مترابطة مع بعضها حيث أنها تتعلق مع غيرها من المجموعات بحركة الإنسان ذهابًا أو إيابًا أو خروجًا أو دخولاً أو وصفا لكيفية هذه الحركة من سرعة أو انحدار أو ارتفاع أو تغير أو خوف أو إجبار أو توقيت أو حلول أو تكرار .

وعلى هذا فالأفعال تتجمع في مجموعات يمكن وصفها بصفة جامعة عامة ثم تنقسم إلى مجموعات أدنى من ذلك تتصف بجامع أخص من الأول وهكذا .

لكن المجموعات النهائية لا تتفق في المعنى فهي مؤتلفة أحيانًا ومختلفة أحيانًا أخرى . وهناك الكثير من المؤلفات في التراث العربي التي تذكر مثل هذه الألفاظ ( 6 ) .

كما هناك قواميس حديثة التي تعطي مثل هذه المجموعات وما يقابلها من مفردات أجنبية (7).

إن الجذور وحدها تجمع في غالبيتها أصولاً لمعاني عديدة . ولذلك فإن الاستناد إليها يعطي وجهة عامة غير دقيقة للدلالة . لذلك يجب الانتقال من مستوى المجموعات العامة للجذور إلى المجموعات المتخصصة إلى مجموعات الجذور المتقاربة إلى الأوزان المختلفة التي تدخل على الجذر نفسه . فللجذر ذهب صيغ أفعال مثل ذهب ، أذهب ، ذهَّب وللجذر قدم : صيغ مثل : أقدم ( أفعل ) وقدَّم ( فعَّل ) واقتدم ( افتعل ) تقادم ( تفاعل ) تقَّدم ( تفعَّل ) واستقدم ( استفعل ) (Cool .

ويلاحظ أن بعضًا من هذه الصيغ ذات علامة بالسير . أما بعضها مثل تقادم فليس لها علامة بذلك بل تتعلق بمعنى الزمن ، كما أن قدَّم قد لا تتشير إلى حركة الإنسان وحده بل إلى حركة الأشياء أيضا . وهكذا فإن سلسلة الأفعال المتقاربة ( المزيدة ) بالمعنى يجب أن ينظر إليها وليس إلى الجذور المتقاربة فقط .

هناك حاجة أيضا إلى الإشارة إلى الفروق بين الأوزان المختلفة . فمثلاً قدَّم واستقدم تشيران إلى فعل القدوم أو التقديم على الغير وللغة العربية قواعد راسخة في مثل هذه المعاني تحتاج إلى إدخال إلى قواعد البيانات بطرق مناسبة ذات ترميز دقيق .

الأمر الآخر الذي ينبغي أن تشمله قواعد البيانات هو تعدد المعاني للفظة الواحدة .

الأفعال باللغة العربية من ناحية المعاني يمكن تقسيمها إلى :

أفعال لازمة : اركعوا واسجدوا

أفعال متعدية لمفعول واحد : ورد ماء مدين

أفعال متعدية بحرف الجر : واسجدوا لله

أفعال متعدية لمفعول واحد وبحرف الجر : آوى إليه أخاه

أفعال متعدية لمفعولين : فسيكفيكهم الله

أفعال متعدية لمفعولين وبحرف الجر : وجد عليه أمة من الناس يسقون

وقد يكون الفعل تارة من أحد الأفعال المتعدية بحروف الجر بحيث يعطيها معاني مختلفة عند اختلاف حرف الجر ، فالفعل ذهب مثلا ورد مع إلى مثل " اذهب إلى فرعون " . وقد تأتي الجمل أو أشباه الجمل في موقع المفعول به في أفعال أخرى.

ومع الباء : " تذهبوا به " ومع عن : " يذهب عنكم الرجس "

وقد يأتي لازمًا بلا حرف جر مثل " إذهب أنت وربك " والفعل آتي أكثر من ذلك تشعبًا .

مثل " يأت آباءهم " ، " فأتوا بآياتنا" و " آتاهم الله من فضله " ، " وأتوا البيوت من أبوابها " .

وأوتيت من كل شيء تعدي الفعل لمفعول معين يشير إلى معنى مثل " يبغونها عوجًا ". كذلك فإن تضاد المعاني بين أفعال ( أو كلمات ) وهذا التضاد قد يكون من جهة معينة . فقد يكون التضاد يتعلق بالاتجاه مثل ذهب وأتى أو قام وقعد أو مثل فوق وتحت . وقد يكون التضاد من جهة الزمن مثل الماضي والمستقبل وقد يكون من جهة التبادل بين شيئين مثل أخذ وأعطى وقد يكون من جهة صفة معينة مثل أمات وأحيى وهكذا وهذا التضاد يعطي المعنى الدقيق أحيانًا إذا عرف معنى الضد. وفي القرآن كما في اللغة العربية أصلاً عبارات كاملة تشير إلى معنى محدد كان يمكن أن يشار له بفعل واحد ( لكن ربما تحمل معنىً إضافيًا )

قدرناها من الغابرين = أهلكناها

خذوا ما أتيناكم بقوة = اتبعوا ما آتيناكم بدقة

واضرب لهم مثلا = اقصص عليهم مثلا

مما تقدم يتبين أن قواعد البيانات التي تخدم المعنى والدلالة واسعة جدا ومعقدة ، نظرًا لصعوبة الموضوع أصلاً ولكنها ضرورية جدًا للتقدم في مجالات معالجة بيانات اللغة العربية آليًا والترجمة والدلالة . ويمكن أن تذكر هنا بعض قواعد البيانات التي تخدم المعاني والدلالة في القرآن الكريم .

أ‌- قاعدة بيانات مجموعات الجذور العامة .

ب‌-قاعدة بيانات مجموعات الجذور المتخصصة .

ج - قاعدة بيانات مجموعات الجذور المتسلسلة المعنى .

د - قاعدة بيانات الأفعال المزيدة .

هـ - قاعدة بيانات الأفعال من ناحية اللزوم والتعدي .

و - قاعدة بيانات تعلق حرف الجر بالأفعال .

ز - قاعدة بيانات الكلمات المتضادة .

ح - قاعدة بيانات العبارات التي تشير إلى معنى محدد .

ط - قاعدة بيانات المعاني المعقدة .
10- قاعدة بيانات اللفظ

كانت العناية بقراءة وترتيل وتجويد القرآن فائقة على مر العصور . وقد عني المسلمون بقواعد التجويد ووضع الرموز المساعدة للوقف واللفظ الصحيح أثناء القراءة . وتحتوي المصاحف الشائعة اليوم على الكثير من هذه الرموز وفق القراءة القرآنية الشائعة ( هناك ثلاث قراءات تشيع المصاحف المكتوبة وفقها وهي برواية حفص وورش وقالون ) .

ويمكن لقاعدة بيانات تجويد القرآن الكريم أن تحتوي على ما يأتي :

1- قاعدة بيانات القراءات القرآنية(Cool

فالمعروف أنه على الرغم من التزام كل القراء بالاعتماد على الرسم العثماني إلا أن هناك اختلافات طفيفة بينها ويمكن جمع هذه الاختلافات في قاعدة بيانات تبين ذلك .

يضاف إلى ذلك الرموز المختلفة التي تشير إلى طريقة نطق بعض الحروف كالهمزة والتنوين .

ولا يكفي أن يوضح نطق كل كلمة منفردة لوحدها بل يجب تبيان نطق إرتباط الكلمات المتتالية مع بعضها حيثما كان ذلك ضروريًا للإيضاح.

2- قاعدة بيانات الألفاظ الشاذة وهي كلمات خاصة تلفظ بصيغة معينة في بعض القراءات دون أخرى .

3- قاعدة بيانات الأصوات .

فالمعروف إن وحدة الكلام المنطوقة هي الأصوات phonems وليس الحروف وتحتوي اللغة العربية على أصوات لا توجد في غيرها كما أن أصوات التجويد وخاصة المدود ولفظ النون الساكنة والميم الساكنة والإدغام والإمالة والتخفيف تنطق بشكل معين . وجمع رموز هذه البيانات يجعلها مفيدة للاستعمال في دراسات وأبحاث عن اللغة العربية .

إن نطق بعض الحروف أو الأصوات يخضع في القراءات القرآنية لكثير من القواعد غير الظاهرة في المصاحف. فهناك أصوات مختلفة لبعض الحروف مثل الراء المخففة والمفخمة والنون والنون مع الغنة المخففة والنون مع الغنة المدغمة والواو والواو الإختكاكية والواو الصائتة والياء والياء الإحتكاكية والياء الصائتة وصوت الإمالة وصوت التفخيم واللام المرققة واللام المفخمة. هذا بالإضافة إلى الحركات الثلاثة الفتحة والضمة والكسرة.(10)

4- قواعد البيانات الصوتية .

لقد أصبح بالإمكان تجزئة الصوت بالحاسوب وتقطيعه وإعادة تركيبه والتعرف عليه. فإذا ما خزن صوت نموذجي لقارئ ما وكان هذا النموذج وافيًا وقطِّع إلى أجزاء مناسبة فإن بالإمكان إعادة تركيب هذه الأجزاء لقراءة نص آخر مغاير للنص الأصلي لكنه يحتوي على تلك القطع والأجزاء وبصوت القارئ نفسه .

إن قواعد بيانات اللفظ لا تكون مكونًا مباشرًا من مكونات المعجم الموسع لكنها تساعد في خدمة هذا المعجم.

11- ماذا يمكن أن تقدم قواعد بيانات القرآن الكريم للغة العريية

إن صغر حجم بيانات القرآن الكريم بالمقارنة مع اللغة العربية جعل بالإمكان إكمال بعض قواعد البيانات بجهد معقول . أما البيانات الكاملة للغة العربية فتحتاج إلى جهود كبيرة . لكن الأمثلة التي عرضت في هذا البحث تعطي إشارة واضحة إلى سهولة الكثير من هذه الجهود وإمكان برمجتها . ويمكن تلخيص ما يمكن أن تقدم بيانات القرآن الكريم للغة العربية على النحو الآتي :

1- تعطي قواعد بيانات القرآن الكريم أمثلة واضحة للكثير من المعالجات التي يمكن أن تتم على اللغة العربية . وما تحتاجه اللغة العربية سوى توسيع بعض هذه القواعد لكي تشمل كل الكلمات والمعاني المستعملة في اللغة .

2- إن البرامج التي كتبت وفق قواعد معينة لمعالجة كلمات القرآن الكريم يمكن استخدامها نفسها على اللغة العربية بشكل عام .

3- إن نصوص القرآن الكريم التي تمت معالجتها كانت دقيقة لكنها تحتوي على الكثير من أشكال الكتابة غير القياسية . أما اللغة العربية الحديثة فهي تستعمل أدوات قياسية أكثر، لكن احتمال الخطأ في الكتابة يمكن أن يستفيد من أشكال الكتابة غير القياسية في المصاحف . وعندها يمكن تصحيح أخطاء الكتابة مثل الهمزة أو التنوين وغيرها .

4- إن نصوص القرآن الكريم التي تمت معالجتها كانت مشكولة واشتق منها نص غير مشكول . وحيث أن الكتابة العادية في غالبيتها غير مشكولة لذلك فإن بالإمكان الاستفادة من قواعد بيانات القرآن الكريم لإعادة بعض التشكيل بصورة آلية إلى الكتابة العربية .

5- إن الكثير من الأبحاث على قواعد بيانات القرآن الكريم لم تؤت ثمارها بعد لحاجتها إلى الكثير من المعلومات اللغوية . لكن تصميم هذه القواعد يعطي فوائد للغة وفي الوقت نفسه يعود بالفائدة على أبحاث القرآن الكريم وخاصة في علم التفسير .

6- إن دراسات الصوت التي يمكن أن تتم على القرآن الكريم يمكن أن تؤتي ثمارها في الترجمة الآلية وآلات الإملاء الآلي وتركيب الأصوات .


12- المعجم الآلي الموسع للغة العريبة

المعاجم اللغوية الموسعة المتوفرة الآن عبر الشبكة العالمية ( الأنترنيت) للغات العالمية كالإنكليزية والفرنسية واليابانية تركز على جانبين : المعاجم الكتابية والفهارس اللفظية.

المعجم الكتابية تأخذ كل كلمة من كلمات اللغة وتعطي تركيبها الصرفي المحتمل في اللغة وإمكانية ورودها نحويًا والمعاني المختلفة لها مع الحروف أو التراكيب التي يمكن أن تدخل معها لتكوين معان جديدة . وبعد كل ذلك تعطي أمثلة على ذلك. أما في اللغة العربية فإن المزيد فوق ذلك يجب ان يؤخذ بعين الإعتبار. فالمعجم يجب أن يحوي جذور الكلمات ووزنها الصرفي كما يجب أن يحوي إمكانيات دخول اللواصق المختلفة عليها.

إن الموقع الإعرابي في اللغة الإنكليزية مثلاً هو غير الموقع الإعرابي في اللغة العربية. فكون الكلمة إسمًا أو صفة متعلق بالمعنى أن تكون الكلمة تسمية لشيئ ما أو أنها تصف شيئًا ما . أما في اللغة العربية فإن موقع الكلمة كفاعل أو صفة لا يتعلق بالمعنى بالموقع الإعرابي في جملة معينة. لذلك فإن وسيلة جديدة يجب أن تبتكر لتصنيف الكلمات العربية من ناحية المعنى غير التصنيف النحوي.

أما التصنيف النحوي فهو ضروري أيضًا لكثير من الكلمات مثل الضمائر الني معظمها تحوي الموقع الإعرابي فأنا وأنت للموقع الإعرابي المرفوع و ياء المتكلم للنصب والجر وهكذا.

ومن الضروري أن يحوي المعجم الصيغ والإرتباطات الممكنة بشكل متكامل. فالفعل أكل مثلاً لا يأخذ مفعولاً معنويًا فلا يقال أكل فلان حريته أو قوله . أي أن كل فعل يجب أن تذكر له عند ذكر دلالته ما يجوز أن يرتبط به من أنواع الفاعل أو المفعول به أو الجار والمجرور وما يجوز.

إن وصف اللغة العربية بشكل مقنن في قواعد بيانات موسعة هو الأسلوب الأمثل للتفاعل الآلي مع اللغة العربية ومكوناتها داخليًا ، وكذلك بينها وبين اللغات الأخرى خارجيًا. وذلك ضروري جدًًا لوضع اللغة العربية في المكانة التي تستحقها اليوم بين اللغات الحديثة.

13- المصادر:

1- قاعدة البيانات المعجمية العربية – حصيلة وآفاق : دز عبد الفتاح ابراهيم و د. سالم غزالي – مجلة المنظمة العربية للتربية والثقافة والعلوم - تونس

2- تفسير القرآن العظيم للحافظ إبن كثير

3- الجامع لأحكام القرآن العظيم للقرطبي
4- المعجم المفهرس لألفاظ القرآن الكريم لمحمد فؤاد عبد الباقي

5- لسان العرب لإبن منظور

6- الألفاظ المختلفة في المعاني المؤتلفة – جمال الدين الجياني دار عمار 1991

7- قاموس المفردات المتضادة – انكليزي – عربي د. كاظم عادل ناصر دار البشير 1989

8- إحصاء الأفعال العربية في المعجم الحاسوبي : مروان البواب وغيره، مكتبة لبنان 1996

9- معجم القراءات القرآنية – د. عبد العال سالم – جامعة الكويت

10- القراءات القرآنية بين الدرس الصوتي القديم والحديث للدكتورة مي فاضل الجبوري – دار الشؤون الثقافية العامة – بغداد 2000

شكل (1) نموذج للكلمات القرآنية مرتبة هجائيًا

ءَأَلِهَتُنَا

ءَأَتَّخِذ

ءَأَرْبَاب

ءَأَسْجُد

ءَأسْلَمْتُم

ءَأشْفَقْتُم

ءَأشْكُر

ءَأَقْرَرْتُم

ءَْأَلِِد

ءَأَمَنْتُم

ءَأَمِنْتُم

ءَأَنْت

ءَأَنْتُم

ءَأَنْذَرْتَهُم



شكل (2) الجذور والكلمات(*) التي يزيد ترددها عن 120 مرة في القرآن الكريم



عزز 121

ءمم 122

يدي 123

ءهل 124

بشر 124

رزق 124

خوف 125

دخل 127

بل 128*

خلف 128

عظم 129

جمع 130

سءل 130

طوع 130

لعل 130

نظر 130

لكن 131

نذر 131

دنو 134

قدر 134

موسى 137*

سلم 141

حتى 143

دون 145

نعم 145*

لقي 147

بصر 149

رود 149

وعد 152

وحد 154

غير *155

صدق 156

بعض 159

نصر 160

شهد 161

نبء 161

كبر 162

بنو 164

مع *165

موت 166

سوء 168

كثر 168

شرك 169

قلب 169

مثل 170

قتل 171

تبع 175

سبل 177

صلح 181

خرج 183

سمع 186

حيي 190

ضلل 192

حسن 195

خير 197

نور 197

جنن 202

عند 202*

ملك 207

حكم 211

دعو 212

ءنت 218*

ءم 221*

نوس 231

غفر 235

بعد *236

ءمر 249

ءخر 251

ءيي 253

وقي 259

ولي 260

خلق 262

ءخذ 274

عبد 276

لو *276

هذا 276*

جيء 279

كذب 283

حقق 288

ذكر 293

نزل 294

قبل 295*

نفس 299

ظلم 316

سمو 318

كتب 320

ءو 326

هدي 327

رءي 329

ءلي 332

رحم 340

ثم 343

جعل 347

عمل 361

عذب 374

كل 377

ءيه 383

قد 407

لك 421

هم 445

ءرض 462

عن 465

يوم 476

ذلك 481

هو *482

رسل 514

ب 518*

شيء 520

بين *524

كفر 526

ءتي 550

لم 575*

قوم 661

ءذ 694*

ءلى *743

له 806*

مَن 829*

علم 855

ءمن 880

ربب 982

كون 1359

على 1443*

ءلل 1471

في 1702*

قول 1723

لا 1731*

ما 2181*

ءله 2852

مِـن 3100*

ءن 4038*


الشكل (3) قاعدة بيانات رسم الكلمات القرآنية



root2


verb


root


rnum


word


no_sh_end


no_beg


no_shada


oth


n


k

#


#


#


0


#


#


#


#


#


7


1

@


@


@


0


@


@


@


@


@


7


2

سمى


اسْم


سمى


38


بِسْمِ


بِسْم


اسْم


بِسْمِ


بِسْمِ


0


3

الله


[b:2f5

نديم ، الحب ، برنامج ، تحميل ، دليل ، مسلسل ، انشوده ، جديد ، كامل





زوار بالالف لموقعك مع فتحات العرب طريقة مضمونه وبوضع كود فقط


حمل اي برنامج او تطبيق او لعبه مجانا من مدونة تحميل برامج
الرجوع الى أعلى الصفحة اذهب الى الأسفل
http://nadimlove.blogspot.com
أبو عبد المنعم
عملأق منتديات نديم الحب

عملأق منتديات نديم الحب


::::[بيـانـات العضـو]::::
1 / 1001 / 100

مَُشَارِكآتي: 273
نَقَّاطَيّ: 61
سَمِعَتيََ: 1
دولـتـي: الجزائر
جـنســي: ذكر
المزاج:
غزه  أرض العزه
المركز الثالث : مسابقة افضل عضو
منتديات نديم الحب ترحب بكم

مُساهمةموضوع: رد: قواعد بيانات القرآن الكريم كأساس للمعجم الآلي الموسع للغة العربية   الخميس مارس 31, 2011 5:12 pm


رائع موضوعك يستحق الوقوف عنده أكثر
مفيد للغاية
جزاك الله أخي على هذا المجهود


نديم ، الحب ، برنامج ، تحميل ، دليل ، مسلسل ، انشوده ، جديد ، كامل




الرجوع الى أعلى الصفحة اذهب الى الأسفل
 

قواعد بيانات القرآن الكريم كأساس للمعجم الآلي الموسع للغة العربية

استعرض الموضوع السابق استعرض الموضوع التالي الرجوع الى أعلى الصفحة 
صفحة 1 من اصل 1

 مواضيع مماثلة

-
» طريقة تشغيل إذاعة القرآن الكريم على سطح المكتب‏
» دورة ايسر واسرع الطرق لحفظ القرآن الكريم
» كلمات حب بالانجليزي مترجمه بالعربي و كلمات رومانسية بالإنجليزي مترجمة للغة العربية كلام عشق و وفاء و عتاب بالإنجليزي .
» منهج الحاسب الآلي للصف الأول الثانوي الصناعي
» كتاب الحاسب الآلي للصف الأول الثانوي الفني الصناعي

صلاحيات هذا المنتدى:لاتستطيع الرد على المواضيع في هذا المنتدى
منتديات نديم الحب | Forums Nadim love | :: المنتديات الثقافيه والادبيه | A cultural literary Forums | :: قسم الكتب والبحوث واللغات | books and research, languages |-
المواضيع الأخيرة
» افضل قنوات اليوتيوب لتعلم الانجليزية
أمس في 9:04 pm من طرف نديم الحب

» أي عمل لله يجب أن يخلو من المصلحة
الإثنين أبريل 14, 2014 8:14 am من طرف نديم الحب

» يحيى الفرنسى بيوتى سنتر للجمال عنوان
الأربعاء أبريل 09, 2014 11:17 pm من طرف قطز اند بيبرس

» تحميل سكربت نتائج الطلاب مع شرح التركيب وأمثلة
الجمعة أبريل 04, 2014 1:41 pm من طرف ayman fouad

» لعبة commandos 3 كوموندوز اقوى لعبه و برابط واحد يدعم الاستكمال حمل الان من هنا
الثلاثاء أبريل 01, 2014 5:21 pm من طرف LikeNon

» تعريف يو اس بي Intel Chipset Driver 7.2.2.1006.zip
الأحد مارس 30, 2014 8:12 pm من طرف gaada

» حلقات برنامج الرابح الاكبر 4 كامل اول باول ( جميع الحلقات اون لاين كامل ) الجزاء الرابع
الثلاثاء مارس 25, 2014 12:34 am من طرف عاشقة النبي

» اشكال فوتوشوب لعمل (فواصل - تواقيع - واجهات - بانرات - صور احترافيه - ابداعات فنيه ) من هنا
الإثنين مارس 24, 2014 11:08 pm من طرف المصمم

» اجمل فرش للفوتوشوب (مجموعه كامله)
السبت مارس 22, 2014 2:37 pm من طرف suosuo14

» صور رحلة سياحية إلى جزر الأميرات , السفر الي تركيا للسياحة والسفر
الخميس مارس 20, 2014 8:43 pm من طرف سحر علي

» برنامج الحوباني سوفت لاداره مقاهي الانترنت كامل (البرنامج + الكراك)
الخميس مارس 20, 2014 7:59 pm من طرف hackerone

» نماذج اختبارات وزاريه للصف الثالث ثانوي والتاسع الاساسي اليمن - تحديث 2013/5/1
الأربعاء مارس 19, 2014 2:23 pm من طرف mohsul

» أهمية صفاء النية لله وحده
الثلاثاء مارس 18, 2014 3:30 pm من طرف نديم الحب

» فيلم معجزة الشفاء بالقرآن الكريم
السبت مارس 15, 2014 9:19 pm من طرف نديم الحب

» رسالتي خاص بي
السبت مارس 15, 2014 9:11 pm من طرف نديم الحب

» ادخل هنا قبل طرح موضوعك : لكي نساعدك بشكل سليم وكامل : الرجاء الدخول
السبت مارس 15, 2014 9:07 pm من طرف نديم الحب

»  تسويق الكتروني | شركة داما شركة تسويق الكتروني | اشهار مواقع
السبت مارس 15, 2014 9:03 pm من طرف نديم الحب

» تحميل هوت سبوت شيلد بدون اعلانات عبر ميديافاير hot spot shield
الأربعاء مارس 12, 2014 4:15 pm من طرف نديم الحب

» تحميل اسطوانه الباك تراك توزيعة اليونكس الاقوى على الاطلاق backtrack 4 final
الأربعاء مارس 12, 2014 2:38 pm من طرف نديم الحب

»  شركة داما شركة تصميم مواقع | شركة تصميم مواقع | تصميم مواقع
الأربعاء مارس 12, 2014 2:23 pm من طرف نديم الحب

،1،2،3،4،5،6،7،8،9،10،11،1213،14،15،16،17،18،19،20،21،22،23،24،25،26،27،28،29،30،31،32،33،34،35،36،37
38،39،40،41،42،43،44،45،46،47،48،49،50،51،51،52،53،54،55،56،57،58،59،60،61،62،63،64،65،66،67،68،69،70
71،72،73،74،75،76،77،78،79،80،91،92،93،94،95،96،97،98،99،100،101،102،103،104،105،106،107
feed2 feed3 feed4 feed5 feed1 feed6 feed7 google yahoo Bing


هذه الرسالة تفيد أنك غير مسجل . Welcome To Forums Nadim Love

و يسعدنا كثيرا انضمامك الينا ^_^

للتسجيل اضغط هـنـا