|
Re: دعوة لتجربة واختبار برنامج التصنيف الجغرافي للأسماء (Re: حاتم إبراهيم)
|
ملاحظات حول البرنامج: البرنامج (في نسخته الكاملة) يغطي الأسماء في حوالي 30 دولة بدلاً عن الخمسة المعلنة في النسخة التجريبية، ( 17 دولة عربية+ 5 دول شبه عربية "جيبوتي، السودان، جزر القمر، الصومال، إرتريا + بقية الدول التي تستعمل أسماء عربية ضمن المكون المحلي " إيران، باكستان، ماليزيا، أفغانستان ...").
الوضع الطبيعي هو محاولة الحصول على الدولة الأعلى نسبة من بين الدول المقترحة عبر منطق إحصائي معقد وتتداخل فيه عوامل مختلفة ومتغيرة، مثل المفاضلة بين تميز الاسم (uniqueness) وشيوعه (popularity) الاسم "الجاك" كنموذج مميز في السودان لكنه غير شائع بينما "عوض" مميز وشائع و "إبراهيم" شائع وغير مميز و "عثمان" غير شائع وغير مميز، خلافاً لما تروج له بعض الدوائر الإعلامية. حالة أخرى لأسماء تبدو احصائياً مميزة ظاهرياً (falsely positive) مثل "نواف" و"صدام" في السودان وغيرها من الأسماء الوافدة، هذه يتعامل مها البرنامج بالتحقق من عامل الزمن.
ملحوظة أخيرة، البرنامج في نسخته التجريبية غير صارم في التعامل مع هيئة الاسم الإملائية (orthography) ويقبل بكل بساطة أي مدخلات، هذا لتيسير التعامل معه للمبتدئين، لكنه في أصل البرنامج (النسخة الكاملة) يطبق وظيفة المطابقة الظنية (fuzzy match) وذلك بحسبان أن المقصود "أحمد" بدلاً عن "احمد" و "مصطفى" بدلاً عن "مصطفي" و "إبراهيم" بدلاً عن "أبراهيم" وهكذا.
|
|
|
|
|
|
|
|
|