ماذا
أعددنا لعالم الذكاء الاصطناعى للتغلب على فجوة المحتوي؟
أ.د خالد
عبد الفتاح محمد
مستشار
الحلول الرقمية والمعرفية بمؤسسة محمد بن راشد آل مكتوم للمعرفة
مما
لا شك فيه أن الذكاء الاصطناعى لم يعد تكنولوجيا محتملة أو مستقبلية، بل أصبح واقعاً
ملموساً فى كثير من المجالات والقطاعات وعلى رأسها مجالى استرجاع المعلومات والرد على الاستفسارات. وهما مجالين
يحتاج إليهما قطاع عريض من الممارسين والمهنين والطلاب والباحثين.
ولكى
تعمل أنظمة الذكاء الاصطناعي بكفاءة فى كل المجالات ومنها
مجالات استرجاع
المعلومات والرد علي الاستفسارات وأنظمة الدردشة Chat
Bot يجب أن يتوافر
المحتوي الذى تستخدمه تلك الأنظمة فى صورة مقروءة آلياً فى شكل نصوص مهيكلة أو غير
مهيكلة، حتى تتمكن من معالجته والاستفادة منه باستخدام خورزميات التحليل وأنظمة
تعلم الآلة التى تطبقها أنظمة الذكاء الاصطناعي. وتعمل تلك الأنظمة علي معالجة
المحتوي من خلال التعامل مع مكونين أساسيين هما تحليل البيانات وخاصة البيانات
الدلالية والربط بينها ومعالجة نصوص اللغة الطبيعية سواء كانت مكتوبة أو منطوقة.
لذلك
سعي القائمون على تطوير أنظمة استرجاع المعلومات منذ بدايات استخدام الحاسبات
الآلية نحو أبتكار آليات ذكية للتعامل مع قواعد بيانات النصوص والوسائط المتعددة.
فمنذ ثمانيات القرن الماضى بدأ الباحثون في تطوير أنظمة أطلق عليها مصطلح انظمة
استرجاع المعلومات الذكية. ومع بداية التسعينات بدأ التحول الحقيقي نحو استخدام
خورزميات الذكاء الاصطناعي، حيث بدأت النظم في التحول من نماذج البحث البولينى
التقليدية إلى أنظمة أكثر ذكاءً في تلبية إحتياجات المستفيدين وفى تصنيف وترتيب
النتائج Results Ranking. وتعتمد
تلك الأنظمة على نماذج جديدة للبحث مثل نموذج مساحة المتجه Vector Space والنموذج
الاحتمالى Probabilistic Model والنموذج اللغوى
Linguistic
Model.
وقد
فتحت هذه الأنظمة التي تعتمد على الاستدلال التقريبى Approximate
Inference الطريق نحو تطوير مكونات أكثر ذكاءً بأنظمة استرجاع
المعلومات، وخاصة مع النمو الهائل في عدد الوثائق والنصوص والمقاطع الصوتية
والفيديوهات التي أصبحت متاحة بقواعد البيانات وعلي
الانترنت من خلال محركات البحث وأداوت الاكتشاف، مما نتج عنه أيضا نمو كثيف في الأبحاث والدراسات في هذا
الإتجاه.
ولعل
ابرز التطورات في هذا الإتجاه تمثلت في أنظمة وخورزميات تردد ووزن المصطلحات
والمعالجات اللغوية بالبتر والجذع، وخورزميات الربط الفائق مثل Page Rank وغيرها من
الأساليب الخاصة بالمعالجة اللغوية للكلمات والروابط الفائقة. كما ظهرت الحاجة إلى معالجة أكثر كفاءة لتلك النصوص
لإشتقاق واستخلاص المعرفة من البيانات التي أصبحت متاحة بصورة رقمية مكثفة في تلك
البيئة.
وقد
أصبح من السهل تطبيق كل أو معظم التقنيات التي يتم إبتكارها في عالم الذكاء
الاصطناعى بأنظمة استرجاع المعلومات بنجاح كبير ومنها أنظمة تعلم الآلة Machine Learning مثل التغذية الراجعة من عملية الاسترجاع Retrieval Feedback وتفاعلات المستفيدين User
Interactions وأنظمة معالجة
اللغة الطبيعية.
ومع
بدايات أنتشار أنظمة الذكاء الأصطناعى في بيئة الأنترنت فى مطلع العقد الثالث من القرن
الجديد، وخاصة من ظهور أنظمة البحث الذكية مثل Chat GPT تحولت عملية البحث من آليات البحث بالكلمات من خلال
توجيه استفسار بكلمات مفتاحية إلى اساليب البحث بالجمل من خلال البحث باللغة
الطبيعية وإجراء حوار مع النظام، كما تمكنت النظم الذكية من تقديم معلومات مركزة
في صورة مقالات للمستفيد في مقابل النظم لتقليدية التي كانت تقدم وثائق متعددة، وعلى
المستفيد أن يختار من بينها. من ثم فأنظمة استرجاع المعلومات التي تعتمد على
تطبيقات الذكاء الاصطناعى أحدثت تحوليين أساسيين في هذا المجال هما:
-
البحث بالمشكلة في صورة جمل باللغة الطبيعية في مقابل
البحث بالكلمات المفتاحية في الأنظمة التقليدية.
-
استرجاع نصوص ومعلومات في صورة مقالات بالانظمة الذكية
في مقابل استرجاع وثائق مرشحة للمستفيد للإختيار من بينها فى الأنظمة التقليدية.
ومما لاشك فيه أن أنظمة استرجاع المعلومات الذكية
الحالية تواجه نفس التحديات التى واجتهها كل الطفرات التكنولوجية التى حدثت منذ
ستينات القرن الماضى، بداية من ظهور قواعد البيانات خارج وعلى الخط المباشر وصولاً
إلى محركات البحث وأداوت الاكتشاف، والمتمثلة فى ضعف وندرة المحتوي المتاح باللغة العربية فى البيئة
الرقمية، مما يجعل الرد على الاستفسارات التى ترد باللغة العربية لأنظمة استرجاع
المعلومات الذكية تواجه تحديات كبيرة فى هذا المجال. إلا أن انظمة الاسترجاع
الذكية تتغلب على تلك المشكلة من خلال الترجمة الأنية للنصوص المتاحة باللغة
الانجليزية واللغات الأخرى إلى لغة الاستفسار. ولتأكيد ذلك قمنا باستخدام نظام Chat GPT للحصول على محتوي فى صورة مقال
عن: we need to brainstorming about the future of information retrieval
systems
نريد أجراء عصف ذهني حول
مستقبل أنظمة استرجاع المعلومات، وبدأنا الاستفسار باللغة الأنجليزية، فقدم النظام
مقالة مطولة للموضوع، ثم وجهنا نفس الاستفسار باللغة العربية فقدم النظام نفس
المقال مترجم إلى العربية بدقة تصل لأكثر من 95 % ومتوافقة تماماً من حيث البنية
والمحتوي المعرفي لما هو متاح باللغة الانجليزية.
وعندما حاولنا إجراء نفس التجربة على المحتوي باللغة العربية
حيث تم توجيه الاستفسار الأول باللغة العربية تجنباً لتعلم الآلة، قدم النظام فى
حالة الإستفسار باللغة العربية مقال قصير، بينما قدم مقال أطول فى حالة الاستفسار
باللغة الإنجليزية، وبمقارنة المقالين أتضح أن اللغة العربية قدمت جزء مشتق من
محتوي متاح باللغة الانجليزية، مما يعنى أن المحتوي العربي غير متاح فى هذا
الموضوع.
يتضح من ذلك أن فجوة المحتوى تمثل أحد أهم التحديات
المستقبلية التى ستواجهها المجتمعات العربية فى التعامل مع انظمة الذكاء الاصطناعي
والتى ستفرض إجابات معينة ورؤى محددة حول الموضوعات وفقا لما هو متاح من محتوي. وتظهر
تلك الفجوة بصورة واضحة فى مجالات التاريخ والجغرافيا والسياسة والدين والاقتصاد والعلوم
الاجتماعية وغيرها. فعلي سبيل المثال أذا قام أحد الاشخاص بالبحث عن تطور موضوع مثل
طبيعة الصراع العربي الإسرائيلى نجد أن تلك الأنظمة فى الغالب ستتبنى الروايات
الغربية الأكثر تحيزاً للجانب الاسرائيلى، مما قد يؤثر بصورة كبيرة على تشكيل
الرأى العام العالمي فى هذه الموضوعات. ويزداد هذا التحدى خطورة مع طبيعة وطريقة
عمل انظمة استرجاع المعلومات الذكية التى تسترجع وحدة معلوماتية واحدة فى مقابل
الانظمة التقليدية التى تسترجع بيانات وإشارات إلى وحدات معلوماتية متنوعة يمكن
للمستفيد أن يختار من بينها وأن يقارن ويقيم وينقد فى ظل التنوع المعرفى الذى تقدمه تلك الأنظمة.
لذلك يجب أن تكون لدى الدول والمجتمعات العربية رؤى
واضحة عن الإجابات التى ترغب فى ظهروها بأنظمة الذكاء الاصطناعى فى كل ما يتعلق
بقضاياها المحلية والاقليمية والدولية ورؤية المجتمعات الأخرى لها. من ثم فإن
الحاجة ماسة إلى استراتيجية للمحتوى العربي والعالمي الذى يعالج القضايا العربية
والدولية فى مجالات التاريخ والجغرافيا والسياسة والدين والعلوم الاجتماعية..الخ.
وأن تكون نقطة البداية فى ذلك خارطة طريق لسد فجوة المحتوى فى المجالات الحساسة وذات
الأهمية الدولية حتي لا تفرض على مجتمع المعلومات العالمي رؤى وأفكار محددة.
ومن
ثم يجب إجراء دراسات متنوعة عن الإحتياجات الحالية والتوجهات المستقبلية نحو
استخدام أنظمة الذكاء الاصطناعي فى البحث عن المعلومات والرد علي الاستفسارت.
ويمكن تطبيق أساليب تحليل الفجوة التى تعتمد على نمذجة الكلمات المفتاحية
ومقارنتها بالمحتوي المتاح للتعرف على الفجوة المعرفية وسدها من خلال تجميع قوائم
المصطلحات التى يتم البحث بها فى أنظمة استرجاع المعلومات الحالية من محركات بحث
وقواعد بيانات ومقارنتها بالمحتوي المتاح للتعرف على الفجوة وأوليات إنتاج المحتوي
فى المجالات المختلفة.

تعليقات