الفصـــل 25 من دستور المملكة : حرية الفكر والرأي والتعبير مكفولة بكل أشكالها. حرية الإبداع والنشر والعرض في المجالات الأدبية والفنية والبحت العلمي, والتقني مضمونة.


الأحد، أكتوبر 03، 2021

الوسائط التشعبية التكييفية والإبحارعبر النص التشعبي (10) ترجمة عبده حقي

1.1 سياق التمثيل والتعلم

هناك العديد من المناهج الواعية للسياق في مجال أنظمة AH ، والتي تعرض السياق وتمثله وتلتقطه بشكل مختلف. نقوم بتجميع الأساليب المختلفة وفقًا لكيفية تمثيل السياق وتعلمه. يجب أن نلاحظ أن ملفات تعريف المستخدمين المستعملة بواسطة أنظمة التوصية

المستندة إلى المحتوى التي قدمناها في القسم 4 تلتقط جزءًا من سياق التصفح من حيث اهتمامات المستخدمين العالمية. وبالتالي، هنا ، نحن مهتمون أكثر بالسياقات المحلية ، التي تتطور وتتغير مع تغير اهتمامات المستخدمين والمواضيع.

1.1.1 السياقات كتاريخ التصفح

إن تمثيل السياق باعتباره التمثيل المتجه للمستند الذي يقرأه المستخدم حاليًا هو أبسط منهج للسياق. إن ملاحظات الهامش [81] تتبنى هذا الأسلوب للتوصية بالوثائق للمستخدم. تم استخدام نفس الأسلوب في واتسون [15] ، مع اختلاف أن واتسون قادر على استخلاص المصطلحات من مجموعة متنوعة من التطبيقات ، على سبيل المثال ميكروسوفت وورد ، وتجميع المستندات ذات الصلة مسبقًا قبل التوصية بها للمستخدم. بالإضافة إلى صفحة التركيز الحالية ،. [57] الحصول على المعلومات من الصفحة المرجعية ، أي الصفحة التي جاء منها المستخدم إلى الصفحة الحالية. في النموذج الأولي الخاص بهم ، يستخدمون فقط المعلومات التي تظهر في عنوان URL لصفحة المرجع ، والتي يُفترض أنها تمثل سياق التصفح الحالي.

لقد تم التقاط مسار التصفح بالكامل في نظام هيراشيما. [42]. وفقًا لهذا المنهج ، يتم تمثيل السياقات أيضًا كمصطلحات مرجحة. كما يتم تحديث الأوزان بشكل تدريجي بحيث يتم تعيين أوزان عالية للمصطلحات التي ظهرت بشكل متكرر في المستندات التي تم تصفحها مؤخرًا. تحدد المعلمة r ذات القيم بين 0 و 1 حساسية السياق لمحفوظات الاستعراض. عندما تكون  r = 0 ، تحدد الصفحة الحالية فقط سياق التصفح. عندما تكون  r = 1 ، تساهم جميع العقد التي تمت زيارتها بشكل متساوٍ في حساب السياق. العيب الرئيسي لهذه التقنية هو أنها تعاني من المفاضلة بين تذكر اهتمامات المستخدم السابقة والتعامل مع التغييرات المفاجئة في سياقات التصفح.

تم تقديم منهج أكثر تعقيدًا بواسطة وورد سييف [5] ، وهو نموذج سياقي يتكون من شبكة ذات ثلاثة مستويات. يتكون كل مستوى من مجموعة من الكلمات مصحوبة برقم حقيقي أو رقمين حقيقيين. تمر المستندات التي يزورها المستخدم عبر الشبكة كتدفقات من الكلمات. يلتقط المستوى الأول من الشبكة الكلمات الأكثر شيوعًا في البث. وزن يصاحب كل كلمة يسمى الإثارة ،

يمثل التكرار النسبي لحدوث الكلمة المقابلة في النصوص الحديثة. الكلمات التمييزية مثل "و" و "أو" محاصرة أيضًا بهذا المستوى. أما المستوى الثاني له حق الوصول إلى المستوى الأول فقط ويحدد الكلمات التي تميل إلى الظهور معًا في تسلسل الوصول إلى المستند. الكلمات التي كانت تتكرر كثيرًا في الماضي ، وليس بالضرورة مؤخرًا ، تثير حماسة شديدة. أخيرًا ، المستوى الثالث لديه وصول فقط إلى المستوى الثاني ويتعلم الإثارة العالية للكلمات التي تحدث بشكل غير متكرر لفترات من الزمن. هذا المستوى يزيل الكلمات المميزة. يتم حساب سياق التصفح الحالي بضرب قيم الإثارة لكلمات المستويات الثلاثة. بهذه الطريقة ، يتم تمثيل السياق بالكلمات التي تشكل جزءًا من كل من التركيز الحالي للمستخدم واهتمامات المستخدم المستمرة.

1.1.1  السياقات كمجموعات من اهتمامات المستخدم

هناك عدة طرق تمثل السياقات كمجموعات من الوثائق التي زارها المستخدم في الماضي. تمثل كل مجموعة موضوعًا مختلفًا لاهتمامات المستخدم. مع تغير اهتمامات المستخدم ، يتم استخدام مجموعات مختلفة لتمثيل سياق التصفح الحالي. جميع الأعمال الثلاثة المذكورة أعلاه تستخدم TF-IDF جنبًا إلى جنب مع وظيفة تشابه جيب التمام لتحديد المجموعات. التمثيل الفعلي للسياق يتكون من التمثيل المتجه للنقطة الوسطى للعنقود. يتم حساب النقطه الوسطى العنقودية عن طريق حساب متوسط ​​متجهات المستندات في مجموعة معينة.

[28] استخدم البالتاجي وآخرون سياقات المستند لاستخراج الروابط التشعبية وإنشاء قواعد روابط مجمعة حسب السياق والتي تربط نقاط ارتساء النص بعناوين URL للصفحة. عندما يطلب المستخدم صفحة جديدة ، تتم مقارنتها بالسياقات الموجودة. إذا تم تحديد سياق مطابق ، يتم ربط العبارات الموجودة في نص الصفحة والتي تطابق الروابط في قاعدة الارتباط بعناوين URL المقابلة فيما يتعلق بسياق التسطير. بيلي وآخرون. [3] قد وسعوا هذا العمل من خلال ملاحظة أن صفحة معينة يمكن أن تتضمن أكثر من سياق واحد ، على سبيل المثال ، يمكن أن تنتمي صفحة عن لعبة الهوكي الكندية إلى سياق "كندا" أو سياق "الهوكي". وفقًا للمنهج ، فإن القرار بشأن أي سياق يجب استخدامه يعتمد على سياقات التنقل السابقة. على سبيل المثال ، إذا قام المستخدم بزيارة الصفحة أعلاه القادمة من صفحات تحتوي على معلومات حول تورنتو ، فسيتم اختيار السياق "كندا

يتبع


0 التعليقات: