العمارة
نموذج من الرياضيات
يمكن نمذجة شبكة
الويب العالمية ، كمجموعة من موارد النص التشعبي ، كرسم بياني موجه مع دورات ومع
موارد للرؤوس والارتباطات التشعبية للأقواس. ونظرًا لأن الرسم البياني موجه ، يمكن
أن تشكل بعض الموارد أحواضًا ، أو بشكل رسمي أقل culs-de-sac: لا يوجد
مسار لبقية الويب. على العكس من ذلك ، قد تشكل بعض الموارد مصادر: لا يوجد مسار من
بقية الويب.
لقد أظهرت التحليلات أن بنية الويب قد استجابت لنموذج الشبكات الثابتة الحجم الموجودة في معظم الشبكات الاجتماعية. نتج عن هذا وجود محاور ، محاور ، تتقارب معها روابط النص التشعبي: هذه هي أهم المواقع التي تشكل الهيكل العظمي للويب.
من الناحية
الفنية ، لا شيء يميز شبكة الويب العالمية عن أي شبكة ويب أخرى تستخدم نفس
التقنيات. وبالتالي ، توجد شبكات خاصة لا حصر لها. من الناحية العملية ، تعتبر
الصفحة من موقع ويب مشهور ، مثل دليل الويب ، جزءًا من الويب. يمكن بعد ذلك تعريف
الويب على أنه جميع الموارد والارتباطات التشعبية التي يمكن اكتشافها بشكل متكرر
من هذه الصفحة ، مما يستبعد المصادر وشبكات الويب الخاصة.
استكشاف الويب
والشبكة العميقة
يعد الزحف
المتكرر للويب من الموارد المختارة جيدًا الطريقة الأساسية المبرمجة في برامج زحف
محركات البحث. في عام 2004 ، فهرست محركات البحث حوالي أربعة مليارات من الموارد.
إن الويب العميق
، أو الويب غير المرئي ، هو جزء من الويب غير مفهرس وبالتالي لا يتم العثور عليه
في محركات البحث العامة. أشارت دراسة نُشرت في عام 2001 إلى أن الجزء غير المرئي
من الويب يمثل أكثر من 99٪ من الويب. تتضمن شبكة الويب العميقة الموارد التالية ،
من بين أمور أخرى:
• الموارد التي يتعذر الوصول إليها
للجمهور ، وبالتالي للروبوتات ، ولا سيما الصفحات الإدارية أو صفحات الدفع ،
والمحمية بكلمة مرور ؛
• الموارد التي لا يتم توصيلها بواسطة
بروتوكولات الاتصال التي تدعمها الروبوتات (غالبًا ما تدعم فقط HTTP و HTTPS) ؛
• الموارد التي لا يدعم الروبوت تنسيق
بياناتها ؛
• الموارد المدرجة في ملف استثناء
الروبوت.
• الموارد التي استبعدها الروبوت لأنها
مصممة لإساءة استخدام الإحالة (spamdexing) ؛
• الموارد التي استبعدها الروبوت لأنها
تعتبر غير ذات صلة (على سبيل المثال إذا كان الموقع يحتوي على ملايين من الموارد
التي لا ترتبط بأي موقع آخر) ؛
• الموارد التي يتم إنشاء الارتباطات
التشعبية لها ديناميكيًا استجابةً لاستفسارات الزائرين.
عادةً ما تأتي
هذه الموارد الأخيرة من قواعد البيانات وهي أهم جزء من الويب العميق.
0 التعليقات:
إرسال تعليق