أرشفة
تشغيل الوسائط
يتحدث بروستر
كاهلي من أرشيف الإنترنت عن عمليات الأرشفة
أنشئت في أوائل عام 2006، الأرشيف، و هي خدمة الاشتراك أرشفة الويب التي يسمح للمؤسسات والأفراد لبناء والحفاظ على مجموعات من المحتوى الرقمي وإنشاء محفوظات الرقمية. الأرشيف - يسمح للمستخدم بتخصيص التقاطه أو استبعاد محتوى الويب
الذي يريد الاحتفاظ به لأسباب تتعلق بالتراث الثقافي. من خلال تطبيق ويب ، يمكن لشركاء Archive-It حصاد مجموعاتهم المؤرشفة وفهرستها وإدارتها وتصفحها والبحث فيها وعرضها.فيما يتعلق
بإمكانية الوصول ، فإن مواقع الويب المؤرشفة قابلة للبحث في النص الكامل في غضون
سبعة أيام من الالتقاط. المحتوى الذي تم جمعه من خلال Archive-It يتم التقاطه وتخزينه كملف WARC . يتم تخزين النسخة الأساسية والنسخة الاحتياطية
في مراكز بيانات أرشيف الإنترنت. يمكن إعطاء نسخة من ملف WARC للمؤسسات الشريكة للاشتراك لأغراض
الحفظ والتخزين المتكرر جغرافيًا وفقًا لمعايير أفضل الممارسات الخاصة بهم. بشكل
دوري ، البيانات التي يتم التقاطها من خلال Archive-It يتم
فهرستها في الأرشيف العام لأرشيف الإنترنت.
اعتبارًا من
مارس 2014 ، كان لدى Archive-It أكثر من 275 مؤسسة شريكة في 46 ولاية أمريكية و 16 دولة استحوذت على
أكثر من 7.4 مليار عنوان URL لأكثر
من 2444 مجموعة عامة. شركاء أرشيف والجامعات والمكتبات الجامعية، أرشيف الدولة
والمؤسسات الاتحادية والمتاحف والمكتبات القانون، والمؤسسات الثقافية، بما في ذلك
منظمة الإلكترونية الأدب ، ولاية كارولينا الشمالية أرشيف الدولة والمكتبة، جامعة
ستانفورد ، جامعة كولومبيا ، الجامعة الأمريكية في القاهرة ، جورج تاون مكتبة
القانون ، وغيرها الكثير.
باحث أرشيف
الإنترنت
في سبتمبر 2020
، أعلن أرشيف الإنترنت عن مبادرة جديدة لأرشفة المجلات الأكاديمية ذات الوصول
المفتوح والحفاظ عليها ، تسمى " باحث أرشيف الإنترنت ".
مجموعات الكتب
مجموعة نصية
أرشيف الإنترنت
"الكاتب" كتاب مسح محطة العمل
يدير أرشيف
الإنترنت 33 مركزًا للمسح الضوئي في خمسة بلدان ، حيث يتم رقمنة حوالي 1000 كتاب
يوميًا لما مجموعه أكثر من مليوني كتاب ، بدعم مالي من المكتبات والمؤسسات. اعتبارًا من
يوليو 2013 ، تضمنت المجموعة 4.4 مليون كتاب مع أكثر من 15 مليون تنزيل شهريًا. اعتبارًا
من نوفمبر 2008 ، عندما كان هناك ما يقرب من مليون نص ، كانت المجموعة بأكملها
أكبر من 0.5 بيتابايت ، والتي تتضمن صور الكاميرا الأولية والصور المقطوعة
والمنحرفة وملفات
PDF وبيانات OCR الأولية . بين عامي 2006 و 2008 ،
مايكروسوفتكان له علاقة خاصة بنصوص أرشيف الإنترنت من خلال مشروع Live Search Books ، حيث قام بمسح أكثر من
300000 كتاب تم المساهمة بها في المجموعة ، بالإضافة إلى الدعم المالي ومعدات
المسح. في 23 مايو 2008 ، أعلنت شركة Microsoft أنها ستنهي مشروع Live Book Search ولن تقوم بعد الآن بمسح الكتب ضوئيًا. أتاحت Microsoft كتبها الممسوحة ضوئيًا دون قيود تعاقدية وتبرعت
بمعدات المسح الضوئي لشركائها السابقين.
فحص أرشيف
الإنترنت الداخلي جارٍ
في حوالي أكتوبر
2007 ، بدأ مستخدمو الأرشيف بتحميل كتب المجال العام من بحث الكتب من غوغل . اعتبارًا من نوفمبر 2013 ، كان هناك
أكثر من 900000 كتاب مرقم من غوغل في
مجموعة الأرشيف ؛ الكتب متطابقة مع النسخ
الموجودة على غوغل ،
باستثناء بدون علامات غوغل المائية
، وهي متاحة للاستخدام والتنزيل غير المقيد. كشف بريوستر كاهلي في عام 2013 أن
جهود الأرشفة هذه تم تنسيقها بواسطة آرون شوارتز ، الذي قام مع "مجموعة من
الأصدقاء" بتنزيل كتب المجال العام من غوغل ببطء كافٍ ومن أجهزة كمبيوتر كافية
للبقاء ضمن قيود غوغ. فعلوا ذلك لضمان وصول الجمهور إلى المجال العام.
أكد الأرشيف أن العناصر نُسبت وربطت مرة أخرى بـغوغل ، التي لم تشكو أبدًا ،
في حين أن المكتبات "تذمرت". وفقًا لكاهلي ، يعد هذا مثالًا على
"عبقرية" شوارتز للعمل على ما يمكن أن يقدم أقصى فائدة للصالح العام
لملايين الأشخاص. وإلى جانب الكتب، والعروض الأرشيف حرة وصول الجمهور المجهول إلى
أكثر من أربعة ملايين الآراء المحكمة المذكرات القانونية، أو المعارض التي تم
تحميلها من المحاكم الاتحادية في الولايات المتحدة " PACER نظام الوثائق الإلكترونية عبر RECAP المساعد متصفح الويب. تم الاحتفاظ بهذه
الوثائق خلف جدار دفع لمحكمة فيدرالية. في الأرشيف ، تم الوصول إليها من قبل أكثر
من ستة ملايين شخص بحلول عام 2013.
يحتوي تطبيق
الويب
BookReader الخاص
بالأرشيف ،
المدمج في موقعه على الويب ، على ميزات مثل أوضاع الصفحة الواحدة
وصفحتين والصورة المصغرة . وضع ملء الشاشة؛ الصفحة التكبير من عالية الدقة صور. و
صفحة الوجه الرسوم المتحركة.
0 التعليقات:
إرسال تعليق