الفصـــل 25 من دستور المملكة : حرية الفكر والرأي والتعبير مكفولة بكل أشكالها. حرية الإبداع والنشر والعرض في المجالات الأدبية والفنية والبحت العلمي, والتقني مضمونة.


الخميس، نوفمبر 25، 2021

مستقبل الصحافة في ظل البيانات الضخمة؟ (4) ترجمة عبده حقي

مكان آخر، بنية قواعد البيانات غير محايدة. مرة أخرى، تشهد مشاريع أدريان هولوفاتي على حدود أول صحافة البيانات. لقد أعطى الأخير مكانا مهما جدا لمجموعات البيانات لإحضارها في معرفة الدولة بالأجهزة العامة، ثم السماح بتشغيل TRIS في هذه البيانات

لإظهار معلومات التوقيع. وبالتالي، أطلقت أدريان هولوفاتي موقع  chicagocrime.org، الذي يتصاعد على بطاقة خرائط جوجل البيانات في البيانات المفتوحة المستردة من قسم شرطة شيكاغو. يقدم الموقع رسم خرائط تفاعلية من الجرائم المرتكبة في شيكاغو. لقد كشف هذا الموقع عن تردده في القطاعات الحضرية التي تعاملت سابقا بها الصحافة. ثم تسمح صحافة البيانات بتصحيح "التوزيع غير المتكافئ للمصادر في الأراضي الحضرية" بينما يحرز جزئيا الصحفيين اعتمادهم على مصادر مؤسسية.

هناك إيمان هنا في قوة إجمالي البيانات التي سيشكل التحقيق في أوقات لوس أنجلوس ساذجة للغاية. في الواقع، تتساءل الحياة اليومية لمدينة الملائكة حول أهمية البيانات المتاحة من قبل  everyblock.com، موقع آخر من أدريان هولوفاتي الذي امتد إلى كل من الأراضي الأمريكية النموذجي الذي يتصور مع Chicagocrime.org.  على Everyblock.com، تظهر قاعة مدينة لوس أنجلوس في المدينة أكبر مكان إفادة في المدينة، في حين أن الصحفيين لا يشعرون بهذا الواقع على هذه الأراضي المعروفة (لأنها حالة المكان الذي لديهم مكاتبهم!) وبعد التحقيق (الويلزية، سميث، 2009)، ستكتشف أن إدارة شرطة لوس أنجلوس  (LASD)، والتي تستغل everyblock.com البيانات، وتعيين الرمز البريدي لقاعة المدينة إلى جميع الجرائم التي تعد تحديد الموقع الجغرافي مشكلة، وهذا يسبب هذا الرائد التحيز على everyblock.com  والتي تؤكد الحاجة إلى بيانات المراسل، بعد مرحلة استغلال البيانات، للعودة إلى الحقل لاختبار أهمية المعلومات المقدمة.

هذا المنهج يعارض رؤية كريس أندرسون التي غيرت البيانات الكبيرة علاقتنا تماما. وبالتالي، فإنهم سوف يثيروا في العلوم نفس ثورة النكبة مثل التي تديرها غوغل في الاستيلاء الإحصائي بأهمية صفحة ويب، والتي تعتمد على تخصيص الأوراق المالية لروابط النص التشعبي ). من شأن البيانات الكبيرة ومعالجتها الرياضية أن تجعل الأساليب العلمية القديمة المتنقلة بما يتماشى مع نهاية جهاز التحقق التجريبي. وبالتالي الجملة كريس أندرسون الصغير: "patabytes  تسمح لنا أن نقول: هو ارتباط كاف (أندرسون، 2008). كما هو الحال في البحث عبر الإنترنت، يسود معيار فعالية "جيد بما فيه الكفاية" على اختبار الواقع. الارتباط لا يستحق كل هذا العناء، إنه "يكفي". بمجرد قيامهم بالهروب من قدرات العلاج البشري وتميل إلى الاكتمال، ستقوم جماوات البيانات بتقادم اللجوء المسبق إلى فرز المعلومات داخل القواعد المهيكلة التي سيتم مقابلتها. ومع ذلك، فإن مثال حدود everyblock.com حول وضع الجرائم التفاعلية في لوس أنجلوس يوضح الحاجة إلى السيطرة على الطرائق التي تفترض وضع لابد لقاعدة بيانات الجريمة في لوس أنجلوس، باستثناء الحقائق الحكومية التي ليست كذلك في من وجهة النظر هذه، صحافة البيانات، لأنه يحتفظ بمتطلبات التحقق، لأنه يسعى لتفسير البيانات، ويقع تحت منهج معرفي ليس من المروجين البيانات الكبيرة، على الأقل في وعودها الأكثر جذرية. كما يشير Dominique Cardon  إلى أن البيانات الكبيرة تشكل مشاكل تشغيلية، أكثر من الطالب "الجيدة بما يكفي"، وهي مشكلة "الارتباطات دون أسباب" ووضع ضعف نسبة "إشارة / الضوضاء". المشكلة الأولى هي تحليل بيانات كلاسيكية رائعة . إنها تمهد الطريق لإغراق النظريات الصغيرة الطارئة التي تغذي وهم نهاية العلوم الإنسانية والمجتمع. المشكلة الثانية هي أن البيانات الهائلة التي تعامل معها وبالتالي تقدم فعلا احتمالا منخفضا لتقديم مصلحة حقيقية (إشارة) للمستخدم.

يتبع


0 التعليقات: