التحيز العنصري الذي لوحظ في خوارزمية الكشف عن خطاب الكراهية من Google

فهم ما يجعل شيئًا مسيئًا أو مؤلمًا أمرًا صعبًا بما فيه الكفاية بحيث لا يستطيع الكثير من الناس اكتشاف ذلك ناهيك عن أنظمة الذكاء الاصطناعى. وغالبًا ما يتم ترك الأشخاص الملونين من مجموعات التدريب من الذكاء الاصطناعي. لذا من المفاجئ أن تمكنت Jigsaw Alphabet/Google التي تمكنت من الرحلة على كل من هذه المسألة في وقت واحد حيث تم وضع علامة على العامية التي تستخدمها الأميركيين السود على أنها سامة. خوارزمية الكشف عن خطاب الكراهية والتي واجهت القضايا من قبل. وبدلاً من ذلك يتم الاستشهاد بمحاولة معاصرة لتشريح الكلام الحسابي وتعيين درجة سمية - ويبدو أنها تفشل بطريقة تدل على التحيز ضد أنماط الكلام الأمريكية السوداء.

الباحثين في جامعة واشنطن كنت مهتمًا بفكرة أن قواعد بيانات خطاب الكراهية المتوفرة حاليًا قد يكون لها تحيزات عنصرية مخبوزة - مثل العديد من مجموعات البيانات الأخرى التي عانت من عدم وجود ممارسات شاملة أثناء التكوين.

مساءلة الخوارزمية

لقد نظروا إلى حفنة من قواعد البيانات هذه وهم الآلاف من التغريدات المشروحة من قبل الناس على أنها بغيضة مسيئة مسيئة وما إلى ذلك. تم تحليل قواعد البيانات هذه أيضًا للعثور على اللغة المرتبطة بقوة باللغة الإنجليزية الأمريكية الإفريقية أو اللغة الإنجليزية المحاذاة البيضاء.

الجمع بين هاتين المجموعتين بشكل أساسي دعهم يرون ما إذا كان لدى العامية البيضاء أو السوداء فرصة أعلى أو أقل للهجوم. وها كان من المرجح أن يتم تسمية اللغة الإنجليزية ذات المحاذاة السوداء. = 0.42) والتسمية المسيئة من FDCL 18 (ص = 0.35) مما يوفر دليلًا على أن التحيز القائم على اللهجة موجود في هذه الشركات.
ظهرت هذه التحيزات المماثلة. ولكن من خلال تحضير المضيفين مع العلم أن الشخص الذي تغرده كان من المحتمل أن يكون أسودًا أو يستخدم اللغة الإنجليزية المحاذاة السوداء فإن احتمال تصنيف هجوم تغريدة قد انخفض إلى حد كبير.

هذا لا يعني بالضرورة أن المذيعين كلها عنصرية أو أي شيء من هذا القبيل. لكن مهمة تحديد ما هو غير مسيء وما هو معقد واحد من الناحية الاجتماعية واللغوية ومن الواضح أن الوعي بهوية المتحدث أمر مهم في بعض الحالات خاصة في الحالات التي تم فيها استخدام المصطلحات التي كانت مستغلة للإشارة إلى تلك الهوية.

ما علاقة كل هذا مع Alphabet أو Jigsaw أو Google؟ حسنًا Jigsaw هي شركة مبنية من Alphabet - والتي نفكر بها جميعًا كجوجل باسم Google باسم آخر - بقصد المساعدة في معاينة النقاش عبر الإنترنت عن طريق اكتشاف (من بين أشياء أخرى) خطاب هجومي. تتيح واجهة برمجة تطبيقات منظورها للأشخاص إدخال مقتطف من النص وتلقي درجة سمية.

كجزء من التجربة يتغذى الباحثون على منظور مجموعة من التغريدات المعنية. ما رأوه هو الارتباطات بين اللهجات/المجموعات في مجموعات البيانات لدينا وعشرات سمية المنظور. جميع الارتباطات مهمة والتي تشير إلى التحيز العنصري المحتمل لجميع مجموعات البيانات. وجدت أن هذا المنظور كان أكثر عرضة لتصنيف الكلام الأسود على أنه خطاب سام والكلام الأبيض خلاف ذلك. تذكر أن هذا ليس نموذجًا يتم إلقاؤه معًا على خلفية بضعة آلاف من التغريدات - إنها محاولة لمنتج الاعتدال التجاري.

لأن هذه المقارنة لم تكن الهدف الأساسي للبحث بل أ المنتج الثانوي لا ينبغي أن يؤخذ كنوع من الإزالة الضخمة لعمل بانوراما. من ناحية أخرى فإن الاختلافات المعروضة مهمة للغاية وتوافق تمامًا مع بقية نتائج الفريق. في Le

اخلاء مسؤولية! هذا المقال لا يعبر بالضرورة عن رأي جامعة الرازي

إن فهم ما يجعل شيئًا مسيئًا أو مؤلمًا أمرًا صعبًا بما فيه الكفاية بحيث لا يستطيع الكثير من الناس اكتشافه ناهيك عن ذلك

التحيز العنصري الذي لوحظ في خوارزمية الكشف عن خطاب الكراهية من Google

آخر المواضيع

حول مجتمعنا