Dubai Airports تحليل البيانات
كيف قامت مؤسسة Dubai Airports تحليل البيانات بالوقت الحقيقي لتحسين خدماتها
2018-12-14

التمييز في تعلم الآلة وعلم البيانات

التمييز في تعلم الآلة وعلم البيانات
شارك المعرفة
  •  
  •  
  •  
  •  

العديد من أنصار الذكاء الاصطناعي يعتقدون بأن القرارات التي سوف تتخذها الآلة بالمستقبل هي خالية من الخطأ البشري، التحيز، أو التمييز التي من الممكن ان يقع فيها الانسان، لكن للأسف هذا الأمر غير صحيح. التمييز و التحيز في تعلم الآلة وعلم البيانات يعد من أهم الأمور التي تعمل الشركات على تجنبه خلال تطويرمنتجاتها.

ما هو التمييز البشري؟

بشكل مختصر، التمييز يعني معاملتك بشكل سيء أو مختلف مقارنة مع أشخاص اخرين لديهم نفس المؤهلات التي تمتلكها.
حددت بعض القوانين عدة عوامل أساسية يجب عدم التمييز فيها بين الأشخاص وهي:

  • الجنس
  • العرق
  • الدين أو أي انتماء اخر.
  • الاعاقة الجسدية
  • التوجه الجنسي
  • الحالة الاجتماعية
  • العمر (الأشخاص الذين وصلوا لعمر معين)

ما هو التمييز في علم البيانات ؟

التمييز في الذكاء الاصناعي أو علم البيانات يعني أن الخوارزمية المستخدمة في أتمتة أو اتخاذ قرارات معينة تعتمد على عوامل تمييزية وتقوم باستخدامها للتمييز بين الأفراد!
دعونا نقوم بمراجعة هذه الحالة العملية (التخيلية) لكي نتعرف أكثر على الأسباب التي تؤدي لحصول هذا التمييز.

التمييز في عملية اختيار المتقدمين لوظيفة ما

التحدي

لاحظت الشركة X  بأنها تستهلك الكثير من الوقت والموارد البشرية حتى تقوم بعملية فرز واختيار الأفراد المتقدمين لوظيفة معينة وترشيحهم لمقابلة العمل. وفي معظم الأحيان قد يصل عدد المتقدمين لوظيفة واحدة المئات من الأشخاص.

الحل

تطوير نظام يقوم بتصفية وفرز المتقدمين بشكل أوتماتيكي وترشيح أكثر 10 أشخاص ملائمين لهذه الوظيفة. حتى يتم تحقيق ذلك، سوف تقوم الشركة باستخدام أحد خوارزميات تعلم الآلة (Machine Learning).

مصادر البيانات

كأي خوارزمية تعتمد على تعلم الآلة، فإنها تحتاج إلى البيانات حتى تقوم بعملها بشكل مناسب. ولحل المشكلة السابقة قامت الشركة باستخدام البيانات القديمة لقرارات عمليات التوظيف التي قامت بها سابقاً.
يوضح الجدول التالي جزء من البيانات المستخدمة:

الجنستاريخ الولادةالجنسيةرمز مكان السكنالحالة الاجتماعيةسنوات الخبرةالتحصيل العلميعلامة الفحص الاختباريالسيرة الذاتيةهل تم توظيفه؟
ذكر1990AAA123غير متزوج3بكالوريوس8CVنعم
انثى1986AAA123غير متزوجة4بكالوريوس8CVلا
انثى1992BBB1234غير متزوجة4بكالوريوس8CVنعم
ذكر1985SSS123متزوج3ماجستير9CVلا
ذكر1990SSS1234غير متزوج3ماجستير10CVلا

ملاحظة
CV: تدل ضمنياً على النص المستخدم في كتابة السيرة الذاتية، لكننا لن نتطرق هنا لكيفية توصيف النصوص واستخدامها في الخوارزمية وسنكتفي بكتابة كلمة CV.

الخوارزمية المستخدمة

لتطوير نموذج يقوم بتحديد في ما إذا كان المتقدم لوظيفة معينة سوف يتم توظيفه أو رفضه بناءً على البيانات السابقة، يتم استخدام خوارزميات تدعى بخوارزميات التصنيف والتبؤ. وبذلك سوف تقوم الشركة بتزويد الخوارزمية ببيانات المتقدمين للوظيفة الجديدة وسيتم فلترة جميع المتقدمين بشكل سريع وتأهيل الأشخاص ال 10 التي تنبأت الخوازمية بأنهم سوف يكونوا ماهلين لهذه الوظيفة.

النتائج الإيجابية

تم استخدام النظام السابق في عملية فلترة المتقدمين لوظائف الشركة لفترة سنة كاملة وكانت الشركة سعيدة بالنتائج التي حصلت عليها من حيث الوقت والموارد البشرية التي تم ترشيدها بسبب استخدام هذا النظام.

المشكلة

لاحظت الشركة بعد هذه الفترة بأن أغلب الحاصلين على الوظائف بعد استخدام النظام السابق هم من الشباب، الغير متزوجين ومن جنسيات محددة. واكتشفوا بأن الخوارزمية التي استخدموها في بناء النظام تقوم بتمييز المتقدمين بناءً على الجنس, الجنسية، العمر، والحالة الاجتماعية بغض النظرعن المؤهلات العلمية وعلامة الفحص الاختباري الذي قاموا به!

بالعديد من الدول وخاصة الأوروبية، يوجد هنالك قوانين صارمة بخصوص التمييز ضد الأفراد، لذلك تم توقيف النظام بشكل نهائي حتى يتم معرفة الأسباب العلمية لهذا التمييز وكيف يمكنهم بناء تطبيق يستخدم خوارزميات تعلم الآلة بدون أن يقوم بأي نوع من التمييز ضد المتقدمين!

سوف نتعرف في مقالة اخرى عن أسباب كيفية كشف التمييز في خوارزميات تعلم الآلة والحد منه.

برأيكم كيف يمكن تجنب مثل هذه الأخطاء؟

سعيد بالإجابة على جميع استفساراتكم عبر التعليقات. أو يمكنكم إرسال السؤال عبر صفحة الفيسبوك مباشرةً.

المراجع

Eyad Al-Khayat

مهندس برمجيات،ماجستير قيد الإنجاز في علم البيانات في University of Southampton أعشق تحليل وتفسير البيانات لجعل الأعمال تتخذ قرارات أفضل. ومهتم بكل ما يتعلق بـ الذكاء الاصطناعي و تعلم الآلة.

المزيد من المقالات


تابعني على:
TwitterFacebookLinkedIn


شارك المعرفة
  •  
  •  
  •  
  •  

1 Comment

  1. يقول khaled:

    من الممكن تسجيل البيانات التي تسببت في التمييز كتعليقات او لا تتضمن الدوال الشرطية الا اللوازم كالعمر الذي لا يتجاوز عمر التقاعد وهكذا

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

هذا الموقع يستخدم Akismet للحدّ من التعليقات المزعجة والغير مرغوبة. تعرّف على كيفية معالجة بيانات تعليقك.