تعصب در هوش مصنوعی (AI) طی چند سال گذشته موضوعی محبوب بوده است زیرا در زندگی روزمره ما بیشتر مورد هجوم قرار گرفته است. به عنوان یک روانشناس که به علم داده تغییر کرده است ، این موضوع به قلب من نزدیک است.
برای جلوگیری از مغرضانه بودن مدل های هوش مصنوعی ، ابتدا باید از وجود طیف گسترده ای از تعصبات آگاه باشد.
برای تشخیص تعصب ، باید از وجود آن آگاه باشد.
برای انجام این کار ، این مقاله شما را از طریق بسیاری از تعصبات متداول و غیر معمول که می توانید در مراحل مختلف توسعه هوش مصنوعی پیدا کنید ، راهنمایی می کند. مراحل ، از جمله دیگر:
- جمع آوری داده ها
- پیش پردازش داده ها
- تحلیل داده ها
- مدل سازی
امیدوارم ، دانستن اینکه کدام تعصب را ممکن است با شما روبرو شوید ، به شما در توسعه راه حل های هوش مصنوعی کمک می کند که کمتر مغرضانه هستند.
1. تعصب چیست؟
تعصب به عنوان یک تمایل یا تعصب نامتناسب برای یک ایده یا چیز در نظر گرفته می شود. تعصب اغلب در یک زمینه انسانی به نظر می رسد ، اما می تواند در بسیاری از زمینه های مختلف وجود داشته باشد:
- آمار - به عنوان مثال ، اعوجاج سیستماتیک یک آمار
- تحقیقات - به عنوان مثال ، تعصب نسبت به انتشار برخی از نتایج قابل توجه تجربی
- علوم اجتماعی - به عنوان مثال ، تعصب نسبت به گروه های خاصی از مردم
در این مقاله ، ما چندین زمینه را با هم ترکیب خواهیم کرد که در آن می توان تعصبات (شناختی) ظاهر شد تا بفهمیم چگونه تعصبات می توانند راه خود را به سمت هوش مصنوعی پیدا کنند.
در زیر ، من مراحل مشترک توسعه AI را طی می کنم و مراحل تشخیص مکان تعصب را شناسایی می کنم.
2. جمع آوری داده ها
جمع آوری داده ها اولین و یکی از متداول ترین مکانهایی است که در آن تعصب پیدا خواهید کرد. بزرگترین دلیل این امر این است که داده ها به طور معمول توسط انسان جمع آوری یا ایجاد می شوند که امکان خطا ، دور و تعصب را فراهم می کند تا به راحتی وارد داده ها شوند.
تعصبات رایج موجود در فرآیند جمع آوری داده ها:
- تعصب انتخاب - انتخاب داده ها به گونه ای که نمونه نماینده جمعیت نیست
به عنوان مثال ، در بسیاری از مطالعات تحقیقات اجتماعی ، محققان برای آزمایش فرضیه های خود از دانشجویان به عنوان شرکت کننده استفاده کرده اند. دانش آموزان به وضوح نماینده جمعیت عمومی نیستند و ممکن است نتایج حاصل از آن را مغرضانه کنند.
- اثر قاب بندی - سؤالات نظرسنجی که با یک شیب خاص ساخته شده اند.
همانطور که در زیر مشاهده می شود ، در صورتی که این سؤال مثبت باشد ، مردم در مقایسه با 33 ٪ فرصت نجات همه ، در مقایسه با 33 ٪ فرصت نجات همه ، نجات 200 را نجات می دهند.
- تعصب سیستماتیک - این یک خطای سازگار و قابل تکرار است.
این اغلب نتیجه تجهیزات معیوب است. تصحیح این خطا مهم است زیرا تشخیص خطا دشوار است. درک خوب از ماشین آلات یا روند لازم است.
- تعصب پاسخ - طیف وسیعی از تعصباتی که شرکت کنندگان به طور نادرست یا به دروغ به سؤالات پاسخ می دهند.
تعصب پاسخ اغلب در پرسشنامه ها مشاهده می شود. از آنجا که اینها توسط شرکت کنندگان پر شده است ، تعصب انسانی به راحتی راه خود را در داده ها پیدا می کند. به عنوان مثال ، تعصب مطلوبیت اجتماعی بیان می کند که مردم احتمالاً در پاسخ های خود صفات نامطلوب را انکار می کنند. این می تواند با تأکید بر رفتار خوب یا درک رفتار بد باشد. به همین ترتیب ، تعصب نظم سؤال بیان می کند که افراد ممکن است براساس ترتیب سؤالات ، به سؤالات متفاوتی پاسخ دهند.
درک این نکته مهم است که نحوه طراحی فرایند جمع آوری می تواند به شدت بر نوع داده های جمع آوری شده تأثیر بگذارد. اگر مراقب نباشید ، داده های شما نسبت به گروه های خاصی به شدت مغرضانه خواهد بود. هر تجزیه و تحلیل حاصل احتمالاً ناقص خواهد بود!
3. پیش پردازش داده ها
هنگام پردازش داده ها ، مراحل زیادی وجود دارد که می توانید برای تهیه آن برای تجزیه و تحلیل ها انجام دهید:
شما به طور معمول می خواهید فضای دور را حذف کنید زیرا ممکن است در برخی از تجزیه و تحلیل ها تأثیر نامتناسب داشته باشد. در یک مجموعه داده که همه افراد بین 20 تا 30 سال سن دارند ، احتمالاً فردی با سن 110 سالگی نماینده کمتری از داده ها خواهد بود.
نحوه برخورد با مقادیر گمشده برای متغیرهای خاص می تواند تعصب را معرفی کند. اگر می خواهید تمام مقادیر گمشده را با میانگین پر کنید ، پس به طور هدفمند داده ها را به سمت میانگین می کنید. این می تواند شما را نسبت به گروه های خاصی که نزدیک به میانگین رفتار می کنند ، مغرضانه کند.
من این اتفاق را بارها دیده ام که داده ها آنقدر فیلتر می شوند ، که به سختی نماینده جمعیت هدف نیست. این به نوعی تعصب انتخاب را با داده های شما معرفی می کند.
4. تجزیه و تحلیل داده ها
هنگام تهیه راه حل AI ، محصول حاصل می تواند یک مدل یا الگوریتم باشد. با این حال ، تعصب می تواند به راحتی در تجزیه و تحلیل داده ها یافت شود. به طور معمول ، ما تعصبات زیر را در تجزیه و تحلیل داده ها مشاهده می کنیم:
- نمودارهای گمراه کننده - یک نمودار تحریف شده که داده ها را نادرست نشان می دهد به گونه ای که نتیجه گیری نادرست از آن حاصل شود.
به عنوان مثال ، هنگام گزارش نتایج یک تجزیه و تحلیل ، یک دانشمند داده می تواند محور y نمودار خود را در 0. شروع کند. اگرچه این امر تعصب در خود داده ها را معرفی نمی کند ، اما به نظر می رسد که اختلافات می تواند فریم آشکار باشدبرجسته تر (تصویر زیر را ببینید).
اگر محور y با 0 ٪ شروع شود ، تفاوت در بازده محصول کم است. با این حال ، به سادگی تغییر آن برای شروع 70 ٪ در یک دیدگاه به ظاهر متفاوت است در حالی که نتایج در واقع یکسان هستند.
اگر می خواهید در مورد اثرات نمودارهای گمراه کننده اطلاعات بیشتری کسب کنید ، کتاب "نحوه دروغ گفتن با آمار" بسیار توصیه می شود!
- تعصب تأیید - تمایل به تمرکز روی اطلاعاتی که پیش تصورات شخص را تأیید می کند.
بیایید بگوییم که شما اعتقاد دارید که بین سرطان و نوشیدن شراب رابطه محکمی وجود دارد. هنگام انجام تجزیه و تحلیل خود ، شما فقط با در نظر گرفتن هیچ متغیرهای مخدوش ، این فرضیه را جستجو می کنید.
این ممکن است به عنوان یک نمونه افراطی به نظر برسد و کاری که هرگز انجام نمی دهید. اما واقعیت این است که انسان ها ذاتاً مغرضانه هستند و تکان دادن آن دشوار است. این برای من بیشتر از آنچه دوست دارم اعتراف کنم اتفاق می افتد!
5. مدل سازی
وقتی در مورد تعصب در هوش مصنوعی صحبت می کنیم ، مردم به طور معمول به معنای سیستم هوش مصنوعی هستند که به نوعی از گروه خاصی از مردم حمایت می کنند. نمونه بارز این ، الگوریتم استخدام آمازون است که در تصمیمات خود تعصب جنسیتی را نشان می دهد. داده هایی که آنها برای این الگوریتم استفاده می کردند بیشتر از مردان در نقش های فنی تشکیل شده بود که باعث شد تا مردان به عنوان کاندیداهای بالقوه بالا به نفع آن باشند.
این یک نمونه کلاسیک از پدیده زباله در زباله است که در آن حل هوش مصنوعی شما فقط به اندازه داده های مورد استفاده شما مناسب است. به همین دلیل تشخیص تعصب در داده های خود قبل از شروع مدل سازی داده ها بسیار مهم است.
بیایید چندین نوع تعصب را که اغلب هنگام ایجاد یک مدل پیش بینی می بینید ، طی کنیم:
- تجارت تعصب/واریانس-تجارت بین تعصب (فرضیات اساسی مدل) و واریانس (تغییر در پیش بینی در صورت استفاده از داده های مختلف).
یک مدل با واریانس بالا بیش از حد روی داده های قطار متمرکز خواهد شد و به خوبی تعمیم نمی یابد. از طرف دیگر ، تعصب بالا فرض می کند که داده ها همیشه به همان شیوه رفتار می کنند ، که به ندرت درست است. هنگام افزایش تعصب خود ، به طور معمول واریانس و برعکس خود را پایین می آورید. بنابراین ، ما اغلب به دنبال تعادل تعصب و واریانس هستیم.
- Drift Concept - پدیده ای که در آن خصوصیات آماری متغیر هدف با گذشت زمان به روش های پیش بینی نشده تغییر می کند.
تصور کنید شما مدلی ایجاد کرده اید که می تواند رفتار مشتریان را در یک فروشگاه آنلاین پیش بینی کند. این مدل عالی شروع می شود ، اما عملکرد آن یک سال بعد کاهش می یابد. اتفاقی که افتاد این است که رفتار مشتریان در طول سال تغییر کرده است. مفهوم رفتار مشتری تغییر کرده و بر کیفیت مدل شما تأثیر منفی می گذارد.
راه حل می تواند به سادگی این باشد که مدل خود را به طور مکرر با داده های جدید بازیابی کنید تا به روز با رفتار جدید باشید. با این حال ، یک مدل کاملاً جدید ممکن است لازم باشد.
- عدم تعادل کلاس - عدم تعادل شدید در فراوانی کلاسهای (هدف).
بیایید بگوییم که شما می خواهید طبقه بندی کنید که آیا یک تصویر حاوی گربه یا سگ است. اگر 1000 عکس از سگ ها و فقط 10 عکس از گربه ها دارید ، عدم تعادل کلاس وجود دارد.
نتیجه عدم تعادل کلاس این است که مدل ممکن است نسبت به کلاس اکثریت مغرضانه باشد. از آنجا که بیشتر تصاویر موجود در داده ها از سگ ها هستند ، این مدل فقط باید "سگ ها" را حدس بزند تا 99 ٪ دقیق باشد. در واقعیت ، این مدل تفاوت بین تصاویر گربه ها و سگ ها را آموخته است. این می تواند با انتخاب اندازه گیری صحیح اعتبار سنجی (به عنوان مثال ، دقت متعادل یا نمره F1 به جای دقت) اصلاح شود.
6. بعدی چیست؟
بعد از خواندن در مورد همه این تعصبات احتمالی در حل هوش مصنوعی خود ، ممکن است فکر کنید:
"اما چگونه می توانم تعصب را از راه حل خود حذف کنم؟"- شما
من معتقدم که برای مقابله با تعصب ، شما باید منبع آن را درک کنید. دانستن نیمی از نبرد است. پس از آن ، این وظیفه شماست که راهی برای حذف یا رسیدگی به آن تعصب خاص پیدا کنید. به عنوان مثال ، اگر فهمیدید که مشکل ناشی از تعصب انتخاب در داده های شما است ، ممکن است ترجیح داده شود که داده های اضافی اضافه شود. اگر عدم تعادل کلاس باعث می شود مدل شما نسبت به گروه اکثریت مغرضانه تر شود ، می توانید به دنبال استراتژی هایی برای استفاده مجدد از (به عنوان مثال ، SMOTE) باشید.
توجه: برای مرور کلی تعاملی از تعصبات شناختی مشترک ، به این تجسم شگفت انگیز مراجعه کنید.
اگر مانند من علاقه مند به هوش مصنوعی ، علوم داده یا روانشناسی هستید ، لطفا در صورت تمایل به من در LinkedIn اضافه کنید.
فارکس وکسب درامد...
ما را در سایت فارکس وکسب درامد دنبال می کنید
برچسب :
نویسنده : احمد قانع پور
بازدید : 39
تاريخ : شنبه
3 تير
1402 ساعت: :