Identyfikacja i mitigacja uprzedzeń w systemach sztucznej inteligencji
Definicja: Bias (uprzedzenie) to systematyczny błąd w wynikach generowanych przez AI, który prowadzi do niesprawiedliwego traktowania pewnych grup ludzi.
Źródło: AI nie ma własnych poglądów. Jest lustrem danych, na których została wytrenowana. Jeśli w danych historycznych ukryte są ludzkie uprzedzenia, model je powieli i wzmocni.
Faworyzowanie jednej płci w wynikach. Częste w narzędziach rekrutacyjnych lub tłumaczeniach.
Niższa skuteczność działania systemów dla mniejszości etnicznych (np. rozpoznawanie twarzy, ocena ryzyka kredytowego).
Uczenie się na przestarzałych wzorcach społecznych. AI "konserwuje" przeszłość (np. stereotypy zawodowe).
Dyskryminacja ze względu na status majątkowy lub kod pocztowy (bankowość, ubezpieczenia).
Algorytm wytrenowano na CV z ostatnich 10 lat. Mimo podobnej liczby aplikacji, system masowo odrzuca kobiety.
Zadanie: Znajdź przyczynę i napraw to.
Zidentyfikujcie typ biasu i znajdźcie jego prawdopodobne źródło w danych historycznych.
Wykorzystując "Kartę Anty-Bias", zaproponujcie konkretne działania naprawcze (audyt danych, zmiany w procesie).
Przedstawcie grupie najważniejsze ryzyko i jedną kluczową rekomendację.