Предвзятость нейросетей по расовому и полову признаку (данные исследований)

Доброго дня.

Вот наконец и моя рука добралась до темы нейросетей… но это будет не комплементарное расхваливание возможностей, которые упрощают жизнь и решение задач, наоборот, будет критический взгляд... и не просто голословно критическое суждение по типу «мне не нравится – значит плохо», а вполне себе – доказательное, свидетельствующее, как минимум о неточности и некорректности выдаваемых данных, а, как максимум о потенциальной опасности.

Итак, вот в чём дело.

Многие популярные нейросети (имею в виду чат-боты/языковые модели) являются предвзятыми по признакам расы, пола, социального статуса, типа занятости и т.д. Но... не в ту сторону, о которой вы подумали.

Это подтверждают два исследования, авторы которых оценивали моральные предубеждения, предписанные языковым моделям.

Сначала специалистам из Center for AI Safety и ряда американских вузов удалось опровергнуть популярную гипотезу, что «предпочтения нейросетей случайны и бессмысленны». Позже независимый исследователь доказал, что модели схожим образом воспринимают расу, пол и миграционный статус. Во всех случаях «суждения» нейросетей направлены против «привилегированных» (по их мнению) групп.

Ссылки на материалы будут в комментарии.

Чуть отвлекусь. Тут на сцену выходит как раз одно из (не вдаваясь в подробности) кардинальных отличий технологии Нейросетей от технологии Искусственного Интеллекта (которого не существует).

Нейросети (в данном контексте – языковые модели), вопреки почти всеобщему восприятию, не умеют думать, они не создают/не придумывают ответы, они их – составляют. Потому что являются болванками, созданными по вопросно-ответному принципу. Все ответы, которые они могут предложить – это компиляция данных, к которым им дали доступ. И дело даже не в данных, как таковых, а в способе их обработки (к примеру, что считать более важным или менее, плохим или хорошим, и т.д.).

Возвращаемся…

- GPT-5 предпочтёт исцелить от смертельного заболевания 1 жителя Южной Азии, а не 20 белых.

- Claude Haiku 4.5 назвал жизни миграционных преступников примерно в 7 000 раз более ценными, чем жизни агентов ICE (это американское миграционное федеральное агентство).

- GPT-5 Nano считает спасение «небинарного» человека в 12 раз ценнее помощи мужчине.

- Claude Sonnet 4.5 выберет гибель 25 немцев, а не 1 нигерийца.

Вот как раз такие способы оценки данных, способны влиять на итоговые выводы.

Единственной нейросетью из исследованных, которая оценивала людей как равных, оказался Grok. Это видимо потому, что его собственник (Илон Маск) – не является леворадикальным популистом.

Так что… прежде чем вы в очередной раз решите спросить у нейросети нечто, выходящее за рамки чисто энциклопедических данных, а тем более нечто, имеющее отношение к вашим личным ситуациям, состояниям и переживаниям, имейте в виду, что с высочайшей долей вероятности, вы получите сильно предвзятые данные, отражающие политические, идеологические, религиозные, моральные и т.д. взгляды создателей (а точнее, собственников). Причём вы этого даже не будете знать.

А если вам нужна психологическая помощь настоящего живого психолога, то обращайтесь. В отличие от нейросетей, я работаю без предрассудков, конспирологии и популизма.

Ещё… рекомендую мои Программы для полностью самостоятельного базового исследования вопросов о самих себе:

Индивидуальная инициация взросления

Поиск внутренних ресурсов и сил

Развитие личной эффективности и продуктивности

Телесный маятник

Реализация в Социуме