Этический ИИ

Создание алгоритмов эгалитарного ИИ

Проявляют ли алгоритмы машинного обучения стереотипы и гендерные предубеждения? Как их исправить?

Вот небольшая загадка - отец и сын попали в ужасную автокатастрофу, в которой погиб отец. Сын доставлен в больницу для срочной операции; как раз перед тем, как лечь под нож, хирург говорит: «Я не могу оперировать - этот мальчик - мой сын!». Что по-твоему происходит? Если вы догадались, что хирург - второй отец мальчика, гей, вы получите балл за просветление, по крайней мере, за пределами библейского пояса. Но вы также догадались, что хирург может быть матерью мальчика? Если нет, то вы являетесь частью удивительного большинства. Гендерные предубеждения глубоко укоренились в нашей психике и отражаются в наших мыслях и разговорах. Язык - одно из самых мощных средств распространения сексизма и гендерной дискриминации. Лексический выбор и повседневное общение постоянно отражают эти давние предубеждения. Наши произведения, наши фильмы, твиты и весь контент, который мы создаем, отражают эти предубеждения. Между прочим, с недавними достижениями в области НЛП, машинного обучения и искусственного интеллекта эти тревожные предубеждения в нашем контенте обнаруживаются с помощью наших алгоритмов обучения.

Нравится вам это или нет, машинное обучение и алгоритмы искусственного интеллекта, которым доверяют, чтобы помогать или принимать все более важные для нас решения. Они влияют на все, начиная от приема в колледжи и заканчивая тем, как люди находят работу, и заканчивая заявками на получение ссуды, системой уголовного правосудия и даже правилами вынесения приговоров. Слепое применение машинного обучения чревато усилением предвзятости в данных. Перед работой с этими алгоритмами важно устранить эти предубеждения. Но сначала давайте посмотрим, как и где эти предубеждения проникают в эти алгоритмы.

НЛП и вложения слов

Обработка естественного языка или НЛП - это способ, которым компьютеры обрабатывают или понимают человеческий язык. Это может быть наша речь, когда мы разговариваем с Google, Siri или Alexa или используем службы перевода, или когда мы позволяем компьютерам анализировать наши письменные тексты, такие как наши твиты, новостные статьи и другой контент. В этой статье вы можете быстро познакомиться с некоторыми техниками НЛП.

Поскольку компьютеры не понимают слова в такой форме, как мы, люди, прежде чем применять методы НЛП и алгоритмы искусственного интеллекта на человеческом языке, нам необходимо преобразовать эти слова и символы в понятную для компьютера форму. Одна из таких популярных платформ для преобразования текстовых данных в векторы называется встраивание слов . Встраивание слов - одно из самых популярных представлений словаря документов. Он способен фиксировать контекст слова в документе, семантическое и синтаксическое сходство, связь с другими словами и т. Д. Давайте сначала разберемся, как работает встраивание слов.

Давайте рассмотрим несколько примеров - попробуйте это с вашим виртуальным помощником Google, Alexa или Siri. Попробуйте сказать «Хорошего дня» и дождитесь ответа. Затем скажите «Хорошего дня». Скорее всего, вы заметите похожие ответы на два предложения. Как компьютер узнает разницу или сходство между двумя предложениями? Поскольку вы получаете одинаковые ответы на оба предложения, алгоритм знает, что хорошо и отлично - семантически похожие слова. Теперь попробуйте сказать «Хорошего дня», скорее всего, вы получите совсем другой ответ от своего виртуального помощника, возможно, он просто покажет вам результаты поиска по строке «Хорошего дня». Ваш помощник знает, что хорошо и плохо - разные слова. Итак, должен быть какой-то способ, которым компьютер понимает связь между этими словами. Это отношение описывается вложением слов. Это метод, с помощью которого мы преобразуем слово в векторные представления.

Чтобы преобразовать слова в векторные представления, вы берете словарь слов, произносите слова из документа 1 - «Обама обращается к средствам массовой информации в Иллинойсе» и преобразуете каждое слово в вектор. Чтобы преобразовать слово в вектор, вы назначаете значение такой характеристики, как Лидер, Место, Действия и т. Д. для каждого слова , поэтому, например, Обама будет представлен 5 различными характеристиками. . Слово Обама представлено вектором в нашем вложении слов. Этот вектор может сказать нам, что Обама - лидер, а не место или деятельность и так далее.

Obama → 0.98i + 0.01j + 0.01k + 0.01l + 0.01m

Приведенная выше таблица предназначена только для целей иллюстрации с произвольными числами, а не для преобразования слова в вектор. Поскольку наши слова преобразуются в векторы, мы можем построить их в системе координат для визуализации. Хотя они являются n-мерными векторами, их можно визуализировать с помощью методов уменьшения размерности, чтобы они соответствовали трехмерному пространству, что может выглядеть как диаграмма рассеяния ниже. Обратите внимание, как похожие слова слипаются в кластер.

Вы можете делать много интересного с этим представлением встраивания слов. Вы можете попросить свой компьютер найти сходства, различия, отношения и другие корреляции между двумя словами. На самом деле эти вложения слов не определяются вручную путем присвоения значения каждой функции, но функции изучаются автоматически с помощью различных алгоритмов, которые потребляют и обрабатывают большие текстовые корпуса. Некоторые алгоритмы, которые помогают в изучении этих вложений, - это Word2Vec и GloVe. Мы не будем вдаваться в подробности этих алгоритмов.

Мужчина для программиста, как женщина для ______?

Допустим, вы хотите задать своему компьютеру простую головоломку: Франция: Париж :: Япония :?
Поскольку слова теперь представлены в виде векторов, мы можем найти похожие векторов простыми векторными операциями.

Векторные представления при встраивании слов вернут значение x, соответствующее вектору Tokyo. Удивительно, что простая векторная арифметика может одновременно фиксировать множество взаимосвязей. Однако это полагается на отношения, полученные с помощью алгоритма встраивания слов, который также указывает на сексизм, скрытый в тексте. Например, также бывает, что -

Другими словами, та же самая система, которая достаточно хорошо решила вышеупомянутые аналогии, оскорбительно ответит «мужчина для программиста, как женщина для x», где x = домохозяйка. Точно так же он выводит, что отец для врача, как мать для медсестры. Эти вложения изучались в статье Толга Болукбаси, Кай-Вей Чанг и др. Основным встраиванием, которое они изучали, было популярное общедоступное встраивание Word2Vec, обученное на корпусе текстов новостей Google, состоящем из 3 миллионов английских слов и терминов в 300 измерениях или функциях. Можно было надеяться, что встраивание Новостей Google будет демонстрировать небольшую гендерную предвзятость, потому что многие из их авторов - профессиональные журналисты, но, к сожалению, этого не произошло. Конечно, мы не хотим, чтобы эти предубеждения отражались в критических решениях, принимаемых компьютерами в наши дни. Давайте посмотрим, как устранить эти предубеждения при встраивании.

Устранение предубеждений

В целях иллюстрации предположим, что у нас есть заученное вложение слова, например

Каждая точка является векторным представлением слова, полученного с помощью одного из алгоритмов встраивания из нашего словаря. Есть несколько шагов, которые нужно предпринять, чтобы устранить предубеждения. На этой иллюстрации мы просто рассмотрим гендерную предвзятость, но этот подход можно обобщить для любого типа предвзятости, присутствующего во встраивании.

Определить направление смещения
Чтобы определить направление смещения, мы можем взять вложения (векторы) нескольких слов с внутренним гендерным различием и взять среднее значение их вычитания. Например -

Если мы возьмем среднее значение трех различий v1, v2, v3, мы получим направление гендерной предвзятости, которое может выглядеть так:

На самом деле направление определяется не простым усреднением векторных разностей, но и другими математическими операциями, но пока мы просто рассмотрим простые средние. После определения направления смещения мы переходим ко второму шагу.

Нейтрализация
На этом этапе мы проецируем каждое слово в непредвзятом направлении, которое не является определяющим. Конечно, все слова не склонны к гендерной предвзятости, есть некоторые слова, которые по своей сути зависят от пола. Например, слова Бабушка, Дедушка, Он, Она и т. Д. зависят от пола, тогда как Доктор и Няня являются гендерно-нейтральными словами. Мы хотим избавиться от предвзятости в этих словах. Мы спроецируем их на ось без смещения

Теперь слова «доктор» и «няня» свободны от каких-либо гендерных предубеждений, что подводит нас к третьему этапу устранения предвзятости встраивания слов.

Выравнивание
На этом этапе мы переместим слова, для которых характерно гендерное различие, на одинаковое расстояние от оси без смещения. Давайте разберемся, что это значит, на небольшой иллюстрации. Предположим, что после этапа проецирования или нейтрализации мы хотим увидеть сходство или родство между няней и бабушкой и дедушкой. В идеале бабушка и дедушка должны иметь одинаковые отношения со словом «няня». Это отношение означает расстояние между двумя словами от слова «няня» в нашем вложении, которое должно быть равно друг другу.

На приведенной выше диаграмме слово «бабушка» ближе к слову «няня», чем «дедушка», что является нежелательной предвзятостью. Поэтому мы перемещаем слова «бабушка» и «дедушка» таким образом, чтобы они были равноудалены от оси несмещения. Это включает в себя определенные шаги линейной алгебры, в которые мы не будем вдаваться, а просто увидим это наглядно в нашей визуализации вложения слов.

Аналогичным образом мы проделываем эти шаги для всех слов в нашем вложении. Теперь встраивание слов лишено нежелательных предубеждений. Но как выбрать слова для устранения предвзятости и какие слова являются определяющими?

Авторы упомянутой выше статьи обучили классификатор, который разделял внутренние слова гендера и негендерные внутренние слова, а затем удалял предубеждения, используя вышеупомянутые шаги. Эта иллюстрация представляет собой очень упрощенный вид, в котором все математические технические детали опущены из полного алгоритма, представленного в статье. Я бы посоветовал вам ознакомиться с полной статьей, чтобы понять более подробную информацию о сглаживании.

Мир без предубеждений

Одна из точек зрения на предвзятость при встраивании слов заключается в том, что она просто отражает предвзятость в обществе, и поэтому следует пытаться устранить предвзятость в обществе, а не встраивание слов. Однако, уменьшая предвзятость в современных компьютерных системах (или, по крайней мере, не усиливая предвзятость), которая все больше полагается на встраивание слов, можно надеяться, что небольшое снижение искажений встраивания слов может способствовать уменьшению гендерных предубеждений в обществе. Встраивание слов помогает нам лучше понять языковую предвзятость. В мире так много языков, которые отражают разные причуды разных обществ. По крайней мере, машинное обучение не должно использоваться для непреднамеренного усиления этих предубеждений, поскольку, как мы видели, это может произойти естественным образом. В мире делается много работы по устранению нежелательных предубеждений, которые все больше усиливаются за счет машинного интеллекта. Недавняя попытка разработать бесполый голос для виртуального помощника обрела форму Q - бесполый голос.

В связи с быстрым развитием технологий и искусственного интеллекта становится чрезвычайно важным осознавать, что мы создаем, и то, какое влияние оно оказывает на общество. Изучение их и повышение осведомленности - первый шаг к лучшему и эгалитарному будущему.

«Мужчина для программиста, как женщина для программиста»

X8 стремится организовать и построить сообщество ИИ, которое не только имеет открытый исходный код, но и рассматривает его этические и политические аспекты. Позже появятся другие такие упрощенные концепции ИИ. Если вам понравилось это, или у вас есть отзывы или дополнительные вопросы, оставьте комментарий ниже