Искусственная правда: сможет ли ИИ распознать вашу ложь

Искусственный интеллект уже умеет делать множество удивительных вещей, например, не хуже и даже лучше человека разбираться в вопросах этики и морали. Не удивительно, что у некоторых появилась идея применить его таланты в смежной области — научить ИИ отличать правду от лжи. В отличие от этики, это гораздо более прикладная дисциплина с очевидным потенциалом коммерциализации, что и послужило причиной создания нескольких стартапов. Результаты у них пока неоднозначные, но современные ИИ, как мы знаем, очень быстро прогрессируют. Смогут ли они нас привести к обществу без лжи? Хотя, пожалуй, более важный вопрос: понравится ли нам в таком обществе жить?

Сила веры

По понятным причинам люди всегда очень интересовались способами узнать, говорит ли человек правду. Интересно, что основные способы разоблачить лгуна, как в древние времена, так и сейчас, базировались на гипотезе, что человек не может врать спокойно, он обязательно будет при этом нервничать, что отразится в реальности в виде реакций организма.

Возможно, дело в том, что в большинстве культур ложь сама по себе считается грехом, а правдивость – добродетелью.

Например, в западной культуре согласно Библии, среди важнейших 10 заповедей, данных богом Моисею на горе Синай девятая гласит: «Не произноси ложного свидетельства на ближнего твоего». В послании от Иоанна сам дьявол назван «лжецом и отцом лжи». Похожие предостережения против лжи как тяжкого греха есть и в исламе, и в других религиях.

Все это подкрепляется большим корпусом различных нравоучительных историй, в которых людям с детства внушают, что лгать плохо, а говорить правду – хорошо и правильно. Одна из самых популярных в США – про Джорджа Вашингтона и вишневое дерево. Якобы шестилетний Джордж, получив в подарок новый топор, срубил любимое вишневое дерево отца. Но когда он честно сознался в этом, отец обнял его и простил, сказав, что «честность дороже тысячи деревьев». Самое забавное, что эта история скорее всего выдумка, говорится в статье на сайте Службы национальных парков США.

«Самая древняя в мире», как утверждает телеканал «Аль-Арабия», технология обнаружения лжи «биша’х» используется египетским племенем аяида. Подозреваемого заставляют лизнуть горячую ложку, и если на языке появляются волдыри, человек считается виновным. «Практика основана на предположении, что виновный человек будет чрезвычайно нервным, поэтому у него будет сухой язык, в то время как слюна невиновного человека не даст языку обжечься», – пишет «Аль-Арабия». Хотя, если честно, мне кажется, что перспектива лизать раскаленный металл заставит нервничать кого угодно.

В несколько более гуманном виде похожая практика существовала в древнем Китае и в Индии – там подозреваемым давали жевать рис или рисовую муку. Считалось, что невиновный легко её выплюнет, а виновный не сможет, потому что у него от страха рот пересох.

Современные детекторы лжи – полиграфы – по сути недалеко ушли от этих древних методов.

Неточная наука

Первый полиграф создал в 1921 году полицейский и физиолог из Калифорнии Джон Ларсон. Он разработал аппарат для одновременного измерения артериального давления, частоты сердечных сокращений и дыхания с целью выявления обмана. В 30-х годах к этому набору добавили датчик электропроводности кожи (он измеряет интенсивность потоотделения), и в таком виде прибор без существенных изменений применяется до сих пор.

Методика допроса тоже принципиально не изменилась. Вначале подозреваемому задают несколько вопросов с заранее известными ответами (например, «сколько вам лет?») и просят на часть из них ответить правдиво, а на другие – солгать. Это позволяет оператору откалибровать показания прибора, определив нормальный уровень физиологических реакций. А потом начинается допрос по существу, и, глядя на аномалии в реакциях испытуемого, оператор пытается понять, лжет он или нет.

Базовая гипотеза за тысячи лет, как видите, принципиально не изменилась: человек, когда врёт, будет нервничать, и это проявится в его непроизвольных физиологических реакциях. Но, минутку: получается, что по факту полиграф измеряет не «правдивость» а просто уровень стресса испытуемого.

«Многие невиновные люди начинают нервничать во время допроса, а опытные лжецы могут подавлять или вызывать изменения в своём организме, чтобы обмануть тест. Полиграфы также можно обмануть, прикусив язык, наступив на гвоздь или подумав о своём самом большом страхе», – отмечает бюллетень Массачусетского технологического института (MIT).

«Наиболее практичный совет — сохранять скептицизм по отношению к любым выводам, полученным с помощью полиграфа», – резюмирует Американская психологическая ассоциация.

В 1988 году Конгресс США принял закон, запрещающий коммерческим компаниям использовать детекторы лжи при найме на работу, если должность не связана с наркотиками или обеспечением безопасности. Верховный суд США в 1998 году постановил, что результаты полиграфа не могут использоваться в качестве доказательств в федеральном суде, пишет The Atlantic. В судах штатов – на усмотрение судей. «Тем не менее, ФБР и ЦРУ все ещё используют его, и он, безусловно, эффективен для получения признаний от нервных субъектов, виновных или нет», – иронизирует издание.

Несмотря на ограничения применения, только в США в год проводится порядка 2,5 млн проверок на полиграфе, этот рынок, по оценке бюллетеня MIT, превышает $2 млрд. А там, где есть рынок, всегда найдутся желающие на нём заработать.

Более того, потенциальный рынок детекции лжи гораздо больше. Бизнесмены хотят знать, не лгут ли им деловые партнёры и сотрудники. Инвесторы хотели бы быть уверены в правдивости владельцев компаний. Да даже пользователи приложений для знакомств, наверное, не отказались бы от возможности узнать, не сильно ли им врёт визави на первом свидании (немножко можно).

Очевидно, что на каждого датчики не повесишь, и на смену технологии полиграфа, которой уже больше 100 лет, должно прийти что-то другое.

«Доверься мне, братан»

Естественно, с началом бума ИИ стали появляться стартапы, которые попытались приспособить машинный интеллект к различению лжи и правды. The Atlantic описывает один из них – Coyote.

Стартап сообщает, что его ИИ, обученный на выборках файлов с правдивыми и ложными речами, может распознавать ложь с точностью 79,9% в тексте, 84,6% в аудио и целых 92,3% в видео. Вау, дайте два! Хотя, если честно, меня такая заявленная точность до десятых долей процента в тонком искусстве распознавания правды и лжи, сразу насторожила.

Coyote основали Стивен Хайд и Эрик Бачура из Техасского университета в Сан-Антонио (Бачура позже ушел и создал свой стартап Arche AI, который обещает точность определения лжи 93%).

Журналист The Atlantic Кристофер Бим тестировал распознавание лжи в тексте, потому что программное обеспечение для анализа видео и аудио «было глючным».

Технически анализ делается просто: загружаешь файл в программу, и она разбивает текст на сегменты, помеченные «вероятно, правда» и «вероятно, ложь» с оценкой в процентах от -100% (полная ложь) до +100% (полная правда).

Результаты его обескуражили.

«Едва ли хоть одно из моих утверждений было явной ложью, и ни одно не было явно правдивым. Вместо этого все было где-то посередине. Насколько я мог судить, не было никакой корреляции между оценкой утверждения и его фактической правдивостью», – написал Бим. Он даже проверил собственную маму – записал разговор с ней и скормил алгоритму. ИИ написал, что её утверждения о любви к сыну «вероятно, ложь» с вероятностью -14%. Хайд его успокоил – оценка выше -70% не является достоверным признаком лжи: «Твоя мама любит тебя».

Когда Бим спросил Хайда, как можно утверждать, что алгоритм на 79,9% точен, если чёткого критерия правды/лжи, по-видимому, нет, Хайд ответил, что порог для оценки точности является «конфиденциальным».

Все это не мешает Хайду продавать услуги своего ИИ по цене $4,59 за анализ минуты видео и аудио или одной страницы текста (оптом – дешевле). Насколько успешно идут продажи, неизвестно.

Ещё меньше, чем Coyote (хотя это, казалось бы, невозможно) Бима впечатлил стартап Deceptio.ai. На главной странице сайта большими буквами написано, что программа использует ИИ, но так ли это на самом деле, является «конфиденциальной информацией», ошарашил журналиста директор и соучредитель компании Марк Карсон.

Тестовый прогон программы назвал правдивый текст ложью. А на вопрос об уровне достоверности оценки правды/лжи Карсон ответил: «Это немного наука в стиле «Доверься мне, братан».

Несколько более оптимистично звучит текст Bloomberg «Детекторы лжи на базе искусственного интеллекта помогут определить, лжете ли вы во время звонка Zoom» о стартапе CyberQ. Впрочем, похоже, осторожный оптимизм авторов основан исключительно на личности создателя стартапа – Фила Хьюстона, бывшего сотрудника ЦРУ, которого прозвали «ходячим детектором лжи». «Хьюстон проработал 25 лет в ЦРУ в качестве следователя и полиграфиста и разработал методологию обнаружения лжи, которая до сих пор используется правительственными учреждениями», – пишет Bloomberg. В CyberQ утверждают, что с помощью специально обученного чат-бота на основе генеративного ИИ и «секретной подсказки» могут отличить правду от лжи с точностью 92%, однако тестирования программы журналисты не проводили, видимо, поверив авторитету на слово.

В общем, беглый обзор существующих стартапов оставляет впечатление, что нашей маленькой (или даже большой) лжи со стороны ИИ пока что ничего не грозит. Может, это и к лучшему.

«Ложь необходима. Она смазывает наше повседневное взаимодействие, избавляя нас от самых резких мнений друг друга… Разоблачение каждой лжи поставило бы под угрозу саму концепцию личности, потому что версия себя, которую мы показываем миру, изначально избирательна. Мир без лжи был бы миром без приватности», – резюмирует Бим.