Нас явно ждет интересное будущее
Все кругом пишут о том, сколько опасностей сулит нам развитие искусственного интеллекта. Тут и потеря работы дизайнерами и журналистами, и засорение интернета текстами-галлюцинациями, неотличимыми от настоящих, и дипфейки, которые можно использовать для очернения реальных людей или создания ложных свидетельств. Мы тоже недавно обсуждали эту тему в связи с риском, что ученые будут использовать ИИ для написания рецензий на статьи коллег, а студенты уже вовсю его используют, создавая горы рефератов и эссе, для которых они не изучили ни одного источника.
Разумеется, говорить про страшилки прикольно, в конце концов, именно страх – наша самой важная эмоция, потому что без радости жить и размножаться можно, а вот если пропустить что-то пугающее, то велик риск, быть съеденным вместе со всеми генами. Но помимо бед и неприятностей ИИ несет и массу полезных возможностей. Например, с его помощью можно за несколько секунд находить в тех же самых научных статьях сфабрикованные изображения.
Фальшивые картинки – важная проблема для научных публикаций. Подделывая фотографии с результатами экспериментов, можно доказать, что некое несуществующее явление имеет место или, как минимум, здорово завысить его значимость. Научное сообщество в курсе этой практики, и издатели научных журналов давно разработали алгоритмы проверки картинок на подлинность. Но их эффективность далека от 100%, потому что такие проверки выявляют только самые грубые подделки. Если авторы всерьез задались целью сфабриковать иллюстрации, они легко проскочат этот фильтр.
Например, здесь приведены примеры таких хитроумно подделанных иллюстраций. На картинке А клетки, помеченные PG/VG (сверху слева) и +Nic (внизу справа) – это на самом деле одни и те же клетки. На рисунке В синими прямоугольниками выделены области, которые являются фотографиями одной и той же области, только повернутыми друг относительно друга. В статье эти изображения указаны как фото двух разных экспериментов. Если вы внимательно присмотритесь к рисунку С, то заметите, что на всех трех картинках изображен один и тот же участок (пять клеток, образующих подобие Большой Медведицы), только на третьей картинке он повернут и растянут, а на двух других используется разное увеличение, плюс, часть клеток затерта (серая мазня – следы инструмента «кисть», выявленные поднятием контраста).
Чтобы обнаружить подобные манипуляции, нужно много времени. Издательства не готовы его тратить, но есть отдельные энтузиасты, которые добровольно ищут фальшивки в статьях. Например, биолог Шолто Дэвид. Он занимается этим не один год, но истинный масштаб проблемы ускользал даже от него. Потому что искать фальшивки трудно, и самые тщательные может пропустить даже опытный глаз. В конце концов, человек может устать. А вот ИИ не устает никогда, плюс, он ищет измененные копии одной и той же картинки, выделяя для каждой особый набор характерных черт, которые человек выделить не может.
Чтобы проверить, насколько ИИ реально хорош в поиске подделок, Шолто отобрал 1540 статей из журнала Toxicology Reports (там традиционно много картинок) и руками проверил все иллюстрации, что заняло у него несколько месяцев. Параллельно он скормил эти статьи нейросетевому ИИ-инструменту под названием ImageTwin.ai. На обработку картинок, даже сложных, ImageTwin.ai требовалось несколько секунд против получаса у исследователей-людей. В итоге Шолто нашел 63 статьи с фальшивыми иллюстрациями, а ImageTwin.ai добавил к ним еще 41, которые Шолто пропустил. Большую часть статей, найденных человеком, ИИ тоже нашел, не заметив только 4 штуки. В итоге, по оценке Шолто, доля фальшивок составила 4%, а с учетом подделок, найденных ИИ, – уже 16%, то есть в 4 раза больше.
В общем, мало сомнений, что ИИ куда эффективнее в качестве сыщика, чем человек. Да, для верности полученные им результаты стоит перепроверять вручную, но это куда менее время- и ресурсозатратно, чем находить фальшивки с нуля – и пропускать значительную их часть. С другой стороны, очевидно, что можно использовать ИИ и для создания подделок. Короче, нас явно ждет интересное будущее.

