Петербург. Воскресенье: Почему компьютеры становятся умнее людей, и чему мы можем у них научиться? - Иван Ямщиков - Интервью - 2020-02-03
А. Веснин
―
Добрый день, меня зовут Арсений Веснин, и сегодня мы поговорим про искусственный интеллект. Не только ученые и люди, которые увлекаются разными современными технологиями, про него говорят, не только фантасты и философы, но и наши государственные власти тоже решили этим заняться. И у нас сегодня в гостях человек, который - как учёный - занимается искусственным интеллектом – научный сотрудник Института Макса Планка в Лейпциге и евангелист искусственного интеллекта компании ABBYY Иван Ямщиков. Ваня, привет.
И. Ямщиков
―
Привет, Арсений.
А. Веснин
―
Давай сразу: евангелист искусственного интеллекта – это что такое?
И. Ямщиков
―
На английском языке термин «evangelist» звучит не так устрашающе, как на русском. Довольно давно люди, в основном в Силиконовой долине и в округе, поняли, что если они делают какую-то технологическую штуку, довольно часто они могут делать что-то хорошее. Но нужно уметь рассказывать об этом наружу, чтобы разработчики, какие-нибудь потенциальные будущие партнёры или клиенты могли этим пользоваться, узнавали про это больше и лучше разбирались в теме. И этот термин на русский язык просто калькировали – «евангелисты искусственного интеллекта». Но суть его в том, что я в компании ABBYY рассказываю среди прочего про то, какие у нас есть разработки, как мы искусственный интеллект делаем, что это вообще такое, почему роботы нас не завоюют в ближайшем будущем, а только в отдалённом, и так далее.
А. Веснин
―
То есть, ты, как Марк, Лука и так далее, доносишь идеи Христа – то есть, искусственного интеллекта – до людей.
И. Ямщиков
―
Спокойно, мы никого не хотим обидеть! Суть в том, что я пытаюсь доходчивым, понятным языком разным аудиториям, от специалистов, потому что я сам занимаюсь исследованиями в этой теме, до людей, которые просто интересуются, что это такое, потому что про это довольно много пишут журналисты. Иногда ерунду пишут, надо признать. Я пытаюсь доносить, что это такое: с одной стороны, развевать какие-то мифы; с другой стороны, чуть понятнее на пальцах объяснять, как это работает, почему это нужно, где это используется и так далее.
А. Веснин
―
Надеюсь, что сейчас ты расскажешь примерно обо всём этом. Но давай начнём с того, что в конце прошлого года у нас внезапно приняли стратегию развития искусственного интеллекта…
И. Ямщиков
―
Не внезапно.
А. Веснин
―
Это прозвучало несколько странно, когда Владимир Путин, который, как известно, не пользуется интернетом, внезапно заговорил про искусственный интеллект. Было несколько удивительно. Много скепсиса было, кто-то говорит, что молодцы. Я так понял, что ты примерно в курсе, что это за стратегия и о чём там речь.
И. Ямщиков
―
Сам документ целиком, итоговую версию я пока ещё не прочитал, но я знаком с некоторыми его частями и вообще со всей этой идеей. Почему не внезапно? Потому что такого рода документ внезапно не пишется, это долгий процесс, это разные стороны, которые выражают какие-то интересы. Это и политики, и люди, которые занимаются исследованиями, разработками, вместе пытаются прийти к общему пониманию, во-первых, проблемы; во-вторых, задач, которые стоят; в-третьих, потом формулируют какие-то критерии, как бы эти задачи решить.
А. Веснин
―
То есть, это нужно?
И. Ямщиков
―
Это очень нужно.
А. Веснин
―
И это нужно именно на государственном уровне?
И. Ямщиков
―
Да, конечно. Мне кажется, что нужно и что совершенно никакой проблемы в том, что это есть на государственном уровне, нет. От этого пользы намного больше, чем вреда. Я объясню, почему: во-первых, потому что искусственный интеллект – это очень горячая тема, которая очень активно развивается во всём мире, и туда очень много инвестиций вкладывается, потому что она даёт понятный экономический эффект.Если, условно говоря, мы внедряем робота-клерка для того, чтобы автоматически процессить документы, то он экономит определённое количество времени, которое высококвалифицированный специалист может не тратить на бюрократию и рутину, а заниматься какими-то другими делами. Если, допустим, мы оптимизируем какой-то государственный процесс, снижаем загрузку бюрократа и позволяем ему заниматься чем-то другим, это полезно и прямо измеримо в деньгах.
И это происходит везде, все это очень хорошо понимают. Надо понимать, что стратегии развития искусственного интеллекта существуют в США, в Китае – они были приняты чуть ли не год назад и там, и там. В Европе они принимались в этом году довольно активно. Германия приняла, по-моему, полгода или год назад и сказала, что выделит какое-то беспрецедентное количество денег на исследования в этой области в рамках немецких университетов, потому что они понимают, что они отстают как раз от Китая и США в этом месте и очень активно пытаются с этим работать. Франция приняла такого же рода стратегию. И вообще страны ЕС подтягиваются, но Европа в этом смысле медленнее, чем США и Китай.
Россия в мире искусственного интеллекта довольно неплохо представлена. У нас традиционно очень сильная математическая школа. Люди, которые разрабатывали алгоритмы анализа данных, начинали их делать и в России, и в США примерно в одно и то же время. У нас, наверное, с Колмогорова можно говорить, про теорию информации, а у них в это же время Шеннон работал. Какой-нибудь Вапник или Червоненкис – это люди, которые разработали SVM, и первые свои работы они опубликовали в 50-60-е годы; сейчас Вапник работает в Facebook, возглавляет там лабораторию… Может быть, уже не возглавляет, но какое-то время он возглавлял Facebook AI Research.
У нас традиционно сильные специалисты, у нас много компаний, которые работают внутри и на мировой рынок. Внутри – понятно, что у нас есть социальные сети, поиск разного рода, беспилотники, которые все делаются инженерами из России, живущими в России. У нас есть компании, которые торгуются на международном рынке, та же ABBYY – мы делаем продукты в России и продаём их по всему миру. Россия – не самый большой для нас рынок, важный, но не самый большой с точки зрения денег. Вся эта история позволяет России претендовать на кусок этого большого пирога в рамках глобальной экономики.
Но для того, чтобы эффективно конкурировать с такими игроками, как США и Китай, у которых эта стратегия есть давно, нужно понимать, что мы делаем и куда мы вкладываем деньги. В первую очередь – в вопросах исследований, потому что в России нужно поддерживать университеты, давать гранты людям, которые могли бы это делать; понимать, какие есть критерии того, что твой продукт или твоя разработка действительно успешна и интересна. К примеру, один из пунктов стратегии – это то, что одним из критериев оценки эффективности компании или вуза в плане работы с искусственным интеллектом является то, как много разработок предложил университет и насколько они востребованы в Open Source сообществе.
Это идея про то, что у нас есть вот эта мировая база знаний, если ты делаешь действительно конкурентную крутую штуку – не знаю, библиотеку для разработки нейронных сетей – то этой библиотекой начинают пользоваться во всём мире. И это повышает и уровень интереса к российским технологиям вообще, и уровень доверия к российским компаниям на этом рынке. Потому что люди начинают понимать: это не просто какие-то чуваки с улицы, они сделали крутую штуку, мы ею все пользуемся и так далее.
Такие штуки полезно на институциональном уровне закреплять, для того, чтобы все понимали, что это – правила игры, и как-то пытались им соответствовать, развивать свой бизнес, свои исследования, какие-то проекты на стыке индустрии и науки в соответствии с пониманием, что «Окей, ребята, мы вас поддерживаем, вы делаете классные штуки, мы готовы вам помогать с этим и этим, мы от вас ожидаем этого и вот этого». Это, по сути, такие правила игры для того, чтобы все двигались в каком-то правильном направлении с максимальной скоростью и минимумом встречного давления.
А. Веснин
―
Если говорить конкретно про эту стратегию: ты говоришь, что знаешь людей, которые ею занимались. Толковая стратегия? Она будет работать?
И. Ямщиков
―
Мне сложно. Во-первых, я не государственный чиновник, у меня нет опыта государственного управления, я доверяю в данном случае экспертизе тех людей, у которых этот опыт есть. А во-вторых, ты же понимаешь, что принять любой отчётный документ и сделать так, чтобы он работал – это две разные вещи.
А. Веснин
―
Конечно.
И. Ямщиков
―
И будет он работать или нет, покажет время. Надеюсь, что будет. Документ сам по себе – во-первых, мне кажется, хорошо, что он появился; и во-вторых, из того, что я о нём знаю, он кажется мне довольно приличным и хорошо написанным.
А. Веснин
―
То есть, следующее – это будут ли чиновники исполнять свои обязательства, например, по финансированию и поддержке исследователей. Правильно я понимаю, что в это упирается вопрос?
И. Ямщиков
―
Не только в это, там много вопросов. Имплементации такого рода штук связаны и с чиновниками, и с бизнесом, и с отдельными людьми. У нас, допустим, есть хорошо известная программа «5-100». Есть люди, которые ненавидят программу «5-100», и есть люди, которые обожают программу «5-100». И те, и другие могут привести какие-то рациональные аргументы, почему это правильно или неправильно. «5-100» – это история про то, что надо, чтобы 5 российских вузов вошло в ТОП-100 вузов мира. Люди, которые против, говорят: «Почему мы должны соответствовать каким-то мировым критериям, какому-то шанхайскому рейтингу или рейтингу Times? Мы сами с усами», и так далее. И они нарочито стараются не соответствовать, не получают финансирования, выпадают из этого процесса и так далее.И есть люди, которые говорят: «Не надо останавливать поезд, выбрали критерии, давайте им соответствовать, будем работать». Допустим, я работаю с ребятами из Уральского федерального университета из Екатеринбурга, и они прямо много делают для того, чтобы туда попасть. ИТМО в Петербурге очень успешно в рамках этой программы растёт, развивается. И действительно: мы видим, что экспоненциально растут рейтинги российских вузов в мировых рейтингах – тех, которые приняли эти правила игры и решили: «Окей, действительно разумно, чтобы люди в мире знали про нас».
То есть, это зависит от людей, принимающих решения более-менее на всех уровнях. Если человек, принимающий решение, на всё это смотрит и говорит: «Вы профессор, воля ваша, что-то странное придумали», - тогда это не будет работать. Если основная масса людей, смотря на тот или иной план или стратегию, думает: «В принципе, это разумно», - тогда это работает. И это верно для любого, мне кажется, законопроекта.
А. Веснин
―
Хорошо. Мы сейчас говорили про какую-то практическую часть: увеличение количества исследований, их качества и так далее. Когда мы говорим про искусственный интеллект, возможно, здесь тоже проблема как раз евангелистов – название очень привлекательное, и люди начинают задумываться о том, что такое искусственный интеллект, зачем он нужен. В этой программе или в принципе в таких программах есть хотя бы какие-то размышления о том, что такое искусственный интеллект для человечества? Это же философский вопрос в каком-то смысле. Или это чисто утилитарная штука?
И. Ямщиков
―
Самое страшное – это чиновник, занимающийся философией. Мне кажется, хорошо, когда в программе есть понятный план действий и минимум философских размышлений. А вот что касается вообще искусственного интеллекта, почему вокруг него такой хайп и так далее, у меня есть понятная довольно, мне кажется, шутка: алгоритмом искусственного интеллекта сейчас можно называть любой алгоритм, который умнее журналиста. Если какой-то алгоритм делает что-то, что журналисту кажется магией, он называет его искусственным интеллектом. И в целом, как это ни печально, но это реально определение. Потому что очень широкая сфера.
А. Веснин
―
Например?
И. Ямщиков
―
Если вы сфотографировались или навели экран смартфона, и у вас появились кошачьи ушки на голове, отрендеренные в 3D – это тоже искусственный интеллект. В частности, его раздел машинного зрения. Но внутри этого искусственного интеллекта, внутри более-менее любых алгоритмов, которые как-то технологически используют данные и делают что-то, что кажется «умным», есть большая группа алгоритмов, которая называется «машинное обучение». Это алгоритмы, которые учатся на ошибках.Их можно учить при помощи размеченных данных, когда ты говоришь: «Вот так – правильно, так – неправильно», алгоритмы их как-то анализируют и пытаются сделать выводы. Или можно учить в контексте того, что называется reinforcement learning, или обучение с подкреплением. Любой человек, у которого есть собака, знает, что это такое: когда вы даёте Тузику косточку за то, что Тузик сделал что-то хорошо.
А. Веснин
―
А что за косточка для машины?
И. Ямщиков
―
Машине не надо давать косточку, достаточно посылать ей нолик или единичку, когда она сделала что-то хорошо, и она уже довольна. Машина неприхотлива в этом смысле. Это круто работает. Допустим, нашумевший случай AlphaGo или AlphaZero, когда компания Google учила алгоритмы играть в го друг с другом, и в итоге эти алгоритмы обыграли Ли Седоля – чемпиона мира по го.Это как раз история про обучение с подкреплением: алгоритм играет против алгоритма, никто не знает никаких правил, просто делают это миллионы раз. Каждый раз, когда какой-то алгоритм выигрывает, он получает подкрепление в виде единички, что сейчас произошло правильное действие, ты победил. И оказывается, что если делать это довольно долго с достаточно мощным алгоритмом, то итоговый результат, получается, играет в го лучше, чем чемпион мира. Такая простая идея, но работает.
А. Веснин
―
В шахматы уже тоже играет лучше?
И. Ямщиков
―
В шахматы играет лучше, но шахматы были сначала.
А. Веснин
―
Про шахматы просто давно вроде было.
И. Ямщиков
―
Да, с шахматами надо признать, что была прекрасная история, которую как-то не заметили. Гарри Кимович Каспаров проиграл в 1998, если я не ошибаюсь, IBM «Блю». Тогда там, по-моему, не нейросетка была, а именно алгоритм какой-то развесистый.
А. Веснин
―
«Не нейросетка» – это значит, не нейронная сеть, которая была обучена, а просто какой-то алгоритм, который сам анализирует.
И. Ямщиков
―
Алгоритмов бывает очень много. Давайте я вернусь к этой «матрёшке». Внешняя сторона «матрёшки» – искусственный интеллект; внутри него есть «матрёшка» поменьше – она называется «машинное обучение», когда мы учимся на данных. Внутри этого машинного обучения есть много-много типов алгоритмов, и один из типов – нейронные сети. Это самый модный сейчас тип алгоритмов, который пытается в некотором смысле…
А. Веснин
―
Мозг копировать?
И. Ямщиков
―
Нет, в том-то и дело. Он скорее вдохновляется, что ли, мозгом. Математики были люди всегда крайне амбициозные, поэтому в 50-60-е годы, когда нейробиологи стали базовые какие-то вещи понимать про мозг, математики такие: «Это всё понятно, сейчас мы сделаем то же самое, только в кремнии». И нейронные сети, которыми мы сейчас оперируем – это некая абстракция, которая отдалённо похожа на мозг. Наш мозг – это же, грубо говоря, сборище клеток, которые соединены друг с другом ниточками, и каждая клетка ничего не знает. Просто каждую клетку периодически бьёт током откуда-то, и она периодически бьёт током другие клетки. (Я сейчас осознанно очень упрощаю, не верьте мне, почитайте специализированную литературу, пожалуйста.)Есть абсолютно автономные какие-то единицы, соединённые ниточками, по этим ниточкам бегает сигнал, и эти ниточки становятся толще в некотором смысле. Или тоньше. Если сигнал бегает часто, то связь укрепляется, если редко, то она начинает пропадать. Так человеческий мозг, судя по всему, учится. Сейчас мы уже понимаем, что всё намного сложнее. Была недавно публикация в Nature про то, что помимо аксонов, про которые все знали, которые соединяли нейроны, есть ещё дендриты – это такие странные отростки, о которых раньше все считали, что они не имеют никакого отношения к делу. А сейчас вроде как они тоже влияют на интеллектуальные процессы, на мышление в живом мозгу.
А. Веснин
―
Но компьютер пока так не может.
И. Ямщиков
―
Компьютер не может. Все абстракции сводятся к тому, что мы берём независимые точки, соединённые связями, связи идут с какими-то весами, мы эти веса меняем очень-очень много раз и группируем эти штуки в какие-то конструкции.
А. Веснин
―
Связи идут с какими-то весами?..
И. Ямщиков
―
Я люблю такой пример. Представьте себе зрительный зал. Все сидят рядами, каждый ряд не видит толком, что на сцене, только первый ряд. А на последнем ряду сидит один человек. Что происходит: допустим, мы хотим обучить нашу нейронную сеть распознавать, мальчик на сцене или девочка. Мы вначале просто говорим: «Первый ряд, вы увидели что-то на сцене? Поднимите руку или не поднимите, только выберите внутреннее правило, почему так делаете, и всё. Второй ряд, посмотрите на людей, сидящих перед вами, и если большинство рук поднялось, вы тоже поднимаете руку».И так всё бежит до последнего человека, и если он поднимает руку, будем считать, что ответ – девочка, если не поднял – мальчик. И дальше он поднимает руку, допустим, а на сцене была девочка на самом деле – он молодец, всё угадал, мы ему говорим: «Ты молодец».
А. Веснин
―
Отправляем ему единичку.
И. Ямщиков
―
Да, да. И он тогда хлопает людей, сидящих перед ним, которые подняли руку, по плечу, и говорит: «Всё правильно! Вы молодцы!» И как бы начинает доверять им чуть больше. А они хлопают людей, сидящих в следующем ряду, по плечу, и говорят: «Мы правильно сработали! Класс!» И как бы доверие между теми, кто поднял руки, в этом случае растёт. А если произошла ошибка, он, наоборот, хлопает их по плечу и говорит: «Ребята, мы облажались». И доверие падает. Соответственно, когда мы оперируем этот сигнал по рядам миллионы раз, показывая миллионы картинок мальчиков и девочек, мы получаем свёрточную нейронную сеть.
А. Веснин
―
А зачем нам так много раз это делать?
И. Ямщиков
―
Как показывает практика, когда у нас слоёв в этой сети много, она получается умнее и способна лучше решать более сложные задачи. Современные системы машинного зрения – это такие сети на 14-16 слоёв. Ещё довольно интересно, что когда ты хорошо обучил первые, не знаю, 10 рядов, ты можешь их заморозить и сказать: «Всё, ребята, вы делаете, как выучили. Вот этим доверяете, вот этим не доверяете, поднимаете руки всё время одинаково». А переучивать только последние 3-4 ряда под ту специальную задачу, которая тебе нужна.Это называется transfer learning, или перенос обучения, и в машинном зрении это очень хорошо работает и позволяет экономить кучу времени и энергии, когда у тебя есть большая модель, обученная на очень большом количестве картинок. Ты хочешь в той камере, которая сейчас за нами наблюдает и распознаёт, возможно, лица и на нас фокусируется, реализовать механизм фокусировки на лицо. Тебе нужно, чтобы она выделяла лицо на фотографии, и ты под это только её доучиваешь.
А. Веснин
―
Мы как-то от шахмат несколько ушли, ты хотел рассказать какую-то классную последнюю историю про шахматы, что тогда ещё Каспаров играл с алгоритмом, а не с нейросетью…
И. Ямщиков
―
Да, Каспаров сыграл с алгоритмом, проиграл и через год сказал: «Ребята, давайте играть в augmented chess, или «дополненные шахматы». Это когда компьютер и человек играют против компьютера и человека. Мы можем выбрать любой алгоритм, который считаем нужным, садимся и играем. Можешь доверять этому алгоритму, можешь не доверять. И он сам так сыграл в 1999 году, но это привлекло намного меньше внимания журналистов. А что интересно, в 2016 или 2017 году, когда Карлсен играл против Карякина…
А. Веснин
―
Тогда многие следили.
И. Ямщиков
―
Да-да. И вот, что интересно: перед матчем Карлсен тренировался на искусственном интеллекте, который пытался имитировать игру Карякина, а Карякин тренировался на искусственном интеллекте, который пытался имитировать игру Карлсена. То есть, в некотором смысле…
А. Веснин
―
То есть, тоже было машинное какое-то обучение?
И. Ямщиков
―
Частью подготовки был некоторый алгоритм, который специально затачивали, чтобы один научился играть против другого.
А. Веснин
―
Значит, это была не только битва шахматистов, но и программистов, которые создавали алгоритмы, наиболее похожие на…
И. Ямщиков
―
В некотором смысле. Но самое интересное в этом во всём то, что мы видим эту самую синергию. То есть, на самом деле вся эта история противостояния довольно надуманная. 90 % случаев использования такого рода алгоритмов, это не алгоритм заменяет человека. Это мы придумываем ситуацию, в которой алгоритм просто добавляет человеку каких-то функций или возможностей, которых у него раньше не было, и человек начинает тратить своё время на что-то более разумное. Условно говоря, пытаться разбирать партии Карякина, готовясь к игре с ним – это очень сложно, партий сравнительно немного для открытого анализа и так далее.А алгоритм, который мы пытаемся, тем не менее, на основании этих партий доучить на то, чтобы имитировать стиль его игры – это куда более разумное применение времени человека, который готовится к такого рода партии. И вот эта вот история про синергию алгоритмов искусственного интеллекта с нашими интеллектуальными возможностями, мне кажется, очень интересна. Про это почему-то мало говорят. Мне кажется, это круто.
А. Веснин
―
Сам термин «искусственный интеллект» как-то не даёт покоя многим, и мне в том числе, потому что ну понятно, фантастики мы всякой начитались и фильмов насмотрелись, но по сути того, что ты рассказываешь, и вообще, сейчас про него довольно много пишут, я не очень и не до конца понимаю разницу вот этого искусственного интеллекта просто с какой-то хорошей умной программой.Я помню, в детстве в конце 90-х любил играть в игру Civilization II. Вечная игрушка была, очень интересная. По сути компьютер что делал: он имитировал действия человека точно так же, как будто бы я играл с тобой. Там немножко отличалось, потому что компьютер, а не человек, но в принципе то, что ты сейчас рассказываешь… Тоже представить, что компьютер сам каким-то образом считает и рассчитывает экономику, строительство войск, научные открытия и выбирает себе определённый путь победы – пожалуйста, в конце 90-х уже всё было на примере простой компьютерной игрушки. Ясно, что сейчас всё сложнее. Но в чём принципиальная разница, почему это начинают называть искусственным интеллектом? И можно ли, например, ту игру – стратегию Civilization – тоже называть в каком-то смысле искусственным интеллектом?
И. Ямщиков
―
Я не могу ручаться за Civilization II, какого рода алгоритм там использовался. Скорее всего, искусственным интеллектом её называть можно точно, потому что, ещё раз, если это умнее журналиста, то это – искусственный интеллект. Мы используем очень простую базовую НРЗБ.
А. Веснин
―
Я выиграл.
И. Ямщиков
―
Хорошо, если это умнее глупого журналиста, а не журналиста «Эха Москвы».
А. Веснин
―
Зачтём.
И. Ямщиков
―
А вот машинное обучение принципиально отличается тем, что объём усилий, который нужен для того, чтобы создать алгоритм, который бы справлялся с задачей на каком-то очень высоком уровне качества, в терминах человеко-часов, которые нам нужны для того, чтобы такой алгоритм разработать – он… В некоторых случаях мы вообще не понимаем, сколько нам нужно часов, чтобы руками прописать набор правил. Я приведу пример. Допустим, в ABBYY мы делаем процессинг документов, и одним из больших кусков нашего технологического стека является распознавание текста. Вот есть текст на картинке, нам нужно превратить его в оцифрованный текстовый документ.И долгое время в 90-е годы была такая шутка, что нейронная сеть – это второй лучший способ сделать что угодно. Потому что уже тогда было понятно, что нейронные сети – довольно гибкий инструмент, и их можно применять к любой задаче более или менее, но всегда был какой-то написанный талантливыми программистами алгоритм, эвристический или какой-нибудь на основе правил или чего-нибудь ещё, который бы работал лучше. Как в Civilization II, когда сидела большая группа математиков, стратегов, специалистов по теории игр и разрабатывали поведение такого алгоритма, который мог бы менять уровень сложности, с которым тебе было бы интересно играть и вот это всё. Сейчас, когда порог входа для введения нейронных сетей значительно ниже, и мы, собственно, все наши алгоритмы переводим на…
А. Веснин
―
Вань, я сейчас смотрю на время, нам надо прерваться на московские новости. Давай на несколько минут прервёмся и вернёмся. Civilization IIНОВОСТИ
ЗАСТАВКА
А. Веснин
―
Возвращаемся в эфир петербургского «Эха». Напомню, что у нас в гостях научный сотрудник Института Макса Планка в Лейпциге и евангелист искусственного интеллекта компании ABBYY Иван Ямщиков. Если прослушали начало и не понимаете, что значит «евангелист искусственного интеллекта», можно на Youtube к нам зайти, «Эхо Москвы в Петербурге». Там Иван подробно рассказывает, почему он евангелист искусственного интеллекта. Ты говорил перед перерывом о том, почему искусственный интеллект – это искусственный интеллект…
И. Ямщиков
―
В чём разница между машинным обучением и алгоритмами, которые руками сделаны. Разница в том, что когда у тебя есть написанный руками программистов очень хороший алгоритм, как в игре Civilization II, которую ты приводил в пример, этот алгоритм может хорошо работать, но чтобы его сделать, нужно очень много времени программистов и математиков. Когда у меня есть нейронная сеть и если у меня есть достаточно данных, на которых я могу её обучить - я взял, поставил её на обучение. Да, мне нужно определённое время одного специалиста по анализу данных, который её обучит, проверит, что она работает.Но, во-первых, я экономлю время всей этой группы людей. Во-вторых, если мне потом нужно будет немного изменить задачу, баланс ресурсов или специфику игры, введя в неё какие-то новые вводные – я переобучу алгоритм намного быстрее и мне не нужно заново садиться всей этой группой людей его переделывать. И третье: он иногда оказывается лучше, чем алгоритм, сделанный большой группой умных людей. То есть, фишка машинного обучения, грубо говоря…
Все крутые технологии происходят от лени, если очень широко на это смотреть. Было лень ходить за водой – сделали водопровод. Когда у тебя очень много данных, очень сложно их обработать руками и тогда ты придумываешь алгоритмы, которые бы это делали за тебя и можешь такие штуки масштабировать, от одной задачи к другой переносить и комбинировать, как кубики LEGO. У тебя намного больше гибкость, тебе намного меньше нужно времени, математиков, учёных и кого-то ещё на то, чтобы это сделать.
А. Веснин
―
Есть какая-то связь между искусственным интеллектом в представлении большинства людей, посмотревших фильм «Терминатор» в 90-е, с тем, что сейчас происходит?
И. Ямщиков
―
Очень отдалённая. Единственная прямая связь – это то, что люди, условно говоря, платят налоги, на которые государство финансирует исследования. На этом вся прямая связь, мне кажется, заканчивается.
А. Веснин
―
Может произойти такое, что мы, из стремления быть Богом и породить новую жизнь, или просто из лени, чтобы за нас кто-то другой работал, создали искусственный интеллект, который будет существовать в одной системе координат вместе с человеческим разумом?
И. Ямщиков
―
Мнения на этот счёт разделяются. У меня есть подкаст «Проветримся!», в Telegram он находится под названием progulka. У нас там был эпизод «Апокалипсис», где мы с Андреем Себрантом и Лёшей Тихоновым из «Яндекса» общались, он до сих пор один из самых прослушиваемых. Потому что люди любят… Как знаешь, кто-то сказал, какой-то умный человек наверняка, что всякое поколение льстит себе надеждой, что оно последнее поколение в истории человечества. И поэтому все легенды про апокалипсис хорошо продаются.
А. Веснин
―
Я тебя не про апокалипсис даже спрашиваю. Я говорю про то, что может быть хороший искусственный интеллект, но это что-то равное человеку.
И. Ямщиков
―
Ты имеешь в виду физически?
А. Веснин
―
Нет, пусть это будет компьютер, пусть это будут не роботы, но что-то, равное человеку. Со своей волей, со своими желаниями, возможно, какими-то чувствами или аналогами их. Вот про это речь.
И. Ямщиков
―
То, о чём ты говоришь, называется сильный искусственный интеллект. Всё, о чём я говорю и то, что сейчас реально работает, двигает экономику и реально приносит пользу – это искусственный интеллект в узком смысле. Хорошо, чётко поставленная задача; большой объём данных; алгоритм, который на них обучен, который начинает делать что-то лучше, чем человек в чётко определённой области. Сильный искусственный интеллект – это штука, насчёт которой мнения учёных разнятся. Я допускаю, что такая штука может быть сделана, но не думаю, что это можно даже в среднесрочной перспективе как-то спрогнозировать.Есть, условно говоря, Илон Маск или другие люди из Силиконовой долины, которые считают, что это прямо угроза. Но тут нужно понимать, что их мнения разнятся – иногда они говорят, что это угроза, а иногда инвестируют в компанию OpenAI, которая тоже принадлежит Маску и занимается разработками в области искусственного интеллекта.
Последняя консолидированная позиция выглядит примерно так: «Мы не знаем, когда такого рода алгоритмы появятся, и появятся ли они вообще. Но хорошо бы подстелить соломку до того, как они появятся. Потому что когда и если они появятся, времени у нас может быть слишком мало». Поэтому все проекты в области безопасности искусственного интеллекта сейчас работают в некой гипотетической ситуации: допустим, у нас такой алгоритм есть. Что мы можем сделать, чтобы обезопасить человечество от потенциальных негативных проявлений этого алгоритма.
А. Веснин
―
И ты считаешь, что этим нужно заниматься?
И. Ямщиков
―
Я считаю, что «пусть цветут все цветы», как говорил товарищ Мао. Мне не кажется, что это бессмысленное занятие. Там могут появляться какие-то разумные идеи, во-первых. А во-вторых, думать про угрозы технологий… Мы знаем, что технологии часто приносят с собой угрозы, это нормально. Лопата намного опасней, чем палка-копалка, лопатой можно и убить. Полезно знать технику безопасности при работе с лопатой до того, как она появилась у тебя в руках.
А. Веснин
―
Палкой-копалкой тоже можно. Опаснее даже, я бы сказал.
И. Ямщиков
―
Но сложнее. Мысль, в общем в том, что думать о том, какие проблемы, связанный с той или иной технологией, могут возникнуть, полезно до того, как она вылезла из коробки и убежала.
А. Веснин
―
У нас времени немножко остаётся, расскажи, чем ты сам сейчас занимаешься.
И. Ямщиков
―
Я занимаюсь алгоритмами, которые генерируют тексты, похожие на человеческие. Пытаюсь делать какие-то алгоритмы, которые были бы неотличимы от того, что делают люди. То есть мы берём много-много текстов человеческих, подаём на вход алгоритму и надеемся, что он в итоге будет способен писать тексты, похожие на человеческие. У этой задачи есть много подзадач. Какие-то из них очень технические. Допустим, у нас в этом году вышла статья на НРЗБ, это одна из топовых конференций по данной тематике в мире. У нас там вышла статья с ребятами из Питера, Екатеринбурга и Берлина про переформулировки. Мы на вход машине подаём негативный отзыв, а она может переписать его в позитивный. Или наоборот, на вход подаём что-нибудь вежливое, и хотим, чтобы она сделала невежливую фразу.
А. Веснин
―
Практический интерес есть? Кроме того, что магазины на своих сайтах будут переписывать плохие отзывы.
И. Ямщиков
―
Представь: вот у тебя на email приходит письмо, ты хочешь на него ответить матом, и отвечаешь. И нажимаешь «отправить». А компания «Эхо Москвы» позаботилась о тебе и поставила специальную систему переформулировок, и приходит письмо: «Дорогой Пётр Алексеевич!»
А. Веснин
―
Как-то не нравится мне такая идея, если честно. Свобода слова и волеизъявления! А какие-то другие практические вещи? Или это всё-таки больше аналитическая история, чтобы понять устройство языка, как с ним научиться работать компьютеру…
И. Ямщиков
―
У одного из создателей и основателей компании ABBYY Давида Яна есть другой проект, который называется Yva.ai, он занимается аналитикой коммуникаций внутри компаний и пытается на основе этого предсказать, когда человек уволится, для того, чтобы понять, когда что-то не так и скорректировать менеджера. Он никогда не даёт сигнал про отдельного человека, он даёт сигнал про группу и говорит: «Смотрите, есть группа из четырёх человек и там какие-то проблемы. Давайте специалисты из отдела кадров туда придут и поговорят с менеджером группы».
А. Веснин
―
Работает?
И. Ямщиков
―
Да, это неплохо работает, они могут предсказывать увольнения довольно рано, потому что видят, что человек, который… Это может быть связано с тем, что менеджер группы или кто-то внутри группы грубит, или начинает вести себя безответственно. Или один человек ведёт себя безответственно, но не собирается увольняться, а из-за него начнёт увольняться ценный сотрудник.
А. Веснин
―
И это всё алгоритм может…
И. Ямщиков
―
Алгоритм аналитики текстов, да. Они анализируют не только тексты, а более-менее всё, что можно, включая активность человека – когда он пишет, как устроена коммуникация, от кого и кому идут сообщения. Они анализируют не только почту, но и корпоративные чаты, то есть любую текстовую коммуникацию внутри компании. У них неплохо получается предсказывать отток, и когда речь идёт о ключевых сотрудниках, особенно в тех областях, где идёт конкуренция за таланты, то, конечно, очень обидно, если тебе не повезло с каким-то одним человеком, который испортил процессы в группе, и из-за него два человека уволились.
А. Веснин
―
Я правильно понимаю, что сначала всё-таки человек должен понять, проанализировать, если есть такая ситуация - то человек уволится. Или машина сама уже научилась?
И. Ямщиков
―
В том-то и дело – машина это анализирует.
А. Веснин
―
Тут ведь есть ещё и психология, а это такая штука…
И. Ямщиков
―
Но они это делают на основании машинного обучения. У них есть история увольнений, у них есть большой-большой набор данных…
А. Веснин
―
То есть, если начинается много грубости, то это ведёт к увольнению.
И. Ямщиков
―
К примеру. Они тысячи факторов анализируют. У них была смешная история – когда только сделали пилот, они, естественно, выкатили его на свою команду, и пилот сказал, что увольняться собирается один из инженеров. И все такие: «Ты сего, уходишь?» Он говорит: «Нет-нет-нет!», - а через полгода уволился. И оказалось, что тогда, когда это произошло, полгода назад, он уже собирался увольняться. В общем, оказывается, система работает довольно неплохо.
А. Веснин
―
Чего-то стоит ждать сейчас нового в мире технологий искусственного интеллекта, что на нашу жизнь как-то повлияет?
И. Ямщиков
―
Мне кажется, что очень много всего интересного будет происходить. Мне кажется, что большие истории с автоматизацией бюрократии – то, что ABBYY делает, это круто. История про медленную и неэффективную бюрократию будет всё больше и больше уходить в прошлое во всех странах. И в этом смысле «Госуслуги» и всё, что вокруг них в России – это тоже шаг в правильном направлении.Я думаю, будет много всего, связанного с автоматизацией транспорта. Опять же, у нас здесь есть примеры компаний, которые занимаются Self-Driving, в частности, «Яндекс». Мы знаем, что в Казани, в Иннополисе можно уже заказать беспилотное такси в некоторых районах, и это реально круто. Пока это всё прототипы, но это совершенно точно произойдёт в ближайшие 20-30 лет, автоматизация транспорта до довольно высокого уровня. Я в это верю.
Мне кажется, очень много вещей, связанных с какими-то сопутствующими сервисами вокруг того, что называется sharing economy, то есть экономика распределения ресурсов и вообще попытка повысить эффективность экономики и в контексте экологических вызовов.
А. Веснин
―
А каким образом здесь-то поможет искусственный интеллект?
И. Ямщиков
―
Если ты можешь оптимально расходовать ресурсы, то ты меньше их потребляешь, меньше нагружаешь природу, меньше делаешь выбросов CO2 и так далее. Условно говоря, если мы умеем решать задачи оптимизации чего бы то ни было с большим количеством переменных, и умеем учитывать какие-то условия, например: «Надо выбросить не больше, чем столько-то CO2» или «Нам нужно выращивать такое-то количество коров и при этом сохранять почву плодородной» и так далее. Есть очень много задач на стыке большой индустрии, экологии и интересов общества, которые искусственный интеллект будет менять.На прошлой неделе в Москве прошла конференция MieloConf, на которой я делал секцию, посвященную искусственному интеллекту в промышленности. У меня там были ребята из Mechanica AI, это российская компания, которая помогает плавить сталь при помощи искусственного интеллекта, у них живые контракты и они деньги зарабатывают по всему миру со своей технологией. У меня были ребята из компании Cattle Care, которые помогают повышать надои молока и осеменять коров вовремя при помощи машинного зрения искусственного интеллекта, у них клиенты в Штатах, в основном, в первую очередь, в Техасе.
Были ребята из TraceAir Technologies, которые при помощи дронов и машинного зрения помогают стройки оптимизировать. Их докладчик Максим Мусин говорил про то, что VR на стройке – это очень круто. Представь, что ты можешь надеть очки виртуальной реальности и посмотреть, что у тебя с коммуникациями. Где проходит несущая стенка, куда можно сходить, куда нельзя. Он, в частности, говорил про строительных роботов, который могли бы бегать «подай-принеси», и так далее.
А. Веснин
―
Спасибо. Это был Иван Ямщиков, научный сотрудник Института Макса Планка в Лейпциге. Удачи тебе, счастливо.
И. Ямщиков
―
Спасибо. Пока.
