«Если без хайпа, то ИИ повышает производительность труда»

15 тезисов о машинном обучении профессора МФТИ Константина Воронцова

1. ИСТОРИЧЕСКИ В ИССЛЕДОВАНИЯХ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА БЫЛО ДВА САМЫХ КРУПНЫХ НАПРАВЛЕНИЯ: ЭКСПЕРТНЫЕ СИСТЕМЫ И МАШИННОЕ ОБУЧЕНИЕ.

Первое направление основывалось на идее, что можно взять какую-то сложную задачу — например игру в шахматы — и заложить в компьютерную программу опыт лучших шахматистов в виде стратегий, способов оценивания ситуации, правил принятия решений. Экспертные знания в принципе формализуемы, хотя это трудная математическая и программистская задача. Но довольно быстро выяснилось, что чем сложнее задача, тем труднее все учесть и предусмотреть в системе экспертных правил.

Поэтому стало развиваться второе направление, основанное на машинном обучении. Забудем про знания экспертов и будем просто собирать данные о том, какое решение было правильным, а какое неправильным в той или иной ситуации. Накапливается выборка данных, по которой мы строим предсказательную модель, способную принимать решения в аналогичных ситуациях. Обучение предсказательной модели — это математическая технология, основанная на классической задаче проведения функции через заданные точки. Многие из этих методов известны еще со времен Лагранжа и Гаусса.

Конечно, современное машинное обучение оперирует гораздо более сложными функциями, да и под «точкой» теперь может пониматься весьма сложно устроенный объект. По мере того как компьютерный сбор и накопление данных стали более дешевыми, второе направление потихоньку стало вытеснять первое.

Например, компьютерное зрение до 2012 года практически топталось на месте, несмотря на огромный объем исследований во всем мире. А как только появилась база данных ImageNet из миллиона размеченных изображений и глубокая нейросеть, вместе они дали революционный эффект, которого никто не ожидал.

2. НЕЙРОСЕТИ — ЭТО ЧАСТЬ МАШИННОГО ОБУЧЕНИЯ, ПРОДОЛЖЕНИЕ МАТРЕШКИ ИИ.

Сейчас стало принято приравнивать нейронные сети и машинное обучение и говорить, что традиционные методы постепенно вытесняются нейронными сетями. История искусственных нейронных сетей очень драматична. Первая линейная математическая модель нервной клетки — нейрона — появилась в 1943 году в работах МакКаллока и Питтса. Уже в 1950-е годы искусственные нейронные сети начинают отходить от принципов нейрофизиологии и оформляются в отдельные, чисто математические, конструкции.

Если говорить о нейросетях языком программистов, то это просто компьютерный код. Если говорить языком математиков — это сложная композиция функций, в которой есть числовые параметры, настраиваемые по обучающей выборке. Например, выборкой может быть большое количество сыгранных партий, в которых машина играла сама с собой. Алгоритм обучения нейронной сети подбирает параметры так, чтобы на этой выборке ошибаться как можно реже. В ходе обучения алгоритм фактически вырабатывает свои правила принятия решений.

Искусственные нейронные сети пережили несколько волн энтузиазма, сменявшихся разочарованием от перегретых ожиданий. Сейчас мы снова на волне энтузиазма благодаря последней революции глубокого машинного обучения. Похоже, что на этот раз все всерьез и надолго.

В 2016 году глубокие нейронные сети опередили человека по уровню качества классификаций изображений. Люди в ходе тестов допускают 3–5 % ошибок, у нейросетей эта доля меньше.
То есть работу людей уже можно автоматизировать везде, где речь идет о распознавании, скажем, номеров автомобилей, лиц в толпе, брака на конвейере или военной техники с воздуха. Но надо понимать, что глубокие нейросети пока работают лишь для ограниченного круга задач. Это те задачи, которые не поддавались старым методам из-за сложной структуры самих исходных данных, таких как изображения, видео, звук, речь, текст, игры.

3. СТУДЕНТАМ Я ВСЕГДА ОБЪЯСНЯЮ, ЧТО МАШИННОЕ ОБУЧЕНИЕ — ЭТО НЕ ПОВТОРЕНИЕ ЕСТЕСТВЕННОГО ИНТЕЛЛЕКТА.

Машинное обучение строится на математическом анализе, теории вероятностей, оптимизации и статистике. Волна хайпа вокруг искусственного интеллекта добавила ему магической ауры. При этом у глубоких нейронный сетей есть реальный прорыв — они автоматизируют процесс извлечения признаков из сырых данных.

Раньше этим занимались целые отделы математиков и инженеров. Например, придумывали кучу изощренных формул, как перевести изображение в числовой вектор, чтобы распознавать иероглифы, автомобили или лица людей. Все это довольно медленно развивалось, потому что требовало многих лет исследований и высококвалифицированного труда.

Теперь произошел переход от инженерии признаков к инженерии нейросетевых архитектур,когда специалист придумывает, сколько в нейросети будет слоев и как он их расположит. Это намного проще, быстрее и дешевле. Но это совершенно не означает, что глубокие нейросети настолько универсальны, что способны решать все задачи на свете.

Многие задачи моделирования еще долго будут решаться людьми на основе глубоких знаний предметной области. Главное, чего искусственный интеллект пока не может даже близко, — это заниматься целеполаганием и ставить задачи.

Фото: Reuters

4. ПОНАЧАЛУ ЛЮДИ ПЫТАЛИСЬ СТРОИТЬ НЕЙРОСЕТИ НА ПРИНЦИПАХ НЕЙРОФИЗИОЛОГИИ, НО ПОТОМ ЭТО НАПРАВЛЕНИЕ ВСЕ БОЛЕЕ И БОЛЕЕ ОТРЫВАЛОСЬ ОТ ИСХОДНЫХ ПОЗИЦИЙ БИХЕВИОРИЗМА.

Искусственные нейросети идут своим путем. Они развиваются исходя из принципов математического и технологического удобства, и не обязаны быть устроены так же, как устроен наш мозг. Моя любимая аналогия: самолеты, вертолеты и ракеты устроены совсем не так, как птицы, хотя изначально люди пытались копировать механику птичьего полета. Но потом оказалось, что проще построить реактивный двигатель, чем махать крыльями. То же самое происходит с искусственным интеллектом: необязательно воспроизводить сложную работу мозга. Можно создать гораздо более простые механизмы, усовершенствовав давно известные вычислительные методы оптимизации и статистики.

5. СЕЙЧАС ПРОВОДИТСЯ МНОГО ИССЛЕДОВАНИЙ ПО ПОДБОРУ АРХИТЕКТУРЫ НЕЙРОСЕТИ, ЧТОБЫ РЕШАТЬ БОЛЕЕ СЛОЖНЫЕ ЗАДАЧИ.

Под архитектурой сети мы обычно понимаем число слоев, число нейронов в каждом слое и способы связывания нейронов. Примитивный способ связывания — когда все нейроны одного слоя связаны со всеми нейронами следующего слоя. Эта техника постепенно уходит в прошлое — слишком много параметров, много времени на их обучение, много памяти для их хранения.

Знаменитые сверточные нейросети имеют более специфичную архитектуру — в них гораздо меньше связей, и они нацелены на обработку каждого небольшого участка изображения или сигнала вместе с его окрестностью.

Рекуррентные сети для анализа текстов или сигналов имеют еще более сложную архитектуру. Сейчас значительная часть исследований направлена на открытие новых удачных архитектур. Причем исследования в значительной степени эмпирические и феноменологические. Пока у нас нет общей теории архитектуры искусственных нейронных сетей. Мы находимся в той стадии развития этой науки, когда исследователи накапливают сведения о том, какие подходы в каких задачах работают лучше.

6. ЗА КАЖДОЙ СТРОЧКОЙ ОБЫЧНОЙ ПОИСКОВОЙ ВЫДАЧИ СТОИТ КАКОЙ-ТО ИНТЕЛЛЕКТУАЛЬНЫЙ СЕРВИС.

Поисковые системы Яндекс или Google — это, по сути, тоже роботы. Нейросети в поисковиках решают очень много задач. Начнем с фильтрации поискового спама — если бы не эта функция, то вы бы вообще ничего полезного не увидели в списках поисковой выдачи. Вторая задача — это ранжирование результатов запроса по релевантности. Третья — показ рекламы, на которую вы с большей вероятностью кликните. Даже такая мелочь, как выпадающий список вариантов продолжения запроса.

Таких умных сервисов только на стартовой странице «Яндекса» десятки. Поиск информации на сегодняшний день уже очень эффективен, и это огромный прорыв, по сравнению с тем, что было 30 лет назад, когда за информацией надо было ходить в библиотеки. Однако процессы систематизации и понимания информации остались на прежнем уровне. Мы научились экономить время на поиске, но как теперь сэкономить его на чтении? Моя команда в компании Aithea сейчас разрабатывает новую технологию «умного поиска». Мы переходим от поиска по коротким фразам к поиску по текстам любой длины, по их тематике и смыслу. Это новый уровень информационного поиска.

Пользователь может не знать дословно, что именно он ищет, и система должна подсказать ему, что читать и в каком порядке, чтобы разобраться в данной теме. Мы разработали модель тематического поиска, которая решает эту задачу точнее людей. Это будет специализированный поисковый сервис, и первыми его пользователями станут профессиональные сообщества со своими специфическими поисковыми потребностями.

7. ЕСЛИ ОТБРОСИТЬ ВЕСЬ ХАЙП, ТО ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ — ЭТО В ПЕРВУЮ ОЧЕРЕДЬ СПОСОБ ПОВЫШЕНИЯ ПРОИЗВОДИТЕЛЬНОСТИ ТРУДА В РАЗНЫХ СФЕРАХ.

Информационные технологии позволяют централизировать сбор данных. Это, между прочим, огромный объем организационно-технической работы, труд инженеров и менеджеров, которых никакой искусственный интеллект не заменит даже в отдаленной перспективе. Затем мы строим по этим данным предсказательные модели, которые автоматизируют принятие решений, дают прогнозы и рекомендации.

Рост вычислительных мощностей и снижение их стоимости потихоньку ведет к тому, что в памяти компьютеров можно держать все более адекватную модель все большего куска реальности. Например, внутри промышленной информационной системы мы можем знать все, что происходит с каждой деталью, которая идет по конвейеру. В некотором смысле это и есть виртуальная реальность. Если эти модели адекватны по всем узлам производства, то оно может быть роботизировано почти полностью. Это реально приближает нас к тому, чтобы многие процессы происходили почти без людей.

Но автоматизация всегда требует предельно четкой постановки задачи. Экскаватор может только копать. Банковская скоринговая система может только принимать решения по кредитам, причем только на том рынке, на данных которого она была обучена. Скоринговая модель — это тоже «искусственный интеллект», но, чтобы перенастроить ее в новых условиях, необходимо проделать кучу ручной работы по подготовке данных, исправлению модели и ее валидации. Искусственный интеллект — не чудо, а инженерная дисциплина.

Источник

%d такие блоггеры, как: