Вот уже примерно пять лет мы подробно изучаем машинное обучение, и о нем не слышал разве что ленивый. Аналитик и партнер фонда Andreessen Horowitz Бенедикт Эванс порассуждал на тему того, что машинное обучение будет значить для компаний и для самих нас в будущем.
В общем и целом, мы понимаем, что такое нейронные сети в теории и представляем, что они связаны с данными и закономерностями. Благодаря машинному обучению мы можем находить неявные и вероятностные закономерности или структуры в данных, которые раньше могли найти только люди.
Тем не менее, я не считаю, что мы полностью понимаем, что значит машинное обучение – что оно будет значить для технологических компаний в экономике в целом, как структурно мыслить о новых вещах, которые могут появиться благодаря нему или что машинное обучение значит для всех нас и какие проблемы сможет решить.
Здесь не помогает и термин «искусственный интеллект» – как только он всплывает, заканчивается любая дискуссия. Когда кто-то упоминает термин ИИ, мы превращаемся в обезьян из фильма «2001 год: Космическая одиссея», которые кричат и машут кулаками на черный монолит.
Я считаю, что можно составить целый список бесполезных тезисов о нынешнем состоянии машинного обучения:
- Данные – новая нефть
- Google и Китай (или Facebook, или Amazon, или BAT) обладают всеми данными
- ИИ отнимет у нас работу
А вот полезные темы для разговора:
- Автоматизация
- Ключевые технологические слои
- Реляционные базы данных
Почему реляционные базы данных (РБД)? Они провели революцию в области вычисления. До появления РБД в конце 70-х ответ на вопрос, кто из клиентов, купивших продукт, живет в этом городе, требовал отдельного инженерного проекта. Структуры баз данных не позволяли легко осуществить произвольный запрос по нескольким источникам. Они являлись системами учета; реляционные базы данных превратили их в системы для бизнес-анализа.
Благодаря РБД появились новые сценарии использования и компании-миллиардеры. Они подарили нам Oracle и SAP, Apple и Starbucks. К 90-м почти все корпоративное ПО было построено на РБД.
Таким образом, машинное обучение – шаг на пути к переменам, которые могут произойти с компьютерами, и это коснется многих продуктов для различных компаний. В конечном итоге все будут использовать машинное обучение, и это не будет никого удивлять.
Мы не правильно понимаем концепцию автоматизации
Суть машинного обучения заключается в данных, однако они очень специфичны для конкретных применений. Например, данные о газовых трубах помогут разработать систему, которая будет предсказывать отказы и недочеты в газовых трубах, а данные о почерке подойдут для системы распознавания рукописного ввода. Данные не взаимозаменяемы.
Это является причиной распространенных заблуждений, которые возникают в разговорах о машинном обучении: что оно, в каком-то роде, похоже на HAL 9000 – компьютер из «Космической одиссеи», или Google обладает всеми данными. На самом деле, мы неправильно понимаем концепцию «автоматизация»: с каждой волной автоматизации мы представляем, что создаем нечто антропоморфное с общим интеллектом. В 1920-1930-х годах мы представляли людей из стали, которые ходят по заводу с молотком в руках, а в 1950-х – гуманоидных роботов, выполняющих домашние обязанности. Роботы-слуги так и не появились, вместо них мы теперь пользуемся стиральными машинами.
Стиральные машины действительно являются роботами, однако они не умные. Они не знают, что такое вода или одежда. Это лишь еще один вид автоматизации, который концептуально ничем не отличается от конвейерной ленты. Точно так же машинное обучение позволяет нам решать классы проблем, с которыми не могли раньше справиться компьютеры. Однако каждая из этих задач будет требовать определенной реализации, определенных данных и зачастую определенной компании. Все они – лишь часть автоматизации, очередная стиральная машина.
Следовательно, одна из сложностей в разговорах о машинном обучении заключается в поиске золотой середины между механистическим объяснением математики и фантазиями об ИИ. Машинное обучение не создаст HAL 9000, однако также нельзя называть его «просто статистикой». Конечно, можно сказать: «машинное обучение позволяет вам задавать новые типы вопросов», но не всегда очевидно, какие именно это вопросы. Вы можете проводить впечатляющие демо распознавания голоса и изображений, однако еще раз: что с этим должна делать обычная компания? Сотрудница одной медиакомпании сказала мне: «Мы знаем, что можем обработать десять лет видеозаписей интервью со спортсменами – но что мы ищем?»
Что же тогда значит машинное обучение для компаний?
Я думаю, есть два подхода к размышлению об этом. Во-первых, думать в терминах обработки типов данных и типов вопросов:
- Машинное обучение может дать более качественные ответы на вопросы о данных, которыми вы уже обладаете. Например, компания Instacart разработала систему для оптимизации потоков покупателей в продуктовых магазинах, что привело к значительным улучшениям.
- Машинное обучение позволяет задавать новые вопросы по уже имеющимся данным. Например, адвокат может искать «злые» электронные письма, аномальные цепочки сообщений или кластеры документов, а также выполнять поиск по ключевым словам.
- В-третьих, машинное обучение открывает новые типы данных для анализа – компьютеры раньше не могли анализировать аудио, картинки или видео.
Интереснее всего мне кажется анализ изображений. Раньше компьютеры могли анализировать текст и цифры, чего нельзя было сказать об изображениях (и видео). Сейчас они могут «видеть» в той же степени, что и «читать». Это значит, что датчики изображения (и микрофоны) становятся совершенно новыми механизмами ввода. Различные вещи, которые не кажутся проблемами компьютерного зрения сегодня, окажутся таковыми в будущем.
Пять лет назад компьютер ничего не мог делать с фотографиями, кроме как сортировать их по размеру. Десятилетний ребенок мог бы сортировать их в зависимости от того, кто изображен на фотографии – мужчина или женщина. Пятнадцатилетний подросток мог бы разделить их на группы «классные» и «отстойные». Стажер мог бы сказать: «эта фотография кажется особенно интересной». Сегодня благодаря машинному обучению компьютер может сделать с фотографиями то, что может подросток и ребенок. Возможно, он так и не дойдет до уровня стажера. Тем не менее, что бы вы делали, если бы на вас работали миллион пятнадцатилетних подростков, которые смотрели бы на ваши данные? Кого бы вы слушали, на какие картинки смотрели бы, что исследовали бы?
В том-то и дело, машинное обучение не должно соответствовать экспертам или обладать опытом или суждением. Мы просто говорим: «слушай все звонки и отмечай агрессивные», «читай электронные письма и ищи необычные», «смотри на сотни тысяч фотографий и находи крутых (или по крайней мере странных) людей».
В каком-то смысле именно это и делает всегда автоматизация; Excel не подарил нам искусственных бухгалтеров, Photoshop и Indesign – искусственных графических дизайнеров. Мы просто автоматизировали одну отдельную задачу в массовом масштабе.
Тем не менее, в некоторых областях машинное обучение просто не может найти вещи, которые мы уже можем распознать, однако находит вещи, которые человек распознать не может, или уровни закономерностей, с которыми не справится ни ребенок, ни подросток. Это лучше всего проявляется в AlphaGo, программе для игры в го, разработанной компанией Google Deepmind. AlphaGo не играет в го, как шахматные компьютеры играли в шахматы – анализируя каждую возможную комбинацию движений в последовательности. При разработке AlphaGo авторы использовали только самую элементарную теорию игры в го, программа достигла высокого уровня игры, обучаясь сама на партиях профессионалов. В том-то и дело, здесь не нужны тысячи стажеров, скорее один, который очень быстрый; вы предоставляете ему десять миллионов изображений, затем он возвращается и говорит: «забавно, но когда я просмотрел триста тысяч изображений, начала складываться такая закономерность». Какие же области достаточно узки для того, чтобы мы могли объяснить системе МО правила, однако достаточно глубоки для того, чтобы анализ всех данных, чего не может сделать человек, мог бы принести новые результаты?
Я часто встречаюсь с руководителями больших компаний и разговариваю об их технологических потребностях, и они уже поставили довольно простые цели по машинному обучению на будущее. Существует множество очевидных проблем анализа и оптимизации, распознавания изображений или анализа аудио. Точно так же единственная причина, почему мы говорим о беспилотных автомобилях и смешанной реальности, заключается в том, что они появились благодаря машинному обучению. Однако эти компании все равно задаются вопросом: «ну, и что еще?» Какие еще вещи появятся благодаря нему, и что неизвестного оно сможет найти? Вероятно, у нас есть еще десять-пятнадцать лет, пока нам не станет скучно.