Кай-фу Ли "Сверхдержавы искусственного интеллекта". Читать онлайн бесплатно.

Читать Кай-фу Ли "Сверхдержавы искусственного интеллекта
Отзывы на книгу Кай-фу Ли "Сверхдержавы искусственного интеллекта

Сверхдержавы искусственного интеллекта
Кай-фу Ли

Кай-Фу Ли – один из известнейших экспертов в области искусственного интеллекта. За долгую и блестящую карьеру он узнал изнутри, как работают Кремниевая долина США и IT-отрасль Китая, поэтому с уверенностью делает прогнозы о том, кто и почему победит в гонке ИИ.

Но эта победа может обернуться безработицей и невиданным социальным расслоением по всему миру. Катастрофа почти неизбежна, но после серьезнейшего личного кризиса Кай-Фу Ли увидел неожиданный выход. Его укажут человечность и ответственность, а вовсе не армия умных машин.

На русском языке публикуется впервые.

Кай-фу Ли

Сверхдержавы искусственного интеллекта

Китай, кремниевая долина и новый мировой порядок

Издано с разрешения Kai-Fu Lee c/o Brockman, Inc. и Brockman Inc.

Книга рекомендована к изданию Нурланом Утегеновым, Александром Бельским

Научный редактор Владислав Лялин

Никакая часть данной книги не может быть воспроизведена в какой бы то ни было форме без письменного разрешения владельцев авторских прав.

* * *

Посвящается Раджу Реди – моему наставнику во всем, что касается искусственного интеллекта и жизни

Предисловие

Как венчурный инвестор я часто выступаю с лекциями об искусственном интеллекте (ИИ) перед представителями мировой деловой и политической элиты. Но иногда я веду беседы на ту же тему в детских садах, и это особенно приятно. Удивительно, но и там и там я часто слышу одни и те же вопросы. Во время моего недавнего визита в пекинский детский садик стайка пятилетних малышей просто засыпала меня вопросами о будущем ИИ.

«У нас будут воспитатели-роботы?»

«Что произойдет, если один роботизированный автомобиль врежется в другой такой же и кто-нибудь пострадает?»

«Будут ли люди жениться на роботах и заводить с ними детей?»

«Станут ли компьютеры настолько умными, что смогут нами командовать?»

«Если роботы всё будут делать сами, то что будем делать мы?»

И дошкольников, и самых могущественных людей мира волновали одни и те же вопросы. Общение как с теми, так и с другими открыло мне глаза сразу на несколько вещей. В первую очередь мне стало очевидно, что ИИ все больше занимает умы людей. Всего несколько лет назад эта тема фигурировала только в научных работах и фантастических фильмах. Средний человек, возможно, имел представление, что ИИ нужен для создания роботов, мыслящих как люди, но это не имело никакого отношения к его повседневной жизни. Сегодня все изменилось. Статьи об инновациях в области ИИ не сходят со страниц газет. Бизнес-конференции по использованию ИИ для увеличения прибыли проходят почти ежедневно, а правительства по всему миру строят планы по освоению этой технологии. ИИ вдруг стал одной из самых обсуждаемых тем, и не зря. Вслед за крупными прорывами в теории ИИ наконец стали появляться продукты на его основе, способные изменить нашу жизнь. ИИ уже используется во многих популярных приложениях и интернет-сервисах, и в ближайшие годы он будет управлять нашими автомобилями и ценными бумагами, участвовать в производстве большинства товаров, и, возможно, вытеснять нас с рабочих мест.

Его использование сопряжено как с огромными выгодами, так и с потенциальными угрозами, и мы должны быть готовы в том числе и к угрозам.

Мой диалог с дошкольниками показателен и тем, где он состоялся. Не так давно Китай на годы, если не на десятилетия, отставал от США в области искусственного интеллекта. Но за последние три года нашу страну охватила настоящая лихорадка ИИ, и такого эмоционального подъема вокруг этой темы не наблюдается, пожалуй, больше нигде в мире. Серьезное увлечение искусственным интеллектом из сферы технологий быстро проникло в бизнес-сообщества и высшие органы власти. Оно распространилось повсюду – вплоть до детских садиков в Пекине.

Китай возлагает большие надежды на ИИ, и повсеместная поддержка этой технологии приносит свои плоды. Китайские компании и исследователи ИИ уже создали мощную, соответствующую американским аналогам платформу и продолжают экспериментировать с инновационными алгоритмами и бизнес-моделями, обещающими полностью изменить экономику Китая. Совместными усилиями китайские предприниматели и ученые превратили его в подлинную сверхдержаву ИИ, единственное государство, способное соревноваться с США в развитии этой технологии. То, как будут развиваться конкуренция и сотрудничество этих двух стран в области ИИ, может оказать серьезное влияние на мировую экономику и государственное управление.

И наконец, во время встреч с юными слушателями мне внезапно открылась еще более глубокая истина: когда дело доходит до понимания будущего, мы все подобны дошкольникам. Со смесью детского удивления и взрослой тревоги мы пытаемся заглянуть в это будущее и видим множество вопросов, на которые нет ответов. Мы хотим понять, как развитие ИИ повлияет на нашу работу и смысл жизни, и узнать, какие люди и страны выиграют от использования этой невероятной технологии. Мы задаемся вопросом, может ли ИИ привести нас к материальному изобилию и останется ли место для людей в мире, которым управляют умные машины.

К сожалению, не существует хрустального шара, который показал бы нам будущее. Эта неопределенность делает наши вопросы и попытки найти ответы на них еще более важными.

Моя книга – одна из таких попыток. Я не прорицатель, но мой личный опыт исследователя и пользователя этой технологии, а теперь – и венчурного инвестора, которому довелось поработать и в Китае, и в Соединенных Штатах, может оказаться полезным. Надеюсь, что моя книга прольет свет на то, как мы пришли к существующим достижениям в этой области, а также подтолкнет читателей к новым обсуждениям этой темы.

Предсказать окончание нашей истории об искусственном интеллекте довольно сложно, потому что это не просто история о машинах. Это также история о людях и свободе воли, позволяющей им принимать решения и управлять своей жизнью. Будущее ИИ строим мы, и оно зависит от выбора, который мы сделаем, и поступков, которые мы совершим. В ходе этого строительства, я надеюсь, мы сумеем заглянуть глубоко внутрь самих себя и найти мудрость, чтобы не сбиться с пути. В этом духе давайте и начнем наше исследование.

Глава 1. Запуск китайского «спутника»

Юный китаец в очках в квадратной оправе не был похож на последнюю надежду человечества. В черном костюме, белой рубашке и черном галстуке, Кэ Цзе сидел, ссутулившись и потирая виски, полностью погруженный в напряженные раздумья. Обычно излучающий уверенность, граничащую с дерзостью, сейчас этот девятнадцатилетний юноша неловко ерзал в кожаном кресле. Наблюдая такую картину в другом месте, его можно было бы принять за обычного студента, мучающегося над сверхтрудным доказательством геометрической теоремы.

Но на самом деле в этот майский день 2017 года он сражался с одной из умнейших машин – AlphaGo, обладающей мощным искусственным интеллектом, за созданием которого стояла вся мощь технологических ресурсов Google. Сражение шло на доске с полем 19 на 19 линий, уставленной маленькими черными и белыми камешками. Это были принадлежности для го – игры с обманчиво несложными правилами: два игрока, поочередно передвигая свои камни, пытаются окружить камни противника. Кэ Цзе играл в го лучше, чем любой другой человек на Земле, но сегодня ему противостоял невиданно сильный соперник. Считается, что го изобрели более 2500 лет назад, но его история уходит в прошлое глубже, чем история любой другой настольной игры из тех, что дошли до наших дней. В Древнем Китае умение играть в го входило в число четырех искусств, которыми обязан был владеть любой китайский ученый. Считалось, что го наделяет игроков мудростью и изяществом мысли, свойственными философии дзен. Тогда как западные игры, например шахматы, носят примитивно тактический характер, гo требует постепенно менять позиции на доске и медленно окружать противника, что превращает го в искусство, требующее особого состояния ума.

Сложность этой игры вполне соответствует древности ее истории. Чтобы изложить ее основные правила, достаточно девяти предложений, но число возможных комбинаций на доске го больше числа атомов в известной нам Вселенной[1 - Го и математика. Тактика и стратегия игры // Википедия. URL: https://en.wikipedia.org/wiki/Go_and_mathematics#Legal_positions (https://en.wikipedia.org/wiki/Go_and_mathematics#Legal_positions).]. Поскольку построение стратегий в го – невероятно сложный процесс, задача победить чемпиона мира по этой игре стала для специалистов по ИИ своеобразным Эверестом – попытки покорить его долго оставались бесплодными. Поэт сказал бы, что машина не сможет победить, поскольку у нее отсутствует важное человеческое качество – некое мистическое чувство игры. Инженеры же считали, что количество вероятных позиций на доске слишком велико, чтобы компьютер мог их просчитать. Но в этот день AlphaGo не просто победил Kэ Цзе – разгром следовал за разгромом. На протяжении трех матчей-марафонов, продлившихся более трех часов каждый, Kэ боролся с компьютером всеми доступными ему средствами. Он пытался одолеть его, используя различные тактики: консервативную, агрессивную, оборонительную и непредсказуемую.

Но ни одна из них не срабатывала. AlphaGo не поддавался. Вместо этого он медленно затягивал петлю вокруг «армии» Кэ.

Взгляд из Пекина

За поединком Kэ Цзе и AlphaGo следило множество людей, но не все воспринимали его одинаково.

Для некоторых наблюдателей из США победы AlphaGo означали не столько победу машины над человеком, сколько победу западных технологических компаний над всем остальным миром. За последние два десятилетия компании Кремниевой долины смогли завоевать рынки технологий. Facebook и Google стали ключевыми платформами для общения и поиска в интернете. Они подмяли под себя местные стартапы во многих странах – от Франции до Индонезии. Эти интернет-гиганты обеспечили США превосходство в цифровом мире, соответствующее их военной и экономической мощи в реальном мире. AlphaGo – продукт, созданный британским стартапом в области ИИ под названием DeepMind, который приобрела Google в 2014 году, – должен был укрепить позиции Запада в цифровом мире в эпоху искусственного интеллекта.

Но, глядя на матч с Кэ Цзе из своего офиса, я увидел нечто совершенно иное. Штаб-квартира моего венчурного фонда находится в пекинском районе Чжунгуаньцунь, который часто называют китайской Кремниевой долиной. Именно здесь ведутся самые передовые разработки в области искусственного интеллекта. Для работающих здесь людей победа AlphaGo стала одновременно брошенным им вызовом и источником вдохновения. Так что это событие сыграло в истории почти такую же роль, как запуск спутника Советским Союзом.

В октябре 1957 года СССР отправил на космическую орбиту первый в истории спутник, сделанный человеком. Это совершило переворот в сознании людей и серьезно повлияло на государственную политику Америки. Общественность США заволновалась из-за возможного технического превосходства СССР. Американцы следили за тем, как спутник пересекает ночное небо, и настраивали свои радиостанции на прием его сигналов.

Началась работа по созданию Национального управления по аэронавтике и исследованию космического пространства (НАСА), были выделены крупные государственные субсидии на развитие математики, науки и образования – так началась космическая гонка. Эта широкомасштабная мобилизация ресурсов принесла свои плоды 12 лет спустя, когда Нил Армстронг стал первым человеком, ступившим на поверхность Луны.

AlphaGo одержал свою первую громкую победу в марте 2016 года в серии из пяти игр против легендарного корейского игрока Ли Седоля. Серия закончилась со счетом четыре к одному. Причем большинство американцев вряд ли обратили внимание, что эти пять игр собрали более 280 млн китайских зрителей[2 - Мец К. Чему мы как люди можем научиться у ИИ, управляющего AlphaGo // Wired. URL: https://www.wired.com/2016/05/google-alpha-go-ai/ (https://www.wired.com/2016/05/google-alpha-go-ai/) (19 мая 2016 года).]. В тот вечер и вспыхнула в Китае лихорадка искусственного интеллекта. Реакция общества в целом была не такой бурной, как реакция американцев на запуск советского спутника, но пламя разгорелось и с тех пор не угасает.

Когда китайские инвесторы, предприниматели и чиновники объединяют усилия для развития какой-либо отрасли, результаты действительно могут потрясти мир. В наши дни Китай вкладывает огромные средства в научные исследования и поддержку предпринимательства, связанного с ИИ. Деньги для стартапов в области ИИ поступают от венчурных инвесторов, технологических гигантов и китайского правительства.

Китайские студенты заразились лихорадкой ИИ и тоже начали принимать участие в научных программах и слушать лекции международных исследователей со своих смартфонов. Основатели стартапов всерьез взялись за реинжиниринг или просто ребрендинг своих компаний, чтобы оседлать эту новую волну.

Менее чем через два месяца после того, как Кэ Цзе проиграл свою последнюю игру AlphaGo, Государственный совет КНР выпустил смелый план по развитию и внедрению ИИ, чтобы догнать и перегнать США[3 - Мозур П. Пекин хочет, чтобы ИИ появился в Китае к 2030 году // New York Times. URL: https://www.nytimes.com/2017/07/20/business/china-artificial-intelligence.html (https://www.nytimes.com/2017/07/20/business/china-artificial-intelligence.html) (20 июля 2017 года).]. Он требовал большого финансирования, политической поддержки и координации на государственном уровне. Были поставлены четкие задачи, которые предстоит выполнить к 2020 и 2025 годам, и обозначена главная цель – к 2030 году сделать Китай центром глобальных инноваций в области искусственного интеллекта, играющим ведущую роль в сфере теоретических разработок, технологии и внедрения. К 2017 году китайские венчурные инвесторы уже отреагировали на призыв, вложив в стартапы рекордные суммы, составившие 48 % всего венчурного финансирования ИИ в мире[4 - Винсент Д. Китай обгоняет нас в финансировании стартапов ИИ, работающих в области распознавания лиц и производства электронных чипов // Verge. URL: https://www.theverge.com/2018/2/22/17039696/china-us-ai-funding-startup-comparison (https://www.theverge.com/2018/2/22/17039696/china-us-ai-funding-startup-comparison) (2 февраля 2018 года).]. В этом отношении они впервые обогнали США.

Игра по новым правилам

Эту волну государственной поддержки в Китае породила новая парадигма в отношениях между искусственным интеллектом и экономикой. На протяжении десятилетий наука об искусственном интеллекте развивалась медленно, но устойчиво, и только в последнее время начала бурно прогрессировать, позволяя быстро внедрять научные достижения. Задачи технического характера, связанные с победой машины над человеком в игре го, мне хорошо знакомы. Будучи аспирантом Университета Карнеги – Меллона, я занимался разработками в области ИИ под руководством одного из первых его исследователей – Раджа Редди. В 1986 году я написал первую программу[5 - Ли К.-Ф., Махаджан С. Разработка программы мирового класса – «Отелло» // Artificial Intelligence 43. 1990. № 1. С. 21–36.], победившую чемпиона мира по игре «Отелло» (это упрощенная версия го, в которую играют на доске, разлинованной на 88 клеток). В то время я мог по праву гордиться таким результатом, но сама технология не была настолько зрелой, чтобы найти применение где-либо, кроме простых настольных игр.

То же самое можно сказать и о победе компьютера Deep Blue, созданного IBM, над чемпионом мира по шахматам Гарри Каспаровым в матче 1997 года, который называли «последним рубежом обороны человеческого мозга». После него многие забеспокоились, не пойдут ли роботы войной на человечество, но реальные последствия ограничились подорожанием акций IBM. Искусственный интеллект еще долго находил весьма ограниченное применение, и ученым понадобились десятилетия, чтобы сделать действительно фундаментальный шаг вперед.

Deep Blue действовал «грубой силой», полагаясь в основном на аппаратное обеспечение, которое позволяло быстро просчитывать и оценивать последствия каждого хода. Поэтому, чтобы дополнить его программное обеспечение направляющими эвристиками, понадобилась помощь сильнейших реальных шахматистов. Да, победа была выдающимся достижением инженерной мысли, но в ее основе лежала давно устоявшаяся технология, которая работала только при соблюдении множества условий. Заберите у Deep Blue геометрически простую квадратную шахматную доску восемь на восемь квадратов, и эта машина уже не покажется вам такой умной.

Однако теперь все изменилось. Во время игры Кэ Цзе против AlphaGo состязание шло в пределах доски для го, но было связано с серьезными изменениями в реальном мире. Победа программы породила настоящую лихорадку ИИ в Китае.

Работа AlphaGo основана на технологии глубокого обучения – новаторском методе в области искусственного интеллекта, позволяющем развивать когнитивные способности машин. Программы, основанные на глубоком обучении, теперь могут лучше, чем люди, идентифицировать лица, распознавать речь и выдавать кредиты. На протяжении десятилетий до революции искусственного интеллекта всегда оставалось каких-нибудь пять лет. Но с появлением глубокого обучения эта революция, наконец, началась. Она открыла дорогу эре небывалого повышения производительности, но также и масштабных потрясений на рынках труда, которые повлекут за собой глубокие социально-психологические последствия для людей, – ведь искусственный интеллект будет вытеснять их с рабочих мест. В матче с Кэ Цзе его соперниками стали не роботы-убийцы, управляемые ИИ, которыми нас давно пугают. Это были демоны реального мира, способные вызвать массовую безработицу и другие связанные с ней социальные бедствия. Угроза безработицы оказалась намного ближе, чем предсказывали эксперты, – при этом цвет воротничка уже не будет играть никакой роли: и высококвалифицированные, и простые сотрудники пострадают одинаково. В тот исторический день матча между AlphaGo и Кэ Цзе машина превзошла все человечество в игре в го. Вскоре она окажется рядом с вами в цеху и в вашем офисе.

Призрак в го-машине

[6 - Отсылка к культовому аниме «Призрак в доспехах», снятому по одноименной манге. Главная героиня – девушка-киборг – противостоит обретшей разум компьютерной программе. В аниме поднимаются философские вопросы о сути сознания и человечности. Здесь и далее прим. ред.]

Но во время того же матча я увидел и повод для надежды. Через 2 часа 51 минуту после начала игры Кэ Цзе оказался в тупике. Он сделал все возможное, но понимал, что этого недостаточно. Чемпион низко склонился над доской, поджал губы, и у него задергалась бровь. Не в силах сдерживать эмоции, он снял очки и тыльной стороной руки вытер слезы. Это длилось лишь мгновение, но произошло на глазах у всех. Слезы чемпиона вызвали мощную волну сочувствия и поддержки: в течение трех партий матча Kэ пережил невероятные эмоциональные взлеты и падения, испытав поочередно уверенность, тревогу, страх, надежду и отчаяние. Он показал сильнейшую волю к победе, но помимо всего я смог увидеть и проявление подлинной увлеченности: готовность сразиться с непобедимым соперником ради чистой любви к игре, ее истории, и ради людей, которые в нее играют. И все, кто наблюдал за матчем и крушением надежд Кэ, ответили ему искренним сочувствием. AlphaGo выиграл, но Кэ стал народным героем. Это заставило меня задуматься о том, что раз человеческие существа способны делиться друг с другом любовью, то они смогут найти работу и смысл жизни в век искусственного интеллекта. По-моему, умелое применение ИИ даст Китаю отличный шанс догнать – и даже превзойти США. Но что еще более важно, переворот поможет нам заново осознать, что же делает нас людьми. И чтобы понять почему, мы должны сначала познакомиться с основами этой технологии и разобраться, как именно она может изменить наш мир.

Краткая история глубокого обучения

Машинное обучение – это обобщающий термин для области, к которой относится и глубокое обучение – технология, способная повлиять на ход истории, и благополучно выдержавшая полвека энергичных исследований. С момента своего зарождения искусственный интеллект претерпел не один цикл взлетов и падений. За периодами больших надежд следовали периоды разочарования (их еще называют «зимами искусственного интеллекта»), когда отсутствие практических результатов приводило к потере интереса и сокращению финансирования. Чтобы понять, как мы пришли к глубокому обучению, необходим краткий экскурс в историю. Еще в середине 1950-х годов пионеры искусственного интеллекта поставили себе невероятно смелую, но четкую цель – воссоздать человеческий интеллект в машине. Это поразительное сочетание ясности цели и сложности задачи станет притягательным для величайших умов в области компьютерных наук, таких как Марвин Минский, Джон Маккарти и Герберт Саймон. В начале 1980-х годов, когда я изучал информатику в Колумбийском университете, оно поразило и мое воображение. Я родился на Тайване в начале 1960-х годов, но, когда мне было 11 лет, мы переехали в Теннесси, и там я окончил среднюю школу. Через четыре года я принял решение углубленно изучать ИИ в Колумбийском университете в Нью-Йорке. В 1983 году в разделе анкеты, где нужно было указать цель поступления в аспирантуру по информатике, я смело написал: «Исследование искусственного интеллекта – это анализ того, как человек усваивает знания, количественная оценка его мышления, объяснение человеческого поведения и разгадка того, что делает существование интеллекта возможным; это решающий шаг человечества к пониманию самого себя, и я надеюсь сделать что-то для этой новой, но перспективной области науки». Эти слова помогли мне попасть на ведущий факультет компьютерных наук Университета Карнеги – Меллона, очага передовых исследований ИИ. Но они же продемонстрировали мою наивность: я переоценивал нашу способность понимать себя и недооценивал возможности ИИ показывать сверхчеловеческие результаты в узких областях.

К тому времени, когда я начал писать кандидатскую диссертацию, в среде исследователей искусственного интеллекта сформировались два течения: одно объединяло сторонников выбора действий на основе правил, другое поддерживало принцип нейронных сетей. Исследователи из первого лагеря (их иногда называют сторонниками символических систем или экспертных систем) пытались научить компьютеры мыслить, кодируя последовательности логических правил: если X, то Y. Этот подход был хорошо применим для простых игр с четкой структурой («искусственные задачи»), но прекращал работать при расширении множества возможных вариантов. Чтобы сделать программное обеспечение способным решать проблемы реального мира, сторонники этого подхода опрашивали экспертов по тем или иным задачам, а затем кодировали их ответы в виде программ (отсюда второе название – «экспертные системы»).

Однако ученые из лагеря нейронных сетей использовали другой подход. Вместо того чтобы учить компьютер правилам, по которым действовал человеческий мозг, они пытались его реконструировать. Насколько нам известно, запутанные сети нейронов в мозге животных – единственная основа интеллекта, и исследователи полагали, что можно напрямую воссоздать эту основу. Они поставили перед собой задачу имитировать архитектуру мозга, выстраивая слои искусственных нейронов, способных получать и передавать информацию внутри структуры подобно нейронам живых существ. Электронным нейронным сетям не задают правил, которым надо следовать при принятии решений. В них просто вводят большое множество примеров какого-либо явления – картинок, шахматных партий, звуков – и позволяют сетям самим определять закономерности внутри массива данных. Иначе говоря, чем меньше человеческого вмешательства, тем лучше.

Различия между двумя подходами можно увидеть на примере простой задачи, в которой надо определить, есть ли на рисунке кошка. Чтобы помочь программе принять решение, основанный на правилах метод требует установить правило типа «если – то»: если сверху круга расположены два треугольника, то, возможно, кошка на рисунке есть. При использовании метода нейронных сетей программа получит миллионы образцов в виде фотографий с пометкой «кошка» или «нет кошки» и попытается самостоятельно выяснить, какие признаки в миллионах изображений наиболее тесно коррелируют с пометкой «кошка». В 1950-х и 1960-х годах ранние версии искусственных нейронных сетей дали многообещающие результаты и наделали немало шума. Но потом в 1969 году лагерь сторонников правил вырвался вперед, используя аргумент, что нейронные сети ненадежны и ограничены в применении. Метод нейронных сетей быстро вышел из моды, и в 1970-х годах наступила первая «зима искусственного интеллекта». В течение последующих десятилетий о нейронных сетях то вспоминали, то снова забывали. В 1988 году я использовал подход, похожий на метод нейронных сетей (скрытые марковские модели), чтобы создать Sphinx – первую в мире независимую от говорящего программу для распознавания непрерывной речи[7 - Ли К.-Ф. О распознавании естественной речи без обучения на образцах речи говорящего // Speech Coomunication 7. 1988. № 4. С. 375–379.]. О моем достижении написали в New York Times[8 - Маркофф Д. Разговор с машинами: прогресс ускоряется // New York Times. URL: https://www.nytimes.com/1988/07/06/business/business-technology-talking-to-machines-progress-is-speeded.html?mcubz=1.HTML-код?mcubz=1 (https://www.nytimes.com/1988/07/06/business/business-technology-talking-to-machines-progress-is-speeded.html?mcubz=1.HTML-%D0%BA%D0%BE%D0%B4?mcubz=1) (6 июля 1988 года).]. Но этого оказалось недостаточно, и с началом долгого «ледникового периода» в области ИИ, растянувшегося почти на все 1990-е годы, о нейронных сетях снова забыли.

В конечном счете сегодняшнему возрождению метода способствовали технологические прорывы, касающиеся двух важных базовых элементов нейронных сетей. Я имею в виду большую вычислительную мощность и большие объемы данных. Данные «обучают» программу распознавать шаблоны, обеспечивая ее множеством образцов, а вычислительная мощность позволяет ей быстро анализировать эти образцы.

На заре ИИ, в 1950-х годах, не хватало как данных, так и вычислительной мощности. Но за прошедшие десятилетия все изменилось. Сегодня вычислительная мощность вашего смартфона в миллионы раз больше, чем мощность передовых компьютеров НАСА, отправивших Нила Армстронга на Луну в 1969 году. Появление интернета привело к накоплению самых разнообразных текстов, изображений, видео, кликов, покупок, твитов и так далее. В распоряжении исследователей оказались огромные объемы данных для обучения нейронных сетей, а также дешевые вычислительные мощности высокой производительности. Но сами сети все еще были сильно ограничены в возможностях. Для получения точных решений сложных задач требуется много слоев искусственных нейронов, но на тот момент исследователи еще не нашли способ эффективно обучать слои по мере их добавления. Прорыв в этом направлении, наконец, состоялся в середине 2000-х годов, когда ведущий исследователь Джеффри Хинтон обнаружил способ эффективного обучения добавленных слоев. Нейронные сети словно получили дозу стероидов и обрели невиданную мощь, достаточную, чтобы распознавать речь и объекты. Вскоре нейронные сети, названные новым модным термином «глубокое обучение», уже могли превзойти старые модели в решении различных задач. Однако укоренившиеся предрассудки о методе нейронных сетей заставили многих исследователей ИИ игнорировать технологию, которая тем не менее показывала выдающиеся результаты. Поворотный момент наступил в 2012 году, когда сеть, построенная командой Хинтона, одержала убедительную победу в международном конкурсе компьютерного зрения[9 - Речь идет о соревновании Large Scale Visual Recognition Challenge. Алгоритмы, представленные соревнующимися командами, должны распознавать, что изображено на картинках. Прим. науч. ред.], [10 - ImageNet – решение задач визуального распознавания 2012, полные результаты. URL: http://image-net.org/challenges/LSVRC/2012/results.html (http://image-net.org/challenges/LSVRC/2012/results.html).].

После десятилетий самоотверженных исследований нейронные сети в одночасье вышли на передний план, теперь в виде глубокого обучения. Этот прорыв обещал растопить лед последней «зимы» ИИ и впервые позволить по-настоящему использовать его силу для решения ряда реальных проблем. Исследователи, футуристы и технические специалисты – все начали твердить о колоссальном потенциале нейросетей. Ожидалось, что скоро они научатся понимать человеческую речь, переводить документы, распознавать изображения, прогнозировать поведение покупателей, выявлять мошенничества и принимать решения о кредитовании, а еще подарят новые способности роботам – от зрения до умения водить машину.

За кулисами глубокого обучения

Так как же работает глубокое обучение? По существу, чтобы получить решение, оптимизированное в соответствии с желаемым результатом, эти алгоритмы используют огромные объемы данных из определенного домена. Самообучающаяся программа решает задачу, обучаясь распознавать глубоко скрытые закономерности и корреляции, связывающие множество точек данных с желаемым результатом. Такой поиск зависимостей становится проще, когда данные имеют пометки, связанные с результатом: «кошка» против «нет кошки»; «нажал» против «не нажимал»; «выиграл игру» против «проиграл игру». Тогда машина может опираться на свои обширные знания об этих корреляциях, многие из которых невидимы или не имеют смысла для человека, и принимать лучшие решения, чем сам человек. Однако для этого требуется огромное количество данных, мощный алгоритм, узкая область и конкретная цель. Если вам не хватает чего-либо из перечисленного, метод не сработает. Слишком мало данных? Алгоритму не будет хватать образцов, чтобы выявить значимые корреляции. Неточно поставлена цель? Алгоритму не хватит четких ориентиров для оптимизации. Глубокое обучение – это то, что известно как «ограниченный ИИ» – интеллект, который берет данные из одного конкретного домена и использует их для оптимизации одного конкретного результата. Это впечатляет, но все еще далеко от «ИИ общего назначения» – универсальной технологии, способной делать все, что может человек. Глубокое обучение находит самое естественное применение в таких областях, как страхование и кредитование. Соответствующих данных о заемщиках предостаточно (кредитный рейтинг, уровень дохода, недавнее использование кредитных карт), и цель оптимизации ясна (минимизировать уровень неплатежей). Сделав следующий шаг в развитии, глубокое обучение приведет в действие самоуправляемые автомобили, помогая им «видеть» мир вокруг них: распознавать объекты в пиксельном изображении с камеры (например, красные восьмиугольники), выяснять, с чем они коррелируют (дорожные знаки «Стоп»), и использовать эту информацию для принятия решений (задействовать тормоз, чтобы медленно остановить автомобиль), оптимальных для достижения желаемого результата (доставить меня безопасно домой в минимальные сроки).