Искусственный интеллект и язык

Оригинальная статья

Концепция искусственного интеллекта известна уже давно. Все мы знаем компьютер HAL 9000 из фильма «2001: Космическая Одиссея», C-3PO из «Звездных войн» и Саманту из наиболее поздней картины «Она». Если говорить о жанре фантастики в литературе, герои с искусственным интеллектом (ИИ) появляются в произведениях Филипа К. Дика, Уильяма Гибсона и Айзека Азимова. Иногда возникает ощущение, что нет ни одного писателя-фантаста, который не затронул бы эту тему.

Но если многие предсказания и идеи, выдвинутые в научной фантастике, стали реальностью, то искусственному интеллекту до этого, вероятно, очень далеко. Мы и близко не подошли к созданию настоящего искусственного интеллекта упомянутых персонажей.

Порой кажется, что ждем мы уже целую вечность. Мы можем задать простые вопросы Siri, Google или Cortana, и они ответят, но все, кто использовал такую технологию, рано или поздно разочаровывались. Когда Siri только появилась, мы думали, что это и есть будущее, но сейчас большинство из нас обращаются к ней разве что для поиска в Google и дают предельно простые задания вроде установки таймера.

Причина того, что эти программные продукты так далеки от идеала, заключается в языке. Вот здесь и должна сыграть свою роль обработка естественного языка (natural language processing, NLP). ИИ может уловить смысл простых языковых образований и даже ответить, но он ограничен буквальностью собственной интерпретации вопросов. Компьютер может знать определение слов, но он не понимает их значения в более широком контексте.

Если вы интересуетесь технологиями или увлекаетесь научной фантастикой, вы, вероятно, слышали о тесте Тьюринга. Алан Тьюринг был одним их первых, кто всерьез задумался о потенциале ИИ, он верил, что однажды интеллект машин сможет сравняться с человеческим. Он выдвинул идею простого теста: если в ходе беседы человек не может отличить машину от другого человека, значит, машина достигла уровня человеческого интеллекта.

Тест Тьюринга на самом деле несколько сложнее, но его концепция до сих пор применима в качестве целевого ориентира обработки естественного языка. Иными словами, если машина может думать, как человек, она умеет и обрабатывать язык, как человек (учитывая сложность нашего мозга, способность машины думать наравне с человеком — огромное достижение).

Нужны ли нам андроиды, декламирующие стихи?

Возьмем персонаж Скарлетт Йоханссон из фильма «Она». Это отличный пример ИИ, легко воспринимающего язык. Она понимает все, что говорит Тео, которого играет Хоакин Феникс. Каких-то вещей она не знала, но, услышав объяснения, тут же понимала их и добавляла в свою базу знаний. Ровно так же, как сделал бы человек.

Другая интересная форма ИИ — репликанты из фильма «Бегущий по лезвию». Они не просто с легкостью обрабатывают язык, они еще и поэтичны. Оцените высказывание репликанта Роя Батти:

«Я видел нечто, во что вы, люди, просто не поверите. Горящие боевые корабли на подступах к Ориону. Я видел си-лучи, пробивающие тьму, близ врат Тангейзера. И все эти мгновения растворятся во времени… как… слезы под дождем. Пора умирать».

Эта цитата стала известной благодаря своей красоте и человечности. Мы хотим создать поэтичных андроидов? Они нужны нам? Это тема для научно-фантастической сюжета, но факт остается фактом: Рой отлично знает язык и понимает эмоции, которые вызывает его речь.

ИИ подобного рода присутствует в произведениях фантастики уже не один десяток лет. Но нам так и не удалось воплотить эти идеи в жизнь. Чем больше информации мы получали о том, как создать настоящий ИИ, и о программе NLP, тем отчетливее понимали, что знания наши близки к нулю. И вопрос здесь нужно ставить шире, ведь мы практически ничего не знаем и о человеческом мозге. Мы не сумели создать ничего, что думало бы, как человек, потому что мы понятия не имеем, как думает человеческий мозг.

На данном этапе мы выделяем три уровня ИИ. Я не опишу их точнее, чем Тим на ресурсе Wait But Why, так что лучше процитирую:

ИИ 1-й ступени. Узкий искусственный интеллект (УИИ), иногда еще называется слабым ИИ. Это ИИ со специализацией в одной области. Есть ИИ, которые способны только обыграть чемпиона мира по шахматам, и больше ничего. Спросите такую машину, как лучше хранить данные на жестком диске, — и наткнетесь на отсутствующий взгляд.

ИИ 2-й ступени. Общий искусственный интеллект (ОИИ), также называется сильным ИИ или ИИ человеческого уровня. Термином ОИИ обозначается компьютер, который в целом умен, как человек. Это машина, способная выполнять любые интеллектуальные задания, доступные человеческому существу. Создать ОИИ гораздо сложнее, чем УИИ, и нам это только предстоит.

ИИ 3-й ступени. Искусственный суперинтеллект (ИСИ). Ник Бостром, оксфордский философ и идеолог ИИ, определяет суперинтеллект как «интеллект, существенно превосходящий лучшие человеческие умы в любых областях, включая научное творчество, универсальные знания и социальные навыки».

Недавно я услышал то, что прочно засело у меня в голове: оказывается, люди в состоянии производить физические и тригонометрические вычисления буквально с ходу. Когда футбольный мяч взлетает вверх, мы можем сказать, когда и где он приземлится. Это знают и квотербеки, бросающие мяч. Они выполняют сложные вычисления и вкладывают их в свои физические действия. Невероятно, если вдуматься! Но ведь мы и представления не имеем, как нам это удается.

Как разработать ИИ, способный делать вещи, которых мы даже не понимаем?

Дональд Кнут, специалист по информатике и бывший преподаватель Стэнфорда, однажды сказал: «ИИ преуспел в выполнении операций, требующих мыслительных процессов, но не в том, что мы делаем неосознанно». Вот к чему все сводится на самом деле, поскольку мы не понимаем, как человеческий мозг обрабатывает то, над чем не нужно думать. Включая язык. Когда мы слушаем или читаем что-то на языке, которым свободно владеем, мы не думаем об обработке слов. Это просто происходит.

Так как же разработать ИИ, способный делать вещи, которых мы сами не понимаем? Над этим продолжают работать и гиганты вроде Google и Palantir, и многие стартапы, включая X.ai, MetaMind, Feedzai, Signal N, Lilt, и множество других компаний.

Мы испробовали несколько путей преодоления этих препятствий.

Имитация эволюции

Хотя мы многого не знаем о том, как работает человеческий мозг, мы знаем чуть больше о том, как он пришел к этому состоянию, то есть о естественном отборе. Поэтому некоторые пробуют искусственно применить принцип естественного отбора к машинам, с той разницей, что на это уйдут не миллионы лет, поскольку элемент случайности здесь менее выражен.

Этот подход называется эволюционным моделированием или генетическими алгоритмами. Машины выполняют определенные задания, и, когда одна из них проходит испытания с допустимым количеством ошибок, она комбинируется с другими машинами, так же успешно прошедшими испытания. Однако это итеративный процесс, который представляет проблему: мы не знаем, сколько времени понадобится на создание интеллекта, равного нашему.

На данный момент этот метод признан неудачным, и он практически заброшен в 1990-х годах.

Вдохновение от природы

Наш мозг — это биологическая нейронная сеть, поэтому компании и строят искусственные нейронные сети. Методом проб и ошибок они пытаются воспроизвести способы обработки мозгом информации и нейронные маршруты, которые ведут к правильному ответу. На самом деле искусственные нейронные сети имеют гораздо меньше общего с биологическим мозгом, чем отражает их название. Искусственные нейронные сети — это грубая математическая модель, схема, созданная на основе наших скудных знаний о мозге.

И все-таки люди проделывают с нейронными сетями невероятные вещи. Недавно в Сети появился презабавный, пусть и дурашливый, пример использования технологии. Человек по имени Энди Херд ввел все тексты сценариев телесериала «Друзья» в рекуррентную нейронную сеть. Она смогла овладеть стилем их написания, личностями персонажей и самостоятельно написать сценарии.

Они довольно нелепы и бессмысленны, но сам факт, что это вообще состоялось, — большой шаг вперед от той черты, где мы были несколько лет назад. С помощью машинного обучения ИИ будет и дальше совершенствоваться. А сейчас ему как минимум удалось ухватить суть характера Чендлера: «Чендлер (в кексе) (бежит к девочкам и кричит): Можно мне подарки?» Любой, кто смотрел «Друзей», знает, что это классический Чендлер, даже если сама интерпретация… по меньшей мере абсурдна.

Потенциал ИИ сделает доступным преодоление языкового барьера.

Энди использовал электронную библиотеку по машинному обучению TensorFlow от Google (открытый источник) для создания потрясающего и очень значимого генератора скриптов. Google встроил ее во многие свои продукты — от Photos до Search и Gmail — и, разумеется, в Google Now — приложение, которое, в сущности, берет все, что Google знает о вас и использует для выдачи полезной и актуальной информации. Его также можно считать Google-версией Siri.

Глубинное обучение имеет огромный потенциал совершить революцию в области ИИ и помочь нам сделать следующий шаг. Но есть и другие решения, над которыми работают люди.

кадр из фильма Entertainment

Пусть машины проектируют себя сами

Совершенно очевидно, что воспроизвести человеческий интеллект непросто, и никто не знает, сработают ли вообще другие наши методы и произойдет ли это в обозримом будущем. Поэтому кто-то хочет создать машины, которые сделали бы себя разумными сами — путем исследований, обучения и самоконтроля. Похоже, именно так действует Саманта из фильма «Она». Она способна обучаться точно так же, как человек, только быстрее.

В начале фильма Тео нужно многому ее научить, а в конце ее интеллект намного превосходит его собственный. Это экспоненциальный процесс. Выражаясь доступным языком, чем больше она узнает, тем больше способна узнать. Возможно, это приведет нас к кардинально новым типам интеллекта, создаваемого скорее машинами, чем людьми.

Это приводит нас к мысли, что на искусственный интеллект распространяется закон Мура, который гласит, что вычислительная мощность удваивается каждые два года. Речь идет об увеличении мощности в геометрической прогрессии. И хотя темпы начинают замедляться, рост по-прежнему экспоненциальный. Это уже заметно. Глубинное обучение было известно еще в 1970-х годах, но экспоненциальный рост вычислительной мощности и объема данных в значительной мере обеспечил прорывы, которые мы наблюдаем сейчас.

Та же история с новым сервисом Facebook M, который встроен в приложение Messenger. Он задуман как личный ассистент пользователя. Facebook утверждает, что М умеет все то же, что и человек, и все потому, что их программы работают с реальными людьми. В конце концов ИИ не способен позвонить в ресторан и забронировать столик, но люди на той стороне — вполне. Когда вы делаете запрос и М не может его обработать самостоятельно, он отправляет сообщение партнеру Facebook, и по мере того, как люди работают с программой, ИИ обучается. М пока недоступен широкому кругу пользователей, но у него, похоже, большой потенциал.

Facebook очень активно занимается ИИ. Они разрабатывают множество технологий (вроде функции распознавания фотографий, помогающей «увидеть» их незрячим), но самое ценное — их попытка решить проблему «понимания» в рамках обработки естественного языка. Как уже упоминалось, ИИ пока не способен читать и слушать на человеческом уровне — он просто обладает специфическими знаниями. Он знает, что означает слово или предложение, но не может сделать вывод, о чем говорится в абзаце.

С этим Facebook и пытается справиться. В прошлом году они продемонстрировали невероятную программу. Они загрузили краткое содержание «Властелина колец», и после этого ИИ смог ответить на некоторые вопросы, простые и ясные для нас, но очень сложные для компьютера.

Но один из самых сильных способов применения обработки естественного языка принадлежит Microsoft: недавно они встроили в Skype функцию перевода «с ходу». Вы можете разговаривать с иноязычным собеседником, а Skype будет переводить его речь для вас практически без задержек.

Это большое событие для международной коммерческой среды, да и для общества в целом. Представьте, насколько выше была бы наша продуктивность без языковых барьеров, у скольких людей мы могли бы учиться, со сколькими разговаривать, хотя раньше это было нам недоступно, насколько успешнее стал бы международный бизнес, например, для небольших компаний, которые не могут позволить себе содержать штат переводчиков.

Без языковых барьеров мир становится открытым, особенно для тех, кто не пользуется привилегиями жителей стран «первого мира».

Нам еще долго идти к тому, чтобы компьютеры начали понимать язык. Каждый язык — сложная система, включающая разнообразные тонкости, диалекты, сленг, смыслы, эмоции, интонации, нарратив и контекст. И все это машинам трудно понять. Такие программы, как TensorFlow и CNDK, — большой шаг вперед, но, чтобы попасть туда, куда нам нужно, требуется взаимодействие с человеком.

И все-таки мы обязательно туда попадем, пусть и минимум через 15 лет. Саманта из фильма «Она», HAL из фильма «2001: Космическая Одиссея», C-3PO из «Звездных войн» и все остальные чудеса искусственного интеллекта, обещанные нам, — это неизбежность. ИИ необязательно должен быть представлен физически, в форме андроида или робота. Но он должен думать как человек. Преодоление языкового барьера сделает доступным потенциал ИИ. А пока совместная работа ИИ и человека — лучший способ извлечь выгоду из сегодняшних технологий. Мы не должны ждать. Мы можем изменить мир с помощью ИИ уже сейчас.

(1 голосов, оценка: 5,00 из 5)

Загрузка...

Искусственный интеллект и язык

Рубрики: Софт и технологии, Статьи

Рубрики

Поиск по блогу

Архив

Авторы

Хотите стать автором?

Наши партнеры и коллеги