Автор: Мэрион Маркинг. Оригинальная статья
Существует несколько важных направлений влияния инноваций в сфере обработки естественного языка (NLP) на сектор языковых услуг. Машинный перевод, системы автоматизированного перевода, предиктивный набор текста и другие технологии — все это опирается на успехи NLP.
Развитие NLP началось в 1950-х годах, первые прорывы пришлись на конец 1980‑х, мы наблюдаем их и в наши дни — в связи с существенным увеличением объема данных. По иронии, в сфере, где люди пытаются научить компьютеры понимать язык, нет общепринятого определения самого термина NLP, что, в свою очередь, приводит к большому разнообразию оценок объема рынка NLP.
По прогнозу MarketsandMarkets прошлого года, к 2020 году объем мирового рынка NLP достигнет 13,4 млрд долларов. Technavio в начале нынешнего года заявил, что ожидает роста рынка NLP до 11 млрд долларов к 2019 году.
А вот предсказание Tractica: общий доход сектора NLP вырастет с 277 млн долларов в 2015 году до 2,1 млрд в 2024-м. Когда же рынок NLP успел стать таким крошечным? Или таким огромным, судя по двум первым отчетам?
Разница в цифрах появляется из-за слишком расплывчатого определения NLP
Вездесущий MarketsandMarkets, кажется, применяет самое широкое и структурированное определение того, что способствует росту NLP. В своем исследовании они классифицируют участников рынка NLP следующим образом: по типам NLP (на базе правил, статистическая и гибридная NLP), по технологиям (распознавание, операции, аналитика), по сервисам (профессиональные сервисы, поддержка, обслуживание), по размещению (локальное, по запросу), по применению (МП, извлечение данных, генерирование отчетов, ответы на вопросы и т. д.), по вертикали (8 специфических + 1 обобщающий термин «прочее»), а также по регионам. В принципе они рассматривают все и делают собственные прогнозы.
MarketsandMarkets предполагал, что рынок NLP «вырастет до 13,4 млрд долларов к 2020 году при совокупных темпах годового роста в рассматриваемый период 2015—2020 годов на уровне 18,4 %». Если сделать расчет за прошедшее время, получается, что сейчас доход от NLP составляет 5,76 млрд долларов.
Technavio делит рынок на сегменты в зависимости от того, кто является конечным пользователем, но рассматривает только пять обширных категорий: здравоохранение; электронная торговля; IT и телекоммуникации; банковские, финансовые и страховые услуги; прочее. Их прогноз роста рынка NLP таков: 22 млрд долларов к 2019 году при совокупных темпах годового роста на уровне 16 %. Если сделать расчет за прошедший период, получается, что сейчас доход от NLP составляет примерно 6 млрд долларов, что мало отличается от цифр, выведенных на основании прогноза MarketsandMarkets, несмотря на более узкое определение NLP у Technavio.
Выходит, если в Tractica оценивают размер дохода от NLP в 2015 году всего лишь в 277 млн, значит, они существенно сужают спектр движущих сил NLP, верно? А вот и нет. В обзоре основоположника исследований искусственного интеллекта Клинта Уилока, к которому Slator обратился за комментариями, отмечается, что Tractica считает NLP «обобщающим термином, применимым к разнообразным областям, связанным с компьютерами».
Прогнозируя рост рынка NLP до 2,1 млрд долларов к 2024 году, Tractica рассматривала несколько отраслевых вертикалей (в трех из них NLP уже является конкурентным преимуществом, в шести — предположительно станет таковым, еще в шести — не в такой степени), а затем добавила показатели доходов от программного и аппаратного обеспечения, а также от услуг.
Уилок признал, что, хотя в новом отчете Tractica «машинный перевод несколько раз упоминается как ключевой случай применения NLP», они «не рассматривают этот сегмент рынка как самостоятельный и не включили его в прогноз».
Мы обратились к аналитику и консультанту в сфере NLP Сету Граймсу с просьбой прокомментировать большое расхождение в оценках рынка.
По мнению Граймса, «подсчитать вклад NLP в доход от более крупных продуктов и услуг, применяющих NLP… проблематично».
Он пояснил, что продукты NLP, применяемые в широко распространенных технологиях, могут быть «слишком новыми или узкими, чтобы по-настоящему привлечь внимание аналитиков крупных компаний».
Граймс также коснулся вопроса зрелости рынка. Он сказал, что, например, рынку интеллектуального анализа данных уже около 30 лет, а серьезные попытки коммерческого применения анализа текста (включающего NLP) были предприняты только в 2004 году. Он отметил, что «более новые и специализированные аналитические технологии не так широко применяются в деловых операциях, несмотря на их способность положительно влиять на взаимодействия участников бизнес-процесса».
Так что же следует исключить из прогнозов роста рынка NLP? Граймс считает — «академические, правительственные и промышленные исследования», поскольку, как он пояснил, эти «виды деятельности не влияют на объем рынка до тех пор, пока что-нибудь (продукт или услуга) не будет продано».
Кроме того, он отказался бы от «видов работ, выполняемых внутри компаний и время от времени имеющих значительную стоимость, например от анализа текста, осуществляемого компаниями вроде Thomson Reuters или Reed Elsevier в процессе создания информационных продуктов».
Tractica, полагает Граймс, все же зашла слишком далеко в деле исключения. Он обратил внимание на то, что в отчет Tractica включены персональные помощники, например Siri от Apple, а между тем «в 2015 году продан 231 миллион iPhone по цене несколько сотен долларов. Если технологии NLP в программе Siri на каждом проданном устройстве стоят четверть доллара, получается, что только здесь стоимость NLP — 56 млн долларов. Но необходимо также учесть, что в Siri и других системах используется голосовая технология от Nuance, работающая с речью, текстом и изображениями, а NLP лежит в основе большинства комплектов продукции Nuance. Доход Nuance в 2015 году составил 1,93 млрд долларов США». Лишь одна эта сумма почти в семь раз превышает общий показатель объема рынка, выведенный Tractica.
Граймс также подверг сомнению список отобранных Tractica 20 ключевых игроков отрасли, спрашивая, «как именно Tractica пришла к своей оценке таких компаний, как Google (NLP необходима для поиска) и IBM (NLP — ключевой компонент Watson)».
Он охарактеризовал список как «катастрофически неполный», но включающий при этом «по меньшей мере две компании, которые являются самыми маленькими на рынке, — Aylien и Genee — и еще несколько небольших компаний».
Кроме того, Граймс отметил, что в списке Tractica есть компании вроде BirdEye — «мелкие и использующие NLP лишь в неосновных видах деятельности», — но отсутствуют такие, как HP, Facebook, SAP, и более сотни других, за чьими успехами следит сам Граймс.
В статье, опубликованной на ресурсе Slator в этом месяце, Граймс отметил: «NLP присутствует как корневой элемент почти во всем, что создают Google и Baidu, а также во многом из того, что составляет бизнес Facebook, IBM, Amazon и Microsoft».
Вывод таков: большая разница в цифрах говорит о том, что среда еще слишком далека от зрелого состояния. А это, в свою очередь, означает, что бурное развитие инноваций продолжится.