Вверх

Бюро переводов «Прима Виста»
входит в ТОП-20 переводческих
компаний России 2018 г.
English version
Главная Статьи Это интересно Да услышит компьютер
  • Facebook
  • В Контакте
 
 
 
×
Мы перезвоним

Укажите номер телефона, и наш специалист перезвонит в течение 15 минут. Во внерабочее время мы позвоним на следующий рабочий день

Нажимая на кнопку, вы даёте согласие на обработку своих персональных данных

Жду звонка

×
Узнать стоимость

Заполните поля формы — наш специалист свяжется с вами в течение 15 минут и сообщит стоимость работы.

Приложить файлы на оценку

Мы не передаём данные третьим лицам и не рассылаем спам.
Нажимая на кнопку, вы даёте согласие на обработку своих персональных данных

×
Выберите удобный для Вас способ связи

Да услышит компьютер

В течение нескольких месяцев с ноября 2004 года редакция газеты The Sun следила за работой небольшой фирмы в городе Колумбия, которая заявила о создании технологии, способной заменить клавиатуру с мышью на человеческий голос.

Триша БИШОП, Перевод английского текста выполнен в бюро переводов «Прима Виста», нотариальный перевод в Москве,  Источник: http://www.baltimoresun.com/business/bal-sonum1107,0,3904350.story

Вот оно. Воплощается в жизнь. Докторская диссертация, написанная несколько десятков лет назад, переросла в реально существующий продукт, продвигаемый сосем еще молодой компанией, которая устроила презентацию в актовом зале без окон, возвышающимся над заполоненными такси улицами на Таймс-сквер.

Ребята из Sonum Technologies Inc. в себе уверены, но слегка нервничают. Они стоят у своего стенда на конференции — все в пиджаках, ноги на ширине плеч, — «сканируя» передвигающуюся по холлу массу поставщиков и руководителей среднего звена, целый легион в теннисках и темных костюмах.

Вокруг — более ста других фирм, и все раздают подарки: летающие тарелки «Фрисби» и оранжевые резиновые мячики. Одна из компаний, не уверенная в действенности бесплатных конфет и ручек, поставила барную стойку с пивом. По мере того как продвигающие свою продукцию стараются привлечь внимание присутствующих, напряжение и шум только возрастают. Особенно стараются участники с логотипом Microsoft на бейджиках.

Ситуация из разряда «пан или пропал». Здесь, более чем за 200 миль от своего колумбийского офиса, ребята из Sonum смогут понять, так ли они хороши, как им кажется. Сотрудники компании, чье название переводится с латыни как «звук», последние полтора года оттачивали свою технологию и теперь хотят получить подтверждение того, что первые результаты их работы можно реально использовать. Они пока даже не уверены, что кому-то вообще понравится то, что они в скором времени собираются предложить: отсутствие мыши и клавиатуры в век компьютеризации.

Затянувшийся роман

Люди довольно давно стремятся воплотить в жизнь, или по крайней мере романтизируют, то, что по сути является технологией Sonum. Вот уже полвека в научной фантастике и поп-культуре муссируются проблемы взаимоотношений искусственного интеллекта и человека: семейка Джетсонов с их роботом-горничной в мультсериале 1960-х годов; KITT, разговаривающий Понтиак в претенциозном телесериале 1980-х годов «Рыцарь дорог»; механические дети, такие как персонаж Хэйли Джоэла Осмента в фильме 2001 года «Искусственный разум».

Реальность еще далека от этих фантазий. Некоторые машины способны записывать начитываемый текст, но программы зачастую ненадежны и не подразумевают настоящего общения и взаимодействия. Другие, подобно голосовым меню в телефонах, воспринимают произносимые человеком команды, но обычно активизируются лишь за счет определенных ключевых слов. Они не распознают запинок и пауз, слов-паразитов типа «э-э», «короче» и грамматических ошибок разговорной речи.

И никому не удавалось понять, как заставить их все это учитывать, — до сих пор, как утверждает Sonum. Алгоритмы и программные процессы, заключенные в их программном обеспечении, направлены на то, чтобы обучить машины человеческому языку: понимать его, интерпретировать и давать адекватные ответы.

Одни независимые эксперты продолжают упорствовать, заявляя, что эта цель недостижима. Другие потерпели фиаско в попытке ее достичь и сдались или по крайней мере сменили поле деятельности. Сегодня технический персонал Sonum — четыре человека — соревнуется с исследователями самых крупных образовательных учреждений и компаний, работающих с высокими технологиями, такими как Microsoft, которые все еще занимаются похожими проектами. Но большинство их конкурентов уже не ставят своей целью — как Sonum — создание такого вида искусственного разума, который позволит пользователям управлять компьютерами только посредством речи.

«Речь — самый естественный способ взаимодействия, но в некоторых случаях гораздо проще и удобнее воспользоваться мышкой или клавиатурой, — говорит Джеймс Мастан, директор по маркетингу одного из подразделений гиганта программного обеспечения — Microsoft Speech Technologies (речевые технологии Microsoft). — Это более целесообразно».

И все же исключительно мужской коллектив Sonum: бородатый профессор колледжа с творческим складом ума, новоявленный папаша 34 лет и два студента-выпускника чуть старше 20 лет — готовы поклясться, что именно их «преподаватель естественного языка» изменит ситуацию.

Несколько ближайших месяцев The Sun собиралась наблюдать за младенчеством Sonum и вести хронику зарождения этой компании. Это одна из более чем тысячи компаний, возникающих на технологическом рынке штата Мэриленд каждый год. Примерно столько же из них ежегодно ликвидируются, потому что сила воли и мечта — это не позиции в балансовом отчете, и только на них одних бизнес долго не протянет.

Заставить машины слушать

Основная идея большинства технологий, базирующихся на искусственном интеллекте, заключается в трансформации человеческой речи в машинную посредством так называемого «устройства обработки естественной речи» — так, чтобы процесс не был виден человеку. Некоторые методы подразумевают обучение компьютеров составлению схем предложений и подбору существительных и глаголов, которые можно в них использовать. Однако для этого требуется процессор невероятной мощности — быстро поглощающая информацию компьютерная память, а также способность к осмыслению грамматических ошибок.

Другие техники учат компьютеры отыскивать ключевые слова и игнорировать все остальное, в том числе структуру предложений. Но, чтобы воспользоваться подобным методом, человек должен будет следовать целому сценарию с командами, которые может быть неудобно запоминать и выполнять.

Какие-то компании уже применяют интерактивные компьютерные технологии. Amtrak и UAL Corp.'s United Airlines, например, автоматизировали свои системы телефонного информирования и бронирования с помощью программного обеспечения бостонской компании ScanSoft Inc. По оценкам этих компаний, они сэкономили в общей сложности 40 млн долларов или даже больше на рабочей силе.

Такие процессоры работают, так как «сфера их применения» ограничена, пояснила Сьюзен Фельдман из International Data Corp., массачусетской фирмы, занимающейся исследованиями в области технологий. Для них достаточно уметь распознавать всего несколько слов, таких как flight (рейс) и departure (отправка, вылет).

Технология Sonum охватывает гораздо более широкую область. Ее цель — перевести что угодно, даже целую операционную систему, на управление обычной речью. Патентная заявка этой компании была разработана Фордом, и в ее основе лежит способ, каким организует информацию мозг человека. В программу был заложен огромный словарный запас, а также схемы интерпретации фраз с помощью бесконечного упрощения и классификации. Словам и их значениям были присвоены числовые коды, которые распознает компьютер и в соответствии с которыми действует.

Для нью-йоркской конференции SpeechTEK Sonum адаптировала свой процессор к приложению Microsoft Excel, чтобы продемонстрировать его возможности. «Мне, кажется, для Рэнди это шаг номер один, который позволит продвинуться дальше и укрепить позиции его компании, — рассказывает Джудит Марковиц, консультант в сфере высоких технологий из Чикаго, познакомившаяся с Фордом три года назад через коллегу в Северо-Западном университете. — Компьютер как "настоящий помощник" — вот его цель».

«Он значительно опередил конкурентов, — заявляет Уолтер Роланди, консультант по голосовым телефонным системам, один из авторов журнала Speech Technology Magazine, выступившего спонсором конференции в Нью-Йорке. — Рэнди Форд — психолог, он смотрит на все с психологической точки зрения, и это помогает. Он понимает природу функционирования языка».

И все же одной лишь технологии недостаточно для поддержания бизнеса, и так было всегда. Если рассматривать как показатель патентные заявки, то ежегодно возникают тысячи идей новых технологий, но большинство из них так никогда и не воплощаются в жизнь, потому что изобретателям не удается найти спонсоров или партнеров с предпринимательским чутьем.

Лет пять назад компании, работающие в секторе новых технологий, не очень-то об этом беспокоились. С бизнес-планами, второпях начертанными на салфетках, они появлялись как грибы после дождя, поддерживаемые инвесторами, которые были захвачены неизвестным, но, казалось, бесконечным потенциалом Интернета и телекоммуникаций. А после того как лопнул этот пузырь инвестиций в технологии (до пяти триллионов долларов США), настали тяжелые времена для развивающихся компаний, которым необходимо убеждать скептиков и искать средства.

«[Самые первые] инвесторы убежали как можно дальше и быстрее, — сетует Кристофер С. Фостер, заместитель секретаря Департамента предпринимательства и экономического развития штата Мэриленд. — Они возвращаются, но, думаю, мы заметим, насколько более искушенными они становятся».

 

Другие материалы

blog comments powered by Disqus