6 нояб. 2011 г.

Siri Personal Assistent: поговори со мною, трубка


Наверняка все хорошо помнят пухлого капитана корабля «Аксиома» из потрясающего мультфильма WALL-E. И, конечно же, причину набора капитаном лишнего веса — коварного автопилота корабля Auto. Этот человеко-машинный дуэт примечателен не только тем, что на мультяшном уровне поднимает философский вопрос о битве человеческого и искусственного разумов. Вспомните, каким образом капитан общался с Auto? Вспомнили? Естественно, голосом. Думается, сакраментальное капитанское «Это приказ!», подкрепленное для верности суровым выражением лица, многих заставило улыбнуться. И подумать, что эта фантастическая история еще очень далека от реального воплощения.
В мультике WALL-E капитан общался с автопилотом исключительно голосом... на повышенных тонах.
Спешу вас обрадовать: будущее, где люди могут управлять гаджетами, используя только свой голос, уже наступило. Пока, правда, этой возможностью наделен только новый iPhone 4S. Именно на эту новинку Appleустановлена бета-версия программы Siri, которую сама компания называет умным личным ассистентом (intelligent personal assistent).
То, что ума, юмора и самоиронии Siri не занимать, легко убедиться по многочисленным скриншотам, в которых представлены фрагменты диалогов владельцев iPhone c их «ассистентом».
В подавляющем большинстве случаев Siri вполне успешно выкручивается из сложных ситуаций, с юмором реагируя даже на откровенную ахинею, которую городит пользователь. И дает вполне корректные ответы на конкретные, но сформулированные в произвольной форме вопросы. Пользователю вовсе не нужно вспоминать дату послезавтрашнего дня, чтобы узнать, какая в этот день будет погода. Можно просто спросить Siri: «Одеваться ли мне тепло в ближайшие дни?» Цифровой мозг Siri отлично поймет, что речь идет о похолодании, и выведет на экран iPhone погоду на два-три дня вперед.
Волей-неволей вспоминается пресловутый тест Алана Тьюринга, и возникает ощущение, что Siri практически успешно его проходит. А если и нет, то уж точно активно завоевывает любовь владельцев айГаджетов, для которых и без того приятное пальцеориентированное общение со своим смартфоном перешло на качественно новый речевой уровень.
Как же работает Siri? Ведь это всего-навсего программа, установленная в iPhone 4S и работающая под управлением свеженькой iOS 5. На самом деле это далеко не так. Siri — мощный сетевой сервис и масса партнеров Apple, предоставляющих для его работы свои ресурсы. Но главное, Siri — это коммерческое воплощение длинного исследовательского пути ученых в области искусственного интеллекта, сконцентрированное в по-эппловски лаконичном пользовательском интерфейсе.
Давайте же посмотрим на тот путь, который прошел умный помощник Siri от идеи до ее воплощения.

Siri. Американская мечта в действии

Формально Apple не является разработчиком Siri. Скажем так, «яблочная» компания выступила креативным и одновременно финансовым директором для перспективного стартапа с огромной базой наработок и гигантскими амбициями, для реализации которых банально не хватало средств.
Компанию Siri в 2007 году основали четверо увлеченных исследователей, решивших вывести академические разработки из кабинетов в люди. Даг Китлаус (Dag Kittlaus), Адам Чейер (Adam Cheyer), Том Грубер (Tom Gruber) и Норман Винарски (Norman Winarsky) — бывшие сотрудники Центра искусственного интеллектаисследовательской компании SRI International, бывшей когда-то Stanford Research Institute при знаменитомСтенфордском университете.
Основатели Siri. В центре — главный закоперщик Даг Китлаус.
Разработчики Siri — выходцы из Центра искусственного интеллекта компании SRI International.
Вдохновленные финансовыми победами основателей Google, не побоявшихся в свое время связаться с венчурным капиталом, владельцы вновь испеченной компании Siri бросились обивать пороги толстосумов, демонстрируя им свою разработку — умную программу, общающуюся с пользователем на привычном ему языке. Будьте уверены, впечатление программа производила неизгладимое, и компания дважды получала вполне приличное финансирование. Это позволило Siri развиться до состояния сервиса, который не грех было разместить на самой активной площадке мобильных приложений — в магазине программ Apple App Store. При этом Даг Китлаус и компания имели далеко идущие планы по портированию Siri на конкурентные iOS платформы.
Ну а дальше все понятно. Дальновидные аналитики, менеджеры и маркетологи Apple усмотрели в Siri задатки ледокола второй части наступления эры пост-ПК, характерной активным переходом пользователей от необходимости изучения азов работы с компьютером к возможности общаться с машинами естественным образом. Голосовые и интеллектуальные возможности Siri при этом стали следующим этапом развития интерфейсов после сенсорного мультитач-управления, на которое Apple подсадила весь мир.
Приложение Siri по-тихому исчезло с полок App Store, чтобы четвертого октября 2011 года появиться интегрированным в iOS 5. Apple при этом взяла с разработчиков Siri юридическое слово не делать вариантов своей программы под Android и другие мобильные системы.  
Финансовый успех Siri кажется простым и естественным, но за ним стоят годы напряженной исследовательской работы ученых SRI International в области искусственного интеллекта (AI — artificial intellegence).

AI. Двадцать лет пути

Что требуется компьютеру, чтобы пройти тест Тьюринга? Чтобы человек признал его умным, не сумев распознать, с кем же он общается — с себе подобным или с машиной?
Основными компонентами умной компьютерной системы ученые считают:
  1. систему, обеспечивающую представление информации не в виде фактов, а в виде знаний, пригодных для логического вывода новых знаний;
  2. систему формирования логически верных выводов на основе имеющейся в ее распоряжении базы знаний;
  3. систему адаптации алгоритмов логического вывода к различного рода нестандартным ситуациям и формирования своего рода опыта;
  4. систему взаимодействия с пользователем на естественном языке.
Именно этим проблемам и было посвящено большинство исследовательских программ Центра искусственного интеллекта компании SRI International.
Так, например, исследования, проводимые под руководством доктора Дэвида Израэля (David Israel), были посвящены распознаванию естественной речи и письма, а также созданию многофункциональных мультимедийных интерфейсов «человек-машина».
Более тридцати лет доктор Дэвид Израэль посвятил разработке интерфейсов общения с компьютером на естественном языке.
Ученые из лаборатории исследования естественных языков придумали методы декомпозиции произносимой фразы на компоненты, пригодные для логического вывода.
Результатом этих исследований стали программы ATIS и Communicator  — части справочно-информационной системы авиатерминалов, общающейся с пользователем на естественном языке, а также программы Common Talk, используемой Министерством обороны США в компьютерных симуляторах боевых действий.
Именно это программное обеспечение и легло в основу сервиса Siri, поскольку, каким бы умным ни был искусственный интеллект, он будет бесполезен, если не поймет, что говорит ему человек.
Посмотрите на этот пример диалога программы Communicator с пользователем. Правда, очень похоже на работу Siri? Все правильно, созданная в далеком 1994 году программа Communicator является одним из предков Siri. Отвечающим за понимание человеческой речи.
Кстати, голосовые наработки Дэвида Израэля и его коллег нашли свое коммерческое воплощение задолго до Siri. Программы распознавания речи семейства Dragon Dictate от компании Nuance, в основе которых лежит голосовое ядро SRI International, весьма востребованы уже более десятка лет. Существует даже русская интерпретация этой программы по имени «Горыныч».
Еще одним важным предком Siri стал проект CALO, участие в котором приняли не только исследователи SRI, но и масса ученых из других исследовательских центров и ведущих вузов мира.

CALO. Денщик для юзера

Начало проекту CALO положили исследования знаменитого «военизированного» агентства DARPA по созданию программной системы, призванной помочь компьютеру понять пользователя. Не только распознать его речь, но и понять, чего же он желает. И, возможно, даже предугадать эти его желания.
Результатом таких исследований стал проект PAL (Personal Assistent that Learns), то бишь обучающийся личный помощник.
В основу архитектуры PAL легли самые передовые методы обучения компьютеров, а также средства формирования знаний и сохранения их в соответствующих базах.
В амбициозном проекте PAL участвовали ведущие исследовательские центры и вузы США.
Проект PAL — это целый пакет методов искусственного интеллекта и поддерживающего их программного обеспечения.
Дальнейшим развитием PAL стала система CALO, для названия которой разработчики использовали латинское слово «calonis», в вольной интерпретации означающее «денщик».
CALO — это целая совокупность программ, работающих на компьютере пользователя и следящих за его поведением и запросами. Общаясь с пользователем, «денщик» CALO постепенно начинает предугадывать его действия и упреждает их, сортируя почту по пользовательским приоритетам, планируя его время и управляя решаемыми задачами. Впрочем, зачем слова? Любой может опробовать CALO, скачав и установив на своем компьютере программу CALO Express.
В действиях CALO легко распознать черты айфоновской Siri — обучаемость и знание персональных предпочтений пользователя.
Взаимопонимание с пользователем, конечно, важнейшая черта Siri. Но откуда он черпает факты, о которых его спрашивает пользователь? Ведь Siri в курсе буквально всего и способна не только найти ближайший к вам суши-бар, но и попытаться ответить на риторический вопрос о смысле жизни.
Помощников в поиске фактов у Siri множество. Выпуская свой сервис в свет, Apple заручилась поддержкой крупнейших систем поиска и бронирования мест в ресторанах и развлекательных заведениях — например,OpenTableSitySearch и MovieTickets, а также таких мощных систем поиска ответов на вопросы (factual questions answering), как True Knowledge и Wolfram Alpha.

Wolfram Alpha. Тугоплавкий поисковик

Сколько лет Бараку Обаме? Идет ли сегодня дождь в Лондоне? Что такое любовь? Как поймать енота?
Wolfram Alpha не обычная поисковая система — скорее вычислитель, пытающийся сформулировать ответы.
На эти и любые другие вопросы система Wolfram Alpha попытается дать вам ответ — вместо того, чтобы банально забрасывать релевантными страничками, как поступают традиционные поисковики.
Именно попыткой найти ответ, а не источники, которые его могут содержать, и отличаются системы factual questions answering. Это прекрасно понимал Стивен Вольфрам (Stephen Wolfram), основавший в 1987 году компанию Wolfram Research. Основным продуктом компании стала программа Mathematica — проект значительно более мощный, чем традиционные математические пакеты. Фактически Mathematica является распределенной вычислительной системой, в рамках которой можно реализовать решение самых разнообразных задач. В том числе и поиска ответов на вопросы.
Поэтому, завоевав признание пользователей с помощью Mathematica и базируясь на ее технологиях, Стивен Вольфрам приступил к амбициозному проекту имени своего имени. Результатом стала система Wolfram Alpha.
Пусть вас не вводит в заблуждение лаконичная командная строка Wolfram Alpha. За ней скрывается мощная архитектура, базирующаяся на распределенной вычислительной системе gridMathematica.
Создатель Mathematica и Wolfram Alpha Стивен Вольфрам.
Основой Wolfram Alpha является распределенная вычислительная система Mathematica.
Эта система вовсю использует мощь современных многоядерных процессоров в компьютерах пользователей, а если мощности не хватает (например, при работе с мобильным устройством), подключает мощный сетевой кластер и даже компьютеры независимых «самаритян», выразивших желание участвовать в проекте.
Система Mathematica привлекает высокопроизводительные кластеры и компьютеры добровольцев.
С помощью пакета Wolfram Workbench и среды визуализации результатов вычислений webMathematica разработчик может создать любую необходимую пользователю программу. Wolfram Alpha — одна из них. Именно поэтому, подготавливая ответ на вопрос, она пишет: «Compute» (вычисляю). Львиная доля ответов Siri на вопросы, связанные с какими-либо фактами, подготавливает именно Wolfram Alpha.

Поговори со мною, Siri

Итак, Siri — ваш персональный Альфред (помните дворецкого Бэтмена?). В iPhone 4S на самом деле не одна программа, а умная сеть, способная распознать вашу речь, попытаться понять смысл распознанного, найти необходимые для ответа факты и постараться связно ответить вам.
И пусть местами Siri отвечает невпопад. Система ежесекундно учится и совершенствуется. И ведь, кроме того, алгоритмы Siri способны выполнять рутинную работу: превратить в текст SMS или письма сказанную вами фразу, заполнить ваш календарь, запустить новый трек.
Персональный помощник для этого и нужен. Правда, полноценно общаться с ним можно только на английском, немецком и французском, да и большинство задействованных в Siri сервисов работают только на территории США. Пока.
Заговорит ли Siri по-русски? Это зависит от множества факторов, начиная от признания купертиновцами России в качестве полноценного рынка сбыта и заканчивая активизацией исследований российских ученых в области распознавания естественного великого и могучего.
В любом случае надеяться на голосовую Siri-революцию в России стоит.
А пока стоит подучить английский. Ваш умный персональный помощник в iPhone  горит желанием помочь вам.

Комментариев нет:

Отправить комментарий