Голосовой поиск Google – теперь и в России

23 сентября 2010, Капранов Олег 1
22 сентября компания Google представила в Москве русскоязычный сервис голосового поиска для мобильных телефонов Google Voice Search и рассказала обо всех новинках и приложениях, которые на сегодняшние день представлены компанией на западном рынке. Поражался новшествам и пытался говорить с собственным телефоном и корреспондент F1CD.ru.

Сказать, что пресс-конференция Google вызвала повышенный интерес – не сказать ничего. Столько журналистов ваш корреспондент смог вспомнить только на пресс-конференции HTC, когда те привезли в Москву HTC Desire и HTC Legend, но тут дело другое, тут – всего лишь сервис. Всего лишь. Итак, что же придумали в Google?

Что такое голосовой поиск от Google? #

Новый сервис Google Voice Search, в основе которого лежит технология распознавания речи, позволяет пользователям осуществлять поиск в интернете с мобильного телефона просто произнеся интересующее понятие вслух.

На сегодняшний день весь этот функционал доступен владельцам "гуглофонов", т.е. смартфонов с операционной системой Android, поклонникам iPhone, а также обладателям Nokia S60. Причем тем, у кого есть смартфон на базе Android 2.1 или 2.2 не придется совершать никаких дополнительных действий – приложение уже у них на телефоне, и им можно смело пользоваться. Остальным же придется обновить свою операционную систему, ну а пользователям продукции Apple предстоит заглянуть в App Store и скачать там Google Mobile App.

Функционал голосового поиска Google #

Что же может смартфон с помощью Google Voice Search? Сразу отмечу, что в англоязычной среде он может много больше, но тут уж лиха беда начало. На сегодняшний день российский пользователь может спросить у Google, что тот думает по поводу:

  • Новостей;
  • курсов валют;
  • картинок;
  • товаров;
  • расписания мероприятий;
  • результатов спортивных мероприятий;
  • поиска необходимых мест рядом с вами (сервис связан с навигацией и GPS);
  • ну и просто поиска в сети.

Печалит здесь одно обстоятельство, вернее два: ну про то, что англоязычный функционал гораздо богаче мы уже сказали, ну а во-вторых, насладится всеми возможностями через наш родной GPRS довольно-таки проблематично. На презентации все имели возможности выйти в сеть через Wi-Fi и все выглядело шикарно, но оказавшись в полевых условиях… Разработчики уверяли, что все в целом более или менее прилично, а проблемы могут быть из-за перегруженности конкретной соты, но они были в разных местах и даже довольно пустынных. А вот там, где был доступен 3G – все летало.

Google Voice Search – распознавание речи #

Впрочем, это не так важно, если мы говорим об академическом интересе. Гораздо любопытнее, как Google Voice Search работает, и будет ли нормально распознавать речь. Отвечая на второй вопрос, могу сказать – даже мою речь сервис понимает, а это не так просто, как кому-то может показаться. Более того, во время пресс-конференции сервис Google Voice Search тестировал один из разработчиков и автор технологии распознавания русского языка – Юджин Вайнштейн. Юджин – сотрудник одного из американских офисов Google и выходец из России, всю жизнь проживший в США и теперь говорящий по-русски с очень приличным акцентом, и не всегда безупречно. Так вот, его речь была без проблем воспринята и обработана.

Юджин Вайнштейн

Как это работает голосовой поиск Google? #

Теперь о том, как это работает. Разумеется, сам смартфон ничего не распознает – вся информация обрабатывается в облаке. Именно на этом этапе становится понятно, почему для качественной и быстрой работы сервиса необходим быстрый интернет. Голосовая информация передается в облако, где за считанные доли секунды анализируется на основе словаря, языковой модели, т.е. выбора наиболее типичных сочетаний букв и слов из ряда имеющих схожее звучание, модели произношения – т. е. соотношения между буквой алфавита и звуками, из которых она формируется при произношении, а также акустической модели – сюда отправляются все акценты, местные говоры и прочие речевые особенности.

Система постоянно учит себя, так что велика вероятность того, что со временем качество распознавания будет повышаться. С другой стороны, оно и сегодня вполне достойное. Особо сложными для системы распознавания голоса являются аббревиатуры, смеси из букв и цифр вроде "xbox360" (каждый произносит такие сочетания как бог на душу положит), а также просто короткие слова – ведь чем меньше букв, тем менее уникальным получается и сочетание звуков.

Довольно любопытным выглядит и методика сбора данных для системы распознавания. Как рассказал Хьюго Барра (Hugo Barra) – директор подразделения мобильных продуктов Google, компания старается привлекать к работе множество людей, отличающихся произношением, акцентами и манерой речи. На основе этой информации и формируется база системы.

Хьюго Бара

Кому нужен голосовой поиск Google? #

Если определять целевую аудиторию новинки, то, как сказал Андрей Дороничев из Google, данный сервис, в первую очередь, предназначен для людей, которые не знают и не хотят знать как все это работает, и которым просто нужны необходимые ответы.

Андрей Дороничев

Chrome to Phone #

Был продемонстрирован еще один довольно любопытный функционал, так называемый Chrome to Phone, который позволяет передавать в телефон необходимые данные из браузера Google Chrome вашего ПК. Это может быть как ссылка на статью, которую пользователь не успел прочитать до конца, так и номер телефона с какой-либо веб-страницы. Он сразу же буде воспринят смартфоном как телефонный номер, и пользователь получит весь необходимый ему набор функций. Разумеется, в данном случае речь идет об устройствах под управлением Android.

Вообще же, на сегодняшний день смартфон, оснащенный всеми сервисами Google превращается в некое подобие переводчиков из фантастических фильмов. Посудите: пользователь может задать вопрос голосом и получить ответ, причем также голосом (данный функционал пока доступен на английском, но обещают, что и русская версия не за горами), может сфотографировать текст, затем распознать его с помощью системы Google OCR и перевести с помощью Google Translate на родной язык. Более того, возможность воспринимать голос и воспроизводить текстовые сообщения голосом может в будущем дать пользователю возможность использовать этот набор функций как полноценного переводчика-синхрониста. Хьюго Барра упомянул о таких потенциальных возможностях системы мельком, но стало понятно, что в компании над этим работают.

Завершалась пресс-конференция под негромкое бормотание журналистов, которые пытались поговорить со своими телефонами. Пугающее зрелище, доложу я вам.

Рекомендуем также почитать

  • Видео:
  • Отзывы

    1 Оставить отзыв

    Добавить отзыв

    загрузить другую
    Ваш отзыв

    Видео

    BenQ PU9730: обзор инсталляционного двухлампового проектора

    23 января 20159890 1

    Обзор инсталляционного двухлампового проектора BenQ PU9730. Модель имеет моторизованный большой зум с широким диапазоном масштабирования и поддерживает вертикальный/горизонтальный сдвиг линз. Проектор можно разворачивать на 360 градусов и управлять им дистанционно [..]

    Видеосвидетель 5410 FHD 2CH: обзор видеорегистратора с двумя камерами

    31 декабря 201413321 0

    Обзор видеорегистратора Видеосвидетель 5410 FHD 2CH. В комплекте с устройством поставляется дополнительная камера для крепления на заднее стекло автомобиля. Обе камеры записывают видео со звуком в разрешении 1920x1080 при 30 кадрах в секунду. Посмотреть отснятое можно на экране [..]

    Видеосвидетель 4410 FHD G: обзор видеорегистратора

    31 декабря 201412751 0

    Обзор видеорегистратора Видеосвидетель 4410 FHD G. Устройство снимает видео со звуком в разрешении вплоть до 2304x1296 на частоте 30 кадров в секунду и умеет делать фотографии. Угол обзора камеры составляет 170 градусов по горизонтали. В числе особенностей модели – система [..]

    Cвежие новости

    Все новости