Голосовой поиск Google – теперь и в России
Содержание
Сказать, что пресс-конференция Google вызвала повышенный интерес – не сказать ничего. Столько журналистов ваш корреспондент смог вспомнить только на пресс-конференции HTC, когда те привезли в Москву HTC Desire и HTC Legend, но тут дело другое, тут – всего лишь сервис. Всего лишь. Итак, что же придумали в Google?
Что такое голосовой поиск от Google? #
Новый сервис Google Voice Search, в основе которого лежит технология распознавания речи, позволяет пользователям осуществлять поиск в интернете с мобильного телефона просто произнеся интересующее понятие вслух.
На сегодняшний день весь этот функционал доступен владельцам "гуглофонов", т.е. смартфонов с операционной системой Android, поклонникам iPhone, а также обладателям Nokia S60. Причем тем, у кого есть смартфон на базе Android 2.1 или 2.2 не придется совершать никаких дополнительных действий – приложение уже у них на телефоне, и им можно смело пользоваться. Остальным же придется обновить свою операционную систему, ну а пользователям продукции Apple предстоит заглянуть в App Store и скачать там Google Mobile App.
Функционал голосового поиска Google #
Что же может смартфон с помощью Google Voice Search? Сразу отмечу, что в англоязычной среде он может много больше, но тут уж лиха беда начало. На сегодняшний день российский пользователь может спросить у Google, что тот думает по поводу:
- Новостей;
- курсов валют;
- картинок;
- товаров;
- расписания мероприятий;
- результатов спортивных мероприятий;
- поиска необходимых мест рядом с вами (сервис связан с навигацией и GPS);
- ну и просто поиска в сети.
Печалит здесь одно обстоятельство, вернее два: ну про то, что англоязычный функционал гораздо богаче мы уже сказали, ну а во-вторых, насладится всеми возможностями через наш родной GPRS довольно-таки проблематично. На презентации все имели возможности выйти в сеть через Wi-Fi и все выглядело шикарно, но оказавшись в полевых условиях… Разработчики уверяли, что все в целом более или менее прилично, а проблемы могут быть из-за перегруженности конкретной соты, но они были в разных местах и даже довольно пустынных. А вот там, где был доступен 3G – все летало.
Google Voice Search – распознавание речи #
Впрочем, это не так важно, если мы говорим об академическом интересе. Гораздо любопытнее, как Google Voice Search работает, и будет ли нормально распознавать речь. Отвечая на второй вопрос, могу сказать – даже мою речь сервис понимает, а это не так просто, как кому-то может показаться. Более того, во время пресс-конференции сервис Google Voice Search тестировал один из разработчиков и автор технологии распознавания русского языка – Юджин Вайнштейн. Юджин – сотрудник одного из американских офисов Google и выходец из России, всю жизнь проживший в США и теперь говорящий по-русски с очень приличным акцентом, и не всегда безупречно. Так вот, его речь была без проблем воспринята и обработана.
Как это работает голосовой поиск Google? #
Теперь о том, как это работает. Разумеется, сам смартфон ничего не распознает – вся информация обрабатывается в облаке. Именно на этом этапе становится понятно, почему для качественной и быстрой работы сервиса необходим быстрый интернет. Голосовая информация передается в облако, где за считанные доли секунды анализируется на основе словаря, языковой модели, т.е. выбора наиболее типичных сочетаний букв и слов из ряда имеющих схожее звучание, модели произношения – т. е. соотношения между буквой алфавита и звуками, из которых она формируется при произношении, а также акустической модели – сюда отправляются все акценты, местные говоры и прочие речевые особенности.
Система постоянно учит себя, так что велика вероятность того, что со временем качество распознавания будет повышаться. С другой стороны, оно и сегодня вполне достойное. Особо сложными для системы распознавания голоса являются аббревиатуры, смеси из букв и цифр вроде "xbox360" (каждый произносит такие сочетания как бог на душу положит), а также просто короткие слова – ведь чем меньше букв, тем менее уникальным получается и сочетание звуков.
Довольно любопытным выглядит и методика сбора данных для системы распознавания. Как рассказал Хьюго Барра (Hugo Barra) – директор подразделения мобильных продуктов Google, компания старается привлекать к работе множество людей, отличающихся произношением, акцентами и манерой речи. На основе этой информации и формируется база системы.
Кому нужен голосовой поиск Google? #
Если определять целевую аудиторию новинки, то, как сказал Андрей Дороничев из Google, данный сервис, в первую очередь, предназначен для людей, которые не знают и не хотят знать как все это работает, и которым просто нужны необходимые ответы.
Chrome to Phone #
Был продемонстрирован еще один довольно любопытный функционал, так называемый Chrome to Phone, который позволяет передавать в телефон необходимые данные из браузера Google Chrome вашего ПК. Это может быть как ссылка на статью, которую пользователь не успел прочитать до конца, так и номер телефона с какой-либо веб-страницы. Он сразу же буде воспринят смартфоном как телефонный номер, и пользователь получит весь необходимый ему набор функций. Разумеется, в данном случае речь идет об устройствах под управлением Android.
Вообще же, на сегодняшний день смартфон, оснащенный всеми сервисами Google превращается в некое подобие переводчиков из фантастических фильмов. Посудите: пользователь может задать вопрос голосом и получить ответ, причем также голосом (данный функционал пока доступен на английском, но обещают, что и русская версия не за горами), может сфотографировать текст, затем распознать его с помощью системы Google OCR и перевести с помощью Google Translate на родной язык. Более того, возможность воспринимать голос и воспроизводить текстовые сообщения голосом может в будущем дать пользователю возможность использовать этот набор функций как полноценного переводчика-синхрониста. Хьюго Барра упомянул о таких потенциальных возможностях системы мельком, но стало понятно, что в компании над этим работают.
Завершалась пресс-конференция под негромкое бормотание журналистов, которые пытались поговорить со своими телефонами. Пугающее зрелище, доложу я вам.
Рекомендуем также почитать
Видео
04:52
Мультимедиа
|
BenQ PU9730: обзор инсталляционного двухлампового проектора23 января 20159890 2 |
02:16
Авто Hi-Tech
|
Видеосвидетель 5410 FHD 2CH: обзор видеорегистратора с двумя камерами31 декабря 201413321 0 |
02:38
Авто Hi-Tech
|
Видеосвидетель 4410 FHD G: обзор видеорегистратора31 декабря 201412751 0 |
Cвежие новости
Apple обменивается исками с Ericsson, в 2022-м году сохранится дефицит микросхем
Apple обменивается исками с Ericsson, в 2022-м году сохранится дефицит микросхем
Google готовит Android 11 и думает о запуске собственного процессора
Google хочет, чтобы новый дизайн платформы напоминал медиаадаптер Chromecast
ТОП-3 тарифов на интернет для загородных домов и коттеджей
ТОП-3 выгодных тарифов на интернет для загородных домов и коттеджей от провайдеров
ONYX BOOX Note – новый ридер с экраном 10,3"
Букридер с ридер с экраном 10,3" весит всего 325 граммов
MMO Project Genom – обновление Авалон
Обновление Project Genom – новая территория более 90 квадратных виртуальных километров
Искусственный интеллект научили думать по-собачьи
Ученые разработали систему на базе алгоритмов глубокого обучения, которая может действовать как собака.
HyperX анонсировала старт поставок модулей памяти Predator DDR4 RGB
HyperX Predator DDR4 RGB представлена как в виде отдельных модулей 8 ГБ, так и комплктами 16 ГБ и 32 ГБ
Отзывы
1 Оставить отзывжаль, не на компьютере
Добавить отзыв