21.06.2011 в 10:34 1824

Компьютерный голос с человеческим лицом

Израильская фирма придает синтезированной речи человеческие обертоны

Израильтянин разработал первую в мире систему синтеза слов, продукцию которой трудно отличить от настоящей человеческой речи.

Основатель "Вивотекст" Гершон Сильберт, фото mfa.gov.il

Наберите номер линии обслуживания клиентов почти каждой компании, и голос, который ответит вам, будет, скорее всего, принадлежать компьютеру. Машины разговаривают с нами через приборы GPS, интернет-сайты, игрушки и видеоигры, мобильные телефоны, приборы дистанционного управления и многие другие аппараты. Все они используют технологию синтеза речи TTS, благодаря которой компьютер преобразует документ в звуки.

Однако, как объясняет руководитель израильской новой технологической компании Vivotext Гершон Сильберт, голоса, издаваемые ТТS, просто неприятно слушать. "Вивотекст" разработала первую в мире систему синтеза слов, продукцию которой трудно отличить от настоящей человеческой речи. Сильберт отмечает, что спрос на "искусственные голоса" огромен и постоянно растет, однако до сих пор многие потребители и клиенты испытывали немалый дискомфорт и раздражение, когда на другом конце линии им отвечал механический голос.

Холодные, лишенные эмоций голоса, производимые популярными системами компаний AT&T, Nuance и Loquendo, производят, как утверждает Сильберт, резко отталкивающее впечатление на слушателей. Исследования подтверждают, что чем более естественно звучит синтезируемая речь, тем более позитивна реакция потребителей. Проблема состоит в том, что живая речь стоит намного дороже.

"Мы все знакомы с аудиокнигами, но не все понимают, что стоимость их производства так высока, что всего два процента публикуемых книг получают звуковую версию, тем более что для чтения бестселлеров принято нанимать известных людей и артистов", - отмечает Сильберт. - "Если бы на рынке появился более дешевый, автоматизированный способ преобразования текста в живую речь, издатели ухватились бы за него".

Именно это и предлагает Вивотекст. "Наша запатентованная технология опирается на результаты из области анализа исполнения музыкальных произведений, а также исследования в сферах фонетики, синтакса, лексикографии и обработки цифровых сигналов (DSP). Мы собрали богатую коллекцию голосовых образцов, которые можно отрегулировать для отражения широкого спектра эмоций и выразительности", - подчеркивает Сильберт. Именно это делает голоса, производимые Вивотекст, более "человеческими".

Технология анализа музыкальных произведений, разработанная Сильбертом, применяет методы, используемые для превращения печатной партитуры в слышимую музыку, для трансформации текста в живую речь. Именно это позволяет насытить компьютерный синтезированный звук эмоциями и смысловыми акцентами.

"Так же, как изменения темпа, артикуляции и динамики делают исполнение музыкального произведения более выразительным, так и ударения, тон, интонация - то, что в целом называется просодия - определяют эффективность TTS, имея критическое значение при передаче слушателю фонематического, синтаксического и прагматического содержания слов и предложений", - отмечает Сильберт.

Руководитель "Вивотекст" знает природу звуков не понаслышке - в течение многих лет он был пианистом международного уровня. В 1994 году было опубликовано его самое популярное исполнение "Вариаций Гольдберга" Иоганна Себастьяна Баха. Теперь, применяя свои знания качественного музыкального исполнения к синтезу речи, используя метод под названием МОR (распознание музыкальных объектов), Сильберт может производить "голоса с высоким качеством произношения, естественным потоком слов и различными словарными стилями".

Используя систему "Вивотекст", программисты могут, используя простые меню и рабочие инструменты, повышать или снижать эмоциональный уровень синтезируемой речи. Базисная программа способна оценить содержание текстового отрывка, используя фонетический, семантический и синтактический анализ, и сама установить, к примеру, является ли данный текст вопросом, частью разговора, утверждением либо просьбой ввести данные. Анализ принимает во внимание и пунктуацию текста. На заключительном этапе программист может выделить желаемую эмоциональную нагрузку - радость, огорчение, энтузиазм, сочувствие - и получить на выходе голос, звучащий совсем "по-человечески".

Компания "Вивотекст" создана и финансируется технологической теплицей "Мофет Бе-Иегуда", расположенной к югу от Иерусалима. Несколько независимых инвесторов уже проявили интерес к ее перспективам. Руководство фирмы состоит из самого Сильберта, технического эксперта доктора Йосефа Бен Эзры и председателя Самуэля Соломона.

Поскольку ничего подобного продукции "Вивотекст" на рынке до сих пор не было, индустрия синтезированной речи уже проявляет к израильской молодой компании растущий интерес. Ведутся переговоры о сделках с ведущим американским производителем игрушек и крупной фирмой-издателем аудиокниг. "На всех ярмарках и промышленных конференциях к нам поступает масса запросов, и всех поражает теплота и человеческое качество наших голосов. Все, кто нуждается в синтезированной речи для работы, влюбляются в наш продукт с первого взгляда", - говорит Сильберт.

Авторы:

Давид Халеви

Самое интересное

«Хазит аКавод» значит — «За достойное будущее»

Выяснилось, какие разрушения «Орешник» нанес «Южмашу»

«Издевательство над людьми»: съемки «Голубого огонька» в Москве начались с громкого скандала

"Дела плохи": в Польше запаниковали после сильного хода России

"Новая ракета": Зеленский сделал экстренное заявление после удара

В Сириусе завершился первый в истории страны Всероссийский «Кубок Защитников Отечества»

Фотогалерея

Семенович, Шуфутинский, Цой, Бузова, Басков на музыкальной премии: фоторепортаж

Баринов, Кравец, Калашникова: скорбные кадры прощания со Светланой Светличной

Семья, "На-на", друг Мацкявичюс: Владимира Левкина похоронили на Троекуровском кладбище

Блогерша с самыми большими в мире бедрами объявила войну авиакомпаниям: фото рекордсменки

С Владимиром Левкиным простились самые близкие: кадры траурной церемонии на Троекуровском кладбище

Ушёл из жизни Владимир Лёвкин: последние фото легенды группы "На-На"

Скончалась Светлана Светличная: роли и светская жизнь самой известной блондинки СССР

Кадры последствий массированной атаки на Киев: "прилет" по Нацбанку и другим объектам

Ольга Бузова отметила на сцене 8-летие творческой деятельности: яркие кадры

Что еще почитать

«Тяжелый песок» Ильи Альтмана

Давид Зильберман: хранитель памяти о Холокосте в Латвии

В результате нападения на колонну машин на ключевой автомагистрали убиты десятки людей

Путин запустил механизм мести Западу за дальнобой: время слов подходит к концу

Путин высек Запад «Орешником» Россия перехватила управление эскалацией

Видео

На Каховском направлении группировка войск «Днепр» уничтожила миномет ВСУ: видео

Светличную проводили аплодисментами и криками "Браво!": видео с церемонии прощания в Москве

Дочери Владимира Левкина простились с отцом: "самые теплые слова" прозвучали на видео

Рублевская жена Алёна Кравец собралась сыграть Светличную в клипе: видеопризнание

Могилы Началовой, Заворотнюк и Мирошниченко подготовили к зиме: видео

Бузова в короткой юбчонке довела публику до экстаза: видео

Маша Распутина рассказала, когда началась ее сумасшедшая жизнь: видео

Опубликовано видео эпичной погони за кемеровским лихачем: полицейские открыли огонь

Ревва раскрыл способ оздоровления организма: видео

В регионах

Народные приметы на 21 ноября 2024 года: что нельзя делать в Михайлов день

Народные приметы на 20 ноября 2024 года: что нельзя делать в Федотов день

Народные приметы на 22 ноября 2024 года: что нельзя делать в день Матрены Зимней

Сергей Павленко: «Общественная работа дает участникам СВО возможность понять, что они нужны и в мирной жизни»

В Севастополе развернут ПВР для людей, которых спасли из горящего дома

Машина от государства: кто имеет право на бесплатный автомобиль