Проект из Сан-Франциско с названием BabelOn Technologies сегодня заявил о разработке инновационной технологии, позволяющей переводить речь в режиме реального времени на остальные языки и при этом полностью сохранять голос и интонацию пользователя. Для дальнейшего развития своей технологии стартап запустил краудфандинговую кампанию на платформе Indiegogo.
Первоначально данная система будет функционировать следующим образом: клиент подъезжает в офис BabelOn, расположенный в Сан-Франциско, чтобы на протяжении дня его голос записали на особое устройство, лишенное всяких микрофонов, однако имеющее чувствительный радар, который направляют на челюсть человека, а также на его голосовые связки.
Далее с помощью передовых технологий обработки больших объемов информации и глубокого машинного обучения создается уникальный цифровой образ голоса и мимики пользователя (B.L.I.P.), последний возможно затем применять, чтобы синтезировать речевой перевод совместно с лицевой мимикой. Дабы надежно защитить данные от любых мошенников, все B.L.I.P. станут сберегаться в зашифрованном виде, в специальном хранилище, сообщили представители стартапа.
Данная разработка уже целиком изучена и запатентована, заявляют в компании, но она еще нуждается в определенной доработке: ведь на всю процедуру с начала формирования B.L.I.P до непосредственно самого перевода с соблюдением голоса пользователя, его интонации, вибрации голосовых связок и мимики лица требуется от нескольких недель до пару месяцев.
Кроме того, на страничке BabelOn на краудфандинговой платформе возможно выяснить и дальнейшую стоимость услуг стартапа: для создания B.L.I.P. бекеру понадобится инвестировать 5 000 долларов, за перевод музыкального трека на другой язык с полным сохранением голоса и интонации звучания – 50 000 долларов, а на 7 различных языков – 250 000 долларов.
YouTube YouTube
Представители проекта сообщили, что вначале планируют наладить сотрудничество с компаниями из музыкальной, игровой и киноиндустрии для перевода кинофильмов и игр (синхронизируя при этом и движения губ героев) и для перевода музыкальных композиций, а сервисы для обычных пользователей (например, установка своего голоса в Siri) запустят немного позже – совместно с уменьшением времени на всю процедуру, вплоть до режима реального времени.
Имеются и некоторые остальные нюансы: на текущий момент проект собирается использовать преимущественно английский, испанский, русский, французский, португальский, итальянский, немецкий, китайский, арабский, японский и корейский языки. Внедрять у себя остальные языки стартаперы собираются по мере роста их востребованности.
Пока у данного проекта отсутствуют клиенты. Создать полностью рабочую версию стартаперы планируют в течение полугода, а усовершенствовать ее до возможности перевода в режиме реального времени – на протяжении следующих нескольких лет. На сегодняшний день у данного проекта отсутствуют прямые конкуренты, но простой перевод речи в режиме реального времени, например, имеется в Skype.
По материалам
rb.ru
https://text.ru/antiplagiat/594d087cb63ef