A nova tecnologia de reconhecimento de voz da Microsoft pode traduzir sua voz natural em outro idioma [vídeo]

Há um pouco de batalha de comando de voz acontecendo no momento no espaço móvel, com o Siri Assistant da Apple e a pesquisa de voz do Google Usando o Duking U uma contra a outra para os afetos dos usuários. Ambos vêm com seu próprio conjunto de prós e contras e só melhorarão à medida que avançamos no futuro, mas parece que as equipes de pesquisa e desenvolvimento da Microsoft estão trabalhando em algo com base em seus próprios bastidores que podem mudar o caminho Os seres humanos interagem entre si.

Embora a Siri seja muito mais poderosa que a pesquisa de voz do Google na plataforma iOS, ambos geralmente funcionam da mesma maneira, capturando comandos audíveis do usuário antes de publicar e processar esse comando em um servidor de back-end antes de cuspir o resultado Voltar ao usuário e agir sob a solicitação. Um vídeo foi publicado pela Microsoft, apresentando uma apresentação de Rick Rashid, que descreve as melhorias que a empresa fez no campo das interfaces naturais do usuário usando a fala humana.

Sistemas baseados em computador que entendem a fala humana não são uma nova invenção. Vimos muitos lançamentos ao longo dos anos que mostram progresso significativo nesse campo, com a Siri e o Google Voice Search sendo alguns dos exemplos mais recentes de como essa tecnologia pode ser aplicada no mundo real. No entanto, a Microsoft tem tentado silenciosamente dar algumas etapas adicionalmente, construindo um sistema em torno de tecnologias que não apenas reconhecem a fala humana, mas também traduzem -a no texto de uma língua estrangeira e depois repita as palavras nessa linguagem usando uma voz sintetizada gerada por voz Parecer como o alto -falante.

A demonstração no palco com o diretor de pesquisa da Microsoft mostra a tecnologia em ação reconhecendo suas palavras em inglês falado, convertendo-as em chinês na tela projetada e depois anunciando audivelmente a mesma frase em mandarim. Tudo isso é a mente soprando o suficiente, mas as coisas são tomadas um pouco além de você perceber que Rashid e seus colegas alimentam o sistema com mais de uma hora no valor de seus próprios dados de voz para permitir que o sistema repita a frase em mandarim usando seu própria voz!

A tecnologia não é melhor e ainda comete erros, mas é genuinamente impressionante perceber que isso é possível. O futuro da interação humana está absolutamente no horizonte.

(via Technetblog)

Você pode nos seguir no Twitter, adicionar -nos ao seu círculo no Google+ ou gostar da nossa página do Facebook para manter -se atualizado em toda a atual da Microsoft, Google, Apple e The Web.

Leave a Reply

Your email address will not be published. Required fields are marked *

Extra Text
Cape Town, South Africa