sur

Microsoft dévoile VALL-E, une IA qui peut imiter votre voix après seulement 3 secondes d’écoute ! Incroyable !

Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft mise beaucoup sur GPT-3, l'intelligence artificielle conçue par OpenAI/ »>OpenAI/ »>OpenAI/ »>OpenAI/ »>OpenAI/ »>OpenAI/ »>OpenAI/ »>OpenAI, pour plusieurs de ses applications et services, comme Bing ou Word.

Mais l'entreprise dirigée par Satya Nadella développe également ses propres modèles. La preuve en est VALL-E, une IA capable d'imiter la voix de n'importe quelle personne en écoutant simplement trois secondes d'audio.

VALL-E, en particulier, est un modèle de langage pour la synthèse texte-parole (TTS) basé sur EnCodec, le codec audio de , et est très similaire à d'autres IA qui peuvent générer du son à partir d'une brève description textuelle. En fait, Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft dispose d'un service similaire : le Text to Speech, qui permet de convertir un texte en parole synthétique. La différence, cependant, est que VALL-E est capable d'analyser la voix d'une personne et d'interpréter comment cette voix sonnerait avec différentes phrases. Tout en préservant l'intonation et l'émotion de l'orateur, précise la société. Et il peut obtenir d'excellents résultats avec seulement trois secondes de voix.

Plus précisément, nous entraînons un modèle de langage de codec neuronal (appelé VALL-E) en utilisant des codes discrets dérivés d'un modèle de codec audio neuronal standard, et nous considérons le TTS comme une tâche de modélisation conditionnelle du langage plutôt que de régression de signaux continus comme dans les travaux précédents.

VALL-E est peut-être prometteur, mais aussi très dangereux.

/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft

Lire plus  Adidas : Voici les baskets Stan Smith Hello Kitty

La nouvelle IA de Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft, capable de reproduire la voix de n'importe qui, peut également être utilisée avec d'autres modèles d'IA générative. Ainsi, les utilisateurs pourraient, par exemple, demander à Chat/ »>Chat/ »>Chat/ »>Chat/ »>Chat/ »>Chat/ »>Chat/ »>Chat/ »>Chat/ »>Chat/ »>Chat/ »>Chat/ »>Chat/ »>Chat/ »>Chat/ »>ChatGPT d'imiter la voix d'une personne spécifique.

Lire plus  Bill Gates annonce l'arrivé des tatouages électroniques

L'objectif est donc de pouvoir créer des discours vocaux à partir d'une saisie de texte. Cela présente toutefois un inconvénient majeur. Si VALL-E est finalement mis à la disposition du public, il pourrait être utilisé par beaucoup pour se faire passer pour quelqu'un d'autre. Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft, en l'occurrence, précise qu' »il est possible de construire un modèle de détection pour discriminer si un clip audio a été synthétisé par VALL-E« .

Lire plus  Instagram et l'intelligence artificielle, les ingrédients d'un jeune homme pour s'inventer une vie et tromper ses amis

VALL-E n'est qu'un exemple de plus de ce que Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft/ »>Microsoft compte faire avec l'intelligence artificielle. La firme fondée par , répétons-le, est également intéressée par l'inclusion de modèles d'autres entreprises, comme le GPT d'OpenAI/ »>OpenAI/ »>OpenAI/ »>OpenAI/ »>OpenAI/ »>OpenAI/ »>OpenAI/ »>OpenAI, dans certains de ses services. Parmi eux, Bing, dans le but d'offrir de meilleurs résultats de recherche et, ainsi, de concurrencer Google/ »>Google/ »>Google/ »>Google/ »>Google/ »>Google/ »>Google/ »>Google.

Microsoft prévoit d’investir 10 milliards dans les créateurs de ChatGPT et DALL-E

ChatGPT dispose désormais d’une version payante