Les assistants vocaux font partie intégrante de la technologie d'aujourd'hui. Dominée par Apple Siri, Amazon Alexa et Google Assistant, il est important que la technologie vocale soit chargée d'éléments réalistes. Dans cet esprit, basé à Londres Sonantique a développé une technologie de voix artificielle de qualité humaine destinée aux gaming et l'industrie du divertissement.
La société a annoncé lundi avoir produit une vidéo en collaboration avec un client hollywoodien intitulée "Quel est son secret ?”. La vidéo surprises lorsqu'il est révélé que le personnage principal n'est pas une personne réelle mais une IA.
Lancée le jour de la Saint-Valentin, la vidéo vise à démontrer comment les studios de divertissement peuvent tirer parti AI pour créer des rencontres amoureuses hyperréalistes.
Voix artificielles expressives et réalistes
Fondée en 2018 par Zeena Qureshi et John Flynn, Sonantic (anciennement Speak Ai) vise à perturber le divertissement et gaming industrie de la voix. La société a construit une plate-forme alimentée par l'IA qui crée des modèles vocaux convaincants, nuancés et réalistes.
Sonantic propose un doublage dynamique à la demande, c'est-à-dire la capacité de créer un type de personnage spécifique en termes d'accent, de ton, de personnalité, de sexe et d'état émotionnel. Le système de synthèse vocale de qualité humaine de l'entreprise est fourni par une API et un outil d'interface utilisateur graphique qui permet aux acteurs de voix synthétiques d'être sculptés, dirigés et édités de la même manière que les acteurs humains.
Il profite aux studios de jeux car il fournit des cycles d'itération plus rapides à un coût beaucoup plus abordable en réduisant les dépenses logistiques et dispose de modèles vocaux prêts à fonctionner.
"Le thème de l'amour"
Sonantic dit avoir proposé le concept de la vidéo en mettant l'accent sur le thème de l'amour.
Les modèles vocaux, connus pour exprimer un large éventail d'émotions humaines allant du bonheur à la tristesse, peuvent désormais transmettre des subtilités telles que le flirt, la timidité et les taquineries, entre autres nouvelles options "Style".
Sonantic a également développé la capacité de capturer des sons non vocaux tels que des respirations, des moqueries et des rires. Selon la société, ces avancées dans la synthèse vocale rendent la plate-forme de Sonantic plus complète.
"Dans la vidéo, la voix calme et apaisante du personnage fluctue légèrement lorsqu'elle demande : « Que faudrait-il pour que tu tombes amoureuse de moi ? Pendant que vous écoutez le dialogue, remarquez quand elle rit, respire ou soupire au bon moment. La vidéo surpriseaux téléspectateurs lorsqu'il est révélé que, bien que la femme à l'écran soit une personne réelle, le personnage principal qui parle est une IA », déclare la société dans un article de blog.
Selon les fondateurs, Qureshi et Flynn, "Les êtres humains sont incroyablement complexes par nature et nos voix jouent un rôle essentiel pour nous aider à nous connecter avec le monde qui nous entoure. Chez Sonantic, nous nous engageons à capturer les nuances de la voix humaine, et nous sommes incroyablement fiers de ces percées technologiques que nous avons concrétisées grâce à "What's Her Secret". Du flirt et du rire à la respiration et à la pause, c'est la démo romantique la plus réaliste que nous ayons créée à ce jour, nous aidant à nous rapprocher de notre vision d'être le CGI de l'audio.