Sprachassistenten sind ein integraler Bestandteil der heutigen Technologie. Dominiert von Apple Siri, Amazon Alexa und Google Assistant, ist es wichtig, dass die Sprachtechnologie mit realistischen Elementen ausgestattet ist. Mit diesem Gedanken im Hinterkopf, mit Sitz in London Sonantisch hat eine künstliche Sprachtechnologie in menschlicher Qualität entwickelt, die darauf abzielt gaming und Unterhaltungsindustrie.
Das Unternehmen gab am Montag bekannt, dass es in Zusammenarbeit mit einem Hollywood-Kunden ein Video mit dem Titel „Was ist ihr Geheimnis?“. Das Video ist großartigrises Zuschauer, als sich herausstellt, dass es sich bei der Hauptfigur nicht um eine reale Person, sondern um eine KI handelt.
Das am Valentinstag veröffentlichte Video soll zeigen, wie Unterhaltungsstudios davon profitieren können AI um hyperrealistische romantische Begegnungen zu schaffen.
Ausdrucksstarke und realistische künstliche Stimmen
Sonantic (ehemals Speak Ai) wurde 2018 von Zeena Qureshi und John Flynn gegründet und hat sich zum Ziel gesetzt, die Unterhaltungsbranche zu revolutionieren gaming Sprachindustrie. Das Unternehmen hat eine KI-gestützte Plattform entwickelt, die überzeugende, differenzierte und realistische Sprachmodelle erstellt.
Sonantic bietet dynamische Sprachausgabe auf Abruf, d. h. die Möglichkeit, einen bestimmten Charaktertyp in Bezug auf Akzent, Ton, Persönlichkeit, Geschlecht und emotionalen Zustand zu erstellen. Das Text-zu-Sprache-System des Unternehmens in menschlicher Qualität wird durch eine API und ein grafisches Benutzeroberflächentool bereitgestellt, mit dem synthetische Synchronsprecher ähnlich wie menschliche Schauspieler geformt, geleitet und bearbeitet werden können.
Davon profitieren Spielestudios, da es schnellere Iterationszyklen zu wesentlich günstigeren Kosten bietet, indem es den Logistikaufwand reduziert und über einsatzbereite Sprachmodelle verfügt.
„Das Thema Liebe“
Sonantic gibt an, das Konzept für das Video mit dem Schwerpunkt auf dem Thema Liebe entwickelt zu haben.
Die Stimmmodelle, die dafür bekannt sind, ein breites Spektrum menschlicher Emotionen von Glück bis Traurigkeit auszudrücken, können jetzt neben anderen neuen „Stil“-Optionen Feinheiten wie Flirt, Schüchternheit und Neckerei vermitteln.
Sonantic hat auch die Fähigkeit entwickelt, nicht-sprachliche Geräusche wie Atemzüge, Spott und Lachen zu erfassen. Nach Angaben des Unternehmens machen diese Fortschritte in der Sprachsynthese die Plattform von Sonantic umfassender.
"In dem Video, schwankt die ruhige, beruhigende Stimme der Figur ganz leicht, als sie fragt: „Was wäre nötig, damit du dich in mich verliebst?“ Beachten Sie beim Zuhören des Dialogs, wenn sie genau im richtigen Moment lacht, atmet oder seufzt. Das Video ist großartigrises Zuschauer, wenn sich herausstellt, dass die Frau auf dem Bildschirm zwar eine reale Person ist, die sprechende Hauptfigur jedoch eine KI ist“, heißt es in einem Blogbeitrag des Unternehmens.
Laut den Gründern Qureshi und Flynn „sind Menschen von Natur aus unglaublich komplex und unsere Stimmen spielen eine entscheidende Rolle dabei, uns mit der Welt um uns herum zu verbinden.“ Bei Sonantic ist es uns ein Anliegen, die Nuancen der menschlichen Stimme einzufangen, und wir sind unglaublich stolz auf diese technologischen Durchbrüche, die wir mit „What's Her Secret“ zum Leben erweckt haben. Von Flirten und Kichern bis hin zu Atmen und Innehalten ist dies die realistischste romantische Demo, die wir bisher erstellt haben, und hilft uns, unserer Vision, das CGI von Audio zu sein, einen Schritt näher zu kommen.“