Zum Inhalt springen

KI lässt es menscheln ChatGPT kann jetzt sprechen, singen – und Sarkasmus

Der Chatbot kann in seiner neuesten Version direkt mit Menschen interagieren – und verblüffend lebendige Unterhaltungen führen.

Das kann GPT-4o: Der populäre Chatbot kann jetzt eine Unterhaltung mit Menschen führen und deren Emotionen erkennen. Mit der natürlichen Stimme und der kurzen Reaktionszeit erinnert GPT-4o an Sprachassistenten aus Hollywood-Filmen. Es übersetzt ausserdem zwischen verschiedenen Sprachen und kann gleichzeitig mit gesprochenen Befehlen auch Informationen von einer Smartphone-Kamera verarbeiten. Wie gut die Software Deutsch sprechen kann, blieb nach der Präsentation vom Montag noch offen.

Dein Freund und Helfer: ChatGPT wird damit zu einem mächtigen Konkurrenten für die Sprachassistenten der Tech-Schwergewichte wie Amazons Alexa und Apples Siri, die im Vergleich dazu sehr schlicht wirken. In einem Livestream demonstrierte die Entwicklerfirma OpenAI unter anderem, wie das neue Modell helfen kann, eine Mathematik-Gleichung zu lösen. Dabei gab die Software per Stimme Ratschläge für den Rechenweg, statt das Ergebnis zu verraten.

In einer weiteren Demonstration erfand ChatGPT eine Gute-Nacht-Geschichte und las sie vor. Dabei konnte man die Software unterbrechen und bitten, mehr Dramatik in die Stimme zu bringen oder wie ein Roboter zu sprechen. ChatGPT sprach dabei fliessend und lebendig wie ein Mensch.

Auch mit einer Gesangseinlage überzeugte die KI. Reibungslos funktionierte auch ein Live-Test, bei dem ChatGPT einige Sätze zwischen Spanisch und Englisch übersetzte. Alle Interaktionen wurden mit dem Weck-Satz «Hey, ChatGPT» eingeleitet.

Natürliche Interaktion: Max Meister ist Investor und Dozent für Entrepreneurship an der Hochschule für Wirtschaft Zürich (HWZ). Er befasst sich intensiv mit Künstlicher Intelligenz und vor allem mit ChatGPT. Für ihn ist die neuste Version der KI ein beachtlicher Sprung: «Zwischen Mensch und Computer wird damit eine viel natürlichere Beziehung aufgebaut.»

ChatGPT als Urknall des KI-Hypes

Box aufklappen Box zuklappen

ChatGPT löste vor über einem Jahr den Hype um Künstliche Intelligenz aus. Solche KI-Chatbots werden mit gewaltigen Mengen an Informationen trainiert und können Texte auf dem sprachlichen Niveau eines Menschen formulieren, Software-Code schreiben und Informationen zusammenfassen. Das Prinzip dahinter ist, dass sie Wort für Wort abschätzen, wie ein Satz weitergehen sollte.

Emotionale Verbindung: Die KI interagiert nun intuitiv und glaubwürdig mit Menschen – und bringt auch Emotionen in ihre Stimme oder greift zum Sarkasmus:

Gleichzeitig kann sie auch die emotionale Befindlichkeit der Nutzenden einordnen und reagiert etwa auf Schwankungen in der Stimmlage oder die Mimik. «Es ist verrückt, auf wie viele Aspekte diese Bots nun schon reagieren», sagt Meister. «Es kann sehr gut sein, dass wir auf dem Weg zu einer Revolution sind.» Das könne ebenso spannend wie furchteinflössend sein. «Ich glaube aber, dass wir uns im Laufe der Zeit daran gewöhnen werden.»

Angesichts der neuen Fertigkeiten der KI ist für Meister absehbar, dass sie quasi zu einem lebendigen Assistenten des Menschen wird. So könnte sie Aufträge erfüllen, die man heute noch selbst erledigen muss – zum Beispiel die Buchung von Reisen, die Führung des Terminkalenders und dergleichen.

Das KI-Rennen läuft: Der Zeitpunkt der Präsentation von GPT-4o ist interessant. Am Dienstag hält Google seine jährliche Entwicklerkonferenz ab, bei der auch Ankündigungen zu neuen Funktionen mit Künstlicher Intelligenz erwartet werden. Google zeigte bereits vor einigen Monaten, wie seine KI-Software Gemini gesprochene und visuelle Informationen verarbeiten kann. Welcher der Techgiganten mit seiner Software am Ende am meisten Erfolg haben wird, ist für Meister noch offen. Für kleinere Startups werde es aber zunehmend schwieriger, mit Microsoft, Google, Apple und Co. konkurrieren zu können.

SRF 4 News, 14.05.2024, 10:41 Uhr ; 

Meistgelesene Artikel