Mit dem neuen Sprachmodell will Google an die Spitze. Gemini punktet mit Multimodalität und Diversität. Die Sterne um das neue Modell stehen also nicht schlecht.

Das ist Google’s Gemini: Mit dem neuen KI-Modell Gemini will Google die Konkurrenz abhängen. Das bestehende KI-System GPT4 vom US-amerikanischen Unternehmen OpenAI soll damit übertroffen werden. In der Branche nimmt KI eine immer wichtigere Rolle ein.

Legende: Mit Gemini hat Google Grosses vor. «Wir bringen Gemini über die Google-Produkte zu Milliarden von Menschen», kündigte der Chef von Google DeepMind, Demis Hassabis, an. REUTERS/Dado Ruvic

Google-Chef, Sundar Pichai, sagte bei der Lancierung von Gemini gar, der Wandel, den man mit KI erlebe, sei «der tiefgreifendste in unserem Leben». Er sei weitaus grösser als die Umstellung aufs Mobiltelefon oder Internet. Verständlich also, dass Google nun ein eigenes Produkt auf den Markt bringt.

Gemini macht ChatGPT Konkurrenz: Etwas mehr als ein Jahr vor der Geburtsstunde von Gemini, wurde der KI-Chatbot ChatGPT öffentlich zugänglich. Ob Gemini besser ist als ChatGPT, lässt sich nicht abschliessend beantworten.

Gemini hat die Fähigkeit, die Welt um uns herum so wie ein Mensch zu verstehen.

Laut SRF-Digitalredaktor Guido Berger schneidet Gemini in einigen standardisierten Tests besser ab als ChatGPT, in anderen dafür nicht. Wer die Nase vorn hat, «weiss man erst, wenn diese Modelle verfügbar sind und man sie in echten Anwendungen testen kann».

Was kann Gemini, das ChatGPT nicht kann? «Gemini ist multimodal», so Berger. Das bedeute, dass es nicht nur Text verstehen und produzieren, sondern auch Audio, Bilder und Videos direkt verarbeiten und produzieren kann.

Bei ChatGPT sei dies im Moment nur über Umwege möglich, erklärt der Digitalredaktor. Google und Deepmind Chef, Demis Hassabis, sagt über die Software: «Gemini hat die Fähigkeit, die Welt um uns herum so wie ein Mensch zu verstehen.»

Gemini kommt in drei Grössen auf den Markt: Gemäss dem Vizepräsidenten für Produkte und Forschung bei Google Deepmind, Eli Collins, wird Gemini in drei verschiedenen «Grössen» verfügbar sein: Ultra, Pro und Nano. Damit grenze sich das Googleprodukt auch in wirtschaftlicher Hinsicht vom OpenAI Konkurrent ab, so Berger.

Google unter Zugzwang: Auch wenn Gemini zurzeit nicht viel besser ist als ChatGPT, durfte Google mit der Lancierung nicht mehr länger warten. Für Guido Berger ist klar: «Sie dürfen einfach nicht weiter Boden verlieren gegenüber anderen wie OpenAI oder Microsoft.»

Insbesondere, weil viel von der Technologie, die in ChatGPT drinstecke, ursprünglich von Google entwickelt wurde, so Berger. Google arbeitet schon seit Jahren an Anwendungen auf Basis Künstlicher Intelligenz. Die Früchte dieser Arbeit sollen nun nicht anderen überlassen werden, so Berger.

Ultra, Pro und Nano erklärt Box aufklappen Box zuklappen Gemini Ultra braucht am meisten Rechenleistung und soll hochkomplexe Aufgaben lösen können. Diese Variante richtet sich vor allem an Unternehmenskunden. Gemini Pro wird sich an ein breites Publikum wenden und dem bereits bestehenden Chatbot Bard fortgeschrittenes Denken, Planen, Verstehen und mehr beibringen. Es ist vorerst nur in Englisch verfügbar, soll aber in Zukunft auch in anderen Sprachen verfügbar sein. Die Nano-Variante hat die kleinste Rechenleistung und ist für die Anwendung auf dem Smartphone ausgelegt. Damit könne zum Beispiel gesprochene Sprache aus einer Sitzung oder einer Vorlesung direkt in schriftliche Sprache umgewandelt und ohne Verzögerung eine kompakte Zusammenfassung erstellt werden. In den kommenden Monaten wird Gemini in weiteren Google-Produkten und Diensten wie Suche, Werbeanzeigen oder dem Chrome-Browser verfügbar sein. Google bietet verschiedene Modelle an, «dass man die Produkte und Preise schön ausdifferenzieren kann», erläutert der Digitalredaktor.

Der KI-Markt wird weiter wachsen: Schon jetzt gebe es viele Anbieter von KI.«ChatGPT ist einfach so stark im Gespräch, weil es ein Produkt ist, das sich direkt an Endkunden und Endkundinnen richtet.» In Zukunft werde es eine starke Fragmentierung auf dem Markt geben, sagt der Digitalredaktor.

Das ist sicher anspruchsvoller, als wenn man einfach ein, zwei grosse Anbieter hat, denen man sehr genau auf die Finger schauen kann.

Viele Anbieter würden Produkte mit ganz unterschiedlichen Anwendungsmöglichkeiten anbieten. Das ist vor allem aus Sicht von Kundinnen und Kunden von Vorteil. Aus der Vielzahl von Angeboten können sich Unternehmen ein passendes aussuchen.

KI wird immer schwerer zu regulieren: Die Diversifizierung der Angebote bringt aber auch Nachteile mit sich. KI-Angebote zu regulieren wird bei einer Vielzahl an Angeboten immer schwieriger.

«Das ist sicher anspruchsvoller, als wenn man einfach ein, zwei grosse Anbieter hat, denen man sehr genau auf die Finger schauen kann», so Berger. Gesamtgesellschaftlich bleibe also noch offen, ob die Fragmentierung auf dem Markt für KI-Modelle ein Vorteil oder Nachteil ist.