KI-Benchmarks haben mehr Probleme als Lösungen

KI-Entwickler brüsten sich stolz mit den Zahlen, die ihre Systeme in Benchmark-Tests erreichen. Wir erklären, wie KI-Benchmarks funktionieren und fragen: Wie aussagekräftig sind solche Tests wirklich? Und kommt es am Ende vielleicht bloss auf die «Vibes» an?

Von: Jürg Tschirren

Download

Der ganze Podcast im Überblick:

(00:01:28) Was sind eigentlich KI-Benchmark-Tests?

(00:06:23) Neun Probleme

(00:34:27) Drei Lösungen

Chatbot Arena:

https://chat.lmsys.org

SRF Geek Sofa bei Discord:

https://discord.gg/geeksofa

Audio & Podcasts
Digital Podcast
Aktueller Artikel

Mehr von «Digital Podcast»

Audio Nvidia: Vom Chip-Champion zum KI-König in einem neuen Fenster öffnen. Laufzeit 33 Minuten 51 Sekunden.

Audio
Nvidia: Vom Chip-Champion zum KI-König abspielen. Laufzeit 33 Minuten 51 Sekunden. Aus: Digital Podcast vom 26.04.2024
Audio Mit BIM zurück zu den effizienten Baustellen des Mittelalters in einem neuen Fenster öffnen. Laufzeit 31 Minuten 56 Sekunden.

Audio
Mit BIM zurück zu den effizienten Baustellen des Mittelalters abspielen. Laufzeit 31 Minuten 56 Sekunden. Aus: Digital Podcast vom 19.04.2024
Audio TikTok Shop: Homeshopping für die Generation Z in einem neuen Fenster öffnen. Laufzeit 54 Minuten 30 Sekunden.

Audio
TikTok Shop: Homeshopping für die Generation Z abspielen. Laufzeit 54 Minuten 30 Sekunden. Aus: Digital Podcast vom 12.04.2024
Audio Quantencomputer, quo vadis? in einem neuen Fenster öffnen. Laufzeit 26 Minuten 57 Sekunden.

Audio
Quantencomputer, quo vadis? abspielen. Laufzeit 26 Minuten 57 Sekunden. Aus: Digital Podcast vom 29.03.2024
Audio Wie gut kann künstliche Intelligenz Texte zusammenfassen? in einem neuen Fenster öffnen. Laufzeit 59 Minuten 10 Sekunden.

Audio
Wie gut kann künstliche Intelligenz Texte zusammenfassen? abspielen. Laufzeit 59 Minuten 10 Sekunden. Aus: Digital Podcast vom 22.03.2024
Audio Mit der neuen E-ID wird alles anders in einem neuen Fenster öffnen. Laufzeit 36 Minuten 2 Sekunden.

Audio
Mit der neuen E-ID wird alles anders abspielen. Laufzeit 36 Minuten 2 Sekunden. Aus: Digital Podcast vom 15.03.2024
Audio Stirbt die Content-Industrie? in einem neuen Fenster öffnen. Laufzeit 58 Minuten 22 Sekunden.

Audio
Stirbt die Content-Industrie? abspielen. Laufzeit 58 Minuten 22 Sekunden. Aus: Digital Podcast vom 08.03.2024
Audio Nordkoreas Raketen fliegen dank Bitcoin in einem neuen Fenster öffnen. Laufzeit 48 Minuten 13 Sekunden.

Audio
Nordkoreas Raketen fliegen dank Bitcoin abspielen. Laufzeit 48 Minuten 13 Sekunden. Aus: Digital Podcast vom 01.03.2024
Audio Bären-und Löwenhunger auf Daten: Was bringt's den Eishockeyclubs? in einem neuen Fenster öffnen. Laufzeit 54 Minuten 7 Sekunden.

Audio
Bären-und Löwenhunger auf Daten: Was bringt's den Eishockeyclubs? abspielen. Laufzeit 54 Minuten 7 Sekunden. Aus: Digital Podcast vom 23.02.2024
Audio 15 Jahre WhatsApp – wie geht es jetzt weiter? in einem neuen Fenster öffnen. Laufzeit 36 Minuten 17 Sekunden.

Audio
15 Jahre WhatsApp – wie geht es jetzt weiter? abspielen. Laufzeit 36 Minuten 17 Sekunden. Aus: Digital Podcast vom 16.02.2024

Mehr von «Digital Podcast»

Suche

Hauptnavigation

Rubriken

TV/Radio

Weitere Angebote