KI-Modell für anspruchsvolle Aufgaben

Software beherrscht komplexe Argumentationsketten
chatgpt

Eine neue Software von OpenAI beherrscht komplexe Argumentationsketten.

Der ChatGPT-Entwickler OpenAI hat im September ein neues KI-Modell vorgestellt, das komplexere Aufgaben als bisherige Chatbots lösen kann. Die Software mit dem Namen o1 verbringe dafür mehr Zeit mit «Nachdenken», bevor sie eine Antwort gibt. Die Künstliche Intelligenz probiere verschiedene Ansätze aus und erkenne und korrigiere ihre eigenen Fehler, erläutert OpenAI in einem Blogeintrag.

 

Das zeige bei Mathematik und dem Programmieren von Software Wirkung. So habe das o1-Modell 83 Prozent der Aufgaben der Prüfung für die Internationale Mathematik-Olympiade gelöst. Das aktuelle ChatGPT-4o sei lediglich auf 13 Prozent gekommen. Zugleich fehlen bei dem neuen Modell noch viele nützliche Funktionen von ChatGPT. So könne es nicht im Web nach Informationen suchen und unterstütze nicht das Hochladen von Dateien.

Auch o1 erfindet Antworten

Aus den Unterlagen geht zugleich hervor, dass das neue Modell bei einer Testauswahl von 100'000 Anfragen in 0,38 Prozent der Fälle wissentlich eine falsche Antwort gab. Das sei vor allem passiert, wenn OpenAI o1 darum gebeten worden sei, auf Artikel, Websites oder Bücher zu verweisen.

 

Das war aber ohne Zugang zur Internet-Suche in vielen Fällen nicht möglich. So erfand die Software selber plausibel aussehende Beispiele. Die Software habe aber stets nur die Wünsche der Nutzenden erfüllen wollen. Die sogenannten «Halluzinationen», bei denen KI-Software Informationen einfach erfindet, sind generell ein bisher ungelöstes Problem.