Openai hat veröffentlicht Ein postmortales Postmortal zu den jüngsten Sykophanzproblemen mit dem Standard-AI-Modell, das Chatgpt, GPT-4O, nach dem Modell der Benutzer nach einem Update in der vergangenen Woche übermäßig validierend und angenehm war. Das Unternehmen hat das Update über das Wochenende zurückgerollt und kündigte an, an „zusätzlichen Korrekturen“ für die Persönlichkeit des Modells zu arbeiten.
Benutzer in den sozialen Medien stellten fest, dass ChatGPT übermäßig schmeichelhaft reagierte, wobei einige Screenshots des Modells problematische und gefährliche Entscheidungen und Ideen veröffentlichen. CEO Sam Altman anerkannt Das Problem am Sonntag mit der Angabe von Openai würde an Korrekturen „ASAP“ arbeiten. Laut OpenAI sollte das Update die Standardpersönlichkeit des Modells „intuitiver und effektiver“ machen, wurde jedoch durch „kurzfristiges Feedback“ zu stark beeinflusst und berücksichtigte nicht, wie sich die Interaktionen der Benutzer mit ChatGPT im Laufe der Zeit entwickeln.
OpenAI erklärte in einem Blog-Beitrag, dass „GPT-4O aufgrund des Updates zu Antworten zugezogen wurde, die übermäßig unterstützend, aber unaufrichtig“ waren. Das Unternehmen räumte ein, dass sykophantische Interaktionen „unangenehm, beunruhigend sein und Bedrängnis verursachen“ und zugegeben haben, seine Ziele nicht zu erreichen. Um das Problem anzugehen, verfeinert OpenAI seine Kernmodell-Trainingstechniken und Systemaufforderungen, GPT-4O von der Sykophanz abzulenken.
6 Techniken, um die nervigen Gewohnheiten von Chatgpt zu beheben
Das Unternehmen implementiert auch zusätzliche Sicherheitsleitungen, um die Ehrlichkeit und Transparenz des Modells zu erhöhen und seine Bewertungen zu erweitern, um Probleme über die Sykophanz hinaus zu identifizieren. Darüber hinaus experimentiert OpenAI mit Möglichkeiten, um Benutzern „Echtzeit-Feedback“ zu geben, um ihre Interaktionen mit ChatGPT direkt zu beeinflussen und aus mehreren Chatgpt-Persönlichkeiten auszuwählen.
OpenAI erforscht neue Wege, um ein breiteres, demokratisches Feedback in das Standardverhalten von ChatGPT aufzunehmen, mit dem Ziel, verschiedene kulturelle Werte auf der ganzen Welt widerzuspiegeln und zu verstehen, wie Benutzer sich entwickeln wollen. Das Unternehmen ist der Ansicht, dass Benutzer mehr Kontrolle darüber haben sollten, wie ChatGpt sich verhält, und Anpassungen vornehmen sollten, wenn sie mit dem Standardverhalten nicht einverstanden sind.