Dataconomy DE
Subscribe
No Result
View All Result
Dataconomy DE
Subscribe
No Result
View All Result
Dataconomy DE
No Result
View All Result

OpenAI fügt seinen intelligenten Modellen Bedrohungsfilter hinzu

byKerem Gülen
April 17, 2025
in Artificial Intelligence, Cybersecurity, News
Home Artificial Intelligence
Share on FacebookShare on Twitter

OpenAI hat ein neues Überwachungssystem für seine neuesten KI-Modelle O3 und O4-Mini eingeführt, um Aufforderungen im Zusammenhang mit biologischen und chemischen Bedrohungen gemäß der Sicherheit des Unternehmens zu erkennen und zu verhindern Bericht. Das als „sicherheitsorientierten Argumentationsmonitor“ beschriebene System soll potenziell gefährliche Anfragen identifizieren und die Modelle anweisen, sich zu weigern, Beratung zu geben.

Die neuen KI -Modelle stellen eine erhebliche Erhöhung der Fähigkeit gegenüber OpenAs früheren Modellen dar und stellen neue Risiken ein, wenn sie von böswilligen Schauspielern missbraucht werden. Insbesondere O3 hat eine erhöhte Fähigkeit zur Beantwortung von Fragen zur Schaffung bestimmter biologischer Bedrohungen gemäß den internen Benchmarks von OpenAI gezeigt. Um diese Risiken zu mildern, wurde das Überwachungssystem individuell ausgebildet, um die Inhaltsrichtlinien von OpenAI zu begründen, und läuft über O3 und O4-Mini.

OpenAI fügt seinen intelligenten Modellen Bedrohungsfilter hinzu
Bild: OpenAI

Um das Überwachungssystem zu entwickeln, verbrachten die Red-Teamer von OpenAI rund 1.000 Stunden mit „unsicheren“ Biorisk-bedingten Gesprächen von O3 und O4-Mini. In einem simulierten Test lehnten die Modelle ab, auf riskante Aufforderungen in 98,7% der Fälle zu reagieren. OpenAI erkennt jedoch an, dass dieser Test nicht für Benutzer berücksichtigt wurde, die nach dem Blockieren neue Eingaben ausprobieren könnten, und das Unternehmen wird sich weiterhin auf die menschliche Überwachung verlassen.

Laut OpenAI überqueren O3 und O4-Mini nicht die Schwellenwert für Bioristen mit hohem Risiko. Frühe Versionen dieser Modelle erwiesen sich jedoch als hilfreicher bei der Beantwortung von Fragen im Zusammenhang mit der Entwicklung biologischer Waffen im Vergleich zu O1 und GPT-4. Das Unternehmen verfolgt aktiv die potenziellen Risiken, die mit seinen Modellen verbunden sind, und stützt sich zunehmend auf automatisierte Systeme, um diese Risiken zu mildern.

OpenAI verwendet einen ähnlichen Argumentationsmonitor, um zu verhindern, dass GPT-4O native Bildgeneratorin von sexuellem Missbrauch von Kindern (CSAM) erzeugt. Einige Forscher haben jedoch Bedenken geäußert, dass OpenAI die Sicherheit nicht so sehr priorisiert, wie sie sollte, und zitiert nur begrenzte Zeit, um O3 auf einem Benchmark für Täuschungsverhalten und das Fehlen eines Sicherheitsberichts für zu testen GPT-4.1.


Ausgewähltes Bildnachweis

Tags: chatgptopenAI

Related Posts

Ford kündigt auf der CES 2026 den KI-Assistenten und BlueCruise der nächsten Generation an

Ford kündigt auf der CES 2026 den KI-Assistenten und BlueCruise der nächsten Generation an

Januar 8, 2026
OpenAI führt einen speziellen ChatGPT-Gesundheitsbereich ein

OpenAI führt einen speziellen ChatGPT-Gesundheitsbereich ein

Januar 8, 2026
Skylight stellt auf der CES 2026 Calendar 2 mit KI-Organisationstools vor

Skylight stellt auf der CES 2026 Calendar 2 mit KI-Organisationstools vor

Januar 8, 2026
Tone Outdoors stellt auf der CES 2026 den leisen Laubbläser T1 vor

Tone Outdoors stellt auf der CES 2026 den leisen Laubbläser T1 vor

Januar 8, 2026
Bluetti stellt auf der CES 2026 den Charger 2 mit zwei Motor-Solar-Eingängen vor

Bluetti stellt auf der CES 2026 den Charger 2 mit zwei Motor-Solar-Eingängen vor

Januar 8, 2026
CES 2026: Samsung Display-Ankündigungen auf den Punkt gebracht

CES 2026: Samsung Display-Ankündigungen auf den Punkt gebracht

Januar 8, 2026

Recent Posts

  • Ford kündigt auf der CES 2026 den KI-Assistenten und BlueCruise der nächsten Generation an
  • OpenAI führt einen speziellen ChatGPT-Gesundheitsbereich ein
  • Google und Character.AI vergleichen Ansprüche wegen KI-bedingter Todesfälle von Teenagern
  • Skylight stellt auf der CES 2026 Calendar 2 mit KI-Organisationstools vor
  • Tone Outdoors stellt auf der CES 2026 den leisen Laubbläser T1 vor

Recent Comments

Es sind keine Kommentare vorhanden.
Dataconomy DE

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Home
  • Sample Page

Follow Us

  • Home
  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.