Dataconomy DE
Subscribe
No Result
View All Result
Dataconomy DE
Subscribe
No Result
View All Result
Dataconomy DE
No Result
View All Result

OpenAI fügt seinen intelligenten Modellen Bedrohungsfilter hinzu

byKerem Gülen
April 17, 2025
in Artificial Intelligence, Cybersecurity, News
Home Artificial Intelligence
Share on FacebookShare on Twitter

OpenAI hat ein neues Überwachungssystem für seine neuesten KI-Modelle O3 und O4-Mini eingeführt, um Aufforderungen im Zusammenhang mit biologischen und chemischen Bedrohungen gemäß der Sicherheit des Unternehmens zu erkennen und zu verhindern Bericht. Das als „sicherheitsorientierten Argumentationsmonitor“ beschriebene System soll potenziell gefährliche Anfragen identifizieren und die Modelle anweisen, sich zu weigern, Beratung zu geben.

Die neuen KI -Modelle stellen eine erhebliche Erhöhung der Fähigkeit gegenüber OpenAs früheren Modellen dar und stellen neue Risiken ein, wenn sie von böswilligen Schauspielern missbraucht werden. Insbesondere O3 hat eine erhöhte Fähigkeit zur Beantwortung von Fragen zur Schaffung bestimmter biologischer Bedrohungen gemäß den internen Benchmarks von OpenAI gezeigt. Um diese Risiken zu mildern, wurde das Überwachungssystem individuell ausgebildet, um die Inhaltsrichtlinien von OpenAI zu begründen, und läuft über O3 und O4-Mini.

OpenAI fügt seinen intelligenten Modellen Bedrohungsfilter hinzu
Bild: OpenAI

Um das Überwachungssystem zu entwickeln, verbrachten die Red-Teamer von OpenAI rund 1.000 Stunden mit „unsicheren“ Biorisk-bedingten Gesprächen von O3 und O4-Mini. In einem simulierten Test lehnten die Modelle ab, auf riskante Aufforderungen in 98,7% der Fälle zu reagieren. OpenAI erkennt jedoch an, dass dieser Test nicht für Benutzer berücksichtigt wurde, die nach dem Blockieren neue Eingaben ausprobieren könnten, und das Unternehmen wird sich weiterhin auf die menschliche Überwachung verlassen.

Laut OpenAI überqueren O3 und O4-Mini nicht die Schwellenwert für Bioristen mit hohem Risiko. Frühe Versionen dieser Modelle erwiesen sich jedoch als hilfreicher bei der Beantwortung von Fragen im Zusammenhang mit der Entwicklung biologischer Waffen im Vergleich zu O1 und GPT-4. Das Unternehmen verfolgt aktiv die potenziellen Risiken, die mit seinen Modellen verbunden sind, und stützt sich zunehmend auf automatisierte Systeme, um diese Risiken zu mildern.

OpenAI verwendet einen ähnlichen Argumentationsmonitor, um zu verhindern, dass GPT-4O native Bildgeneratorin von sexuellem Missbrauch von Kindern (CSAM) erzeugt. Einige Forscher haben jedoch Bedenken geäußert, dass OpenAI die Sicherheit nicht so sehr priorisiert, wie sie sollte, und zitiert nur begrenzte Zeit, um O3 auf einem Benchmark für Täuschungsverhalten und das Fehlen eines Sicherheitsberichts für zu testen GPT-4.1.


Ausgewähltes Bildnachweis

Tags: chatgptopenAI

Related Posts

CES 2026: Alles, was HP angekündigt hat

CES 2026: Alles, was HP angekündigt hat

Januar 6, 2026
Amazon bringt Alexa mit der Einführung von Alexa.com auf der CES 2026 ins Internet

Amazon bringt Alexa mit der Einführung von Alexa.com auf der CES 2026 ins Internet

Januar 6, 2026
Google bringt Gemini AI auf der CES 2026 ins Wohnzimmer

Google bringt Gemini AI auf der CES 2026 ins Wohnzimmer

Januar 6, 2026
DeepSeek führt Manifold-Constrained Hyper-Connections für R2 ein

DeepSeek führt Manifold-Constrained Hyper-Connections für R2 ein

Januar 6, 2026
Teradar stellt auf der CES 2026 den Terahertz-Sensor Summit vor

Teradar stellt auf der CES 2026 den Terahertz-Sensor Summit vor

Januar 6, 2026
Intel stellt auf der CES 2026 die Core Ultra Series 3 auf 18A vor

Intel stellt auf der CES 2026 die Core Ultra Series 3 auf 18A vor

Januar 6, 2026

Recent Posts

  • Das Imperial College London entwickelt KI, um die Entdeckung von Herzmedikamenten zu beschleunigen
  • CES 2026: Alles, was HP angekündigt hat
  • Amazon bringt Alexa mit der Einführung von Alexa.com auf der CES 2026 ins Internet
  • Google bringt Gemini AI auf der CES 2026 ins Wohnzimmer
  • Kodiak AI arbeitet mit Bosch für eine universelle autonome Lkw-Plattform zusammen

Recent Comments

Es sind keine Kommentare vorhanden.
Dataconomy DE

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Home
  • Sample Page

Follow Us

  • Home
  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.