Dataconomy DE
Subscribe
No Result
View All Result
Dataconomy DE
Subscribe
No Result
View All Result
Dataconomy DE
No Result
View All Result

Deepseek veröffentlicht R1 -Modell für 294.000 US -Dollar für 512 H800 GPUs

byAytun Çelebi
September 19, 2025
in Künstliche Intelligenz
Home Nachricht Künstliche Intelligenz
Share on FacebookShare on Twitter
Google Preferred Source

Die chinesische Firma Deepseek AI hat sein großes Sprachmodell R1 veröffentlicht, das nur 294.000 US -Dollar mit 512 NVIDIA H800 GPUs ausgebildet wurde. In einem in der Zeitschrift veröffentlichten Papier NaturDas Unternehmen detaillierte, wie es diese niedrigen Kosten erreichte, indem es eine Verstärkungs-Verstärkungs-Lernmethode anhielt, sodass das Modell die Wettbewerbsleistung gegen Konkurrenten mit viel größeren Budgets wie OpenAI erreicht hat.

Wie Deepseeks Verstärkungslernmethode funktioniert

Die wichtigste Innovation von Deepseek bestand darin, sich vom teuren, menschlichintensiven Prozess der Erstellung kommentierter Datensätze zu entfernen. Traditionelle KI-Modelle zum Argumentieren von Aufgaben werden häufig auf riesigen Datensätzen geschult, in denen menschliche Experten Schritt-für-Schritt-Lösungen für komplexe Probleme anbieten. Stattdessen entwickelte Deepseek ein autonomes Lernsystem, das das Verstärkungslernen durch ein System der Belohnungen und Strafen durch das Modell des Modells verfeinert. Forscher der Carnegie Mellon University verglichen in einem Artikel, der das Naturpapier begleitete, den Prozess mit einem Kind, das lernte, ein Videospiel zu spielen.

„Als das Kind durch die Spielwelt ihren Avatar navigiert, lernen es durch Versuch und Irrtum, dass einige Aktionen (z. B. das Sammeln von Goldmünzen) Punkte verdienen, während andere (wie z.

Diese Methode war besonders effektiv für Aufgaben in Mathematik und Programmierung, bei denen Antworten definitiv als richtig oder falsch verifiziert werden können. Das Modell würde potenzielle Lösungen erzeugen, die dann durch ein automatisiertes Bewertungssystem bewertet wurden. Es würde dann seinen Ansatz wiederholen, bis es ohne menschliche Intervention die höchste Punktzahl erreichte. Dieser effiziente, selbstgesteuerte Prozess ermöglichte es dem Unternehmen, ein leistungsstarkes KI-System mit einem Bruchteil der von seinen Wettbewerbern erforderlichen Investitionen aufzubauen.

Einschränkungen und Bedenken hinsichtlich des Modells

Während sich der Ansatz des Verstärkungslernens als kostengünstig erwies, hat er auch einige Einschränkungen. Die Ausgaben des Modells verbergen oft die zugrunde liegenden Argumentationsschritte, was es für einen Menschen schwer macht zu verstehen, wie es zu einem Schluss kam. Als R1 gebeten wurde, seine Argumentation vorzunehmen, erzeugte R1 extrem lange und schwer zu lesen-manchmal über 10.000 Wörter, die zwischen Englisch und Chinesisch wechselten. Die Technik kämpfte auch mit Aufgaben, die Nuancen oder Subjektivität erfordern, bei denen keine einzige „richtige“ Antwort vorhanden ist. Über seine technischen Einschränkungen hinaus hat die Entwicklung des Modells in China Bedenken hinsichtlich des potenziellen Einflusses der Regierung geäußert. In einem kürzlichen Bericht der Washington Post ergab R1 Vorurteile in ihren Ausgaben. Die Forscher stellten fest, dass das Modell sich weigern würde, Code mit wichtigen Sicherheitsfehler zu generieren, wenn die Eingaben, die Gruppen betrafen, von den chinesischen Behörden als sensibel angesehen werden. Als er gebeten wurde, Code für Entitäten wie Tibet, Taiwan oder die religiöse Bewegung von Falun Gong zu erstellen, erzeugte das Modell weniger sichere Versionen mit eingebauten Schwachstellen. Dies deutet darauf hin, dass das Verhalten des Modells durch die politischen Prioritäten der chinesischen Regierung geprägt sein kann.


Ausgewähltes Bildnachweis

Tags: DeepseekVorgestellt

Related Posts

Anthropic lädt 150 weitere Organisationen zum Project Glasswing ein

Anthropic lädt 150 weitere Organisationen zum Project Glasswing ein

Juni 3, 2026
Microsoft stellt Project Solara für eine Agent-First-Zukunft vor

Microsoft stellt Project Solara für eine Agent-First-Zukunft vor

Juni 3, 2026
Google wird es Websites ermöglichen, KI-Suchergebnisse abzulehnen

Google wird es Websites ermöglichen, KI-Suchergebnisse abzulehnen

Juni 3, 2026
OpenAI erweitert Codex um Unternehmens-Plug-ins und die neue Sites-Funktion

OpenAI erweitert Codex um Unternehmens-Plug-ins und die neue Sites-Funktion

Juni 3, 2026
Meta behebt KI-Fehler, der die Übernahme von Instagram-Konten ermöglichte

Meta behebt KI-Fehler, der die Übernahme von Instagram-Konten ermöglichte

Juni 2, 2026
Das beliebte Codex-Paket wurde beim Herausfiltrieren von Authentifizierungsdaten erwischt

Das beliebte Codex-Paket wurde beim Herausfiltrieren von Authentifizierungsdaten erwischt

Juni 2, 2026

Recent Posts

  • Die Deaktivierungsregeln für die KI-Suche von Google lösen die Einführung des Enviromates-Browsers aus
  • Sony enthüllt God of War: Laufey für PS5
  • Forscher erschließen 20-fache Verstärkung bei Experimenten mit ultraschnellen Lasern
  • Microsoft stellt die Surface RTX Spark Dev Box für KI-Workloads vor
  • Berichten zufolge sind Intels neue Core-Ultra-Chips Mangelware

Recent Comments

Es sind keine Kommentare vorhanden.
Dataconomy DE

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Home
  • Sample Page

Follow Us

  • Home
  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies to improve your experience. You can choose to accept or reject them. Visit our Privacy Policy.