Dataconomy DE
Subscribe
No Result
View All Result
Dataconomy DE
Subscribe
No Result
View All Result
Dataconomy DE
No Result
View All Result

Denkmaschinenlabor Labors zeigt die Erforschung der Eliminierung von Zufälligkeit in AI -Modellantworten

byKerem Gülen
September 11, 2025
in Künstliche Intelligenz
Home Nachricht Künstliche Intelligenz
Share on FacebookShare on Twitter
Google Preferred Source

Das Denkmaschinenlabor, das von 2 Milliarden US -Dollar an Saatgutfinanzierungen unterstützt und mit ehemaligen OpenAI -Forschern teilgenommen hat, hat seine ersten detaillierten Forschungserkenntnisse geteilt. Das Labor veröffentlichte am Mittwoch einen Blog -Beitrag, in dem untersucht wurde, wie KI -Modelle erstellt werden, die konsistentere und reproduzierbarere Antworten erzeugen und eine grundlegende Herausforderung in der Entwicklung künstlicher Intelligenz angehen.

AI -Modellkonsistenzforschungsforschung zielt nicht determinismus in Großsprachenmodellen ab

Der Blog -Beitrag mit dem Titel „Nichtdeterminismus in LLM -Inferenz zu besiegen„Untersucht, warum KI -Modelle häufig unterschiedliche Antworten auf identische Fragen generieren. Diese Variabilität wurde zwar als inhärentes Merkmal großer Sprachmodelle angenommen, und das Denkmaschinenlabor betrachtet diesen Nichtdeterminismus eher als lösbares Problem als als unvermeidliche Einschränkung.

GPU -Kernel -Orchestrierung verursacht die Reaktion zufälligen

Forscher Horace er verfasste den Beitrag und argumentierte, dass Zufälligkeit in AI -Modellen darauf zurückzuführen ist, wie GPU -Kerne während der Inferenzverarbeitung orchestriert werden. Die Inferenzverarbeitung bezieht sich auf die Berechnungsschritte, die auftreten, nachdem Benutzer Abfragen eingereicht haben, z. B. das Drücken der Eingabetaste in ChatGPT. GPU -Kerne sind spezielle Programme, die auf NVIDIA -Computerchips ausgeführt werden. Er glaubt, dass eine sorgfältige Verwaltung dieser Orchestrierungsschicht AI -Modellen ermöglichen kann, vorhersehbare und konsistentere Ausgaben zu erzeugen.

Konsistente Reaktionen verbessern das Training des Verstärkungslernens

Neben der Verbesserung der Zuverlässigkeit für Unternehmens- und wissenschaftliche Anwendungen schlägt er vor, dass reproduzierbare Antworten die Schulung des Verstärkungslernens (RLL) rationalisieren können. KI -Modelle für Verstärkungslernen für korrekte Antworten, aber inkonsistente Antworten führen Rauschen in Trainingsdaten ein. Konsistentere Antworten könnten den RL -Prozess verbessern, der mit den früheren Berichten der Informationen übereinstimmt, dass Denkmaschinen Labor RL zur Anpassung von KI -Modellen auf bestimmte Geschäftsanforderungen verwenden.

Erste Produkteinführung für die kommenden Monate geplant

Der ehemalige OpenAI -Chief Technology Officer Mira Murati gab im Juli bekannt, dass Denke Machines Lab bald sein erstes Produkt veröffentlichen wird. Sie gab an, dass das Produkt „nützlich für Forscher und Startups, die benutzerdefinierte Modelle entwickeln“, obwohl spezifische Details, und ob es die Reproduzierbarkeitstechniken enthält, bleiben unbekannt.

Open Forschungsverpflichtung spiegelt den frühen OpenAI -Ansatz wider

Denkmaschinenlabor kündigte Pläne zur regelmäßigen Veröffentlichung von Blog -Posts, Code und Forschungsergebnissen an, um „der Öffentlichkeit zugute zu kommen, aber auch unsere eigene Forschungskultur zu verbessern“. Die jüngste Post startet eine neue Serie namens „Connectionism“, die diese Transparenzverpflichtung widerspiegelt. Dieser Ansatz spiegelt das frühe Open Research -Versprechen von Openai wider, obwohl Openai mit zunehmendem Wachstum weniger transparent wurde. Der Forschungsblog bietet seltene Einblicke in die Geschäftstätigkeit von Thinking Machines Lab und zeigt an, dass das Unternehmen erhebliche AI ​​-Forschungsherausforderungen angeht und auf Produkte hinarbeitet, die seine Bewertung von 12 Milliarden US -Dollar rechtfertigen.

Tags: Denkmaschinenlaborkünstliche IntelligenzVorgestellt

Related Posts

Anthropic lädt 150 weitere Organisationen zum Project Glasswing ein

Anthropic lädt 150 weitere Organisationen zum Project Glasswing ein

Juni 3, 2026
Microsoft stellt Project Solara für eine Agent-First-Zukunft vor

Microsoft stellt Project Solara für eine Agent-First-Zukunft vor

Juni 3, 2026
Google wird es Websites ermöglichen, KI-Suchergebnisse abzulehnen

Google wird es Websites ermöglichen, KI-Suchergebnisse abzulehnen

Juni 3, 2026
OpenAI erweitert Codex um Unternehmens-Plug-ins und die neue Sites-Funktion

OpenAI erweitert Codex um Unternehmens-Plug-ins und die neue Sites-Funktion

Juni 3, 2026
Meta behebt KI-Fehler, der die Übernahme von Instagram-Konten ermöglichte

Meta behebt KI-Fehler, der die Übernahme von Instagram-Konten ermöglichte

Juni 2, 2026
Das beliebte Codex-Paket wurde beim Herausfiltrieren von Authentifizierungsdaten erwischt

Das beliebte Codex-Paket wurde beim Herausfiltrieren von Authentifizierungsdaten erwischt

Juni 2, 2026

Recent Posts

  • Die Deaktivierungsregeln für die KI-Suche von Google lösen die Einführung des Enviromates-Browsers aus
  • Sony enthüllt God of War: Laufey für PS5
  • Forscher erschließen 20-fache Verstärkung bei Experimenten mit ultraschnellen Lasern
  • Microsoft stellt die Surface RTX Spark Dev Box für KI-Workloads vor
  • Berichten zufolge sind Intels neue Core-Ultra-Chips Mangelware

Recent Comments

Es sind keine Kommentare vorhanden.
Dataconomy DE

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Home
  • Sample Page

Follow Us

  • Home
  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies to improve your experience. You can choose to accept or reject them. Visit our Privacy Policy.