Dataconomy DE
Subscribe
No Result
View All Result
Dataconomy DE
Subscribe
No Result
View All Result
Dataconomy DE
No Result
View All Result

ElfLabs ’neues Sprach-Text-Modell behauptet 97% Genauigkeit

byKerem Gülen
Februar 27, 2025
in Artificial Intelligence, News
Home Artificial Intelligence
Share on FacebookShare on Twitter

ElfLabs hat ein KI-Startup, das für seine Audio-Generation-Fähigkeiten anerkannt ist gestartet Ein eigenständiges Sprach-zu-Text-Modell namens Scribe. Der Start folgt einer erheblichen Finanzierungsrunde in Höhe von 180 Millionen US -Dollar, was die Bewertung des Unternehmens auf 3,3 Milliarden US -Dollar erhöht.

ElfLabs startet Schreiber: ein neues AI-Sprach-zu-Text-Modell

Scribe unterstützt über 99 Sprachen und erzielt in über 25 Sprachen eine Wortfehlerrate von weniger als 5%, einschließlich Englisch, die eine geltende Genauigkeitsrate von 97% enthält. Weitere Sprachen in der Kategorie Excellentgenauigkeit sind Französisch, Deutsch, Hindi, Indonesier, Japanisch, Kannada, Malayalam, Polnisch, Portugiesisch, Spanisch und Vietnamesisch. Zusätzliche Sprachen werden mit unterschiedlichen Fehlerraten von hoch (5% bis 10%) bis moderat (25% bis 50%) klassifiziert.

https://eleven-public-cdn.elevenlabs.io/payloadcms/w814e04tfy-elevenlabs%20Scribe%20-%20Final%20V3.mp4

Video: elfLabs

Das neue Modell übertrifft Berichten zufolge Googles Gemini 2.0 Flash und Openai’s Whisper Large V3 in mehreren Sprachen basierend auf Fleurs und gemeinsamen Sprachbenchmark -Tests. Scribe ist das erste separate Spracherkennungsmodell von ElevenLabs, das zuvor Sprach-zu-Text-Komponenten in seine KI-Konversationsagenten-Plattform integriert hatte.


Chatgpt Plus -Abonnenten genießen jetzt eine tiefe Forschungsfunktion


CEO Mati Staniszewski betonte das Ziel, das Verständnis von Gesprächen zu verbessern: „Wir arbeiten daran, nur Inhalte zu generieren und zu verstehen und Sprache zu transkriptieren“, sagte er. Das Modell verfügt über die Sprecherdurch Diatrisierung, Zeitstempel auf Wortebene für genaue Untertitel und automatische Aufgabe von nonverbalen Audioereignissen.

Scribe beschränkt sich derzeit auf vorgezeichnete Audioformate, wobei eine Echtzeitversion voraussichtlich in Kürze veröffentlicht wird. Die Preisgestaltung für Schreiber beträgt 0,40 USD pro Stunde transkribierter Audio, wobei in den ersten sechs Wochen ein einführender Rabatt von 50% erhältlich ist.

elfLabs-New Speech-to-Text-Model-Claims-97-Prozent-Genauigkeit
Bild: Elevenlabs

Benchmark -Tests geben an, dass Scribe die niedrigsten Wortfehlerraten für verschiedene Sprachen aufzeichnet und 98,7% in Italienisch und 96,7% in Englisch erzielen. Zu den wichtigsten Merkmalen gehören die Möglichkeit, Lautsprecher in Multi-Sprecher-Aufnahmen, detaillierten Zeitstempeln und die Erkennung von Nicht-Sprach-Ereignissen zu unterscheiden.

Für Unternehmensbenutzer dient Scribe als skalierbares Transkriptionsinstrument, das für Sektoren von Vorteil ist, die sich auf Dokumentation, Erfüllung von Transkriptionen und Zugänglichkeitsinitiativen verlassen. Die bevorstehende Echtzeitversion könnte ihren Nutzen in Live-Kommunikationsszenarien weiter verbessern.

Der Start von Schreiber fiel mit der Veröffentlichung von Hume Ai’s Octave zusammen, einem anpassbaren, llm-betriebenen Text-zu-Sprach-Modell, das auf die Erstellung von Inhalten zugeschnitten ist. ElfLabs behauptet, Schreiber hat die Wettbewerber in der Transkriptionsgenauigkeit konsequent übertroffen.

Scribe kann direkt über die ElevenLabs -Website oder -A -API zugegriffen werden, sodass Benutzer Audio- oder Videodateien für formatierte Transkripte hochladen können. Die strukturierte Output-Integration in verschiedene Anwendungen unterstützt eine Wettbewerbsoption für Unternehmen, die Transkriptionsdienste mit hoher Genauigkeit suchen.


Ausgewähltes Bildnachweis: elfLabs

Tags: ElflabsSchreiber

Related Posts

Samsung und Fender starten Gitarrenunterricht für 2025-Fernseher

Samsung und Fender starten Gitarrenunterricht für 2025-Fernseher

Januar 15, 2026
Zwillinge gewinnen persönliche Intelligenz, um Daten aus Gmail und Fotos zu synthetisieren

Zwillinge gewinnen persönliche Intelligenz, um Daten aus Gmail und Fotos zu synthetisieren

Januar 15, 2026
YouTube führt strenge Shorts-Limits ein, um die Bildschirmsucht von Teenagern einzudämmen

YouTube führt strenge Shorts-Limits ein, um die Bildschirmsucht von Teenagern einzudämmen

Januar 15, 2026
Apple sichert Civilization VII für Arcade-Mobil- und Mac-Abonnenten

Apple sichert Civilization VII für Arcade-Mobil- und Mac-Abonnenten

Januar 15, 2026
Die FTC verbietet GM den Verkauf von Fahrerdaten ohne ausdrückliche Zustimmung

Die FTC verbietet GM den Verkauf von Fahrerdaten ohne ausdrückliche Zustimmung

Januar 15, 2026
Der weltweite Mangel an Speicherchips lässt die PC-Preise in die Höhe schnellen

Der weltweite Mangel an Speicherchips lässt die PC-Preise in die Höhe schnellen

Januar 14, 2026

Recent Posts

  • Samsung und Fender starten Gitarrenunterricht für 2025-Fernseher
  • Der Gewinn von TSMC steigt um 35 % und erreicht ein Rekordhoch bei der Nachfrage nach KI-Chips
  • Zwillinge gewinnen persönliche Intelligenz, um Daten aus Gmail und Fotos zu synthetisieren
  • YouTube führt strenge Shorts-Limits ein, um die Bildschirmsucht von Teenagern einzudämmen
  • Interessengruppen kritisieren Apple und Google für das Hosten von Grok- und X-Apps

Recent Comments

Es sind keine Kommentare vorhanden.
Dataconomy DE

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Home
  • Sample Page

Follow Us

  • Home
  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.