OpenAI hat ausgerollt der Advanced Voice-Modus für die Desktop-Versionen von ChatGPT, verfügbar auf macOS und Windows. Diese Funktion, die bisher nur in Mobilversionen verfügbar war, erweitert die Funktionen der Desktop-ChatGPT-App und ermöglicht es Benutzern, Sprachgespräche mit der KI auf natürlichere Weise zu führen. Die Ankündigung stand unter dem Motto „Großer Tag für Desktops“ und betonte die Bedeutung dieses Updates für Desktop-Benutzer.
Während die macOS-Version der ChatGPT-App schon seit einiger Zeit verfügbar ist, ist die Die Windows-Version wurde gerade gestartetwodurch der Komfort von ChatGPT direkt an PC-Benutzer weitergegeben wird. Der erweiterte Sprachmodus war jedoch nicht Teil des browserbasierten ChatGPT-Erlebnisses, was diese neue Funktion zu einer bedeutenden Ergänzung zu den Desktop-Versionen macht.
Die Sprachfunktionalität auf dem Desktop entspricht weitgehend der der mobilen Versionen. Benutzer können auf das Advanced Voice-Symbol neben der Eingabeaufforderungsleiste klicken und so ein neues Fenster öffnen, das die bekannte schwebende blaue Kugel zeigt, die pulsiert, während ChatGPT zuhört. Mit dieser Funktion können Benutzer Gespräche mit der KI mit einer der neun verfügbaren Stimmen führen. Um die Stimmen zu ändern, klicken Benutzer einfach auf ein Symbol in der oberen rechten Ecke des Bildschirms.
Der ChatGPT Advanced Voice-Modus verwendet das neueste ChatGPT-4o-Modell von OpenAI, um sicherzustellen, dass Interaktionen so nahtlos wie möglich sind. Benutzer können die KI bei Bedarf unterbrechen und sie dazu auffordern, mit dem Sprechen aufzuhören und zuzuhören, was dazu beiträgt, Gespräche effizient und konzentriert zu halten. Diese Funktion ist besonders nützlich, wenn die Antworten länger werden oder das Gespräch eine unerwartete Wendung nimmt.
Abonnementanforderungen
Für den Zugriff auf den Advanced Voice-Modus sowohl auf Desktop- als auch auf Mobilplattformen ist ein ChatGPT Plus-Abonnement erforderlich, das 20 US-Dollar pro Monat kostet. Es gibt jedoch eine Option für Free-Tarif-Benutzer, die allerdings die Sprachinteraktionen auf zehn Minuten pro Monat begrenzt. Die Sprachfunktion ist in den USA schon seit einiger Zeit verfügbar und wurde kürzlich auch in Europa verfügbar, wodurch sie einer größeren Benutzerbasis zugänglich gemacht wird.
Es wird gemunkelt, dass bald eine neue Version von ChatGPT namens Orion veröffentlicht wird, obwohl OpenAI-CEO Sam Altman diese Behauptungen als „Fake News“ zurückgewiesen hat.
Der kürzliche Start der Windows-Version von ChatGPT brachte einige bemerkenswerte Einschränkungen mit sich. Im Gegensatz zur macOS-Version, in der der Advanced Voice-Modus bereits früher integriert war, war diese Funktion in der ersten Version der Windows-App nicht enthalten. Das Fehlen des Sprachmodus führte dazu, dass Windows-Benutzer eine der am meisten erwarteten Funktionen von ChatGPT nicht nutzen konnten, wodurch sich das Erlebnis etwas unvollständig anfühlte.
OpenAI hat dafür gesorgt, dass Windows-Benutzern trotz der fehlenden Funktionen ein intuitives Erlebnis geboten wird. Um zu beginnen, müssen Benutzer die App von der offiziellen Website von OpenAI herunterladen, die sie dann für die eigentliche Installation zum Microsoft Store weiterleitet. Nach der Installation können Benutzer ChatGPT aufrufen, indem sie Alt + Leertaste drücken. Dies bietet eine schnelle und einfache Möglichkeit, auf den Chatbot zuzugreifen, ohne ihre aktuellen Aufgaben zu verlassen. Diese Funktionalität soll ChatGPT tiefer in die Arbeitsabläufe der Benutzer einbetten und so eine einfachere und direktere Interaktion ermöglichen.
Der erweiterte Sprachmodus in ChatGPT bietet Benutzern eine Möglichkeit, natürlicher mit der KI zu kommunizieren. Sie können damit Erinnerungen einrichten, Fragen zu allen Themen stellen, von arbeitsbezogenen Themen bis hin zu Allgemeinwissen, oder einfach über alltägliche Angelegenheiten chatten. Die Möglichkeit, die KI mitten im Satz zu unterbrechen, ermöglicht ein dynamischeres Gespräch, im Gegensatz zu vielen Sprachassistenten, die ein festgelegtes Frage-und-Antwort-Format erfordern.
Ein wesentlicher Vorteil der Verwendung des Advanced Voice-Modus auf dem Desktop ist seine Integration in die täglichen Aufgaben. Durch Drücken von Alt + Leertaste unter Windows oder einfaches Klicken auf das ChatGPT-Symbol unter macOS können Benutzer sofort auf die Sprachfunktion zugreifen, ohne den Kontext wechseln oder einen Browser öffnen zu müssen. Dies verringert die Reibung und macht ChatGPT eher zu einem integrierten Produktivitätstool und nicht zu einem eigenständigen Dienst.
Ein weiterer bemerkenswerter Aspekt der Desktop-Version ist ihre Ähnlichkeit mit dem mobilen Erlebnis. Benutzer, die es gewohnt sind, den Sprachmodus auf ihren Telefonen zu verwenden, werden die Desktop-Version als intuitiv und einfach zu bedienen empfinden. Die schwebende blaue Kugel, die Option zum Ändern der Stimmen und der Interaktionsablauf sind alle darauf ausgelegt, ein einheitliches Erlebnis auf allen Geräten zu bieten und sicherzustellen, dass Benutzer zwischen Plattformen wechseln können.
Hervorgehobener Bildnachweis: Andrew Neel/Unsplash