Die Gemini Android Application Beta enthält jetzt eine Funktion, mit der Benutzer Audiodateien wie MP3s an Chat -Konversationen anhängen können. Diese Funktionalität, beobachtet von Android Autorität In Version 16.30.59.Sa.ArM64 der Google App Beta wird bei der Dateianhang eine Eingabeaufforderung „Live über diese“ vorgestellt. Während die Audioverarbeitungsfunktionen innerhalb der Beta noch nicht voll funktionsfähig sind.
Beim Anhängen einer Audiodatei werden den Benutzern die Option entweder eine Frage eingeben oder die Eingabeaufforderung „Live sprechen“ auswählen. Aktuelle Beobachtungen zeigen, dass Gemini den Audioeingang nicht konsistent verarbeitet. In einigen Fällen ignoriert die Anwendung die beigefügte Audiodatei vollständig. In anderen Fällen kann Gemini Antworten generieren, die nicht mit dem Audio -Inhalt korrelieren und ein Verhalten aufweisen, das mit Chatbot -Halluzinationen übereinstimmt.
Trotz der aktuellen Einschränkungen in der Android -Beta unterstützt die Gemini -API die Audioeingabe bereits. Entwickler können die API nutzen, um Audiodateien einzureichen und verschiedene Verarbeitungsaufgaben anzufordern. Diese Aufgaben umfassen das Erstellen von Beschreibungen von Audioinhalten, Zusammenfassung gesprochener Informationen und die Transkription von Sprache. Die API bietet auch spezifische Zeitstempelanfragen, z. B. die Verarbeitungssegmente von „2:30 bis 3:29“. Zu den unterstützten Audioformaten für die API gehören MP3, WAV und FLAC.
Die Integration des Anhangs von Audiodatei in die Gemini Android App ist wahrscheinlich eine fortlaufende Entwicklungsaufwand von Google. Es gibt keine offizielle Bestätigung in Bezug auf ein bestimmtes Startdatum für diese Funktion. Die Funktionalität des Bild -Uploads ist derzeit in der Gemini Android -Anwendung weit verbreitet, was darauf hindeutet, dass Audio -Unterstützung eine nachfolgende Fortschritte in den Funktionen der App darstellt.





