Dataconomy DE
Subscribe
No Result
View All Result
Dataconomy DE
Subscribe
No Result
View All Result
Dataconomy DE
No Result
View All Result

Implizite Caching zielt darauf ab, die Kosten der Gemini -API -Kosten um 75% zu senken

byKerem Gülen
Mai 9, 2025
in Artificial Intelligence, News
Home Artificial Intelligence

Google hat gestartet Ein neues Merkmal in der Gemini-API mit dem Namen „Impliccit Caching“, das das Unternehmen behauptet, die Kosten für Entwickler von Drittanbietern, die die neuesten KI-Modelle, Gemini 2.5 Pro und 2,5 Flash, um 75% senken können.

Die Funktion ermöglicht automatisch Kosteneinsparungen, wenn eine Gemini -API -Anforderung an ein Modell einen Cache trifft und die Bedarf an manueller Konfiguration beseitigt, die nach der vorherigen expliziten Caching -Methode erforderlich sind. Laut Google wird implizite Caching ausgelöst, wenn eine Anforderung ein gemeinsames Präfix mit einer vorherigen Anforderung aufweist und die erforderliche Mindestanzeige der Eingabeaufforderung für 2,5 Blitz und 2.048 für 2,5 Pro 1.024 beträgt.

Logan Kilpatrick, Mitglied des Gemini -Teams, angekündigt Der Start am 8. Mai 2025, in dem die Funktion den Entwicklern erhebliche Kosteneinsparungen erzielen kann. Google empfiehlt, dass Entwickler einen wiederholten Kontext zu Beginn von Anfragen platzieren und am Ende den Änderungskontext anhängen, um die Wahrscheinlichkeit impliziter Cache -Treffer zu erhöhen.

Das Caching ist eine weit verbreitete Praxis in der KI-Branche, die häufig auf Daten zugegriffen oder vorbereitet wird, um die Rechenanforderungen und -kosten zu senken. Die frühere explizite Caching-Methode von Google musste die Entwickler von Hochfrequenz manuell definieren, was häufig zu zusätzlichen Arbeiten und manchmal überraschend große API-Rechnungen für einige Benutzer führte.

Einige Entwickler hatten Unzufriedenheit mit der expliziten Caching -Implementierung für Gemini 2.5 Pro zum Ausdruck gebracht, was das Gemini -Team dazu veranlasste, sich zu entschuldigen und sich zu verpflichten, Änderungen vorzunehmen. Die neue implizite Caching -Funktion befasst sich mit diesen Bedenken, indem der Caching -Prozess automatisiert und Kosteneinsparungen an Entwickler weitergegeben werden, wenn ein Cache -Treffer auftritt.

Während Google behauptet, dass implizite Caching 75% Kosteneinsparungen erzielen kann, lieferte das Unternehmen keine Überprüfung der Effektivität der Feature. Daher können die tatsächlichen Kosteneinsparungen abhängig von der Verwendung der Funktionen der Funktionen variieren.


Ausgewähltes Bildnachweis

Tags: APIGoogleZwillinge

Related Posts

Apple entwickelt neue Chips für AI -Smart -Brillen und Macs

Apple entwickelt neue Chips für AI -Smart -Brillen und Macs

Mai 9, 2025
Chrome setzt lokale KI bereit, um neue aufstrebende Webbetrugs zu erkennen

Chrome setzt lokale KI bereit, um neue aufstrebende Webbetrugs zu erkennen

Mai 9, 2025
Chatgpt kann jetzt Ihre Github -Repositories analysieren

Chatgpt kann jetzt Ihre Github -Repositories analysieren

Mai 9, 2025
Meta-Threads haben gerade ein bisschen x-mehr bekommen

Meta-Threads haben gerade ein bisschen x-mehr bekommen

Mai 9, 2025
Dieser Amazon -Roboter hat ein Gefühl des Gefühls

Dieser Amazon -Roboter hat ein Gefühl des Gefühls

Mai 8, 2025
Safari kann Openai- oder Verwirrungs -KI -Suchoptionen erhalten

Safari kann Openai- oder Verwirrungs -KI -Suchoptionen erhalten

Mai 8, 2025

Recent Posts

  • Apple entwickelt neue Chips für AI -Smart -Brillen und Macs
  • Skymizer startet einen Hyperthought AI IP für Smart Edge -Geräte
  • Top 5 AI -Forschungsassistenten, die mit ChatGPT konkurrieren
  • Nextdoor-Anzeigen erhalten einen KI-angetriebenen Sicherheitsschild vor IAS
  • Sigenergy Flexes Full AI Energy Suite in Intersolar Europe

Recent Comments

Es sind keine Kommentare vorhanden.
Dataconomy DE

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Home
  • Sample Page

Follow Us

  • Home
  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.