Google hat gestartet Ein neues Merkmal in der Gemini-API mit dem Namen „Impliccit Caching“, das das Unternehmen behauptet, die Kosten für Entwickler von Drittanbietern, die die neuesten KI-Modelle, Gemini 2.5 Pro und 2,5 Flash, um 75% senken können.
Die Funktion ermöglicht automatisch Kosteneinsparungen, wenn eine Gemini -API -Anforderung an ein Modell einen Cache trifft und die Bedarf an manueller Konfiguration beseitigt, die nach der vorherigen expliziten Caching -Methode erforderlich sind. Laut Google wird implizite Caching ausgelöst, wenn eine Anforderung ein gemeinsames Präfix mit einer vorherigen Anforderung aufweist und die erforderliche Mindestanzeige der Eingabeaufforderung für 2,5 Blitz und 2.048 für 2,5 Pro 1.024 beträgt.
Logan Kilpatrick, Mitglied des Gemini -Teams, angekündigt Der Start am 8. Mai 2025, in dem die Funktion den Entwicklern erhebliche Kosteneinsparungen erzielen kann. Google empfiehlt, dass Entwickler einen wiederholten Kontext zu Beginn von Anfragen platzieren und am Ende den Änderungskontext anhängen, um die Wahrscheinlichkeit impliziter Cache -Treffer zu erhöhen.
Das Caching ist eine weit verbreitete Praxis in der KI-Branche, die häufig auf Daten zugegriffen oder vorbereitet wird, um die Rechenanforderungen und -kosten zu senken. Die frühere explizite Caching-Methode von Google musste die Entwickler von Hochfrequenz manuell definieren, was häufig zu zusätzlichen Arbeiten und manchmal überraschend große API-Rechnungen für einige Benutzer führte.
Einige Entwickler hatten Unzufriedenheit mit der expliziten Caching -Implementierung für Gemini 2.5 Pro zum Ausdruck gebracht, was das Gemini -Team dazu veranlasste, sich zu entschuldigen und sich zu verpflichten, Änderungen vorzunehmen. Die neue implizite Caching -Funktion befasst sich mit diesen Bedenken, indem der Caching -Prozess automatisiert und Kosteneinsparungen an Entwickler weitergegeben werden, wenn ein Cache -Treffer auftritt.
Während Google behauptet, dass implizite Caching 75% Kosteneinsparungen erzielen kann, lieferte das Unternehmen keine Überprüfung der Effektivität der Feature. Daher können die tatsächlichen Kosteneinsparungen abhängig von der Verwendung der Funktionen der Funktionen variieren.