Dataconomy DE
Subscribe
No Result
View All Result
Dataconomy DE
Subscribe
No Result
View All Result
Dataconomy DE
No Result
View All Result

Implizite Caching zielt darauf ab, die Kosten der Gemini -API -Kosten um 75% zu senken

byKerem Gülen
Mai 9, 2025
in Artificial Intelligence, News
Home Artificial Intelligence

Google hat gestartet Ein neues Merkmal in der Gemini-API mit dem Namen „Impliccit Caching“, das das Unternehmen behauptet, die Kosten für Entwickler von Drittanbietern, die die neuesten KI-Modelle, Gemini 2.5 Pro und 2,5 Flash, um 75% senken können.

Die Funktion ermöglicht automatisch Kosteneinsparungen, wenn eine Gemini -API -Anforderung an ein Modell einen Cache trifft und die Bedarf an manueller Konfiguration beseitigt, die nach der vorherigen expliziten Caching -Methode erforderlich sind. Laut Google wird implizite Caching ausgelöst, wenn eine Anforderung ein gemeinsames Präfix mit einer vorherigen Anforderung aufweist und die erforderliche Mindestanzeige der Eingabeaufforderung für 2,5 Blitz und 2.048 für 2,5 Pro 1.024 beträgt.

Logan Kilpatrick, Mitglied des Gemini -Teams, angekündigt Der Start am 8. Mai 2025, in dem die Funktion den Entwicklern erhebliche Kosteneinsparungen erzielen kann. Google empfiehlt, dass Entwickler einen wiederholten Kontext zu Beginn von Anfragen platzieren und am Ende den Änderungskontext anhängen, um die Wahrscheinlichkeit impliziter Cache -Treffer zu erhöhen.

Das Caching ist eine weit verbreitete Praxis in der KI-Branche, die häufig auf Daten zugegriffen oder vorbereitet wird, um die Rechenanforderungen und -kosten zu senken. Die frühere explizite Caching-Methode von Google musste die Entwickler von Hochfrequenz manuell definieren, was häufig zu zusätzlichen Arbeiten und manchmal überraschend große API-Rechnungen für einige Benutzer führte.

Einige Entwickler hatten Unzufriedenheit mit der expliziten Caching -Implementierung für Gemini 2.5 Pro zum Ausdruck gebracht, was das Gemini -Team dazu veranlasste, sich zu entschuldigen und sich zu verpflichten, Änderungen vorzunehmen. Die neue implizite Caching -Funktion befasst sich mit diesen Bedenken, indem der Caching -Prozess automatisiert und Kosteneinsparungen an Entwickler weitergegeben werden, wenn ein Cache -Treffer auftritt.

Während Google behauptet, dass implizite Caching 75% Kosteneinsparungen erzielen kann, lieferte das Unternehmen keine Überprüfung der Effektivität der Feature. Daher können die tatsächlichen Kosteneinsparungen abhängig von der Verwendung der Funktionen der Funktionen variieren.


Ausgewähltes Bildnachweis

Tags: APIGoogleZwillinge

Related Posts

Alphaevolve: Wie Googles neue KI mit Selbstkorrektur auf die Wahrheit strebt

Alphaevolve: Wie Googles neue KI mit Selbstkorrektur auf die Wahrheit strebt

Mai 15, 2025
TIKTOK implementiert AI-generierte ALT-Texte, um eine bessere Akzierbarkeit zu erhalten

TIKTOK implementiert AI-generierte ALT-Texte, um eine bessere Akzierbarkeit zu erhalten

Mai 15, 2025
Trump zwingt Apple, seine indische iPhone -Strategie in Indien zu überdenken

Trump zwingt Apple, seine indische iPhone -Strategie in Indien zu überdenken

Mai 15, 2025
Die KI von YouTube weiß jetzt, wann Sie kurz vor dem Kauf sind

Die KI von YouTube weiß jetzt, wann Sie kurz vor dem Kauf sind

Mai 15, 2025
Der CEO von SoundCloud gibt zu, dass KI -Begriffe nicht klar genug waren, ein neues Versprechen herausgibt

Der CEO von SoundCloud gibt zu, dass KI -Begriffe nicht klar genug waren, ein neues Versprechen herausgibt

Mai 15, 2025
Lightricks enthüllt ein 13B LTX -Videomodell für die HQ -AI -Videogenerierung

Lightricks enthüllt ein 13B LTX -Videomodell für die HQ -AI -Videogenerierung

Mai 14, 2025

Recent Posts

  • Databricks -Wetten auf serverlose Postgres mit seiner Akquisition von 1 Milliarde US -Dollar
  • Alphaevolve: Wie Googles neue KI mit Selbstkorrektur auf die Wahrheit strebt
  • TIKTOK implementiert AI-generierte ALT-Texte, um eine bessere Akzierbarkeit zu erhalten
  • Trump zwingt Apple, seine indische iPhone -Strategie in Indien zu überdenken
  • Die KI von YouTube weiß jetzt, wann Sie kurz vor dem Kauf sind

Recent Comments

Es sind keine Kommentare vorhanden.
Dataconomy DE

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Home
  • Sample Page

Follow Us

  • Home
  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.