Der urbane Wandel schleicht sich normalerweise auf uns. Ein neues Café hier. Eine gemalten Überführung dort. Aber was wäre, wenn Sie ein ganzes Jahrzehnt mit der visuellen Transformation einer Stadt sehen könnten, die automatisch von KI erfasst, sortiert und erklärt wird?
Genau das nannte ein neues Forschungsprojekt Visuelle Chroniken machte dich auf den Weg. Entwickelt von Forscher Von Stanford und Google DeepMind verwendete dieses System multimodale Großsprachenmodelle (MLLMS), um über 40 Millionen Bilder von Google Street View aus New York City und San Francisco zu analysieren. Es entdeckte Trends, die Menschen nicht leicht bemerken würden.
Das unmögliche Problem des Skalens
Das Verfolgen kleiner Veränderungen im Laufe der Zeit ist in der Computer Vision nichts Neues. Aber die meisten früheren Arbeiten benötigten Etiketten oder konzentrierten sich auf bestimmte Dinge wie Autos oder Gesichter. Dieses Projekt war anders. Das Ziel war offen: Was hat sich in diesen Städten über ein Jahrzehnt am häufigsten geändert?
Einfache Frage. In der Praxis brutal hart.
Großsprachige Modelle sind gut darin, über Bilder zu denken, aber sie kämpfen, wenn der Datensatz über einige tausend Bilder hinaus wächst. Visuelle Chroniken befassten sich mit Millionen. Die Forscher haben also eine Bottom-up-Strategie entwickelt. Erkennen Sie zunächst winzige lokale Änderungen wie ein neues Zeichen oder einen entfernten Baum. Dann gruppieren Sie sie in breitere städtische Trends.
KIs Detektivarbeit auf der Straße
So funktionierte es in Aktion:
- Schritt 1: Vergleichen Sie Bilder desselben Ortes im Laufe der Zeit.
- Schritt 2: Bitten Sie die KI, zu beschreiben, was sich mit Beweisen aus den Bildern geändert hat.
- Schritt 3: Gruppen ähnliche Veränderungen in der Stadt gefunden.
- Schritt 4: Überprüfen Sie diese Trends mit weiteren KI -Überprüfungen.
Mit diesem Hybridansatz ermöglicht das System subtile Änderungen. Essanlagen im Freien nach Covid-19. Neue Sonnenkollektoren auf Dächern. Alle entdeckt, ohne Daten zu ertrinken oder abstrakte Antworten wie „Wirtschaftswachstum“ zu generieren.
Also, was hat es gefunden?
In New York City entdeckte die KI einen dramatischen Aufstieg in:
- Überwachungskameras: 745 Neuinstallationen in den Nachbarschaften.
- Zäune um Parkplätze: 509 Neuzugang.
- Bürgersteig -Upgrades: 519 neue rote Ada -Warnpads.
In San Francisco sahen die charakteristischen Trends des Jahrzehnts anders aus:
- Sonnenkollektoren: 1504 neue Installationen auf dem Dach, insbesondere von erhöhten Autobahnen.
- Dedizierte Busspuren: 751 neue Lane -Umbauten für den öffentlichen Verkehr.
- Fahrradständer: 1799 neue Racks, meistens in der Nähe der Innenstadt.
Die Covid -Jahre verließen visuelle Fingerabdrücke überall
Die Forscher konzentrierten sich auch auf die Pandemiezeit und erfuhren, wie sich die Straßen der Stadt nach 2020 adaptierten. In San Francisco explodierte das Essen im Freien, und 1482 neue Setups wurden allein zwischen 2020 und 2022 verzeichnet.
Und dann war da noch die blaue Überführung. Eine Autobahnabteilung in San Francisco wurde ‚Coronado Blue‘ gemalt, ein Detail, das nach 2020 481 -mal in Street View -Bildern entdeckt wurde.
In New York wurde das System auch verwendet, um Änderungen des Einzelhandelsgeschäfts zu verfolgen. Es enthüllte zwei entgegengesetzte Trends:
- Öffnungen von Bäckereien und Saftgeschäften in Gentrifizing -Bereichen.
- Schließungen von Lebensmittelgeschäften und Bankfilialen in älteren Einzelhandelszonen.
Denn warum nicht. Die Forscher führten ein endgültiges Experiment durch und baten die KI, zufällige Bilder zu betrachten und „ungewöhnliche Dinge“ zu finden.
Der Gewinner? Riese abstrakte Skulpturen in ganz New York City. Über 200 Fälle von öffentlichen Kunstinstallationen, die alle vom Modell gruppiert sind.
Vertrauen KI -Modelle ihren Aufsichtsbehörden?
Warum dies weit über die Straßenansicht hinausgeht
Visuelle Chronik zeigt, wie zukünftige KI -Tools Unternehmen, Regierungen oder Forschern es ermöglichen können, Änderungen in einem großen visuellen Datensatz zu verfolgen. Satellitenbilder. Fabrikböden. Jeder Ort, der sich im Laufe der Zeit ändert.
Es ist auch eine Warnung. KI „sieht“ nicht nur Bilder. Es erklärt sie uns auf eine Weise zurück, die das prägt, was wir glauben. Je mehr wir diesen automatisierten Trendberichten vertrauen, desto mehr benötigen wir Systeme, die die Geschwindigkeit der KI mit menschlicher Vorsicht bilden.
Visual Chronicles ist ein frühes Beispiel für diese Art von System. Es ist präzise genug, echte Muster zu finden, skalierbar genug, um Millionen von Bildern zu verarbeiten, und der geerdet genug ist, um das durch Beweise unterstützte Geschichtenerzählen zu verlassen.