Elon Musk kündigte kürzlich an, dass Nutzer auf eine bestimmte Anzahl von Tweets pro Tag beschränkt sein werden, bevor sie die Entscheidung rasch rationalisieren. Musk machte KI-Startups für das Daten-Scraping auf Twitter verantwortlich.
Jetzt können täglich nur 600 Beiträge von nicht verifizierten Konten angezeigt werden, und nur 300 können täglich von „neuen“ nicht verifizierten Konten angezeigt werden. Die Einschränkungen für verifizierte Konten erlauben weiterhin nur das Lesen von bis zu 6.000 Beiträgen pro Tag.
„Um dem extremen Ausmaß an Daten-Scraping und Systemmanipulation entgegenzuwirken, haben wir die folgenden vorübergehenden Grenzwerte angewendet“, schrieb Musk im ersten von mehreren Tweets über die Wahl. Musk postete im Laufe des Tages wiederholt über die Tarifbeschränkungen, sodass die Leute jedes Mal mehr Beiträge ansehen konnten.
Verifizierte Konten für zahlende Benutzer hatten ab Samstag, 10 Uhr, ein Limit von 6.000 Beiträgen pro Tag, bestehende nicht verifizierte Konten hatten eine Beschränkung von 600 Beiträgen pro Tag; Für neue, nicht verifizierte Konten galt ein Limit von 300 Beiträgen pro Tag. Laut Musks Tweets stiegen diese Zahlen bis 15 Uhr auf 10.000, 1.000 bzw. 5.000.
Um dem extremen Ausmaß an Daten-Scraping und Systemmanipulation entgegenzuwirken, haben wir die folgenden vorübergehenden Beschränkungen eingeführt:
– Verifizierte Konten sind auf das Lesen von 6000 Beiträgen pro Tag beschränkt
– Nicht verifizierte Konten bis zu 600 Beiträge/Tag
– Neue, nicht verifizierte Konten bis 300/Tag— Elon Musk (@elonmusk) 1. Juli 2023
Twitter-Daten-Scraping: Elon Musk gibt KI-Startups die Schuld
Für das Training großer Sprachmodelle (LLMs) mit künstlicher Intelligenz (KI), wie sie ChatGPT, Microsoft Bing und Google Bard unterstützen, kritisiert Musk Unternehmen, die versuchen, Daten zu schlucken. Laut Musk ist Twitter Data Scraping der Grund für all diese Beschränkungen.
Er vergaß jedoch zu erklären, dass er seit der Übernahme des Unternehmens im vergangenen Herbst beschlossen hat, mehr als die Hälfte der Twitter-Mitarbeiter zu entlassen, darunter auch Personal, das für die Aufrechterhaltung der Infrastruktur von Twitter unerlässlich ist. Immer wieder wurde davor gewarnt, dass die Entlassung so vieler Mitarbeiter negative Auswirkungen auf die Stabilität von Twitter haben würde, und als Folge der ungeplanten Entlassungen musste das Unternehmen sogar einige entlassene Ingenieure wieder einstellen.

Elon Musk arbeitet an einem ChatGPT-Konkurrenten mit dem Codenamen „TruthGPT“
Twitter-Bots sind eine der größten Ursachen
Twitter hat jetzt ein Problem, das über Kryptowährungs-Spam-Konten hinausgeht: Konten und Bots, die sexuelle Inhalte bewerben und Direktnachrichten und Benutzerkonversationen infiltrieren. Eine einfache Antwort scheint auch nicht in Sicht zu sein.
Auch wenn das Problem schon lange besteht, machen Elon Musks hoffnungsvolle Aussagen über die Bekämpfung von Bots und betrügerischen Konten auf Twitter nach der Übernahme der Plattform den Anstieg der Porno-Bots amüsant.
Das Sicherheitsforschungsunternehmen MalwareHunterTeam hat in einem Tweet mehrere Twitter-Konten aufgedeckt, bei denen es sich um Spam-Bots handelt, die sich als Likes in Diskussionen einbringen. Dies geschieht, um Benutzer dazu zu bringen, sich die Profile dieser Bot-Konten anzusehen und auf die Links zu klicken, die in ihren Biografien bereitgestellt werden. Hier ist der Tweet:
WTF, @elonmusk? Likes von 9 Porno-Bots-Konten hintereinander … Das ist meiner Meinung nach ein Rekord für dieses Konto.
Aber alle Bot-Probleme wurden schon vor Monaten gelöst, oder?pic.twitter.com/gN56SPNcR7
— MalwareHunterTeam (@malwrhunterteam) 27. Juni 2023
Was ist Daten-Scraping?
Beim Data Scraping werden mithilfe von Softwaretools oder Skripts Daten von Websites, Datenbanken oder anderen Quellen abgerufen. Ein Beispiel ist auch Twitter Data Scraping. Es gibt verschiedene Einsatzmöglichkeiten für Data Scraping, darunter:
- Marktforschung: Data Scraping kann Unternehmen dabei helfen, mehr über ihre Konkurrenten, Kunden, Waren, Kosten, Trends usw. zu erfahren. Data Scraping kann auch verwendet werden, um unerschlossene Märkte, Nischen oder Möglichkeiten zu finden.
- Lead-Generierung: Mithilfe von Data Scraping können Unternehmen potenzielle Verbraucher oder Kunden anhand ihrer Vorlieben, Bedürfnisse, Gewohnheiten oder Interessen identifizieren. Mithilfe von Data Scraping können auch Kontaktdaten erfasst werden, darunter Profile in sozialen Netzwerken, E-Mail-Adressen und Telefonnummern.
- Inhaltserstellung: Data Scraping kann Inhaltsproduzenten dabei helfen, relevante und interessante Themen, Schlüsselwörter, Fotos, Videos oder andere Medien für ihre Websites, Blogs, Social-Media-Plattformen usw. zu finden. Data Scraping kann auch dabei helfen, Inhalte mithilfe von NLP-Ansätzen automatisch oder weitgehend automatisch zu erstellen.
- Datenanalyse: Data Scraping ermöglicht es Wissenschaftlern und Datenanalysten, erhebliche Datenmengen aus zahlreichen Quellen zu sammeln und sie in nützlichen Formaten zu organisieren. Darüber hinaus können Datenanreicherung, -bereinigung, -validierung oder -visualisierung dazu beitragen, neue Informationen oder Erkenntnisse aus den Daten bereitzustellen.

Es können sowohl manuell als auch automatisch generierte Daten gescrapt werden. Beim manuellen Data Scraping werden Daten von Websites oder anderen Quellen kopiert und in Tabellenkalkulationen oder andere Dokumente eingefügt.
Manuelles Daten-Scraping ist mühsam, zeitaufwändig und fehleranfällig. Der Einsatz von Softwareprogrammen oder Skripten zum automatischen Crawlen, Interpretieren, Extrahieren und Speichern von Daten von Websites oder anderen Quellen wird als automatisches Data Scraping bezeichnet.
So führen Sie Datenrecherchen im Web durch
Im Vergleich zum menschlichen Data Scraping ist das automatische Data Scraping schneller, einfacher und genauer. Das ist wahrscheinlich auch das, was beim Twitter-Data-Scraping verwendet wurde.
Hervorgehobener Bildnachweis: Glenn Carstens-Peters auf Unsplash.