Die SpamCloud - "Spammer generated Content"

Der Eine oder Andere mag es evtl. schon bemerkt haben: es gibt einen neuen Bereich hier im Pepilog, die SpamCloud.
Obwohl hier im Pepilog keine schlauen Wordpress-Plugins (wie z.B. askimet o.Ä. laufen, denn hier läuft kein Wordpress), Blacklists oder sonstigen 3rd-Party-Plugins installiert sind, ist das Pepilog seit Monaten bzw. Jahren nahezu spamfrei. Zumindest rein äußerlich.
Dennoch läuft hier von fast allen Lesern (hoffentlich) völlig unbemerkt im Hintergrund eine sehr wirkungsvolle Spamerkennung, die nun als kleines Nebenprodukt schon seit einiger Zeit fleissig die Datenbank füllt und dabei die beworbenen Begriffe sammelt und am Ende des Tages in Form einer Wortwolke ausspuckt: der SpamCloud.
Falls mich irgendwer von dem Nutzen überzeugt, bin ich auch gerne bereit, noch weitere Auswertungen und Darstellungen mit den Spam-Daten vorzunehmen (denkbar wären evtl. RSS-Feeds oder Toplisten).
Hat irgendwer noch eine sinnvollere Anwendungsmöglichkeit als eine relativ stupide Wortwolke?

30.01.2007 · fast im Bett · Intern
13 Kommentare
.olli schrieb am 30.01.2007 um 10:28 Uhr:
Du könntest in der Datenbank noch ein paar Füllwörter wie 'I' 'the' 'a' etc. hinterlegen und dann ala sloganizer Deine 'eigenen' spamtexte automatisiert generieren lassen.
Du könntest mit erfassen, aus welcher Gegend der spammer spamt und dann die WELTKARTE DER SPAMBEGRIFFE darstellen...
ooch --- da gibt es so viele Dinge...
Pepino schrieb am 30.01.2007 um 10:37 Uhr:
Da ich bei der Worterfassung nicht zwischen Subjekt, Prädikat und Objekt unterscheide, dürfte die Generierung von einigermaßen sinnvollen Sätzen relativ schwierig werden.
Eine Visualisierung der Spam-IPs ist zwar denkbar, aber
IMHO wenig aussagekräftig, da kaum ein Spammer die eigene IP nutzt. Bestenfalls die Orte der Bot-Netze oder der Proxies könnte man so zeigen.
Weitere Vorschläge?

.olli schrieb am 30.01.2007 um 15:49 Uhr:
seit wann sind denn Spam-Texte sinnvoll?
Pepino schrieb am 30.01.2007 um 17:53 Uhr:
Da hast Du zwar schon recht, aber einen gewissen Anspruch hat man da doch schon, oder nicht?
.olli schrieb am 30.01.2007 um 21:28 Uhr:

Uii. Anspruch an Spamtexte? Ich könnte mir schon vorstellen, dass das Ganze unfreiwillig komisch werden würde. Und ein paar Muster, um halbwegs verständliche Sätze zu haben, könnte ich mich auch vorstellen:
zB [SPAM][SPAM][füllverb][SPAM]
zB [füllPronomen][füllverb][SPAM][SPAM]
usw.
olli
Boris schrieb am 30.01.2007 um 22:04 Uhr:
Wenn genügend Leute weltweit SpamClouds erzeugten und sämtliche Begriffe darin mit echten Nichtspam-Seiten (z.B. aus der jeweiligen Blogrolle) verlinkten, dann hätten die Spam-Begriffe vielleicht bald keine Suchmaschinen-Relevanz mehr für die von den Spammern "beworbenen" Seiten...
Pepino schrieb am 31.01.2007 um 01:43 Uhr:
@olli: Anspruch war vielleicht nicht das ganz richtige Wort. Aber zumindest ein Fünkchen Sinn sollte schon dahinter stecken. Finde ich.
@Boris: genau so schaut mein längerfristiger Plan aus. ich wollte bisher nur nicht willenlos beliebige Webseiten mit Spam-Begriffen "bewerben". Aber vielleicht finden wir ja noch eine coole Idee, wie wir das umsetzen können... ein SpamCloud-Service oder ein SpamCloud-Wiki...
Jean schrieb am 31.01.2007 um 06:00 Uhr:
Tolle Idee, die spam-cloud!
Damit könntest du ja ein spam-of-the-day-blog füllen, in dem jeden Tag oder 1x/Woche die aktuellen spam-trends besprochen werden.
Ich finde das zumindest eine super-interessante Aussage der clouds, das i.M. Briana Banks interessanter ist als russische Bräute.
Und zur Krönung könntest du noch die besten Zielseiten mit Screenshots zeigen. Ich wette, nach spätestens 1 Woche bekommst du ziemlich viel Geld dafür geboten, die Screenshots auch mit der Zielseite zu verlinken. Cool, oder?
Wenn du da keinen Bock drauf hast, sag Bescheid, dann mach ich das!
Jean
P.S: Da fällt mir ein, ein Web2.0iges-Mockup um deine cloud klauen zu können?
Pepino schrieb am 31.01.2007 um 09:39 Uhr:
"ein Web2.0iges-Mockup"???
Jean schrieb am 31.01.2007 um 20:38 Uhr:
Zu früh am morgen die Begriffe im Hirn durchgeschüttelt und das falsche rausgezogen...
Ich meinte natürlich "ein Web2.0iges-Mashup"!!!
de.wikipedia.org
Pepino schrieb am 31.01.2007 um 22:04 Uhr:
Das ist eigentlich noch eine große Frage: soll ich die Daten z.B. per RSS anbieten oder nicht?
Falls ja, weshalb und für wen und in welchem Format?
Stefan schrieb am 06.02.2007 um 21:17 Uhr:
was ist denn gegen briana banks zu sagen? die wertet so mache tag cloud auf?
Pepino schrieb am 07.02.2007 um 01:18 Uhr:
Ich kenne die Dame nicht, aber vermutlich wird es schon seinen Sinn haben, daß sie in meiner Spamcloud (was keine Tagcloud ist) auftaucht...
Erstaunlich, wie wenig Beachtung solch eine Spam-Wolke findet...
Kommentar hinzufügen
Thematisch dazu passend:
- "Spamcloud" war mir! (0 Kommentare)
- Spam. Don't Buy It. (1 Kommentar)
- Open-Source-Spam (10 Kommentare)
- Wir kriegen Euch... (5 Kommentare)
- ich krieg Euch alle! (0 Kommentare)