"ähnlichen Artikel" ähnlich?
Boris fragt hier völlig zu Recht:
"In welcher Hinsicht sind eigentlich die unten immer aufgeführten "ähnlichen Artikel" ähnlich?"
Die im Pepilog eingebaute "ähnliche Artikel"-Funktion ist ein Eigenbau. Dabei werden aus dem aktuellen Artikel die relevanten Schlüsselworte automatisch extrahiert und damit wird dann eine Volltextsuche über den kompletten Artikelbestand durchgeführt. Die Ergebnisse werden nach Trefferwahrscheinlichkeit sortiert und heraus kommt eine möglichst gute Anzahl an themenähnlichen Artikeln.
Es funktioniert IMHO nicht immer 100% einwandfrei und manchmal frage auch ich mich, wie da Ähnlichkeiten entstehen können bzw. sein sollen. Natürlich kann ein Automatismus, der programmatisch versucht, "relevante" Worte zu finden, niemals so gut sein, wie ein halbwegs intelligenter Blogger. Aber ich habe dennoch schon oft längst vergessene "Perlen" und auch Peinlichkeiten wiederentdeckt... 
13.03.2008 · spät nachts · Intern
5 Kommentare
Boris schrieb am 13.03.2008 um 10:17 Uhr:
Ein System, das zum Ermitteln der thematischen Ähnlichkeit Tags verwendet, müsste zu besseren Treffern gelangen, denn Tags vergibt man als Autor ja selbst.
Ich müsste mal die diesbezüglichen Features des Tagging-Plugins ausprobieren, das ich verwende.

Robert schrieb am 13.03.2008 um 14:26 Uhr:
Ich würde schon auch die ganz normalen Tags vergleichen, welche ich für einen Blogeintrag vergeben habe. Der Aufwand anhand des Inhaltes zu relevanten anderen Einträgen zu kommen wäre mit viel Arbeit verbunden, da es gilt relevante Wörter zu extrahieren und das wäre das selbe wie Tags.
Pepino schrieb am 13.03.2008 um 16:12 Uhr:
ähhh, Jungs. Nochmals zur Erklärung:
Im Pepilog hat nicht jeder Beitrag vom Autor (also mir) vergebene Tags. Da dieses Blögchen ein Eigenbau ist, kann man das nicht mit WP o.ä. vergleichen (u.a. deshalb kommen auch keine WP-Plugins zum Einsatz).
Deshalb habe ich eine Funktion entwickelt, die aus einem beliebigen Text möglichst die relevanten Keywords automatisch extrahiert (mit einer ähnlichen Technik kann ich Keywords für eine HTML-Seite automatisch generieren) und damit dann eine Volltextsuche (nicht "Word by word", sondern anhand Trefferwahrscheinlichkeiten) ausführt.
Selbst wenn manuell eingegebene Tags für eine Suche benutzt werden würden, dürfte die Qualität der Ergebnisse nicht unbedingt besser werden.
Boris schrieb am 14.03.2008 um 10:17 Uhr:
Ich weiß das ja vom selbst-programmierten Blog ohne Tagging-Funktion. War auch nur so ein Gedanke bezüglich Relevanzkriterien.
Aber das Tagging dient ja eben genau dem Zweck, inhaltliche Kriterien sozusagen freizustellen, ohne auf die Wörter im Text angewiesen zu sein. D.h. wenn ich sorgfältig und sinnvoll "tagge", erhalte ich eine sehr gute Ergebnisqualität. Bibliotheken leben davon.
Pepino schrieb am 15.03.2008 um 02:03 Uhr:
Selbst wenn es eine eingebaute Tagging-Funktion gibt, welche von mir sogar schon realisiert wurde: die manuelle Vergabe von Tags ist keine Garantie für gute Treffer, denn gesucht werden muss sowieso. Egal ob manuelle Tags oder automatisch gefilterte.
Es gibt ja zwei Ansätze: entweder man sucht nur in den Tags. Oder man sucht die Tags in den Texten, was ich für die bessere Alternative halte. Und da ist es dann egal, ob manuelle oder automatische Tags, denn ich suche nicht nach 100%-Match jedes Tags im Text, sondern es ist eine "echte" Volltextsuche, die auch Ergebnisse liefert, die nicht alle Suchworte beinhalten. Nur eben nach Relevanz sortiert.
Ich sehe die reine Suche von manuellen Tags in der menge der vergebenen Tags als suboptimal an, da hier ggfls. Informationen z.B. durch falsche oder ungenaue Schreibweise verloren gehen können.
Kommentar hinzufügen
Thematisch dazu passend:
- Thematisch passende Beiträge (1 Kommentar)
- Lange Artikel wo speichern? (22 Kommentare)
- Tagging? (9 Kommentare)
- Blogger4Blogger-Aktion hat einen Teilnehmer (4 Kommentare)
- self examination (0 Kommentare)