AutoTagging

Wenn für Inhalte keine Schlagworte mit geliefert werden kann die Content Überschrift Abhilfe schaffen, denn in ihr sind meist schon die wichtigsten Informationen enthalten: Wann, was, wer, wo? Filtert man nun noch die Substantive heraus und entfernt man die Stopwords wie Adjektive und Verben erhält man Schlagworte in einer recht hohen Qualität.

Ich habe nun diesen Meschanismus verbessert, so dass auch aufeinanderfolgende Substantive (Namen, Firmenbezeichnungen, etc.) berücksichtigt werden und der Stopword-Filter bereits im PHP greift.

Auf http://labs.evolver.de/index.php#autotag sehen Sie einige aktuelle Beispiele die aus der NEWSWALL stammen.