WDF*IDF

Aus induux Wiki
(Weitergeleitet von WDF*IDF)
Die WDF*IDF oder auch TF-IDF Analyse wird zur Suchmaschinenoptimierung von Online-Texten verwendet und ist elementarer Bestandteil einer Keyword-Analyse. Mit dem Verfahren lässt sich die Relevanz von Inhalten untersuchen und optimieren.
Synonym(e): Termgewichtung



Die Aufgaben von Suchmaschinen ist es, die relevanteste Webseite dem Suchenden auszuliefern. Die Relevanz bzw. Qualität des Inhalts einer Seite spielt daher eine große Rolle in der Suchmaschinenoptimierung. Um Texte für Google relevant zu gestalten, wird von vielen B2B SEO-Experten, Textern und Webmastern die WDF*IDF Analyse verwendet. Mit WDF*IDF werden wichtige Begriffe im Zusammenhang zum Suchterm untersucht. So soll mit der Untersuchung nicht nur die Häufigkeit eines relevanten Keywords (wenn nötig) erhöht werden, sondern auch weitere übergreifende Suchterme gefunden und eingebaut werden.

Anwender

Adressaten von WDF*IDF-Analysen sind:

  • Webmaster
  • Redakteure und Texter
  • Freelancer
  • SEOs & Marketing-Verantwortliche

Das WDF+IDF-Verfahren ist besonders für den B2B für die digitale Markenführung (Absatz-Marke, Produkt-Marke, Meta-Marke) spannend sein, da schnell erkennbar wird, welche Marken bei entsprechenden Keywords entscheidend sind. Will ein Unternehmen demnach ein Top-Ranking erhalten, müssen diese Marken oftmals mit in den Content der Seite aufgenommen werden. Dies bedeutet demnach die Nennung des Wettbewerbs, was für B2B-Unternehmen unmöglich, für allgemeine Shops und Plattformen schon leichter ist.

Funktionsweise

Karl Kratz - SEO Rankingfaktoren 2013 - OMCap 2012 zu WDF*IDF Termgewichtung

Die WDF*IDF Analyse berechnet, welche Begriffe in Bezug auf den Suchterm am häufigsten in den Texten der ersten Suchergebnisse benutzt werden. Da diese Begriffe häufig um den Suchterm auf den Top-Ergebnisse auftauchen, wird ihnen eine relevante Bedeutung für den Text nachgesagt. Für die Analyse werden die Begriffe nach dem relativen Aufkommen gewichtet. Die Ergebnisse der WDF*IDF Analyse werden in einem Diagramm dargestellt. Mit den Ergebnissen kann festgestellt werden:

  1. welche der aufgeführten Begriffe noch häufiger im eigenen Text vorkommen können/sollen
  2. welche schon zu viel eingesetzt wurden und
  3. welche noch komplett fehlen.

WDF*IDF-Wissen

Um das Thema - wenn an sich schon seit 1992 auf dieser Welt - hat sich Karl Kratz im Bereich Suchmaschinenoptimierung sehr verdient gemacht. Unter anderem aufgrund seines bedeutenden und für die Suchmaschinenoptimierung empfehlenswerten Artikel Termgewichtung w=WDF * IDF und ihre Auswirkung auf Online-Inhalte und SEO.

Der WDF-Wert (Within-Document-Frequency)

erläutert, wie oft ein Begriff in einem Dokument im Vergleich zu allen anderen Begriffen relativ gesehen vorkommt. Dazu wird die Keyword Recherche-Dichte einem Logarithmus zur Basis 2 versehen.

Der IDF-Wert (Inverse-Document-Frequency)

zeigt an, welche Gewichtung der Begriff im Vergleich zu allen anderen im Index gespeicherten Dokumenten besitzt.

Eine genaue Erläuterung zur WDF-Formel ist auf Wikipedia beschrieben.

WDF*IDF-Tools

WDF*IDF-Tool fehlerhaft
Fehlerhafte Analyse im WDF*IDF-Tool

Es gibt verschiedene SEO Tools zur WDF*IDF-Analyse. Folgende Tools bieten bieten die WDF*IDF-Funktionalität an:

  • Xovi: ein kostenpflichtiges Analyse-Tool für die Suchmaschinenoptimierung
  • die Website http://www.wdfidf-tool.com/: diese ist kostenfrei und funktioniert gelegentlich nicht; auf der Website zu finden sind:
    • das WDF*IDF Analyse Tool und
    • der WDF*IDF Texteditor
    • Erweiterung mit dem OnpageDoc
  • ryte WDF*IDF-Tool: arbeitet nach demselben Pinzip wie die wdfidf-tool Homepag und bietet dazu noch einen Wettbewerbsvergleich an
  • seobility
  • SEOlyze
  • Searchmetrics

Vorteile und Nachteile

WDF*IDF einfach erklärt: WDF-IDF-Tool: Wie optimiert man Texte auf Relevanz? Hier wird WDF*IDF anschaulich am Beispiel der Tool-Anwendung erklärt.

Neben all den Vorteilen, wie das Erkennen fehlender, relevanter, zusammengehörender Suchterme, bietet das WDF*IDF-Tool auch einige Nachteile.

Bei den Tools kann es allerdings oftmals neben einer Nicht-Funktionalität zu weiteren Problemen bei der Ermittlung relevanter Suchterme kommen: Dadurch, dass bei den meisten Tools für WDF nur die ersten 10 Suchergebnisse von Google zu dem Hauptkeyword genutzt werden, ist die nötige Datenbreite nicht vorhanden. So sind Ausreißer und fehlende Suchterme nicht auszuschließen.

Probleme bieten sich dabei auch, wenn Shopping-Ergebnisse oder ähnliche Anfragen in den ersten Suchergebnissen auftauchen. Hierbei sind neben den relevanten Suchtermen auch irrelevante (wie bspw. Warenkorb) aufgeführt, die nichts zum suchmaschinenoptimierten Text beitragen, aber dennoch aufgelistet sind. Daher ist eine genaue Prüfung der angegebenen Suchterme bei der Optimierung nach WDF*IDF immer nötig.

Meinungen

Laut Sistrix-Chef Johannes Beus wird Sistrix nie ein WDF*IDF erhalten, da er nicht an das Verfahren glaubt.

Die induux Meinung dazu: Ja, Tools bieten mit der Berechnung von WDF*IDF kein exaktes Abbild der Realität, z.B. unter Einbezug aller im Web existierenden Dokumente, an. Aber: Bei genauer Betrachtung der Analyse-Ergebnisse in Zusammenhang mit einem Term-Verständnis der eigenen Begriffe, ist WDF*IDF eine sehr gute Orientierung für Redakteure beim Schreiben von suchmaschinenoptimierten Texten. Dieser Meinung schließen sich auch Unternehmen wie CONTENTmanufaktur, ryte oder die B2B SEO-Küche an.


WDF*IDF ist ein sinnvolles Tool zur Ergänzung der eigenen Texte und suchmaschinenoptimiertes Schreiben. Gerade bei News und aktuellen Themen ist ein ständiges Beobachten der Texte allerdings wichtig.

Bevor das Tool jedoch angewendet wird, sollte ein sog. Briefing erstellt werden, in dem die Anforderungen an den Text klar vorgegeben werden.

Auch neben der Nutzung des Tools und damit relevanter Suchterme, ist nach wie vor wichtig, dass:

  • Texte sauber und klar gegliedert sind
  • Texte für Leser und nicht Google geschrieben werden
  • Texte den Leser binden und nicht nur an erster Stelle bei entsprechenden Suchanfragen stehen

Denn: Google belohnt guten Content und stellt diesen über schlechte Inhalte.

Die WDF*IDF-Analyse von induux

Im Rahmen des induux Online Marketing Service führen wir für Eure Webseiten individuelle WDF*IDF-Analysen durch. Die Ergebnisse / aktuellen Rankings (inklusive Wettbwerbsvergleich) seht ihr im induux-Report.

Die Erläuterung der Tabelle, die Ihr von uns erhaltet

Für die Tabelle werden die für einen spezifischen Suchbegriff bei Google auf den ersten zehn Positionen rankenden Seiten herangezogen. Die Inhalte dieser zehn Seiten werden mit Eurer eigenen Webseite abgeglichen. Das Ergebnis findet Ihr in der Tabelle. Die Spalten bedeuten im einzelnen:

Spalte: Term

Zeigt den gefunden / analysierten Term (Begriff / Keyword Recherche) an. In dieser Spalte steht gleichzeitig der häufigste Begriffe einer Wortstammgruppe, wenn diese extrahiert wurde (siehe rechte Spalte daneben. Spalte 'Vom selben Wortstamm')

Spalte: Vom selben Wortstamm

Zeigt alle weiteren Begriffe (Terms) der Wortstammgruppe des Begriffs in der linken Spalte an.

Spalte: Korpus-Rang

Zeigt an, ob der Begriff eher generisch oder eher spezifisch ist. Je häufiger der Begriff im deutschsprachigen Web vorkommt, desto kleiner ist die Zahl. Je seltener der Begriff, desto größer ist die Zahl. Der Wertebereich reicht von 1 bis 8.

Spalte: Document Count

Zeigt an, auf wie vielen der zur Analyse herangezogenen Top 10 Webseiten der Begriff bzw. Begriffe aus Wortstammgruppe (wenn vorhanden) verwendet werden.

Spalte: Avg

Zeigt die durchschnittliche Relevanz aller URLs der Analyse an. Durch absteigende Sortierung kann eine Übersicht der häufig vorkommenden Begriffe mit hoher Gesamtrelevanz angezeigt werden.

Spalte: Max

Zeigt die maximale Relevanz der Analyse an. Dies bedeutet, dass auf mindestens einer der analysierten Webseiten der Begriff diese höchste Relevanz hat. Es spielt dabei keine Rolle auf wie vielen Webseiten der Begriff vorkommt. Es wird hier nur die Webseite mit dem Maximum herangezogen. Durch absteigende Sortierung kann eine Übersicht der relevantesten Begriffe aus einzelnen Webseiten angezeigt werden.

Spalte: Ref

Zeigt den errechneten Relevanzwert des Begriffs auf der eigenen Webseite an. Im Idealfall sollte der Wert nahe dem Wert aus der Spalte Max liegen aber diesen nicht übertreffen.

Spalte: Score

Zeigt die Einstufung an, wie gut ein Begriff auf deiner Webseite in Bezug zur Begriffshäufigkeit optimiert ist. Du siehts damit, ob ein Begriff fehlt, zu selten oder zu häufig auf der eigenen Webseite verwendet wird. Wenn Missing, bad oder poor angezeigt werden, sollte der Begriff bzw. ein Begriff der Wortstammgruppe (wenn vorhanden) auf der Webseite hinzugefügt werden oder wiederholt verwendet werden. Es besteht Optimierungsbedarf. Sollte good angezeigt werden, kann noch optimiert werden, so dass perfect erreicht wird. Bei perfect besteht kein Handlungsbedarf. Top zeigt an, dass der Begriff eher zu häufig verwendet wird. Unique bedeutet, dass der Begriff nur auf der eigenen Webseite und nicht auf den zur Analyse herangezogenen Webseiten verwendet wird. Priorität sollte zuerst auf die Optimierung der Begriffe gelegt werden, die nicht auf der eigenen Webseite zu finden sind (missing) oder zu wenig auf der eigenen Webseite verwendet werden (bad, poor).

Spalte: Ref-TF

Zeigt die Anzahl an, wie häufig der Begriff bzw. ein Begriff der Wortstammgruppe (wenn vorhanden) auf der eigenen Webseite verwendet wird.

Du hast Feedback zur Wiki-Seite?