Wie mann man Foren mit Social Media Monitoring auswerten?

Foren beobachten mit Social Listening Tools

Bestes-Social-Media-Monitoring
Social Media Monitoring Agenturen 2024 Welche sind die größten Social Listening Agenturen?

LISTE ANSCHAUEN

Forenmonitoring

Dr. William Sen

von Dr. William Sen
digitalwelt-Kolumnist für Social Media Monitoring

digitalwelt logo

Google hält mit 90 Prozent Marktanteil im Suchmaschinenvergleich die unangefochtene Herrschaft im Finden und Wiederfinden von Inhalten im Web.

Da die Wichtigkeit bzw. Relevanz einer Website gegenwärtig faktisch von Google definiert wird, impliziert das Ergebnis einer Suchanfrage bei Google die Relevanz der gefundenen Quellen. Vor allem Foren werden im Ranking der deutschsprachigen Trefferlisten vorn angezeigt. Dies lässt sich insbesondere daran erkennen, dass unter den ersten Google-Treffern zu beinahe jedem Suchbegriff zahlreiche Einträge aus Foren gefunden werden. Im Vergleich dazu tauchen Blogs im Ranking selten auf den vorderen Plätzen auf. Der Grund liegt in der hohen Quantität deutscher Foren. In Deutschland wird ein Großteil aller Social-Media-Beiträge in Foren produziert. Selbst Social Networks wie Facebook oder Twitter können trotz ihrer hohen Popularität nicht mit dieser Menge an Daten mithalten.

Die Bedeutung von Foren in Deutschland

Dass sich in Deutschland Foren besonders etabliert haben, liegt daran, dass sie bereits lange vor dem Social-Network-Boom entstanden sind und gegenwärtig nahezu jeden Themenbereich abgedeckt haben.

In einem Forum tummeln sich zudem oft mehr als 10.000 Mitglieder, die sich täglich über alle möglichen Inhalte austauschen. Ein mittelgroßes deutsches Forum kann bis zu 40.000 Beiträge im Monat erzeugen. Verschiedene Beobachtungen zeigen zudem, dass die meisten Blog- und Social-Network-Nutzer in Deutschland auch in Foren diskutieren. Unbeachtet bleibt in diesem Zusammenhang zudem das Diskussionsnetzwerk Usenet. Alleine in dieser Plattform werden 775.000 Postings und 248 Terabyte an Diskussionsvolumen pro Monat erzeugt (Hemmer, 2011).

Somit ist es vor allem für den deutschen Markt unabdingbar, Foren zu beobachten. Dabei zeigt die Erfahrung, dass ein großes Quellenset an Foren notwendig wird, um flächendeckend Nutzermeinungen zu erfassen.

Typen von Foren

Foren lassen sich grob in zwei Typen klassifizieren: allgemeine und spezielle Foren.

Allgemeine Foren können alle möglichen Themen beinhalten, so dass bei der Suche nach relevanten Daten zu einem Thema die Betrachtung des gesamten Forums notwendig werden kann. Es gibt allgemeine Foren, die mittlerweile ein derartig hohes Maß an Diskussionsvolumen bereithalten, dass leicht der Eindruck entstehen kann, die Betrachtung einiger dieser Foren würde genügen. Eine solche Fokussierung würde allerdings außer Acht lassen, dass im deutschen Sektor auch viele spezielle Foren existieren. Vor allem diese themenspezifischen Plattformen sind in Sachen Quantität und Qualität der relevanten Beiträge nicht zu unterschätzen. Während in allgemeinen Foren sporadisch bestimmte Themen auftreten und wieder verschwinden, halten sich in diesen speziellen Foren vor allem Experten der jeweiligen Bereiche auf. Diese haben oft eine hohe Reichweite und können im Forum, aber auch darüber hinaus, Konsumentenmeinungen sehr stark und nachhaltig beeinflussen.

Foren-Monitoring

Die Erfassung und Überwachung von Foren stellt die Anbieter von Social Media Monitoring vor die größte Herausforderung.

Inhalte von Foren können nur selten oder gar nicht über RSS oder andere Dienste abonniert bzw. bezogen werden. Suchmaschinen, wie auch Google, greifen nur in längeren Abständen bzw. gar nicht erst auf Inhalte von Foren zu. Das Auffinden eines aktuellen Beitrags in einem neuen Forum kann durch eine öffentliche Suchmaschine somit oft nicht gewährleistet werden. Des Weiteren ist es aufgrund fehlender Standards, wie beispielsweise XML, auch öffentlichen Suchmaschinen nicht ohne weiteres möglich, den Beitrag strukturiert aus einem Forum in einer Datenbank abzulegen. Selbst Google ist somit nicht in der Lage, das Erstellungsdatum des Postings, den Autorennamen und den Textbeitrag voneinander zu trennen. Somit erscheinen alle diese Entitäten in der Google-Trefferliste als reiner Volltext. Abfragen nach bestimmten Kriterien wie Suche nach Stammusern, Eingrenzungen des Erstellungsdatums etc. sind daher nicht möglich. Dies erschwert den Bau einer strukturierten Datenbank, aus der jedoch betriebswirtschaftliche Kennzahlen generiert werden müssen, mit denen ein Unternehmen seine Entscheidungen begründen kann.

Foren-Datenbanken

Social Media Postings

Einzelne Beiträge in einem Forum können oft keine Rückschlüsse auf das diskutierte Thema geben. Antworten auf Postings wie etwa „das habe ich auch erlebt“ oder „ganz meine Meinung“ machen die Themenerkennung ebenfalls schwierig.

Zudem enthalten Beiträge oft keine aussagekräftige Tonalität, wenn der Autor nicht erkennbar Bezug auf den Thread nimmt. Zwar wird in Foren oft die Zitier-Funktion eingesetzt, sie ist jedoch weder verpflichtend, noch wird sie konstant angewendet. Die Arbeit in Foren wird zusätzlich dadurch erschwert, dass Threads teilweise mehrere Jahre unbeachtet bleiben, dann jedoch reaktiviert werden können. Auch diese neuen Postings müssen verlässlich eingeordnet werden.

Ein naheliegender Schritt zur Lösung dieses Problem wäre es, im Cockpit zusätzlich zum Beitrag einen Link zur Ursprungsquelle abzulegen. Abgesehen davon, dass gewährleistet werden müsste, dass die Beiträge in dieser Ursprungsquelle noch unverändert vorliegen, kann dies keine effiziente Lösung sein. Hierfür gibt es verschiedene Gründe: Eine Monitoring-Technologie muss mehr bieten als das reine Erkennen und Bewerten von Inhalten.

 Foren-Datenbanken etablierter Monitoring-Agenturen können mehr als 200 Millionen Beiträge beinhalten. Um aus dieser Menge relevante Erkenntnisse zu gewinnen, wird Data Mining eingesetzt. Daher benötigen Monitoring-Anbieter Technologien, um sich beispielsweise nur die aktivsten oder neusten Threads anzeigen zu lassen. Kurze und  wahrscheinlich weniger aussagekräftige Threads können außer Acht gelassen werden, da sie anhand der Posting- oder Autorenanzahl identifizierbar sind. Trends oder Diskussionen mit hoher Reichweite lassen sich dadurch mit wenigen Klicks erkennen (s. Kapitel Cockpit Module / Trenderkennung). Dies ist allerdings nur dann möglich, wenn bereits eine Posting-to-Thread-Zuordnung durch die Technologie möglich ist.

RSS bei Foren

Zudem gibt es in großen Foren keine Push-Dienste, wie man es beispielsweise in Blogs durch RSS-Feeds kennt, da der Traffic des Foren-Providers ins Unermessliche steigen würde.

Zwar ist ein Abonnement von neuen Beiträgen technisch möglich, der Forenbetreiber müsste jedoch mit einer sehr hohen Datenströmung rechnen. Es ist Gang und Gäbe, dass viele Internet-Provider die Installation von Forensoftware verbieten oder höheren Traffic extra berechnen, um extreme Datenmengen von vornherein zu verhindern.

Wie schwierig es ist, Foren-Plattformen zu betreiben, zeigt auch das fehlende Angebot von freien Foren-Portalen. Nahezu kein Anbieter stellt diese kostenlos im Internet zur Verfügung, während schier unzählige Blog-Plattformen wie Blogspot.com, myblogsite.com oder blog.com ihre Angebote kostenlos bereithalten. Für den Forenanbieter kann es also durchaus sehr teuer werden, wenn zu viele Nutzer Daten von ein und derselben Quelle beziehen. Würden alle Suchmaschinen ständig auf diese Foren-Inhalte zugreifen, wären die Grenzen der Server-Bandbreiten schnell erreicht und die Forum-Website wäre in regelmäßigen Abständen nicht abrufbar. Die ständigen Zugriffe vieler Suchmaschinen oder Abonnenten kämen einer Hackerattacke gleich. Daher gehen größere Forenbetreiber dazu über, Suchmaschinen das Indexieren ihrer Foreninhalte zu verbieten, um große Datenübertragungen zu stoppen. So untersagt auch heise.de, eines der größten IT-Foren, Suchmaschinen das Indexieren seiner Foren-Inhalte mittels einer sogenannten Robots Exclusion.

Bedeutung von Foren im Social Media Monitoring

Foren Post Zuordnung

Wie bereits erwähnt, stellen Foren vor allem auf dem deutschen Markt eine der ältesten Web-Kommunikations-formen dar. Foren waren bereits vor Social Media ein intensiv genutztes Medium.

„Foren sind hinsichtlich des Web-Monitorings eine ganz besonders interessante Form der Informationsquelle. Im Gegensatz zu Websites findet man in Foren einen wesentlich höheren Grad an Interaktivität vor. Dies zeichnet sich vor allem durch einen erhöhten Informationsaustausch aus, der in Foren über die verschiedensten Themen betrieben wird“ (Güldenring, 2007). Zudem herrschen in Foren Grundregeln des Verhaltens, wie beispielsweise Netiketten und andere Grundregeln, die sich in den letzten 20 Jahren etabliert haben. Diese und viele weitere Eigenschaften machen Foren zu den wichtigsten Meinungsquellen in Social Media. Sie grenzen sich also mit einem bedeutenden Unterschied von allen anderen Kommunikationsformen im Web ab: Foren haben Tradition.

Nachdem eine Monitoring-Technologie einerseits Foren indexieren und andererseits die darin enthaltenen Entitäten erkennen kann, ist eine weitere Eigenschaft gefragt: die Posting-to-Thread-Zuordnung. Das bedeutet, dass die Technologie in der Lage sein muss, ein Posting in den größeren Zusammenhang eines Threads einzuordnen.

Foren-Analyse

Für die Foren-Auswertung gibt es derzeit keine technischen Erleichterungen.

Stattdessen muss der Monitoring-Dienstleister die jeweiligen Foren mit Hilfe von aufwendigen Systemen selbst auslesen, unter Berücksichtigung der Attribute in einer Datenbank verwalten und wiederauffindbar machen. Diese Technik verlangt neben einem entsprechenden Know-how auch einen deutlich höheren Aufwand. Im Gegenzug liefert sie aber wirklich relevante Daten.

Themen-Monitoring bei Foren

Eine weitere wichtige Eigenschaft der Foren sind die Themen-Ebenen. Eine fortschrittliche Technologie ist in der Lage, die verschiedenen Ebenen eines Forums zu erkennen. Diese Fähigkeit bringt sowohl technische als auch intellektuelle Vorteile.

Der intellektuelle Vorteil liegt darin, dass der Auftraggeber befähigt wird, nur den Themenbereich eines Forums zu beobachten, der für ihn relevant ist. Da Foren große Datenmengen bereithalten, ist es oft nicht empfehlenswert, das gesamte Themenspektrum zu beobachten und erst dann die Ergebnisse nach Relevanz zu ordnen.

Foren Themen

Wie in der Abbildung zuvor zu sehen, lassen sich Foren wie das Automobil-Forum motor-talk.de in verschiedene Ebenen aufteilen. Das Forum motor-talk.de zählt zu den größten deutschen Foren und hat knapp 2 Millionen Mitglieder, von denen durchschnittlich ca. 10.000 gleichzeitig online sind. Motor-Talk hält ca. 20 Millionen Beiträge bereit. Insbesondere beim Monitoring von Foren dieser Größenordnungen muss sich das Unternehmen auf einzelne Themenbereiche beschränken.

Auch aus technischer Sicht ist die Vorgehensweise, Themen-Ebenen maschinell erkennen zu lassen, sehr sinnvoll. 20 Millionen Beiträge zu indexieren, würde nicht nur für den Betreiber von Motor-Talk eine hohe Traffic-Belastung bedeuten, sondern auch für die Server des Monitoring-Anbieters. Ohne Differenzierung zwischen den Themen-Ebenen müsste zudem bei jeder Indexierung das gesamte Forum gescannt werden, um neue Beiträge zu erkennen. Da eine Monitoring-Technologie teilweise tausende Foren indexiert, wäre eine Überlastung der Systeme womöglich die Folge.

Ist die Monitoring-Technologie dagegen in der Lage, Ebenen zu erkennen, kann die Datenflut um bis zu 90% geringer ausfallen. Die Daten können auf diese Weise schneller indexiert werden. Außerdem treten in der Social-Media-Datenbank weniger Redundanzen auf.

Die Möglichkeit, Ebenen in einem Forum automatisch zu erkennen, birgt weitere technische Vorteile. Die Monitoring-Technologie kann so nur die oberste Ebene scannen und erkennen, welche Beiträge neu sind. Erst, wenn tatsächlich neue Beiträge verfasst worden sind, wird die nächsttiefere Ebene untersucht. Der Einsatz von Observer-Technologien führt dazu, dass nicht immer das gesamte Forum gescannt werden muss. Stattdessen „observiert“ die Technologie das Forum und startet dementsprechend ihren Indexierungsprozess nur bei neuen Beiträgen.

Diese Art von Technologie wird tatsächlich nur selten angewandt, gehört jedoch zu einem professionellen Monitoring dazu. Das Erkennen von Ebenen setzt ein hohes Verständnis für unstrukturierte Daten in Foren voraus. Es bleibt jedoch eines der wichtigsten Merkmale, wenn es darum geht, Foren in größeren Mengen zu indexieren. Es ist daher von großer Wichtigkeit für einen Auftraggeber, zu wissen, ob ein Dienstleister thematische Ebenenerkennung einsetzt. Verwendet der Anbieter diese Methode nicht, sollte der Auftraggeber in Erfahrung bringen, welche Lösung für das Problem der Datenmenge besteht.

Zugangsbeschränkung bei Foren

Foren Zugangsbeschränkung

Im Bereich von Social Media sind zwei verschiedene Typen von Foren zu beobachten, was die Zugangsberechtigung angeht. Die Zugangsbeschränkung auf Funktionalitäten, wie zum Beispiel Suchfunktionen und Mitgliederlisten, versperrt nicht angemeldeten Nutzern bestimmte Bereiche. Die Inhalte der Plattform können jedoch trotzdem gelesen werden.

Vor allem Foren nutzen diese Möglichkeit, um nicht registrierte Gäste des Portals mit Inhalten zu überzeugen. Die wesentlichen Funktionen sind dann jedoch eingetragenen Mitgliedern vorbehalten und können durch ihre Nützlichkeit anziehend auf Besucher wirken. Derartige Plattformen können in der Regel von Social Media Monitoring erfasst werden.

In einigen Foren können Nutzer nicht mal lesen, was im Forum diskutiert wird. In einem solchen Fall sind die meisten Inhalte (also Meinungen, Aussagen und Informationen der Mitglieder) für Gast-User gesperrt.

Ohne eine Anmeldung im Portal kann somit kein Nutzer erkennen, um welche Art von Content es sich handelt. Nur wenige Foren nutzen diese Sperrung, sie wird jedoch vor allem dann angewandt, wenn es sich um Themen handelt, die der Allgemeinheit nicht zugänglich sein sollen. Vorstellbar sind private Vereine, politisch-motivierte Gruppen und Special-Interest-Gemeinden.

Zugang nur mit Erlaubnis

Foren Zugang

In den meisten Fällen überprüft ein Administrator die Registrierung in einem solchen Portal. Teilweise ist eine Neuanmeldung im Portal gar nicht möglich. Die Monitoring-Agentur muss hier einen eigenen Account einrichten. Die Monitoring-Software muss zusätzlich in der Lage sein, sich automatisch einzuloggen. Der hohe technische Aufwand ist vor dem Hintergrund der Seltenheit solcher Foren jedoch in Frage zu stellen. Zugangsbeschränkte Social-Media-Quellen haben in der Regel nur eine geringe Reichweite und kaum Meinungsmacht im Web.

In einigen Foren können Nutzer nicht mal lesen, was im Forum diskutiert wird. In einem solchen Fall sind die meisten Inhalte (also Meinungen, Aussagen und Informationen der Mitglieder) für Gastuser gesperrt.

Ohne eine Anmeldung im Portal kann somit kein Nutzer erkennen, um welche Art von Content es sich handelt. Nur wenige Foren nutzen diese Sperrung, sie wird jedoch vor allem dann angewandt, wenn es sich um Themen handelt, die der Allgemeinheit nicht zugänglich sein sollen. Vorstellbar sind private Vereine, politisch-motivierte Gruppen und Special-Interest-Gemeinden.

Indexierung ausgeschlossen

Index-Sperre bei Foren

Ein spezieller Fall der Zugangsbeschränkung ist gegeben, wenn von der Hauptseite des Portals ausgehend kein Zugang zum User Generated Content besteht, öffentliche Suchmaschinen die Inhalte jedoch finden können.

Dabei handelt es sich um eine Form von Search Engine Optimization (SEO): Der Forenbetreiber möchte nicht, dass Gäste, die auf das Forum zugreifen, ohne eine Anmeldung Inhalte lesen können. Da er jedoch weiß, dass Suchmaschinen wie Google auf Inhalte besonders hohen Wert legen, hat er mit einer speziellen Funktionalität den Suchmaschinen die Erfassung seiner Inhalte trotzdem ermöglicht. Die Inhalte derartiger Portale können daher nur von öffentlichen Suchmaschinen gefunden werden. Der positive Nebeneffekt: Die Monitoring-Software kann die Inhalte auf diesem Wege ebenfalls erfassen und weiterverwenden. Ein manuelles Monitoring ist hier meist ausgeschlossen.

Nicht-öffentliche Foren

Nicht-öffentliche Foren

Ein anderer Fall ist gegeben, wenn das Portal nicht zugangsbeschränkt, die Indexierung durch Suchmaschinen jedoch unerwünscht ist.

Diese Methode wird anhand eines sogenannten Robots Exclusion Standard ermöglicht, der auf der Site enthalten sein muss. Durch diese technische Anwendung hat der Betreiber einer Website die Möglichkeit, Suchmaschinen vorzuschreiben, welche Inhalte indexiert werden dürfen und welche nicht. Für das Monitoring kann dies unter Umständen bedeuten, dass die Indexierung zwar technisch möglich wäre, vom Betreiber jedoch offenkundig unerwünscht ist. In diesem Fall können vor allem urheberrechtliche Gründe gegen eine Indexierung sprechen: Anbieter von Social Media Monitoring müssen hier die Wünsche des Webmasters berücksichtigen.

Fazit Foren

Technische Barrieren hin oder her, Foren bilden zumindest noch in Deutschland die größte Quelle für Konsumentenmeinungen.

In Deutschland wird die Anzahl der Foren auf über 100.000 geschätzt. Zu jedem Thema oder jeder Branche gibt es jeweils mindestens 300-900 spezialisierte Foren (Hemmer, 2011).

Dr. William Sen

von Dr. William Sen
digitalwelt-Kolumnist für Social Media Monitoring

digitalwelt logo

Social Media Thema
Themen rund um Social Media Unser Themenfokus rund um Social Media

ARTIKEL LESEN

Letzte Artikel über Social Media Monitoring ALLE ARTIKEL ANSCHAUEN

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

* Please select reCAPTCHA