Ein Webanalyse Tool liefert zwar eine Menge an Daten, die Kunst jedoch ist es, diese Daten zu analysieren und auszuwerten, zu interpretieren und anschließend daraus Maßnahmen abzuleiten. Avenash Kaushik sagte einmal, dass maximal 10 Prozent der Kosten für ein Webanalyse Tool ausgegeben werden sollten und 90 Prozent für die Benutzer die damit arbeiten und die Daten auswerten und interpretieren. Meistens nutzen Anwender gar nicht alle umfangreichen Möglichkeiten, die man bei Webanalyse Tools hat.
Die Trackingvariante von Google (Google Analytics) z. B. ermöglicht das Filtern mit Hilfe von regulären Ausdrücken (RegEx) in der Weboberfläche. Das Anlegen von Filterungen und Segmenten in Google Analytics hilft die Daten besser zu verstehen und gibt eine zusätzliche Möglichkeit der spezifischen Erfolgskontrolle von Online Aktivitäten. Hierbei spielen reguläre Ausdrücke eine große Rolle, denn mit RegEx lässt sich eine Analyse viel mehr verfeinern und erweitern.
Überblick über reguläre Ausdrücke
Die Grundfunktion von regulären Ausdrücken ist es, spezielle Zeichenketten in einer Menge von Zeichen bzw. Zeichenketten (String) zu finden.
Praktische Beispiele
Segmentierung von mehreren Suchmaschinen
Wenn ich z. B. wissen möchte wie viele von meinen Visits, welche über Suchmaschinen gekommen sind, nicht über Google oder Bing gekommen sind, kann ich mit der Pipe | im erweiterten Filter von Google Analytics folgendes filtern: Segmentierung von Markentraffic
Ebenso kann ich so einen Markenfilter definieren, wenn ich z. B. nicht nur nach „meinestadt“, sondern auch nach „meine stadt“ filtern will. Mit der RegEx meine.?stadt lassen sich so mehrere Varianten der Schreibweise der Marke filtern. Dabei sagt der Punkt, dass nach „meine“ ein beliebiges Zeichen kommt (z. B. Leerzeichen oder Bindestrich) und das Fragezeichen bezieht sich auf diesen Punkt und sagt, dass es Null oder einmal vorkommen kann. Auch bei der Suche nach TRG gibt es unterschiedliche Schreibweisen der Marke, z. B.:
- TRG
- TRG Gmbh
- The Reach Group
- Reach Group
- he Reach Group
- TRG Group
- The Reach Gr
Um nach all diese Markensuchbegriffen zu filtern eignet sich beispielsweise folgende RegEx: trg|(the)?.*reach.*group
Segmentierung von Longtail Keywords
Ebenso möchte ich z. B. wissen, wie viele meine Nutzer in der organischen Suche über 2 Wort-Keywords, über 3 Wort-Keywords oder mehr als 4 Wort-Keywords gekommen sind. Dies kann ich z. B. mit folgender RegEx:
- ^[^ ]+ [^ ]+$ -> Filterung nach genau 2 Wort-Keywords
- ^[^ ]+ [^ ]+ [^ ]+ [^ ]+$ -> Filterung nach genau 4 Wort-Keywords
- ^[^ ]+ [^ ]+ [^ ]+ [^ ]+ -> Filterung nach mehr 4 und mehr Wort-Keywords
Segmentierung von mehreren Social Media Kanälen
Inzwischen gibt es bei Google Analytics direkt den Reiter „soziale Netzwerke“, der einen alle Informationen über die Visits gibt, welche über soziale Kanäle auf die Seite gelangt sind. Dennoch kann ich mit Hilfe von RegEx auch ein spezielles Social Media Segment anlegen, in dem ich nach unterschiedlichen sozial Media Kanälen filtern: (facebook|twitter|linkedin|stumbleupon|youtube|vimeo|myspace|delicious|reddit|tumblr)
Segmentierung von Zielen mit mehreren unterschiedlichen URLs
Jede Website hat ein Ziel was auch getrackt werden sollte. Dies geht in Analytics ganz einfach unter „Ziele anlegen“, bei dem eine Zielseite als Ziel definiert wird. Dies kann z. B. eine Bestellbestätigungsseite sein. In einigen Fällen kann es aber z. B. auch sein, dass man für ein bestimmtes Ziel zwei verschiedene Zielseiten hat, die zum selben Ziel führen. Hierzu wählt man dann unter den Zieldetails als Übereinstimmungstyp „Übereinstimmung regulärem Ausdruck“ und kann als Ziel-URL mit Hilfe von RegEx nach den zwei Ziel-URLs filtern.
Segmentierung des Traffics von Linkpartnern
Beim Linkaufbau ist es z. B. interessant zu wissen, ob über Links, welche sich auf Partnerseiten befinden, auch Traffic gekommen ist. Mit einer RegEx Filterung lassen sich verschiedene Linkpartner zusammenfassen und als Segment anlegen, sodass der Traffic über Links gemessen und beobachtet werden kann. Hierzu eignet sich am Besten die Pipe (|), mit der mehrere Domains aufgelistet werden können.
Segmentierung des Traffics von E-Mail
Um auszuwerten wie viel Traffic aufgrund von E-Mails (Newsletter etc.) ausgelöst hat eignet sich z. B. eine Filterung der Quelle mit folgender RegEx: mail.(google|yahoo|live|aol). Eine einfache Filterung nach „mail“ würde zwar auch funktionieren, damit würde man allerdings auch mailand.com mit filtern.
RegEx sind alles andere als kompliziert!
Generell erweitert die Filterung mit RegEx die Auswertungsmöglich in Google Analytics. Der Artikel reißt dabei nur einige wenige Funktionsmöglichkeiten mit RegEx an und spiegelt noch lange nicht die kompletten Möglichkeiten wider. Der Vorteil an regulären Ausdrücken ist, dass diese relativ leicht zu erlernen sind auch ohne dass man über ein großes technisches Verständnis verfügt. Auch bei anderen Auswertungen reduzieren RegEx häufig erheblich den Aufwand.
Teste Dein eigenes Wissen:
Ich habe mehrere Ressorts auf meiner Website (z. B. Politik, Sport, Wirtschaft, Kultur etc.). Nun möchte ich mir für einen bestimmten Zeitraum anzeigen lassen, welche Artikel im Ressort „Sport“ die meisten Visits generiert haben.
Tipp: Dies kann ich bei Analytics beispielsweise unter dem Navigationspunkt Content -> Website-Content -> Zielseiten anzeigen lassen.
Wenn ich mir jedoch insgesamt die Top Artikel nach Visits aus dem Ordner Wirtschaft und Politik auf einmal ausgeben lassen will, kann ich mir dies mit der normalen Filterung nicht anzeigen lassen. In diesem Fall kann ich mit einer RegEx jedoch nach diesen zwei Bedingungen filtern. Welche muss ich einsetzen?
Wofür benutzt Ihr RegEx ausserdem noch? Schreibt mir einen Kommentar, ich freue mich!
Guter Artikel! Ich finde auch dieses CheatSheet ganz nett: http://regexlib.com/CheatSheet.aspx Vielleicht für den einen oder anderen Leser hilfreich.
Ich gebe es offen zu: RegEx ist nicht mein Lieblingsthema, auch wenn die regulären Ausdrücke natürlich enorm praktisch sind. Danke für die kompakte deutschsprachige Zusammenfassung. Hab bei meinen Recherchen auch noch ein englischsprachiges Booklet zum Thema „RegEx for Google Analytics“ gefunden, dass auch grafisch und inhaltlich sehr nett aufbereitet ist. Download ist hier möglich: http://www.lunametrics.com/regex-book/Regular-Expressions-Google-Analytics.pdf