SPAM in Google Analytics verwijderen

S

Denk je veel websitebezoekers te hebben in Google Analytics? Let op: dit kunnen veel nep-bezoekers zijn, veroorzaakt door SPAM! Ik kom websites tegen waar 60% tot 80% van de vermeende bezoekerscijfers in Google Analytics nep is door SPAM! Je bezoekcijfers worden hierdoor opgeblazen en verziekt.

In Google Analytics kun je de bezoekercijfers van je website zien. Alsmede waar precies bezoekers vandaan komen. Analytics registreert namelijk keurig alle bezoekjes tot in detail. Probleem: Je website wordt niet alléén bezocht door ‘echte’ personen of klanten, maar ook door zgn ‘SPAM bots’, oftewel: geautomatiseerde programma’s van frauduleuze websites. Google Analytics kan dit spam-verkeer niet onderscheiden van een ‘echte’ bezoekers. Dit probleem noemt men ook wel ‘Analytics Referal SPAM’. Véél websites en Google Analytics rapportages worden door SPAM geteisterd!

Het is nog onduidelijk hoe Google dit probleem wil (en kan!) gaan aanpakken. Bij de instellingen van Google Analytics is wel een optie aanwezig om bekende bots te filteren. Maar deze lijkt voorlopig nog weinig te doen. Je lost het probleem met deze instelling dus niet op! Hoe dan wel?

Waarom SPAM in Analytics?

In Google Analytics kun zien vanaf welke bron of ‘referrals’ je bezoekers vandaan zijn gekomen. Dit kan bijv. vanaf social media zijn, maar ook vanaf andere websites. Spammers hebben hiermee een nieuwe manier gevonden om jouw aandacht te krijgen (aan SPAM via e-mail zijn we immers ondertussen wel gewend, toch?). Door het nep-bezoek van een SPAM bot, planten spammers hun frauduleuze website-links in jouw Analytics rapportages als vermoedelijke herkomst (bron) van je websitebezoekers.

Waarom doen ze dit? Zodat het je interesse wekt en je naar het frauduleuze websiteadres gaat!

Miljoenen websites gebruiken het gratis Google Analytics om hun websitebezoek bij te houden. Zodoende kan een spammer een ongekend aantal bezoekjes verwachten van nieuwsgierige website-eigenaars zoals jij; er zit altijd wel iemand die voor het reclameverhaaltje ‘valt’ en waar ze geld aan (kunnen) verdienen.

Laat spam je Google Analytics rapportages niet verpesten! Ik leg je in dit artikel uit hoe je ‘Analytics referal spam’ bijna feilloos kunt tegenhouden! Je kunt dan weer met een gerust hart op je bezoekcijfers en herkomst van websitebezoekers in Google Analytics gaan vertrouwen…

Hoe verpest SPAM je Analytics?

Op tenminste 2 manieren worden je rapportages aangetast door SPAM:

  1. Opgeblazen, foutieve bezoekcijfers. Het lijkt alsof je (veel) bezoekers op je website hebt. De spammers doen zich immers voor als ‘echte’ bezoekers. Ze vervuilen je rapportages, doordat ze niet te onderscheiden zijn van echt verkeer.
  2. Herkomst van bezoekers = onoverzichtelijk. Het is niet meer duidelijk wat de werkelijke herkomst of ‘Bron’ van je websitebezoek is. Deze rapportage wordt namelijk overspoeld door fake spam-adressen. Het enigste doel van de spammer is om hun websiteadres onder jouw aandacht te krijgen, en dat lukt ze zo uitstekend helaas.

Benieuwd hoe jouw website er voor staat, en wat voor invloed SPAM heeft op jouw rapportages? Kijk maar eens in Google Analytics waar je websitebezoekers vandaan komen:

  • Ga naar analytics.google.com en log in (met ‘Aanmelden‘)
  • Ga naar ‘Rapportage‘ (helemaal bovenaan)
  • Ga naar ‘Acquisitie‘, dan ‘Alle verkeer‘ en vervolgens ‘Bron/medium‘.

Hier zie je de herkomst (bron) waar je website bezoekers vandaan komen. Let goed op bronnen met ‘/ referral’ er achter. Staan hier rare websites tussen? Nogmaals: het doel van de spammers is je interesse te wekken met opvallende links, zodat je naar deze websiteadressen gaat om te kijken.

Hoe stop je SPAM in Analytics?

Volg mijn (bijna feilloze) oplossing voor SPAM in Analytics in 4 stappen:

  1. Een extra SPAM weergave
    Om te controleren welke spammers precies gefilterd worden. Hierdoor kun je blijven controleren op ‘false positives’.  Het kan zijn dat we een ‘echte’ website waar bezoek vandaan komt tegen houden welke geen SPAM is! Vergelijk het met de veilige ‘quarantine’ van een virusscanner met aangemerkte bestanden waar soms niets mee aan de hand is…
  2. Filteren op hostnaam
    Om alléén bezoek (verkeer) te registreren vanaf je eigen websiteadres of domein.
  3. Filteren op campagnebron
    Op veelgebruikte SPAM woorden en termen, zoals o.a.: offer, free, porn, buttons, etc.
  4. Een filter-segment voor oude bezoekcijfers
    Bovenstaande filters werken alléén maar vanaf het heden. Om verzamelde statistieken uit het verleden SPAM-vrij te maken, gaan we een segment aanmaken met dezelfde SPAM-filters. Dit segment kun je eenvoudig toepassen op je oude cijfers en rapportages.

Het makkelijkste is deze stappen achtereenvolgens uit te voeren:

1. Extra SPAM weergave toevoegen

Als je nog niet ingelogd bent in Google Analytics, doe dat dan alsnog. En dan:

  • Ga naar ‘Beheerder‘ (helemaal bovenaan)
  • Bij het kopje ‘Weergave’ (helemaal rechts) klik je op de grijze balk met je websitenaam en kies je ‘Nieuwe weergave maken
  • Vul bij ‘Naam van weergave voor rapportage’ de bestaande naam in van je websiteweergave met als toevoeging: (Excluded SPAM referrals).
    LET OP: selecteer de juiste tijdzone: ‘Netherlands’.
  • Kies vervolgens voor ‘Weergave maken‘ op deze op te slaan.
  • Bij het kopje ‘Account’ (helemaal links), ga je naar ‘Alle filters‘.
    Hier staan één of meer filters ingesteld om te zorgen dat je eigen (interne) websitebezoek niet wordt meegeteld in Google Analytics. (p.s.: Is dit lijstje leeg? Je eigen bezoek wordt dan meegerekend. Een beginnersfout! Lees dan eerst mijn uitleg over Filters instellen in Google Analytics).
  • Zorg dat je alle bestaande filters (dus voor het uitsluiten van je eigen websitebezoek) ook toegepast worden op de nieuwe weergave met ‘(Excluded SPAM referrals)’. Dit doe je door alle filters na te lopen. Begin bij de 1e filter boven aan de lijst. Onderaan bij ‘Filter toepassen op weergaven’ selecteer je de nieuwe weergave en klik je op ‘Toevoegen >>‘. De nieuwe weergave verspringt dan naar rechts, en is dan zichtbaar bij ‘Geselecteerde weergave’. Klik op ‘Opslaan‘. Herhaal deze stap bij alle andere filters, tot je het gehele lijstje hebt gehad!
  • Optionele check: nadat je alle filters hebt doorlopen, controleer of beide website-weergaven dezelfde filters toegepast hebben staan! Je kunt dit checken bij het kopje ‘Weergave’ en hier te klikken op ‘Filters‘. Tel het aantal toegepaste filters per weergave; het aantal toegepaste filters dient gelijk te zijn!

2. Filter op hostnaam

We voegen een filter toe welke alléén websitebezoek registreert welke daadwerkelijk van jouw  websiteadres (domein) afkomen. Hiermee voorkomen we dat frauduleuze websites niet meer jouw persoonlijke Analytics code kunnen aanroepen (misbruiken!). Google Analytics laat het namelijk toe als er vanaf een ander domein (dan jouw websiteadres) een bezoek wordt geregistreerd. Om een voorbeeld te geven: iemand ‘belt’ met jouw telefoonnummer en je provider laat jou betalen! Hier gaan we als volgt een stokje voor steken:

  • Ga naar ‘Beheerder‘ (helemaal bovenaan)
  • Bij het kopje ‘Account’ kies je ‘Alle filters
  • Klik op de button ‘+NIEUW FILTER
  • Vul het scherm als onderstaande voorbeeld in.
    LET OP: dit voorbeeld is gebaseerd op mijn eigen website. Vervang bij ‘Filternaam’ (1) mijn voorbeeldtekst ‘erikmolenaar.nl’ uiteraard even door jouw eigen websiteadres!
    BELANGRIJK: bij ‘Filterpatroon’ (5) deze RegEx-regel te plaatsen. Deze kun je het beste kopiëren, plakken en aanpassen voor jouw websiteadres. Let ook op dat je de .nl vervangt door een eventueel andere adres-extensie zoals .nu of .com:
    jouwwebsite.nl|googleusercontent
  • Voeg beide weergaven toe bij ‘Beschikbare weergaven’ (6) met de button ‘Toevoegen >>‘. Beide weergaven staan nu rechts bij ‘Geselecteerde weergaven’.
  • Kies ‘Opslaan‘ (7) op deze nieuwe filter om te slaan en te activeren.

3. Filter op campagnebron

Veel SPAM websites hebben gelijknamige SPAM namen. Zoals bijv.: ‘buy’, ‘offer’, ‘porn’, ‘semalt’, ‘button’ etc. Hier kunnen we gemakkelijk een filter op loslaten die deze termen markeert als SPAM:

  • Ga naar ‘Beheerder‘ (helemaal bovenaan)
  • Bij het kopje ‘Weergave’ kies je ‘Alle filters
  • Klik op de button ‘+NIEUW FILTER
  • Voer deze RegEx code in het veld ‘Filterpatroon’ (5):
    offer | free- |share | video.*-.*business | guardlink | buy | cheap | semalt | googlsucks | benz | sl500 | hulfington | buttons | darodar | motor | money | blackhat | backlink | webrank | seo | phd | crawler | anonymous | d{3}.*forum | porn | webmaster | flipboard | fl.ru | mbca | ahrefs | game | .io
    BELANGRIJK: voeg bij (6) alléén je standaard website-weergave, dus zonder ‘Excluded SPAM referrals’ toe door deze te selecteren en met de button ‘Toevoegen >>‘ te verplaatsen naar rechts.
  • Kies ‘Opslaan‘ (7) op deze nieuwe filter op te slaan en te activeren.

Blijf nu in hetzelfde scherm van ‘Alle filters’, want we voegen hier nog één extra filter toe voor de weergave met ‘Included SPAM referrals’:

  • Klik op de button ‘+NIEUW FILTER
  • Vul het scherm als onderstaande voorbeeld in. Deze wijkt af op een paar punten van bovenstaande, namelijk:
  • Bij ‘Filternaam’ (1) vul je in “Included SPAM referrals’
  • Selecteer ‘Opnemen‘ bij (3)
  • Voeg bij (6) nu alléén de andere weergave toe, dus mét ‘Excluded SPAM referrals’. Dit klinkt tegenstrijdig, omdat de filternaam iets anders suggereert; maar vertrouw me maar!
  • Kies ook hier weer ‘Opslaan‘ (7) om deze op te slaan en te activeren.

4. Een filter-segment voor oude bezoekcijfers

  • Ga naar ‘Rapportage‘ (helemaal bovenaan)
  • Verzeker jezelf er van dat je de normale website-weergave voor je hebt! Dit kun je doen door rechtsboven op het pijltje omlaag te klikken. De normale website-weergave hoort nu geselecteerd te zijn, dus zonder de toevoeging ‘Excluded SPAM referrals’. Zo niet, schakel dan nu over naar je normale weergave voordat je verder gaat.
  • Klik op ‘+ Segment toevoegen
  • Klik op de rode button ‘+ NIEUW SEGMENT
  • Klik links bij ‘Geavanceerd’ op ‘Voorwaarden
  • Klik rechts op de button ‘EN‘.
  • Neem het onderstaande schermvoorbeeld over. Bij ‘Hostnaam’ en ‘Bron’ kopieer en plak je wederom de bovenstaande, bijbehorende RegEx-regels.
    CHECK: je ziet rechts een cirkeldiagram welke meteen de gefilterde bezoekcijfers laat zien van je website. Dit gebeurt al direct tijdens het invullen van bovenstaande regels! Schrik niet als blijkt dat het merendeel van je websitebezoek altijd SPAM is geweest, en er eigenlijk maar een klein deel overblijft! Als deze teller op 0% staat, heb je iets niet goed gedaan!
  • Klik bovenaan op de blauwe button ‘Opslaan

Oude bezoekcijfers SPAM-vrij maken

De SPAM-filters die we hebben aangemaakt werken alléén maar vanaf het heden. Om oude cijfers en rapportages SPAM-vrij te maken is het noodzakelijk het hierboven aangemaakte ‘segment’ te gebruiken. Dit segment kun je als volgt eenvoudig toepassen op je oude rapportages:

LET OP: je hoeft het filter-segment alléén te gebruiken bij oude rapportages en cijfers. Dat wil zeggen: de periode vóórdat je bovenstaande filters ingesteld had!

  • Klik bij ‘Rapportage’ op ‘+ Segment toevoegen
  • Klik links op ‘Aangepast‘ (1)
  • Klik op je aangemaakte segment ‘Excluded SPAM referrals’ (2)
  • Klik op ‘Toepassen‘ (3)
  • Je ziet nu zowel het totale, niet-gefilterde bezoek (‘Alle sessies‘ in blauw) als het gefilterde SPAM-vrije bezoek (‘Excluded SPAM referrals‘ in oranje). Zie je verschil tussen deze twee?
  • De blauwe, ongefilterde cijfers kun je nu best verwijderen uit je weergave. Die heb je toch niet meer nodig in je rapportages verwacht ik. Klik hiervoor op het pijltje omlaag bij ‘Alle sessies’ en kies ‘Verwijderen‘. Je houdt dan een gefilterde weergave zonder SPAM over!

NOGMAALS: je hoeft het filter-segment alléén te gebruiken bij oude rapportages en cijfers. Dat wil zeggen: de periode vóórdat je bovenstaande filters ingesteld had!

Blijf regelmatig controleren op ‘false positives’

Voer regelmatig deze checks uit om zeker te weten dat je alléén SPAM filtert:

  1. Klik rechtsboven op het pijltje naar onderen
  2. Selecteer de extra weergave met ‘(Excluded SPAM referrals)’.

Volg nu dezelfde stappen als aan het begin van dit artikel bij ‘Hoe verpest SPAM je Analytics’. Als alles goed is gegaan, staan hier alléén SPAM websites tussen (het duurt een overigens paar dagen voordat hier data verschijnt!). Mocht er per ongeluk een ‘echte’ website tussen staan, verwijder of pas het relevante trefwoord aan in RegEx code welke je hierboven het geplaatst bij Filters en het filter-segment.

En nu jij…

Heb je ook zo’n last (gehad) van ‘referral SPAM’ in Google Analytics? Blij dat je er van af bent? Viel het tegen of mee? Heb je een suggestie of toevoeging voor de meest gebruikte SPAM termen? Zo kunnen we de RegEx regels nog verder verbeteren. Heb je nog goede tips of vragen om SPAM in Analytics tegen te gaan? Ik ben erg benieuwd, laat een reactie achter!

Laat een reactie achter