Tip: Hét alternatief voor Google Optimize & A/B-testen is itClicked.nl.

Zoekmachine optimalisatie (SEO)

[How-To] Je eigen website-scraper met Screaming Frog

Door:

Christian Broekmeulen

26 maart 2020

Screaming Frog is een handige tool die veel gebruikt wordt door marketeers voor on-page SEO, zoals het ontdekken van foutieve hyperlinks of ontbrekende meta-tags. Maar Screaming Frog biedt meer mogelijkheden.

Een van die mogelijkheden leg ik stap-voor-stap uit in dit artikel: het verzamelen van (specifieke) gegevens uit websitecontent. Als je Screaming Frog slim inzet, kan je hem gebruiken als slimme ‘webscraper‘ voor het geautomatiseerd verzamelen van content op websites. Denk aan artikelnummers of andere data (zoals e-mailadressen of andere gegevens).

In dit voorbeeld maak ik een uitdraai met van alle producten op een webshop en de daarbij behorende artikelnummers. Maar het principe is toepasbaar voor elk type informatie.

Stap 1: Selector kopiëren met Google Chrome

Browse met Google Chrome naar een productpagina en selecteer de content, in dit geval het artikelnummer dat je wilt onttrekken uit de content en klik op je rechtermuisknop en op Inspecteren.

[How-To] Je eigen website-scraper met Screaming Frog

Je ziet nu een hoop HTML code, zorg ervoor dat je de juiste waarde geselecteerd hebt. Klik vervolgens nogmaals op de waarde met je rechtermuisknop en selecteer Copy > Copy Selector.

[How-To] Je eigen website-scraper met Screaming Frog

In ons geval is de selector “product_addtocart_form > div.product-shop.columns.medium-6.large-7 > ul.inline-list.bonus-info.hide-for-small > li > span“, sla deze selector op, deze hebben we later nodig in Screaming Frog.

Stap 2: Screaming Frog instellen

Open Screaming Frog en open het menu Configuration en selecteer Custom > Extraction.

[How-To] Je eigen website-scraper met Screaming Frog

Vul in het eerste veld de gewenste kolom naam in die terug komt in je uitdraai, in ons geval artikelnummer. Selecteer CSSPath in de dropdown en plak de selector uit stap 1 in het veld. Selecteer vervolgens Extract Text om alleen de waarde binnen de selector als tekst te selecteren.

[How-To] Je eigen website-scraper met Screaming Frog

Klik vervolgens op OK om de instellingen op te slaan.

Stap 3: Start Screaming Frog

Nu start je de Screaming Frog crawler zoals je dat normaal zou doen. Als je helemaal naar rechts scrolled in je resultaten zie je de nieuwe kolom die je in de vorige stap toegevoegd hebt. Als er een waarde is gevonden binnen de selector zal deze waarde in deze kolom terecht komen.

[How-To] Je eigen website-scraper met Screaming Frog

Op eenzelfde manier kun je al het denkbare uit de content halen van je website.

Geen waarde? Probeer XPath

Krijg je in geen gevallen de juiste waarde te zien? Probeer dan XPath in plaats van Selector. Selecteer in Stap 1 Copy XPath in plaats van Selector en selecteer in stap 2 XPath in plaats van CSSPath.

Hulp nodig?

Heb je hulp nodig of kan je wel wat assistentie gebruiken bij een specifieke use-case? We’ve got you covered! Neem contact met ons op. Wij kijken er alvast naar uit.

Labels:

Online marketing specialist

Over de schrijver:

Christian Broekmeulen

Christian wordt als performance marketing specialist blij als het gaat over het behalen van positieve ROI. Zijn weapons of choice zijn Google Ads, Facebook Ads, LinkedIn ads, Amazon Ads en SEO. Hij deinst ook niet terug voor de realisatie van goede dashboards of Tagmanager implementaties. Vooral als het wat ingewikkelder wordt.

SEO uitbesteden?

Een goede online vindbaarheid zorgt voor een continue stroom van relevante bezoekers naar jouw website. Dit bereik je door je website te optimaliseren voor zoekmachines. Wij helpen daarbij.

Meer informatie over seo uitbesteden.

  1. Zoekwoordonderzoek, concurrentieanalyse en SEO-strategie laten bepalen
  2. Onpage- en offpage optimalisaties van je website
  3. Hoger in Google

Online marketing uitbesteden?

Dankzij veel ervaring met zoekmachine optimalisatie (seo) en andere onderdelen van online marketing gaan we deze uitdaging graag aan.

Contact
0%