Wat is Octoparse?
ĂĂ©n van de eerste taken die ik toegewezen kreeg toen ik aan de slag ging bij Sigma Solutions, was het binnenhalen van productdata voor een nieuwe webshop voor Ă©Ă©n van onze nieuwste klanten. De tool die ik hiervoor heb gebruikt heet Octoparse. In deze blog geef ik een korte uitleg van de werking en toepassing van dit handige programma.
Octoparse: een visuele webscraper
Octoparse maakt het mogelijk om veel informatie van een website binnen te halen en te ordenen, zonder dat daar code aan te pas komt. Door te werken in een omgeving die veel lijkt op een browser, bootst Octoparse in feite na hoe een bezoeker door een website zou browsen en gevonden data zou opslaan. Als gebruiker van Octoparse kun je zogezegd bepaalde âpadenâ programmeren; je kan aangeven welke data Octoparse moet opslaan. Zo âprogrammeerâ je waar Octoparse naartoe moet navigeren, welke link moet worden opgeslagen, welke tekst op welke manier moet worden opgeslagen. Vervolgens ordent Octoparse die opgevraagde data in een Excel bestand.
Geen code nodig
Zoals eerder aangegeven, deze webscraper werkt visueel: je klikt als het ware een pad in elkaar op ongeveer dezelfde manier als wanneer je navigeert door een website. Dit gebruikersgemak heeft als voordeel dat ook minder ervaren gebruikers toch data kunnen 'scrapen' van websites.
Toepassing: wat is het nut van Octoparse?
Een dergelijk pad kan worden toegepast op een hele website, waardoor het mogelijk is om veel data op te halen in korte tijd en deze ook nog eens netjes te ordenen. Omdat je met Octoparse de data zo goed kan structureren, maakt het de vervolgstap stukken makkelijker: een import van (product)data voor de eigen site. Kortom: middels Octoparse kun je zeer snel veel data ophalen, deze ordenen en gebruiken naar eigen behoefte.
Meer weten?
Benieuwd naar wat Octoparse nog meer te bieden heeft? Bekijk de website van Octoparse of neem contact met ons op.