Kennsla á Chrome vefsköfu frá Semalt Expert

Ef þú notar Google Chrome er til viðbótar fyrir vafrann þinn sem getur hjálpað til við að skafa vefsíður. Það er þekkt sem '' Skafari, '' og það er hægt að nota það án vandræða. Skrapari mun hjálpa til við að skafa innihald vefsíðna og hlaða niðurstöðunum í skjöl Google.

Hvernig á að skafa vefsíðu með Scraper viðbót?

1. Veldu Chrome Web Store í Google Chrome;

2. Í framlengingum, leitaðu að '' Skafari '';

3. Fyrsta leitarniðurstaðan er viðbótin þekktur sem '' Skafari '';

4. Veldu hnappinn sem er skráður sem '' Bæta við Chrome ';

5. Komdu aftur í skráningu þingmanna Breta;

6. Smelltu á eftirfarandi tengil ;

7. Leitaðu nú að einum þingmanni og tryggðu að færslan sé merkt;

8. Hægrismellt er á til að velja „Skaf svipað ...“ valkostinn;

9. Hugga fyrir sköfu mun birtast í öðrum glugga;

10. Skoðaðu skafa innihaldið í skaftappanum;

11. Til að tryggja að efnið sé vistað sem Google töflureikni, veldu „Vista í Google skjölum…“

Útbreidd skrap

Áður en þú heldur fast við þessa uppskrift er gagnlegt að skilja grunnatriði HTML. Til dæmis er hægt að lesa stutta kynningu á HTML í gegnum þennan hlekk

Við skulum ímynda okkur að við höfum áhuga á öllum kvikmyndum sem léku Asia Argento, fræga ítalska leikkonu.

1. Það er til mjög ítarleg skjalasafn um leikara í IMDB. Argentínasíða Asíu er: http://www.imdb.com/name/nm0000782/;

2. Hér getur þú skoðað öll hlutverk leikkonunnar. Við skulum byrja að skafa upplýsingarnar sem við höfum áhuga á;

3. Reyndu að skafa það eins og lýst var hér að ofan;

4. Þú munt sjá að listinn er svolítið brenglast. Þetta er vegna þess að listinn hér getur verið uppbyggður á annan hátt;

5. Farðu að skafta stjórnborðinu. Efst til vinstri sérðu litla reitinn sem segir XPath;

6. Xpath er eins konar fyrirspurnartungumál sem virkar fyrir XML og HTML;

7. XPath getur hjálpað til við að finna þá hluta síðunnar sem þú hefur áhuga á. Næsta hlutur er að finna viðeigandi frumefni og skrifa XPath fyrir það;

8. Nú skulum við raða borði okkar;

9. Þú munt sjá að núverandi XPath okkar, sem hefur öll gögn sem þarf, er "// div [3] / div [3] / div [2] / div";

10. XPath upplýsir kerfið um að skoða HTML skjalið og velja þriðja þáttinn, síðan annan þáttinn og síðan alla þá;

11. En við viljum láta aðskilja gögnin okkar;

12. Notaðu dálkahlutann í vélinni til að skafa til að gera þetta;

13. Við skulum fyrst finna titilinn okkar Notaðu Skoðaðu þáttinn til að skoða titilinn;

14. Athugaðu titilinn innan merkis. Bættu merkinu við XPath;

15. Tjáningin virðist virka á viðeigandi hátt, svo gerðu það að fyrsta dálki okkar;

16. Í stað hlutans „Dálkar“ skal skipta um fyrsta dálkinn fyrir „titil“;

17. Bættu XPath við það;

18. Í dálkahlutanum eru XPaths afstæður og það þýðir að "./b" mun velja <b> frumefnið

19. Bætið við „./b“ í XPath fyrir titildálkinn og veldu „skafa“;

20. Nú skulum halda áfram í eitt ár. Hægt er að finna ár innan eins span;

21. Búðu til nýjan dálk með því að velja litla plús við hliðina á dálkinum fyrir titilinn þinn;

22. Notkun XPath "./span" búðu til dálk fyrir "ár";

23. Smelltu á skafa og skoðaðu hvernig árinu var bætt við;

24. Lokið!