Back to Question Center
0

Semalt kreéiert op den URLitor - Very Cool Web Scraping & Data Extraction Tool

1 answers:

URLitor ass e neier awer effektiv Web-Schrauwen- a Datenextraktiounstoken. Fir d'URLitor benotzen ze kënnen, braucht Dir nëmmen eng Lëscht vun all de URLen den Inhalt vun deem Dir schrëftlech online an der Presentatioun schablounen ze addéieren. Dann musst Dir de HTML Element benotze fir datt Dir vun de Websäiten extrahéiert wëllt an klickt op de Submit Knäppchen. Et ass esou einfach wéi dat. Mat dësem Tool kënnt Dir eng Kopie oder Paste aus dem Browser net méi maachen.

xPath ass eng Sprooch déi benotzt gëtt fir no Informatiounen an XML-Dateien ze sichen. Et benotzt verschidde Ausdréck fir Node-Sets oder Knäppchen an XML-Dateien ze wielen. Déi Ausdréck, déi XPath verstéisst, sinn ganz ähnlech mat denen, déi mat normale Computerdateuren oder Dokumenter benotzt ginn.

Obwuel XPath mat verschiddene Programméierungssäiten benotzt gëtt, gouf dësen Tool fir Benotzer déi keng Programmiersekenntnisser hunn. Also, Dir musst net e Programmierer sinn, fir dat ze benotzen. Mat dësem Tool kënnt Dir Daten aus verschiddene HTML- an XML Säiten extrahieren.

Fir d'Einfachheet vun der Benotzung hunn verschidden XPath Ausdréck ze vordefinéiren an e Dropdown-Menü, fir datt d'Benotzer nëmme vun hinnen ofhänken. Awer erfleegent Benotzer vu XPath hunn d'Fräiheet hir benodeeleg Ausdréck ze benotzen wann se se wëllen..

D'Instruktioun gouf mat der Kapazitéit vun 100 URLs an enger eenzeger Skriftsitzung entworf an et brauch maximal 10 Ausdréck unzehuelen. An anere Wierder, et ka mat Daten vun maximal 100 URLs ze schréiken.

1. // div [2] - Déi meescht XPath Zousätzlech Äusserungen déi geännert oder ergänzt ginn, sinn direkt ënnendrënner beschriwwen: Dëse Ausdruck wählt d'zweet Div hierarchesch;

2. // Link [@ rel = 'canonical'] / @ href - Dëse Ausdruck wählt d'Positioun (ref) vum Tag, Den Rel Attribut ass gläich wéi kanonesch; - Dëse Ausdréck ass fir d'Auswiel vun Inhalter gebraucht; - Dir kënnt dësen Ausdrock benotzt fir all Element mat "Klass" ze wielen wéi CSS - Klass;

5. // h2 | // title - Dëse Expression däerf benotzt ginn fir den éischte H2 an den Säitentitel ze wielen; - Dëse Expressionell funktionn genau wéi dee virdrun.

6./ * [Numm] Allerdéngs ass den uewendriwwer Exposé besser, well et méi kuerz ass; - Dëse Ausdréck wielt all Element, deen CSS-Klass huet an och "Daumen" enthält. fir Extraktioun; - Dës Exemplar wählt den Elterendeel vun all Element, deen den Text 'Wëllkomm' ass

8.// parent * ';

Dëst Tool ass eng Beta-Versioun an konnt och nach e puer Fehler benotzen. Allerdéngs ass et nach ëmmer e super Tool fir d'Benotzer mat wéineg oder net programméiert Wëssen, wéi all déi oft gebräuchlech Ausdrécke scho virgesinn an e Menu wéi virdrun erwähnt ginn.

December 7, 2017
Semalt kreéiert op den URLitor - Very Cool Web Scraping & Data Extraction Tool
Reply