Semalt: Uża Estensjoni tal-barraxa għall-Estrazzjoni tad-Dejta Online

L-Internet sar sors ewlieni ta 'informazzjoni għat-tipi kollha ta' negozji. Jekk trid tikseb dejta minn websajt u ttella 'fid-dokumenti tal-Google tiegħek jew fil-worksheet CSV jew Excel, allura l-brix huwa r-risposta. Hemm ħafna software ta 'brix fuq ix-xibka, iżda huma għaljin u mhumiex ideali għal utent ordinarju li m'għandux ħiliet tekniċi. Madankollu, għadu possibbli li tuża s-servizz mingħajr spejjeż billi tuża l-brawżer tas-soltu tiegħek. Google Chrome għandu bosta estensjonijiet tal-browser aċċessibbli fil-Google Web Store.

Barraxa tal-web

Scraper Web hija estensjoni Chrome li tippermetti lill-utenti biex jinbarax id-dejta mill-paġni tal-web u jtellgħuhom fl-Ispreadsheets Excel jew fid-databases tiegħek għall-irkupru futur. Ladarba d-dejta tkun estratta, tista 'tesportaha bħala CSV jew taħżenha fi CouchDB. Scraper Web jippermettilek li tinbarax tipi differenti ta 'dejta minn paġni multipli fl-istess ħin. Jippermetti brix ta 'stampi, test, u anke tabelli. Scraper jippermetti l-estrazzjoni tad-dejta minn kull tip ta 'websajt anke mis-siti żviluppati bl-aħħar teknoloġija bħal AJAX u JavaScript.

DataMiner

Din l-għażla hija browser waħedha fuq Chrome użat biex jiġi estratt dejta mill-Internet. Id-dejta miksuba tista 'aktar tard tiġi esportata għal worksheets Excel jew imtella' fuq il-Folji tal-Google. Huwa utli għal brix ta 'emails, riżultati ta' tfittxija onlajn Google, u tabelli HTML fost oħrajn. Huwa wkoll ideali għal selezzjonarji XPath.

Barraxa tal-iskrin

Dan il-barraxa hija estensjoni tal-browser Chrome għall-brix tal-iskrin. Il-proċess huwa proċess awtomatiku għall-estrazzjoni tad-dejta mill-internet. Id-dejta estratt tista 'mbagħad titniżżel bħala fajl JSON jew CSV. Huwa jappoġġa kemm il-metodi tas-selettur tal-Element u XPath.

iMacro

Din l-għażla hija makro-rekorder fuq il-browser Chrome, li żżomm rekord tal-attivitajiet tal-utent. Jintuża għall-awtomazzjoni tal-web, ittestjar tal-web, u estrazzjoni tad-dejta. iMacro jista 'jwettaq varjetà ta' kompiti onlajn bħalma huma tniżżil ta 'fajls, mili ta' formoli online u memorizzazzjoni ta 'passwords. Meta tuża l-iMacro, l-utenti biss għandhom bżonn jirreġistraw il-funzjoni l-ewwel darba u jiffrankawha fuq il-kompjuter. Jekk ikollok bżonn twettaq dak il-kompitu mill-ġdid, ma jkollokx għalfejn tirrepeti l-proċess. iMacro huwa disponibbli għal browsers oħra bħal Firefox, Internet Explorer u Chrome.

Meta tuża l-estensjoni tal-barraxa, trid tfassal pjan biex tinnaviga l-websajts u tidentifika d-dejta li trid estratt. L-estensjoni tgħaddi mis-sit magħżul skont il-pjan tal-utent u tikseb id-dejta rilevanti kollha. L-għodda jiffranka l-ħin li tkun qed taħli meta tiffranka d-data manwalment. Jekk id-dejta li għandek bżonn tinsab f'diversi websajts, jista 'jkollok l-informazzjoni estratta minn dawn kollha, u dan jagħmel din l-għodda aktar qawwija.

L-estensjoni tal-barraxa tagħmel l-estrazzjoni tad-dejta fuq l-Internet faċli. L-utenti tal-Internet jistgħu jevitaw li jwettqu kompiti ripetittivi tal-web billi jirreġistrawhom fuq l-estensjonijiet u jirreferuhom kull meta jsiru meħtieġa. L-estensjoni tal-barraxa twettaq funzjonijiet ta 'rutina bħall-mili ta' formoli onlajn u ftakar tal-passwords.

mass gmail