Bruke Excel som et Verktøy for å Kopiere Data fra Internett

0
665

Web scraping er lov å trekke ut data, informasjon eller bilder fra en nettside ved hjelp av en automatisert metode. Tenk på det som å kopiere og lime inn på full automatisk.

Vi enten skriver eller bruker en app for å gå til nettsteder som vi vil ha det til og lage en kopi av den konkrete ting vi ønsker fra disse nettstedene. Det er mye mer presis enn å laste ned et helt nettsted.

Som med alle verktøy, web skraping kan brukes til det gode eller det onde.
Noen av de bedre grunner for å skrape nettsteder ville være rangerte det i en
søkemotor basert på dens innhold, pris sammenligningen shopping, eller overvåking
aksjemarkedet informasjon. Du kan til og med bruke det som et forskningsverktøy slags.

Hvordan Kan jeg Skrape Nettsteder med Excel?

Tro det eller ikke, Excel har hatt muligheten til å trekke ut data
fra nettsteder for en lang tid, minst siden Excel 2003. Det er bare det at web
skraping er noe de fleste ikke tenker på, la alene for å tenke på å bruke en
regnearkprogram til å gjøre jobben. Men det er overraskende lett og kraftig.
La oss lære hvordan det er gjøres ved å lage en samling av Microsoft Office-tastatur
snarveier.

Finne Nettsteder Du Ønsker å Skrape

Det første vi skal gjøre er å finne den spesifikke web-sider som vi ønsker å få informasjon. La oss gå til kilden og søk på https://support.office.com/. Vi kommer til å bruke søkeordet “brukes ofte snarveier”. Vi kan gjøre det mer spesifikt ved å bruke navnet på appen, som for eksempel Outlook, Excel, Word, og så videre. Det kan være en god idé å bokmerke resultater-siden slik at vi enkelt kan komme tilbake dit.

Klikk på et søkeresultat, “hurtigtaster i Excel for
Windows”. En gang på denne siden, finner du liste i Excel-versjoner, og klikk på Nyere Versjoner. Nå jobber vi med
de nyeste og beste.

Vi kunne gå tilbake til søkeresultatene våre og åpne
resultatene for alle de andre Office-programmer i egne faner og bokmerke dem. Det er
en god idé, selv for denne øvelsen. Det er der de fleste folk ville slutte i
samle Office snarveier, men ikke oss. Vi kommer til å sette dem i Excel, slik at vi
kan gjøre hva vi vil med dem, når vi vil.

Åpne Excel og Skrap

Åpne Excel og starte en ny arbeidsbok. Lagre arbeidsboken som Office-Snarveier. Hvis du har OneDrive,
lagre det der så Autolagrede funksjon
vil fungere.

Når arbeidsboken er lagret, klikk på Data – fanen.

I båndet i kategorien Data, klikker du på Fra Internett.

Den Fra Web – veiviseren
vindu vil åpne seg. Dette er hvor vi skal sette inn web-adressen eller URL-adressen til webområdet
fra der vi ønsker å skrape data. Bytt til nettleseren din og kopier URL-adressen.

Lim inn URL-adressen i URL
feltet av Fra Web-veiviseren. Vi kunne velge å bruke dette i Grunnleggende eller Avansert modus. Avansert modus gir oss mange flere muligheter på hvordan
for å få tilgang til data fra nettstedet. For denne øvelsen, vi trenger bare Grunnleggende
modus. Klikk på OK.

Excel vil nå forsøke å koble til webområdet. Dette kan
ta et par sekunder. Vi vil se en pågående samtale-vinduet, hvis det gjør det.

Den Navigator
vindu vil åpne seg, og vi vil se en liste over tabeller fra nettsider på venstre side.
Når vi velger en, vil vi se en tabell for forhåndsvisning på høyre side. La oss velge den Ofte brukte snarveier bordet.

Vi kan klikke på Nettet
Vis
– fanen for å se den aktuelle nettsiden, hvis vi trenger å se deg rundt bordet
vi ønsker. Når vi finner det, kan vi klikke på det, og det vil bli valgt for
import.

Nå, vi klikker på Legg
nederst i dette vinduet. Det finnes andre alternativer vi kunne velge,
som er mer komplekse og utenfor omfanget av å gjøre vår første skrape. Bare være
er klar over at de er der. Excel web scraping evner er svært kraftig.

Web tabell vil bli lagt inn i Excel, og etter et par sekunder.
Vi vil se data på venstre side, der nummer 1 er i bildet nedenfor. Nummer 2 høydepunktene i Query
brukes for å få data fra nettstedet. Når vi har flere spørringer i et arbeid
bestill, dette er hvor vi velger du den vi trenger å bruke.

Legg merke til at data kommer inn i et regneark som Excel
tabellen. Det er allerede satt opp for oss å være i stand til å filtrere eller sortere data.

Vi kan gjenta denne prosessen for alle andre nettsider som ikke
har Office-snarveier som vi ønsker for Outlook, Word, Access, PowerPoint,
og alle andre Office-app.

Å holde Skrapet Gjeldende Data i Excel

Som en bonus for deg, vi kommer til å lære å holde våre
innsamlet data frisk i Excel. Dette er en flott måte å illustrere akkurat hvor
kraftig Excel for data skraping. Selv med dette, vi bare gjør den mest
grunnleggende skraping at Excel kan gjøre.

For eksempel, la oss bruke en aksje informasjon web-side som https://www.cnbc.com/stocks/.

Gå gjennom hva vi gjorde før, og kopier og lim inn den nye URL-adressen fra adressefeltet.

Du vil få Navigator-vinduet og se ledige bord. La oss velger du de Store AMERIKANSKE Aksjeindekser.

Når dataene er innsamlet vi vil se følgende
regneark.

På høyre side ser vi spørringen for Store AMERIKANSKE aksjeindekser.
Velger du at det er merket. Sørg for at vi er i Tabellen Verktøy – fanen, og i Design
området. Deretter klikker du på pilen under Oppdater.
Klikk på Tilkoblingen Egenskaper.

I Søket
Egenskaper
– vinduet, under Bruk
– fanen, og vi kan kontrollere hvor denne informasjonen oppdateres. Vi kan sette en bestemt tid
periode for å oppdatere, eller for å oppdatere når vi åpner arbeidsboken neste gang, eller til å
oppdater i bakgrunnen, eller en kombinasjon av disse. Når vi velger hva vi
trenger, klikker du på OK for å lukke
vinduet og fortsett.

Det er det! Nå kan du spore aksjekurser, sportsresultater, eller andre data som endres ofte fra et Excel-regneark. Hvis du er god med Excel-formler og funksjoner, kan du gjøre nesten hva du vil med dataene.

Kanskje prøve å identifisere lager trender, kjøre en fantasy sports-pool på jobben, eller kanskje bare holde rede på været. Hvem vet? Din fantasi og hvilke data som er tilgjengelige på Internett, er det kun grensene.