Använda Excel som ett Verktyg för att Kopiera Data från Webben

0
747

Web scraping är handlingen av att extrahera data, information eller bilder från en webbsida med hjälp av en automatiserad metod. Tänk på det som att kopiera och klistra in den på full automatisk.

Vi antingen skriva eller använda en app för att gå till de webbplatser som vi vill ha det och göra en kopia av den specifika saker som vi vill ha från dessa webbplatser. Det är mycket mer exakt än att ladda ner en hel webbplats.

Precis som alla verktyg, web skrapning kan användas för goda eller onda.
Några av de bättre skäl för att skrapa webbplatser skulle vara uppsatt i en
sökmotor baserad på dess innehåll, pris jämförelse shopping, eller övervakning
information till aktiemarknaden. Du kan även använda den som ett verktyg för forskning av olika slag.

Hur Kan jag Skrapa Webbplatser med Excel?

Tro det eller ej, Excel har haft förmågan att extrahera data
från hemsidor under en lång tid, åtminstone sedan Excel 2003. Det är bara det att web
skrapning är något som de flesta människor inte tycker om, än mindre tänka på att använda en
kalkylprogram för att göra jobbet. Men det är förvånansvärt lätt och kraftfull.
Låt oss lära dig hur det görs genom att göra en samling av Microsoft Office-tangentbord
genvägar.

Hitta de Platser Du Vill Skrapa

Det första vi ska göra är att hitta den särskilda webbsidor som vi vill få information. Låt oss gå till källan och söka på https://support.office.com/. Vi kommer att använda söktermen “används ofta genvägar”. Vi kan göra det mer specifikt genom att använda namnet på den specifika app, som Outlook, Excel, Word, och så vidare. Det kan vara en bra idé att bokmärka resultatsidan så att vi enkelt kan få tillbaka det.

Klicka på sökresultat, “för kortkommandon i Excel för
Windows”. En gång på sidan finns listan med Excel-versioner och klicka på Nyare Versioner. Vi arbetar nu med
den senaste och största.

Vi kunde gå tillbaka till våra sökresultat-sidan och öppna
resultat för alla andra Office-program i deras egna flikar och bokmärken dem. Det är
en bra idé, även för denna övning. Det är där de flesta människor skulle sluta i
insamling av Office-genvägar, men inte oss. Vi kommer att sätta dem i Excel så att vi
kan göra vad vi vill med dem, när vi vill.

Öppna Excel och Skrapa

Öppna Excel och börja en ny arbetsbok. Spara arbetsboken som Office-Genvägar. Om du har OneDrive,
spara det så att Autospara har
kommer att fungera.

När arbetsboken sparas, klicka på Data fliken.

I menyfliksområdet på fliken Data, klicka på Från Webb.

Den Från Webben guiden
i fönstret som öppnas. Det är där vi sätter den webbadress eller URL-adressen till webbplatsen
som vi vill skrapa data. Stäng din webbläsare och kopiera URL-adressen.

Klistra in URL-adressen i URL
området Från Web wizard. Vi kan välja att använda detta i Grundläggande eller Avancerat läge. Det Avancerade läget ger oss en hel del fler alternativ på hur
för att få tillgång till data från webbplatsen. För denna övning, vi behöver bara Grundläggande
läge. Klicka på OK.

Excel kommer nu att försöka ansluta till webbplatsen. Detta kan
ta några sekunder. Vi kommer att se ett framsteg fönstret, om det gör det.

De Navigator
i fönstret som öppnas, och vi kommer att se en lista över bord från webbplats till vänster.
När vi väljer ett, ska vi se en tabell som förhandsvisning på höger. Låt oss välja den används Ofta genvägar bordet.

Vi kan klicka på Web
Visa
fliken för att se den faktiska webbplats, om vi behöver titta runt bordet
vi vill ha. När vi hittar den, kan du klicka på det och det kommer att bli utvalda för
import.

Nu, vi klickar på Ladda
knappen, längst ned i det här fönstret. Det finns andra val vi kan välja,
som är mer komplexa och utanför ramen för vår första skrapa. Bara vara
medvetna om att de är det. Excel web scraping kapacitet är mycket kraftfull.

Webben tabellen kommer att läsas in i Excel efter några sekunder.
Vi får se data på den vänstra, där nummer 1 är på bilden nedan. Nummer 2 belyser Frågan
används för att få uppgifter från webbplatsen. När vi har flera frågor i ett arbete
boka, det är där vi väljer vi måste använda.

Observera att de data som kommer in den som en Excel-kalkylblad
tabellen. Det är redan satt upp för oss att kunna filtrera eller sortera data.

Vi kan upprepa denna process för alla andra webbsidor som
Office-genvägar som vi vill ha för Outlook, Word, Access, PowerPoint,
och alla andra Office-app.

Att hålla Skrapade Aktuella Data i Excel

Som en bonus för dig, vi kommer att lära sig att hålla våra
skrapade färska data i Excel. Detta är ett bra sätt att illustrera hur
kraftfull Excel är för data skrapning. Även med detta, vi bara gör de flesta
grundläggande skrapning som Excel kan göra.

För detta exempel, låt oss använda en stock information web-sida som https://www.cnbc.com/stocks/.

Gå igenom vad vi gjorde innan och kopiera och klistra in den nya adressen från adressfältet.

Du kommer att få Navigator-fönstret och se tabellerna tillgängliga. Låt oss välja den Stora AMERIKANSKA Aktieindex.

När data är skrapade vi får se följande
kalkylblad.

På höger ser vi en förfrågan för Stora AMERIKANSKA börsindex.
Väljer du denna så att det markeras. Se till att vi är i Tabell Verktyg fliken och i Design
– området. Klicka sedan på nedåtpilen under Uppdatera.
Klicka sedan på Egenskaper för Anslutning.

I Fråga
Egenskaper
fönstret, under Användning
fliken, kan vi kontrollera hur denna information uppdateras. Vi kan ange en viss tid
period för att uppdatera, eller att uppdatera när vi öppnar arbetsboken nästa gång, eller att
uppdatera i bakgrunden, eller någon kombination av dessa. När vi väljer vad vi
behöver, klicka på OK för att stänga
fönstret och fortsätt.

Det är det! Nu kan du följa börskurser, sportresultat, eller andra uppgifter som ändras ofta från ett Excel-kalkylblad. Om du är bra på Excel ekvationer och funktioner, du kan göra nästan vad du vill med data.

Kanske försök att identifiera trender lager, köra en fantasy sports pool på jobbet, eller kanske bara hålla koll på vädret. Vem vet? Din fantasi och de uppgifter som finns tillgängliga på Internet, är de enda gränser.