Utilizzare Excel come Strumento per Copiare i Dati dal Web

0
325

Web scraping è l’atto di estrarre i dati, le informazioni o le immagini da un sito web utilizzando un metodo automatizzato. Pensate a come copiare e incollare completamente in automatico.

Noi di scrittura o utilizzare un’applicazione per accedere ai siti web che si desidera e fare una copia delle cose specifiche che si desidera da tali siti web. È molto più preciso di quello di scaricare un intero sito web.

Come per ogni strumento, web scraping può essere usato bene o male.
Alcuni dei migliori motivi per raschiare siti web di classifica in un
motore di ricerca basato sul suo contenuto, il prezzo di shopping di confronto, o di monitoraggio
informazioni sul mercato azionario. Si potrebbe anche usarlo come uno strumento di ricerca di sorta.

Come posso Raschiare Siti web con Excel?

Ci crediate o no, Excel ha avuto la capacità di estrarre i dati
da siti web per un lungo periodo di tempo, almeno da Excel 2003. E ‘ solo che web
raschiatura è qualcosa che la maggior parte della gente non pensa, figuriamoci pensare di utilizzare un
programma di foglio di calcolo per fare il lavoro. Ma è sorprendentemente facile e potente.
Impariamo come si è fatto fare una raccolta di Microsoft Office tastiera
di scelta rapida.

Trovare i Siti che Si Vuole Raschiare

La prima cosa che andremo a fare è trovare le specifiche pagine web da cui si desidera ottenere informazioni. Andiamo alla fonte e di ricerca a https://support.office.com/. Stiamo andando a utilizzare il termine di ricerca “spesso utilizzato scorciatoie”. Siamo in grado di renderlo più specifico utilizzando il nome dell’app specifica, come Outlook, Excel, Word e così via. Potrebbe essere una buona idea di aggiungere un segnalibro alla pagina dei risultati in modo da poter facilmente tornare là.

Fare clic sul risultato della ricerca, “le scorciatoie da Tastiera in Excel per
Windows”. Una volta nella pagina, trovare la lista di tutte le versioni di Excel e fare clic su Versioni più Recenti. Ora stiamo lavorando con
l’ultima e più grande.

Potremmo tornare alla nostra pagina dei risultati di ricerca e aprire il
risultati per tutte le altre applicazioni di Office, nel loro schede e segnalibri. È
una buona idea, anche per questo esercizio. Questo è dove la maggior parte delle persone si sarebbe fermata in
raccolta di collegamenti di Office, ma non noi. Stiamo andando a mettere in Excel così abbiamo
possono fare quello che vogliono con loro, ogni volta che vogliamo.

Aprire Excel e Raschiare

Aprire Excel e di iniziare una nuova cartella di lavoro. Salvare la cartella di lavoro come Collegamenti di Office. Se si dispone di OneDrive,
salvare c’è quindi il salvataggio automatico funzione
sarà il lavoro.

Una volta che la cartella di lavoro viene salvata, fare clic su Dati di tab.

Nel nastro della scheda Dati fare clic su Web.

Il Web guidata
si aprirà la finestra. Questo è dove abbiamo messo l’indirizzo web o l’URL del sito
da cui si desidera recuperare dati. Aprite il vostro browser web e copiare l’URL.

Incollare l’URL nella URL
campo del Web guidata. Si potrebbe scegliere di utilizzare questo in Basic o Advanced mode. La modalità Avanzata offre molte opzioni in più su come
per accedere ai dati dal sito web. Per questo esercizio, abbiamo solo bisogno di Base
la modalità. Fare clic su OK.

Excel tenterà di connettersi al sito web. Questo può
prendete un paio di secondi. Vedremo una finestra di avanzamento, se lo fa.

Il Navigatore
si apre la finestra, e vedremo un elenco di tabelle dal sito web, sulla sinistra.
Quando si seleziona uno, vedremo una tabella di anteprima sulla destra. Selezioniamo il Frequentemente utilizzato scorciatoie tabella.

Siamo in grado di fare clic sul Web
Vista
la scheda per vedere il sito web attuale, se abbiamo bisogno di cercare in giro per il tavolo
noi vogliamo. Quando l’abbiamo trovato, siamo in grado di fare clic su di esso e verrà selezionato per
di importazione.

Ora, facciamo clic sul Carico
il pulsante in fondo a questa finestra. Ci sono altre opzioni che si potrebbero scegliere,
che sono più complessi e oltre lo scopo di fare il nostro primo raschiare. Basta essere
consapevoli che ci sono. Excel web scraping funzionalità sono molto potenti.

La tabella di web verrà caricato in Excel dopo pochi secondi.
Staremo a vedere i dati sulla sinistra, dove il numero 1 è nella foto qui sotto. Numero 2 mette in evidenza la Query
utilizzato per ottenere i dati dal sito web. Quando abbiamo più query in un lavoro
libro, questo è dove siamo selezionare quello di cui abbiamo bisogno utilizzare.

Si noti che i dati nel foglio di calcolo come Excel
tabella. Già, per noi, per essere in grado di filtrare e ordinare i dati.

Possiamo ripetere questa procedura per tutte le altre pagine web che
sono i collegamenti di Office che si desidera per Outlook, Word, Access, PowerPoint,
e qualsiasi altra applicazione di Office.

Talmente semplice mantenere aggiornati i Dati Raschiate Corrente in Excel

Come bonus, si sta andando a imparare a mantenere il nostro
raschiato dati in Excel. Questo è un ottimo modo per illustrare semplicemente come
potente Excel per i dati di raschiatura. Anche con questo, stiamo solo facendo il la maggior parte
di base raschiando che Excel può fare.

Per questo esempio, si usa un archivio di informazioni pagina web, come https://www.cnbc.com/stocks/.

Passare quello che abbiamo fatto prima e copiare e incollare l’URL dalla barra degli indirizzi.

Viene visualizzata la finestra del Navigatore e vedere le tabelle disponibili. Andiamo a selezionare i Principali Indici Azionari degli stati UNITI.

Una volta che i dati è raschiato, vedremo il seguito
foglio di calcolo.

Sulla destra, vediamo la query per i Principali Indici Azionari STATUNITENSI.
Selezionare in modo che sia evidenziato. Assicurarsi che siamo in Strumenti Tabella scheda e nel Design
zona. Quindi fare clic sulla freccia in giù sotto di Aggiornamento.
Quindi fare clic su Proprietà della Connessione.

Nella Query
Le proprietà
della finestra di Utilizzo
scheda, possiamo controllare il modo in cui questa informazione viene aggiornata. Si può impostare un tempo specifico
periodo di aggiornamento, o di aggiornamento quando si apre la cartella di lavoro, la prossima volta, o per
aggiornamento in background, o qualsiasi combinazione di questi. Una volta che abbiamo scelto quello che ci
necessario, fare clic su OK per chiudere la
finestra e continuare.

Ecco!!! Ora è possibile monitorare i prezzi delle azioni, i risultati sportivi, o di altri eventuali dati che spesso cambia da un foglio di calcolo di Excel. Se sei bravo con Excel equazioni e funzioni, si può fare quasi tutto quello che vuoi con i dati.

Magari prova a identificare l’andamento degli stock, eseguire una fantasia sport piscina al lavoro, o forse solo a tenere traccia del tempo. Chi lo sa? La vostra immaginazione e i dati disponibili su Internet, sono i soli limiti.