banner

Blog

Dec 09, 2023

La potenza di SQL per i futuri data scientist

Storia riservata ai membri

Meagan Voulo

Seguire

Investitore guidato dai dati

--

Condividere

La mia transizione nel mondo della scienza dei dati non è stata tradizionale. Ho frequentato la scuola di psicologia, ho iniziato a lavorare nel marketing, ho scritto un po' di scrittura e alla fine mi sono iscritto a un BootCamp di scienza dei dati quando avevo 27 anni. Detto questo, ho considerato il mio BootCamp di data science allo Springboard come un lavoro a tempo pieno.

Ho trascorso almeno 40 ore a settimana a completare i miei corsi e a fare ricerche aggiuntive per conto mio per comprendere meglio i concetti. Ma, anche dopo essermi laureato in quel programma, non mi sentivo del tutto preparato per ottenere un lavoro come scienziato dei dati. Invece, ho cercato ruoli di analista di dati e analista di marketing. Dopo aver ottenuto il mio primo ruolo di analista di dati, ho appreso che, sebbene fossi abbastanza competente con Python, analisi esplorativa dei dati e modellazione, non avevo una conoscenza approfondita dell'interrogazione dei dati.

Per risolvere questa carenza, ho cercato risorse per esercitarmi in SQL. Guardando indietro, questa è probabilmente la cosa migliore che avrei potuto fare dopo aver completato il mio boot camp di scienza dei dati ad alta intensità di Python. Per coloro che stanno cercando di mettere piede come data scientist, ho scoperto che c'è un'ottima ragione per imparare SQL: con esso sei indispensabile...

Potresti pensare che sto esagerando, ma è la verità. Nel mercato del lavoro di oggi, nulla è sicuro. I licenziamenti tecnologici stanno accadendo a destra e a manca senza capo né motivo. Essendo una persona che si preoccupa per questo genere di cose, mi sono dato un obiettivo verso cui lavorare e che ho deciso sarebbe stato il mio biglietto per la sicurezza del lavoro... essere il miglior analista di scienza dei dati della mia azienda.

Per fare ciò, ho deciso che dovevo non solo conoscere Python ma anche diventare esperto in SQL. Ecco il mio ragionamento:

Se riesco a estrarre i miei dati, non ho bisogno di affidarmi a un analista o a un ingegnere per ottenere le informazioni di cui ho bisogno per i miei modelli di apprendimento corrispondenti.

Più comunemente, le persone conoscono la regola 80/20 della scienza dei dati, secondo la quale l'80% della scienza dei dati sta preparando i dati e il 20% li sta effettivamente analizzando e riportando. Naturalmente, parte della pulizia dei dati può essere eseguita utilizzando Python, ma avendo una solida conoscenza di SQL, mi sono assicurato di poter gestire i dati, verificare incoerenze ed errori e ripulirli prima di inserirli nel mio notebook.

CONDIVIDERE