Dan v življenju podatkovnega znanstvenika

Karierni vodnik BrainStation Data Scientist vam lahko pomaga narediti prve korake do donosne kariere na področju podatkovne znanosti. V nadaljevanju preberite pregled, kako podatkovni znanstveniki preživijo dneve v službi.

Postanite podatkovni znanstvenik

Pogovorite se s svetovalcem za učenje, če želite izvedeti več o tem, kako vam lahko naši učni taborniki in tečaji pomagajo postati podatkovni znanstvenik.



S klikom na Pošlji sprejemate naše Pogoji .



Pošlji

Ni bilo mogoče oddati! Želite osvežiti stran in poskusiti znova?

Preberite več o našem učnem taboru Data Science

Hvala vam!

Kmalu se oglasimo.



Oglejte si stran Data Science Bootcamp

Dan v življenju podatkovnega znanstvenika

Od vseh disciplin, preučenih v raziskavi Brainstation Digital Skills Survey, znanost o podatkih lahko zajema najširši obseg aplikacij. Toda čeprav podatkovna znanost obstaja že desetletja, je šele pred kratkim zaživela v polnem razcvetu. Ko se je razpoložljivost podatkov povečala, so podjetja spoznala, kako pomembna je lahko znanost o podatkih, pravi Briana Brownell, ustanoviteljica in izvršna direktorica Pure Strategy ter 13 let podatkovna znanstvenica. Vsako podjetje se mora zdaj delno osredotočiti na tehnologijo. Samo ta teden je na primer McDonald's plačal približno 300 milijonov dolarjev za pridobitev lastnega podjetja za velike podatke.

Zato ni čudno, da je konkurenca za podatkovne znanstvenike neverjetno visoka. V samo dveh letih naj bi se povpraševanje povečalo za 28 odstotkov, kar ustreza približno 2,7 milijona novih delovnih mest. To je več prostih mest, kot jih bodo lahko zapolnili novi diplomanti, kar pomeni, da bodo morali tehnološki delavci na drugih področjih okrepiti svoje veščine in preiti v podatke, da bodo izpolnili to povpraševanje.

Dejansko naša raziskava kaže, da se to že dogaja. Približno štirje od petih podatkovnih strokovnjakov so svojo kariero začeli z nečim drugim, 65 odstotkov vseh podatkovnih znanstvenikov pa dela na tem področju pet let ali manj. Ta ogromen priliv novih umov ima dvorezen učinek, pravi Brownell; po eni strani prihaja veliko novih idej, pravi. Ko pogledam nekatere vsebine, ki prihajajo iz podatkovne skupnosti, sem presenečen, koliko je inovacij. Nasprotna stran pa je težnja po ponovnem izumljanju kolesa.



Veliko povpraševanje po podatkovnih znanstvenikih je veliko, če ste to (ali razmišljate, da bi to postali), vendar je za delodajalce lahko zaposlovanje zastrašujoč izziv. Tu je prekvalifikacija očitna rešitev; morda bi bilo stroškovno učinkoviteje prekvalificirati sedanjega zaposlenega v znanost o podatkih kot iskati novega.

Toda tudi če nameravate najeti novo ekipo za podatkovne znanosti, bo morda morala vaša organizacija kot celota osvežiti svojo podatkovno pismenost, opozarja Brownell. Vsakdo želi delati na nečem, kar vpliva na njihovo delovno mesto, kar ljudem izboljšuje življenje, pravi. Če kultura vašega podjetja ni taka, da bi lahko [vaši podatkovni znanstveniki] vplivali, je skoraj nemogoče najeti. Vodstvo mora biti sposobno ne le sporočati potencialnim zaposlenim, kako bodo lahko prispevali, temveč tudi razumeti predloge, ki jih na koncu predloži njihova skupina za podatkovne znanosti.

Na žalost, pravi Brownell, je neprijetna večina podjetij, ki stvari niso ugotovila. Naša raziskava to potrjuje: večina anketirancev (52 odstotkov) je stopnjo podatkovne pismenosti v svojih organizacijah opisala kot osnovno, vmesni je naslednji najpogostejši odgovor (31 odstotkov). To nakazuje, da bi lahko bilo nekaj temeljnega usposabljanja na področju podatkovnih znanosti koristno za veliko večino podjetij – zlasti pri vodenju.



Ta potreba po izboljšani podatkovni pismenosti – in komunikaciji – se povečuje zaradi načina strukture večine skupin za podatkovno znanost: kot diskretna ekipa, običajno z 10 osebami ali manj (glede na 71 odstotkov vprašanih) in pogosto petimi ali manj (38 odstotkov). ). Te tesno povezane ekipe si ne morejo privoščiti, da bi bile izolirane. Posamezniki, ki delajo v večjih podjetjih, so običajno v majhni skupini, specifični za znanost o podatkih, njihove stranke pa so interni – drugi deli organizacije, pojasnjuje Brownell, zato je to ekipa, ki mora delovati na številnih različnih področjih organizacije.

Kaj pravzaprav je znanost o podatkih?

Splošno zaznavanje (da podatkovni znanstveniki krčijo številke) ni preveč oddaljeno, pravi Brownell. Obstaja veliko naborov podatkov, za katere je treba razkriti vpoglede iz njih, in to vključuje veliko korakov, kot sta izgradnja modela in čiščenje podatkov ter celo samo odločitev, katere podatke potrebujete. Navsezadnje je to prizadevanje usmerjeno v cilj: v svojem bistvu morate nekaj narediti s podatki.

Glede tega podatki niso vedno številke. Medtem ko je večina anketirancev (73 odstotkov) navedla, da delajo s številčnimi podatki, jih je 61 odstotkov odgovorilo, da delajo tudi z besedilom, 44 odstotkov s strukturiranimi podatki, 13 odstotkov s slikami in 12 odstotkov z grafiko (manjše pa delajo celo z video in zvokom). —6 odstotkov oziroma 4 odstotke). Ti rezultati raziskave namigujejo na načine, kako se znanost o podatkih širi daleč preko finančnih tabel in pritegne ljudi za takšne projekte, kot je povečanje zadovoljstva strank ali pridobivanje dragocenih vpogledov iz gasilske cevi družbenih medijev.

Posledično je na področju podatkovne znanosti ogromna raznolikost, pravi Brownell. Vsaka industrija ima svoj pogled na vrste podatkov, s katerimi delajo podatkovni znanstveniki, vrste rezultatov, ki jih pričakujejo, in kako se to ujema z vodstveno strukturo njihovega podjetja. V vsakem primeru pa je cilj izkoristiti podatke za pomoč podjetju pri sprejemanju boljših odločitev. To bi lahko bilo izboljšanje izdelkov, razumevanje trga, na katerega želijo iti, obdržati več strank, razumevanje njihove uporabe delovne sile, razumevanje, kako narediti dobre zaposlitve – vse vrste različnih stvari.

Podatkovna delovna mesta

Na nekaterih področjih tehnologije je lahko postati generalist vaša najboljša noga na vratih - pri podatkovni znanosti ni tako. Delodajalci običajno iščejo veščine, specializirane za njihovo panogo. Ker je znanost o podatkih na voljo v toliko različnih okusih, je naša raziskava raziskala globlje in preučila pet glavnih kategorij delovnih mest: podatkovni analitik, raziskovalec, poslovni analitik, vodja podatkov in analitike ter sam podatkovni znanstvenik.

Med vsemi temi delovnimi mesti prepiranje in čiščenje podatkov vzameta večino časa – toda s čim? Najpogosteje je cilj optimizirati obstoječo platformo, izdelek ali sistem (45 odstotkov) ali razviti nove (42 odstotkov). Če kopamo globlje, smo ugotovili, da optimizacija obstoječih rešitev običajno pripade poslovnim analitikom in analitikom podatkov, medtem ko razvoj novih rešitev pogosteje pade na račun podatkovnih znanstvenikov in raziskovalcev.

Tehnike, ki jih uporabljajo Data Scientists, se razlikujejo tudi glede na specializacije. Linearna regresija je bila običajno orodje v vseh kategorijah, ki ga je navedlo 54 odstotkov vprašanih, vendar je bilo nekaj presenečenj, ko smo pogledali programsko opremo, ki jo ljudje uporabljajo.

Excel – ta delovni konj za manipulacijo z nizi podatkov – je skoraj povsod prisoten, navaja ga 81 odstotkov vseh anketirancev in je najbolj priljubljeno orodje v vseh kategorijah, razen podatkovnih znanstvenikov (ki se najpogosteje zanašajo na Python – in je navedel tudi večjo zbirko orodij kot druge kategorije ). Zakaj je Excel tako neizogiben, tudi v letu 2019?

Pri Excelu mi je všeč, kako vam omogoča, da vidite podatke in dobite intuitiven občutek zanje, je pojasnil Brownell. Uporabljamo tudi veliko Pythona in v tem primeru, ko izvajate analitiko podatkovne datoteke, je ta skrita; razen če izrecno programirate del svoje kode za vizualizacijo neobdelanih podatkov, ki jih analizirate, ga ne vidite. Medtem ko je z Excelom tik pred vami. To ima veliko prednosti. Včasih lahko opazite težave s podatkovno datoteko. Ne vidim, da bi Excel nikoli izginil iz analize.

Kljub temu obstaja še dolg seznam drugih programov, ki se uporabljajo na tem področju, kar ni presenetljivo glede na njihovo raznolikost. SQL (43 odstotkov) in Python (26 odstotkov) vodita po priljubljenosti, pri čemer Tableau (23 odstotkov), R (16 odstotkov), Jupyter Notebooks (14 odstotkov) in peščica drugih dosegajo znatne številke – da ne omenjamo ogromnega števila 32 odstotkov vprašanih, ki so navedli druga orodja, tudi glede na ta že tako dolg seznam.

Kakšna je prihodnost podatkovne znanosti?

Na koncu smo vprašali, kateri trendi bodo oblikovali digitalno pokrajino v naslednjih petih do desetih letih. Strojno učenje in umetna inteligenca – ki imata obe aplikaciji v podatkovni znanosti – sta bila v veliki večini razvoj, ki ga anketiranci pričakujejo, in sicer 80 odstotkov oziroma 79 odstotkov. To kljub dejstvu, da jih trenutno manj kot četrtina (23 odstotkov) dela z umetno inteligenco.

Umetna inteligenca lahko popolnoma spremeni znanost o podatkih, potrjuje Brownell, čigar podjetje razvija izdelke AI. To je res slava nenadzorovanih učnih metod. Imamo le toliko časa za ogled teh podatkovnih nizov, še posebej pri velikih je zelo težko narediti vse. Orodja AI lahko pomagajo razkriti nekaj, česar morda ne bi pomislili, da bi iskali. To se nam je zagotovo zgodilo.

Drugi trendi Podatkovni znanstveniki pričakujejo, da bodo v bližnji prihodnosti prevladovali: internet stvari (51 odstotkov), blockchain (50 odstotkov) in e-trgovina (36 odstotkov), razširjena resničnost in navidezna resničnost (38 odstotkov in 27 odstotkov) in celo glasovno- na podlagi izkušenj (25 odstotkov) – vsi pomembni rezultati in vsa področja, kjer je znanost o podatkih mogoče dobro uporabiti.

Kategori: Novice