Podatkovni znanstvenik
Karierni vodnik BrainStation Data Scientist vam lahko pomaga narediti prve korake do donosne kariere na področju podatkovne znanosti. Nadaljujte s pregledom področja podatkovne znanosti in delovne vloge Data Scientist.
Postanite podatkovni znanstvenik
Pogovorite se s svetovalcem za učenje, če želite izvedeti več o tem, kako vam lahko naši učni taborniki in tečaji pomagajo postati podatkovni znanstvenik.
S klikom na Pošlji sprejemate naše Pogoji .
Pošlji
Ni bilo mogoče oddati! Želite osvežiti stran in poskusiti znova?
Preberite več o našem učnem taboru Data ScienceHvala vam!
Kmalu se oglasimo.
Oglejte si stran Data Science Bootcamp
Kaj je podatkovni znanstvenik?
Podatkovni znanstveniki zbirajo, organizirajo in analizirajo velike nabore velikih podatkov – strukturiranih in nestrukturiranih podatkov – za ustvarjanje uporabnih poslovnih rešitev in načrtov za podjetja in druge organizacije. Podatkovni znanstveniki, ki združujejo smisel za matematiko, računalništvo in poslovanje, morajo imeti tako tehnične veščine za obdelavo in analizo velikih podatkov kot poslovno žilico za odkrivanje uporabnih vpogledov, skritih v teh podatkih.
Podatkovna znanost proti rudarjenju podatkov
Obstaja nekaj razlik med podatkovno znanostjo in podatkovnim rudarjenjem. Poglejmo si podrobneje:
Podatkovna znanost
- Je široko področje, ki običajno vključuje strojno učenje, umetno inteligenco, napovedno vzročno analitiko in predpisujočo analitiko
- Ukvarja se z vsemi vrstami podatkov, vključno s strukturiranimi in nestrukturiranimi podatki
- Cilj je izdelati izdelke, osredotočene na podatke, in sprejemati odločitve na podlagi podatkov
- Osredotoča se na znanstveno preučevanje podatkov in vzorcev
Podatkovno rudarjenje
- Je podmnožica podatkovne znanosti, ki vključuje čiščenje podatkov, statistično analizo in prepoznavanje vzorcev ter včasih vključuje vizualizacijo podatkov, strojno učenje in preoblikovanje podatkov
- Ukvarja se predvsem s strukturiranimi podatki, ne z nestrukturiranimi podatki
- Cilj je vzeti podatke iz različnih virov in jih narediti uporabne
- Osredotoča se na poslovne prakse
Kaj počne podatkovni znanstvenik?
Podatkovni znanstvenik analizira velike nabore podatkov, da bi odkril vzorce in trende, ki vodijo do uporabnih poslovnih vpogledov in pomagajo organizacijam pri reševanju zapletenih težav ali prepoznavanju priložnosti za prihodke in rast. Podatkovni znanstvenik lahko deluje na skoraj vseh področjih in mora biti spreten pri ravnanju s strukturiranimi in nestrukturiranimi nizi podatkov. To je multidisciplinarno delo in če želite postati podatkovni znanstvenik, morate imeti razumevanje matematike, računalništva, poslovanja in komunikacije, da boste lahko učinkovito opravljali svoje delo.
Čeprav se posebne delovne dolžnosti in odgovornosti podatkovnega znanstvenika močno razlikujejo glede na panogo, položaj in organizacijo, bo večina vlog Data Scientist vključevala naslednja področja odgovornosti:
Raziskave
Podatkovni znanstvenik mora razumeti priložnosti in boleče točke, značilne za industrijo in posamezno podjetje.
Priprava podatkov
Preden je mogoče najti kakršne koli dragocene vpoglede, mora podatkovni znanstvenik opredeliti, kateri nabori podatkov so uporabni in ustrezni, preden zbere, ekstrahira, očisti in uporabi strukturirane in nestrukturirane podatke iz različnih virov.
Izdelava modelov in algoritmov
Z uporabo načel strojnega učenja in umetne inteligence mora biti podatkovni znanstvenik sposoben ustvariti in uporabiti algoritme, potrebne za izvajanje orodij za avtomatizacijo.
Analiza podatkov
Za podatkovnega znanstvenika je pomembno, da zna hitro analizirati svoje podatke, da prepozna vzorce, trende in priložnosti.
Vizualizacija in komunikacija
Podatkovni znanstvenik mora biti sposoben povedati zgodbe, odkrite s pomočjo podatkov, z ustvarjanjem in organiziranjem estetsko privlačnih nadzornih plošč in vizualizacij, hkrati pa mora imeti komunikacijske veščine, da prepriča zainteresirane strani in druge člane ekipe, da je vredno ukrepati na podlagi ugotovitev v podatkih.
Najnovejša raziskava o digitalnih spretnostih BrainStationa je pokazala, da strokovnjaki za podatke večino časa porabijo za prepiranje in čiščenje podatkov. Anketiranci so tudi ugotovili, da je cilj njihovega dela največkrat optimizacija obstoječe platforme, izdelka ali sistema (45 odstotkov) ali razvoj novih (42 odstotkov).
Vrste podatkovne znanosti
Širše področje znanosti o podatkih vključuje veliko različnih disciplin, vključno z:
Podatkovni inženiring
Načrtovanje, izgradnja, optimizacija, vzdrževanje in upravljanje infrastrukture, ki podpira podatke, pa tudi pretok podatkov v celotni organizaciji.
Priprava podatkov
Čiščenje in preoblikovanje podatkov.
Podatkovno rudarjenje
Ekstrahiranje (in včasih čiščenje in preoblikovanje) uporabnih podatkov iz večjega nabora podatkov.
Napovedna analitika
Uporaba podatkov, algoritmov in tehnik strojnega učenja za analizo verjetnosti različnih možnih prihodnjih izidov na podlagi analize podatkov.
Strojno učenje
Avtomatizacija izdelave analitičnega modela v procesu analize podatkov za učenje iz podatkov, odkrivanje vzorcev in opolnomočenje sistemov za sprejemanje odločitev brez veliko človeškega posredovanja.
Vizualizacija podatkov
Uporaba vizualnih elementov (vključno z grafi, zemljevidi in grafikoni) za ponazoritev vpogledov, najdenih v podatkih, na dostopen način, tako da lahko občinstvo razume trende, izstopajoče in vzorce, ki jih najdemo v podatkih.
Prednosti podatkovne znanosti
Podjetja v vseh panogah v vseh delih sveta namenjajo vedno več denarja, časa in pozornosti podatkovni znanosti in želijo svoji ekipi dodati podatkovnega znanstvenika. Raziskave kažejo, da so podjetja, ki resnično sprejemajo odločanje na podlagi podatkov, bolj produktivna, dobičkonosna in učinkovitejša od konkurence.
Znanost o podatkih je ključnega pomena za pomoč organizacijam pri prepoznavanju pravih težav in priložnosti, hkrati pa pomaga pri oblikovanju jasne slike vedenja in potreb strank in strank, uspešnosti zaposlenih in izdelkov ter morebitnih prihodnjih težav.
Podatkovna znanost lahko pomaga podjetjem:
- Sprejemajte boljše odločitve
- Več o strankah in strankah
- Izkoristite trende
- Predvidevati prihodnost
Kako lahko podatkovna znanost izboljša vrednost za podjetje?
Znanost o podatkih je tako vse bolj priljubljena naložba za podjetja, saj je potencialna donosnost naložbe pri odklepanju vrednosti velikih podatkov ogromna. Znanost o podatkih je vredna naložba, ker:
- Kako tradicionalno je vaše podjetje. Večja, starejša podjetja običajno niso tako prijazna na daljavo, čeprav je COVID morda prinesel velike spremembe na tem področju.
- Kako enostavno lahko delate z drugimi soigralci in oddelki na daljavo. Če je vaše delo zelo sodelovanje, je bolj verjetno, da se boste morali osebno pojaviti.
- Podatkovni znanstveniki, ki delajo po pogodbi – ali celo na podlagi svetovanja – imajo lahko tudi večjo prilagodljivost pri izbiri lastne lokacije.
Plače za podatkovne znanstvenike
Medtem ko se plače podatkovnih znanstvenikov močno razlikujejo glede na regijo in panogo, je povprečna plača podatkovnega znanstvenika v ZDA poročana med 96.000 in 113.000 $, odvisno od vira. Višji podatkovni znanstvenik lahko v povprečju prinese približno 130.000 $.
Povpraševanje po podatkovnih znanstvenikih
Po podatkih znanstvenikov je veliko povpraševanje in pomanjkanje v skoraj vseh panogah. Poročilo Deloitte Access Economics je pokazalo, da 76 odstotkov podjetij namerava v naslednjih letih povečati porabo za zmogljivosti za analizo podatkov, medtem ko je IBM napovedal 28-odstotni porast povpraševanja po podatkovni znanosti na začetku desetletja.
Ameriški urad za statistiko dela je napovedal 31-odstotno rast podatkovne znanosti v naslednjih 10 letih. Medtem je poročilo o trgih in trgih ugotovilo, da naj bi svetovni trg velikih podatkov do leta 2025 narasel na 229,4 milijarde dolarjev, platforma za podatkovno znanost pa bo do leta 2024 narasla za 30 odstotkov.
Zdi se, da se bodo povsod po svetu povečale naložbe v znanost o podatkih in s tem povpraševanje po podatkovnih znanstvenikih.
Katera orodja uporabljajo podatkovni znanstveniki?
Podatkovni znanstveniki uporabljajo različna orodja in programe za dejavnosti, vključno z analizo podatkov, čiščenjem podatkov in ustvarjanjem vizualizacij.
Python je najboljši programski jezik za podatkovne znanstvenike, ki so bili anketirani v raziskavi BrainStation Digital Skills Survey. Python, programski jezik splošnega namena, je uporaben za aplikacije za obdelavo nacionalnih jezikov in analizo podatkov. R se pogosto uporablja tudi za analizo podatkov in rudarjenje podatkov. Za večje število številk so priljubljena orodja, ki temeljijo na Hadoopu, kot je Hive. Za strojno učenje lahko Data Scientists izbirajo med široko paleto orodij, vključno s h2o.ai, TensorFlow, Apache Mahout in Accord.Net. Orodja za vizualizacijo so tudi pomemben del arzenala Data Scientist. Programi, kot so Tableau, PowerBI, Bokeh, Plotly in Infogram, pomagajo Data Scientistom ustvariti vizualno privlačne diagrame, toplotne zemljevide, grafike, razpršene grafe in še več.
Podatkovni znanstveniki bi morali biti tudi zelo zadovoljni tako z SQL (uporablja se na različnih platformah, vključno z MySQL, Microsoft SQL in Oracle) kot s programi za preglednice (običajno Excel).
Kakšne veščine potrebujejo podatkovni znanstveniki?
Obstajajo številne veščine, ki bi jih morali razviti in bi morali razviti vsi ambiciozni podatkovni znanstveniki, vključno z:
Karierne poti podatkovnega znanstvenika
Kot razmeroma nov poklic karierne poti podatkovnega znanstvenika niso zapisane v kamnu in mnogi ljudje najdejo pot do podatkovne znanosti iz ozadja računalništva, IT, matematike in poslovanja. Toda štiri glavne osi karierne poti podatkovnega znanstvenika so na splošno podatki, inženiring, posel in izdelek. Številne multidisciplinarne vloge v znanosti o podatkih zahtevajo obvladovanje več ali vseh teh področij.
Ljudje, ki delajo na področju podatkovne znanosti, so v samem ospredju tehnoloških sprememb, ki bodo najbolj vplivale na prihodnost. Ker lahko podatkovna znanost prispeva k napredku na tako rekoč vseh drugih področjih, so podatkovni znanstveniki sposobni nadaljevati raziskave na vsem, od financ in trgovine do aktuarskih statistik, zelene energije, epidemiologije, medicine in farmacije, telekomunikacij – seznam je tako rekoč neskončen. Vsaka industrija prenaša svoje različne vrste podatkov in jih na različne načine izkorišča za doseganje različnih ciljev. Kjer koli se to zgodi, lahko Data Scientists usmerjajo boljše odločanje, ne glede na to, ali gre za razvoj izdelkov, analizo trga, upravljanje odnosov s strankami, človeške vire ali kaj povsem drugega.
Ne samo, da so aplikacije za znanost o podatkih široke in se dotikajo številnih različnih sektorjev, ampak obstajajo tudi različne vrste podatkovne znanosti. Vsem tem dejavnostim je skupno, da vse poskušajo podatke spremeniti v znanje. Natančneje, Data Scientists uporabljajo metodični pristop za organizacijo in analizo neobdelanih podatkov, da bi identificirali vzorce, iz katerih je mogoče identificirati ali sklepati koristne informacije.
Glede na obseg njihovega vpliva ni čudno, da podatkovni znanstveniki zasedajo položaje, ki so zelo vplivni – in zelo povpraševani. Čeprav je pot do tega, da postanete podatkovni znanstvenik, lahko zahtevna, je za ambiciozne podatkovne znanstvenike zdaj na voljo več virov kot kdaj koli prej in več priložnosti za gradnjo kariere, ki si jo želijo.
Toda glede na vse načine, kako lahko podatkovni znanstveniki prispevajo k različnim panogam, in vse različne poklicne poti, ki jih lahko sledi, lahko vrste dela, ki jih opravljajo, razdelimo v nekaj glavnih kategorij. Vsa znanost o podatkih se ne ujema čisto v te skupine, zlasti v ospredju računalništva, kjer se nenehno prebijajo nova tla – vendar vam bodo dale nekaj idej o načinih, kako podatkovni znanstveniki pretvorijo podatke v vpogled.
Statistika
V središču podatkovne znanosti je statistika področje matematike, ki opisuje različne značilnosti nabora podatkov, pa naj gre za številke, besede, slike ali druge vrste merljivih informacij. Velik del statistike je osredotočen na preprosto identifikacijo in opis tega, kaj je tam – zlasti pri zelo velikih nizih podatkov, je samo vedenje, kaj informacije počnejo in kaj ne, naloga zase. Na področju podatkovne znanosti se to pogosto imenuje deskriptivna analitika. Toda statistika lahko gre še dlje, preverjanje, ali so vaše domneve o tem, kaj je v podatkih, pravilne, ali, če so pravilne, ali so pomembne ali uporabne. To lahko vključuje ne samo preučevanje podatkov, temveč tudi njihovo manipulacijo, da se izvlečejo njihove pomembne značilnosti. Obstaja veliko različnih načinov za to – linearna regresija, logistična regresija in diskriminantna analiza, različne metode vzorčenja itd. – toda na koncu se vsaka od teh tehnik nanaša na razumevanje značilnosti niza podatkov in kako natančno so te značilnosti odražajo nekaj pomembne resnice o svetu, ki mu ustrezajo.
Analiza podatkov
Čeprav je zgrajena na podlagi statistike, gre analiza podatkov nekoliko dlje, v smislu razumevanja vzročnosti, vizualizacije in posredovanja ugotovitev drugim. Če statistika določa, kaj in kdaj je nabor podatkov, analiza podatkov poskuša ugotoviti, zakaj in kako. Podatkovni analitiki to storijo tako, da počistijo podatke, jih povzemajo, preoblikujejo, modelirajo in testirajo. Kot je navedeno zgoraj, ta analiza ni omejena samo na številke. Medtem ko večina analize podatkov uporablja numerične podatke, je mogoče izvesti tudi analizo drugih vrst podatkov – na primer pisnih povratnih informacij strank ali objav v družbenih medijih ali celo slik, zvoka in videa.
Eden od glavnih ciljev podatkovnih analitikov je razumeti vzročnost, ki jo je mogoče nato uporabiti za razumevanje in napovedovanje trendov v širokem spektru aplikacij. Pri diagnostični analizi analitiki podatkov iščejo korelacije, ki nakazujejo vzrok in učinek, ta vpogled pa se lahko uporabi za pomoč pri spreminjanju rezultatov. Napovedna analiza podobno išče vzorce, vendar jih nato še razširi in ekstrapolira njihove poti preko znanih podatkov, da bi pomagala napovedati, kako bi se lahko odigrali neizmerjeni ali hipotetični dogodki – vključno s prihodnjimi dogodki. Najnaprednejše oblike analize podatkov so namenjene zagotavljanju napotkov za posebne odločitve z modeliranjem in napovedovanjem rezultatov različnih izbir, da se določi najustreznejši način delovanja.
Umetna inteligenca in strojno učenje
Eden od velikih napredkov, ki se trenutno dogajajo v znanosti o podatkih – in tisti, ki bo v prihodnosti lahko imel ogromen vpliv – je umetna inteligenca in natančneje strojno učenje. Na kratko, strojno učenje vključuje usposabljanje računalnika za izvajanje nalog, za katere običajno mislimo, da zahtevajo neko obliko inteligence ali presoje, na primer sposobnost prepoznavanja predmetov na fotografiji. To se običajno doseže tako, da mu ponudite obilne primere vrste odločitve, za katero usposabljate omrežje. Kot bi si predstavljali, to zahteva nabor (običajno strukturiranih) podatkov in sposobnost, da računalnik pridobi smisel za te podatke. Obvezne so močne statistične veščine in veščine programiranja.
Ugodni učinki strojnega učenja so tako rekoč neomejeni, vendar je v prvi vrsti sposobnost hitrejšega izvajanja zapletenih ali dolgotrajnih nalog, kot bi jih lahko kdorkoli kadarkoli lahko, kot je prepoznavanje določenega prstnega odtisa v skladišču milijonov slik ali navzkrižno sklicevanje. na desetine spremenljivk v tisočih zdravstvenih kartotekah, da bi identificirali povezave, ki bi lahko ponudile namige o vzrokih bolezni. Strokovnjaki za strojno učenje z dovolj podatkov lahko celo usposobijo nevronske mreže za ustvarjanje izvirnih slik, izvlečejo smiselne vpoglede iz množice pisnega besedila, naredijo napovedi o prihodnjih trendih porabe ali drugih tržnih dogodkih in dodelijo vire, ki so odvisni od zelo zapletene distribucije, kot je energija. , z največjo učinkovitostjo. Prednost uporabe strojnega učenja za izvajanje teh nalog je v nasprotju z drugimi oblikami avtomatizacije v tem, da nenadzorovani A.I. Sistem se lahko sčasoma samodejno uči in izboljšuje – tudi brez novega programiranja.
Poslovna inteligenca
Kot ste morda uganili iz prejšnjega sklicevanja na tržne dogodke, je svet poslovanja in financ eno od krajev, kjer je strojno učenje naredilo enega svojih najzgodnejših in najglobljih vplivov. Zahvaljujoč ogromni količini razpoložljivih številčnih podatkov – trženjskih podatkovnih baz, anket, bančnih informacij, prodajnih podatkov itd., od katerih je večina zelo organiziranih in sorazmerno enostavnih za delo – lahko podatkovni znanstveniki uporabljajo statistiko, analizo podatkov in strojno učenje za pridobivanje vpogledov v nešteto vidikov poslovnega sveta, vodenje odločanja in optimizacijo rezultatov do te mere, da je poslovna inteligenca postala samostojna področje podatkovne znanosti.
Razvijalci poslovne inteligence pogosto ne gledajo preprosto na vse podatke, ki so na voljo, da bi videli, kaj lahko odkrijejo; proaktivno si prizadevajo za zbiranje podatkov ter razvijajo tehnike in izdelke za odgovarjanje na določena vprašanja in doseganje določenih ciljev. V tem smislu so razvijalci in analitiki poslovne inteligence ključnega pomena za strateški razvoj v svetu poslovanja in financ – pomagajo vodstvu, da sprejema boljše odločitve in jih sprejema hitreje, razume trg za prepoznavanje priložnosti in izzivov podjetja ter izboljša splošno učinkovitost sistemi in delovanje podjetja, vse s splošnim ciljem doseganja konkurenčne prednosti in povečanja dobička.
Podatkovni inženiring
Končno glavno področje študija, na katerem pogosto delajo podatkovni znanstveniki, obsega celo vrsto različnih delovnih mest – podatkovni inženir, sistemski arhitekt, aplikacijski arhitekt, podatkovni arhitekt, podjetniški arhitekt ali infrastrukturni arhitekt, če naštejemo le nekatere. Vsaka od teh vlog ima svoj nabor odgovornosti, pri čemer nekatere razvijajo programsko opremo, druge načrtujejo sisteme IT, tretje pa usklajujejo notranjo strukturo in procese podjetja s tehnologijo, ki jo uporablja za izvajanje svojih poslovnih strategij. Vse jih povezuje to, da podatkovni znanstveniki, ki delajo na tem področju, uporabljajo podatkovno in informacijsko tehnologijo za ustvarjanje ali izboljšanje sistemov z mislijo na določeno funkcijo.
Arhitekt aplikacij, na primer, opazuje, kako podjetje ali drugo podjetje uporablja posebne tehnološke rešitve, nato oblikuje in razvija aplikacije (vključno s programsko opremo ali IT infrastrukturo) za izboljšano delovanje. Podatkovni arhitekt podobno razvija aplikacije – v tem primeru rešitve za shranjevanje, administracijo in analizo podatkov. Infrastrukturni arhitekt bi lahko razvil vseobsegajoče rešitve, ki jih podjetje uporablja za vsakodnevno poslovanje, da zagotovi, da te rešitve izpolnjujejo sistemske zahteve podjetja, ne glede na to, ali je to brez povezave ali v oblaku. Podatkovni inženirji se s svoje strani osredotočajo na obdelavo podatkov, zasnovo in izvajanje podatkovnih cevovodov, ki zbirajo, organizirajo, shranjujejo, pridobivajo in obdelujejo podatke organizacije. Z drugimi besedami, odločilna značilnost te široke kategorije podatkovne znanosti je, da vključuje načrtovanje in gradnjo stvari: sistemov, struktur in procesov, s katerimi se izvaja znanost o podatkih.
Katera so najbolj iskana delovna mesta na področju podatkovnih znanosti?
Znanost o podatkih je na splošno zelo zahtevana veščina, zato je na vsakem področju in posebnosti na voljo veliko priložnosti. Dejansko je LinkedIn v letu 2019 uvrstil Data Scientist kot najbolj obetavno službo leta, QuantHub pa je napovedal akutno pomanjkanje kvalificiranih podatkovnih znanstvenikov v prihodnjem letu.
Ključna beseda tukaj je kvalificirana. Pogosto so tehnične zahteve, ki jih mora izpolnjevati Data Scientist, tako specifične, da lahko traja nekaj let izkušenj z delom v industriji, da se vzpostavi potreben obseg kompetenc, začenši kot splošni strokovnjak, nato pa počasi dodaja vedno več sposobnosti in sposobnosti. njihov nabor spretnosti.
To je le nekaj najpogostejših načinov, kako lahko podatkovni znanstveniki to storijo – potencialnih kariernih poti je toliko, kolikor je podatkovnih znanstvenikov, vendar je v vsakem primeru napredovanje v karieri odvisno od pridobivanja novih veščin in izkušenj skozi čas.
Podatkovni analitik
Kot že ime pove, analitiki podatkov analizirajo podatke – vendar ta kratek naslov zajema le majhen del tega, kar lahko analitiki podatkov dejansko dosežejo. Prvič, podatki se redko začnejo v obliki, ki je enostavna za uporabo, in običajno so analitiki podatkov tisti, ki so odgovorni za prepoznavanje vrste potrebnih podatkov, njihovo zbiranje in sestavljanje ter nato čiščenje in organiziranje – pretvorbo v uporabno obliko, ugotavljanje, kaj nabor podatkov dejansko vsebuje, odstranjevanje poškodovanih podatkov in ocenjevanje njihove točnosti. Potem je tu še sama analiza – z uporabo različnih tehnik za preučevanje in modeliranje podatkov, iskanje vzorcev, izluščitev pomena iz teh vzorcev in njihovo ekstrapoliranje ali modeliranje. Nazadnje, podatkovni analitiki dajo svoje vpoglede na voljo drugim tako, da podatke predstavijo na nadzorni plošči ali bazi podatkov, do katere lahko dostopajo drugi ljudje, in svoje ugotovitve sporočijo drugim prek predstavitev, pisnih dokumentov ter grafikonov, grafov in drugih vizualizacij.
Karierna pot podatkovnega analitika
Data Analyst je odlična vstopna točka v svet podatkovne znanosti; lahko je začetna pozicija, odvisno od zahtevane ravni strokovnega znanja. Novi analitiki podatkov običajno vstopijo na področje takoj iz šole – z diplomo iz statistike, matematike, računalništva ali podobnega – ali preidejo na analizo podatkov s sorodnega področja, kot so posel, ekonomija ali celo družboslovje, običajno tako, da nadgradijo svoje spretnosti v sredini kariere prek tečaja analize podatkov ali podobnega certifikacijskega programa.
Toda ne glede na to, ali gre za nedavne diplome ali izkušene strokovnjake, ki naredijo spremembo sredi kariere, novi podatkovni znanstveniki običajno začnejo z opravljanjem rutinskih nalog, kot so pridobivanje in manipulacija podatkov z jezikom, kot sta R ali SQL, izgradnja podatkovnih baz, izvajanje osnovne analize in ustvarjanje vizualizacije z uporabo programov, kot je Tableau. Vsakemu analitiku podatkov ne bo treba vedeti, kako narediti vse te stvari – lahko pride do specializacije, tudi na mlajšem delovnem mestu –, vendar bi morali biti sposobni opravljati vse te naloge, če upate, da boste napredovali v svoji karieri. Prilagodljivost je v tej zgodnji fazi velika prednost.
Kako napredujete kot analitik podatkov, je do neke mere odvisno od panoge, v kateri delate – na primer marketing ali finance. Glede na sektor in vrsto dela, ki ga opravljate, se lahko odločite, da se specializirate za programiranje v Pythonu ali R, postanete profesionalec pri čiščenju podatkov ali se osredotočite samo na gradnjo zapletenih statističnih modelov ali ustvarjanje čudovitih vizualnih elementov; po drugi strani pa se lahko odločite tudi, da se boste naučili vsega po malem, kar vam bo omogočilo, da prevzamete vodstveni položaj, ko prevzamete naziv Senior Data Analyst. Z dovolj širokimi in globokimi izkušnjami je višji analitik podatkov pripravljen prevzeti vodstveno vlogo pri nadzoru skupine drugih analitikov podatkov in sčasoma postati vodja oddelka ali direktor. Z dodatnim usposabljanjem za veščine so analitiki podatkov tudi v močnem položaju, da se premaknejo na naprednejši položaj podatkovnega znanstvenika.
Podatkovni znanstvenik
Pravi podatkovni znanstveniki lahko običajno naredijo vse, kar lahko storijo analitiki podatkov, poleg tega pa še nekaj drugih stvari – pravzaprav lahko s primernim usposabljanjem in izkušnjami podatkovni analitik sčasoma napreduje na položaj podatkovnega znanstvenika. Torej da, podatkovni znanstveniki bi morali biti sposobni pridobivati, čistiti, manipulirati, shranjevati in analizirati podatke – pa tudi razumeti in delati z različnimi metodami strojnega učenja ter biti sposobni programirati v Pythonu, R ali podobnem statističnem programskem jeziku. zgraditi in oceniti naprednejše modele.
Karierna pot Data Scientist
Veliko ljudi vstopi na področje kot analitiki podatkov, preden pridobijo izkušnje in dodane veščine, potrebne za imenovanje podatkovnih znanstvenikov. Nato je naslednji korak od Junior Data Scientist tipično Senior Data Scientist – čeprav ta preprosta sprememba naslova nasprotuje delu, ki je potrebno za ta prehod; Senior Data Scientist bo poleg poznavanja področja, specifičnega za industrijo, kot je poslovna strategija ali analitika zdravstvenega varstva, bodisi dosegel vrhunsko razumevanje skoraj vseh vidikov podatkovne znanosti – AI, skladiščenje podatkov, rudarjenje podatkov, računalništvo v oblaku itd. , ali pa se bodo specializirali za eno od teh področij s strokovnim znanjem na ravni guruja.
Omeniti velja, da medtem ko nekateri podatkovni znanstveniki začnejo svojo kariero v analitiki in napredujejo do višjih položajev na specializiranih področjih, kot so psihologija, trženje, ekonomija itd., drugi začnejo kot strokovnjaki na enem od teh različnih področij, preden preidejo v podatke. znanstvena vloga.
Za mnoge je višji podatkovni znanstvenik končni cilj kariere; to je že tako napredna vloga, da je vsaj na področju podatkovne znanosti pogosto najvišji položaj, ki ga je mogoče doseči – preprosto postanete boljši, sposobnejši višji podatkovni znanstvenik z večjimi specializacijami. Za nekatere, zlasti tiste, ki imajo bolj splošen pristop, je mogoče še naprej napredovati na vodstveni položaj, kot je vodilni znanstvenik za podatke, ki vodi ekipo ali oddelek, ali celo vodja podatkovne službe, ki vodi strategijo podatkov institucije na najvišji ravni. in odgovarja samo generalnemu direktorju.
Podatkovni inženir
Tisto, kar loči podatkovne inženirje od drugih strokovnjakov, ki delajo na področju podatkov, je dejstvo, da načrtujejo in gradijo celotne sisteme – vključno z infrastrukturo in procesi, ki jih podjetje uporablja, da kar najbolje izkoristi te podatke. To pomeni, da so podatkovni inženirji ljudje, ki določajo načine, na katere lahko drugi podatkovni znanstveniki opravljajo svoje delo. Katere oblike podatkov lahko sprejme sistem podjetja? Katere metode se uporabljajo za zbiranje podatkov iz prodaje in trženja ali rezultatov zdravstvene raziskave in njihovo dajanje na voljo za analizo? Da bi to naredili, morajo biti podatkovni inženirji dobro seznanjeni z vrstami dela, ki ga opravljajo drugi strokovnjaki za znanost o podatkih – skrbniki baz podatkov, analitiki podatkov, arhitekti podatkov itd. – do te mere, da lahko podatkovni inženirji pogosto opravljajo vsako od teh vlog kot no. Ker pa so graditelji, podatkovni inženirji običajno porabijo več časa za razvoj kot drugi strokovnjaki na področju podatkovnih znanosti – pišejo programe, gradijo relacijske baze podatkov ali razvijajo orodja, ki podjetjem omogočajo izmenjavo podatkov med oddelki.
Poklicna pot podatkovnega inženirja
Kot druga delovna mesta, ki se ukvarjajo s podatki, je prvi korak, da postanete podatkovni inženir, pogosto univerzitetna diploma (običajno diplomirani ali magistrski inženir inženiringa, računalništva ali matematike) – vendar ne vedno. Nekdo z bogatimi izkušnjami pri delu na področju IT ali razvoja programske opreme bo morda ugotovil, da že ima vse potrebne veščine, da postane podatkovni inženir, razen samih podatkovnih veščin, v tem primeru jim lahko nekaj preusposabljanja, kot je podatkovni bootcamp, pomaga pri pridobivanju do hitrosti. Številne veščine, ki jih potrebuje podatkovni inženir (kot so SQL, UNIX in Linux, razvoj ETL ali konfiguriranje sistemov IT), je mogoče razviti z delom na sosednjem področju; drugi (kot je strojno učenje ali gradnja podatkovnih cevovodov) bodo zahtevali bolj osredotočeno učenje.
Kljub temu večina podatkovnih inženirjev začne svojo kariero z delom na nekem podpodročju računalništva, preden pridobi vsa znanja, potrebna, da postane mlajši podatkovni inženir – pravzaprav večina objav za delovna mesta za mlajše podatkovne inženirje zahteva od enega do petih let delovnih izkušenj. Od tam je naslednji logičen korak do višjega podatkovnega inženirja in glavnega inženirja podatkov. Ker pa obvladajo toliko vidikov IT, programskega inženiringa in podatkovne znanosti, je za podatkovne inženirje odprtih tudi veliko drugih delovnih mest – vključno z arhitektom podatkov, arhitektom rešitev ali arhitektom aplikacij. Za nekoga, ki želi opraviti manj praktičnega dela in več upravljanja zaposlenih, so druge možnosti vključujejo vodjo razvoja izdelkov – ali, sčasoma, glede na prave veščine ljudi, celo vodjo podatkov ali vodjo informacij.
Ali lahko podatkovni znanstveniki delajo od doma?
Kot številna delovna mesta na področju tehnologije je tudi vloge Data Scientist pogosto mogoče opravljati na daljavo, vendar je to na koncu odvisno od podjetja, v katerem delate, in vrste dela, ki ga opravljate.
Kdaj lahko podatkovni znanstveniki delajo na daljavo?
Pozicije podatkovne znanosti, ki delajo z zelo občutljivimi ali zaupnimi podatki in informacijami (kar vključuje veliko njih, tudi zunaj področij, ki so težka glede zasebnosti, kot sta bančništvo in zdravstvo, saj so lastniški podatki lahko eno najbolj dragocenih sredstev velikega podjetja), bodo ugotovili, da se soočajo s številnimi omejitvami glede dela na daljavo. V teh primerih boste verjetno morali delati v pisarni med delovnim časom.
Nekateri drugi dejavniki, ki jih je treba upoštevati:
Kategori: Novice