Vprašanja za intervjuje o podatkovni znanosti

Karierni vodnik BrainStation Data Scientist vam lahko pomaga narediti prve korake do donosne kariere na področju podatkovne znanosti. V nadaljevanju preberite pregled pogostih vprašanj za intervjuje za delovna mesta v znanosti o podatkih in kako nanje najbolje odgovoriti.

Postanite podatkovni znanstvenik

Pogovorite se s svetovalcem za učenje, če želite izvedeti več o tem, kako vam lahko naši učni taborniki in tečaji pomagajo postati podatkovni znanstvenik.



S klikom na Pošlji sprejemate naše Pogoji .



Pošlji

Ni bilo mogoče oddati! Želite osvežiti stran in poskusiti znova?

Izvedite več o našem učnem taboru Data Science

Hvala vam!

Kmalu se oglasimo.



Oglejte si stran Data Science Bootcamp

Procesi intervjujev za podatkovne znanosti se lahko razlikujejo glede na podjetje in panogo. Običajno bodo vključevali začetni telefonski pregled z vodjo zaposlovanja, ki mu bo sledil en ali več razgovorov na kraju samem.

Odgovoriti boste morali na vprašanja v intervjuju za tehnične in vedenjske podatke o podatkih in verjetno boste dokončali projekt, povezan s spretnostmi. Pred vsakim razgovorom morate pregledati svoj življenjepis in portfelj ter se pripraviti na morebitna vprašanja za intervju.

Vprašanja na razgovoru za podatkovne znanosti bodo preizkusila vaše znanje in veščine iz statistike, programiranja, matematike in modeliranja podatkov. Delodajalci bodo ocenjevali vaše tehnične in mehke veščine ter kako dobro bi se vklopili v njihovo podjetje.



Če pripravite nekaj pogostih vprašanj in odgovorov za intervju o podatkovni znanosti, lahko v intervju vstopite z zaupanjem. Obstaja nekaj različnih vrst vprašanj Data Scientist, s katerimi lahko pričakujete, da se boste srečali med intervjujem o podatkovni znanosti.

Seznam vprašanj za intervjuje o podatkovni znanosti: vprašanja v zvezi s podatki

Delodajalci iščejo kandidate, ki dobro poznajo tehnike in koncepte podatkovne znanosti. Vprašanja za intervju v zvezi s podatki se razlikujejo glede na položaj in zahtevane spretnosti.

Tukaj je nekaj primerov vzorčnih vprašanj in odgovorov na intervjuju, povezanih s podatki:



Kakšna je razlika med nadzorovanim in nenadzorovanim učenjem?

Največja razlika med nadzorovanim in nenadzorovanim učenjem vključuje uporabo označenih in neoznačenih podatkovnih nizov. Nadzorovano učenje uporablja izhodne in vhodne podatke, ki so označeni, algoritmi za nenadzorovano učenje pa ne. Druga razlika je v tem, da ima nadzorovano učenje mehanizem povratnih informacij, medtem ko nenadzorovano učenje ne. Končno, pogosto uporabljeni algoritmi nadzorovanega učenja vključujejo logistično regresijo, stroj podpornih vektorjev in odločitvena drevesa, medtem ko so algoritmi nenadzorovanega učenja združevanje v skupine k-means, hierarhično združevanje in apriorni algoritem.

Kakšna je razlika med globokim učenjem in strojnim učenjem?

Na to vprašanje je težko jasno odgovoriti, ker se tukaj očitno nekaj prekriva. Začnite z razlago, da je globoko učenje v bistvu podpolje strojnega učenja in da oba spadata pod okrilje umetne inteligence. Kjer strojno učenje uporablja algoritme za analizo podatkov in se na koncu nauči sprejemati odločitve na podlagi tega, kaj prinese iz podatkov, globoko učenje te algoritme nanese na plasti, da ustvari umetne nevronske mreže, ki so sposobne učenja in sprejemanja informiranih odločitev.

  • Ali lahko podate podrobno razlago algoritma drevesa odločitev?
  • Kaj je vzorčenje? Koliko metod vzorčenja poznate?
  • Kako ločite napako tipa I in tipa II?
  • Prosimo, definirajte linearno regresijo.
  • Kaj pomenijo izrazi p-vrednost, koeficient in vrednost r-kvadrata? Zakaj je vsaka komponenta pomembna?
  • Prosimo, definirajte pristranskost pri izbiri.
  • Prosimo, definirajte statistično interakcijo.
  • Ali lahko navedete primer nabora podatkov z ne-Gaussovo distribucijo?
  • Prosimo, razložite formulo binomske verjetnosti.
  • Ali lahko razložite razliko med združevanjem k-NN in k-means?
  • Kakšen je vaš pristop k ustvarjanju modela logistične regresije?
  • Kaj je pravilo 80/20? Kako pomembno je potrjevanje modela?
  • Določite natančnost in priklic. Kako so povezani s krivuljo ROC?
  • Prosimo, pojasnite, kako razlikovati med L1 in L2 metodama regularizacije?
  • Kakšni so koraki za prepiranje in čiščenje podatkov, preden uporabite algoritme strojnega učenja?
  • Ali lahko razložite razliko med histogramom in okvirnim grafikonom?
  • Kako definirate navzkrižno preverjanje?
  • Ali lahko razložite, kaj sta lažno pozitiven in lažno negativen? Kaj bi rekli, da je bolje imeti: preveč lažno pozitivnih ali preveč lažno negativnih?
  • Kaj je pri oblikovanju modela strojnega učenja pomembnejše: natančnost modela ali zmogljivost modela?
  • Kaj je po vašem mnenju boljše: 50 majhnih dreves odločitev ali veliko?
  • Ali si lahko zamislite projekt podatkovne znanosti v našem podjetju, ki bi vas zanimal?
  • Ali si lahko omislite nekaj primerov najboljših praks na področju podatkovne znanosti?

Seznam vprašanj za intervjuje o podatkovni znanosti: vprašanja o tehničnih spretnostih

Vprašanja o tehničnih spretnostih v intervjuju o podatkovni znanosti se uporabljajo za oceno vašega znanja, veščin in sposobnosti na področju podatkovnih znanosti. Ta vprašanja bodo povezana s posebnimi delovnimi odgovornostmi na delovnem mestu Data Scientist.

Vprašanja za razgovor o tehničnih podatkih imajo lahko en pravilen odgovor ali več možnih rešitev. Pri reševanju problemov boste želeli pokazati svoj miselni proces in jasno razložiti, kako ste prišli do odgovora.

Primeri vprašanj za razgovor o tehničnih podatkovnih znanjih vključujejo:

Katera so najboljša orodja in tehnične veščine za podatkovnega znanstvenika?

Znanost o podatkih je zelo tehnično področje in vodji zaposlovanja boste želeli pokazati, da ste vešči vseh najnovejših industrijskih standardnih orodij, programske opreme in programskih jezikov. Od različnih statističnih programskih jezikov, ki se uporabljajo v znanosti o podatkih, podatkovni znanstveniki najpogosteje uporabljajo R in Python. Oboje se lahko uporablja za statistične funkcije, kot je ustvarjanje nelinearnega ali linearnega modela, regresijska analiza, statistični testi, rudarjenje podatkov in drugo. Drugo pomembno orodje za znanost o podatkih je RStudio Server, medtem ko se Jupyter Notebook pogosto uporablja za statistično modeliranje, vizualizacije podatkov, funkcije strojnega učenja itd. Seveda obstajajo številna namenska orodja za vizualizacijo podatkov, ki jih obsežno uporabljajo Data Scientists, vključno s Tableauom, PowerBI , Bokeh, Plotly in Infogram. Podatkovni znanstveniki potrebujejo tudi veliko izkušenj z uporabo SQL in Excela.

Vaš odgovor mora navesti tudi vsa posebna orodja ali tehnične kompetence, ki jih zahteva delovno mesto, za katerega se pogovarjate. Preglejte opis delovnega mesta in če obstajajo orodja ali programi, ki jih niste uporabljali, bi se morda splačalo seznaniti z njimi pred razgovorom.

Kako obravnavate izstopajoče vrednosti?

Nekatere vrste izstopov je mogoče odstraniti. Vrednosti smeti ali vrednosti, za katere veste, da ne morejo biti resnične, lahko zbrišete. Izstopajoče vrednosti z ekstremnimi vrednostmi daleč zunaj preostalih podatkovnih točk, združenih v niz, je mogoče tudi odstraniti. Če ne morete izpustiti izstopajočih vrednosti, lahko premislite, ali ste izbrali pravi model, lahko uporabite algoritme (kot so naključni gozdovi), na katere vrednosti izstopajočih ne bodo tako močno vplivale, ali pa poskusite normalizirati svoje podatke.

  • Povejte nam o izvirnem algoritmu, ki ste ga ustvarili.
  • Katera je vaša najljubša statistična programska oprema in zakaj?
  • Ali ste delali na projektu podatkovne znanosti, ki je zahteval znatno programsko komponento? Kaj ste vzeli iz izkušnje?
  • Opišite, kako učinkovito predstaviti podatke s petimi dimenzijami.
  • Ustvariti morate napovedni model z uporabo večkratne regresije. Kakšen je vaš postopek za potrditev tega modela?
  • Kako zagotovite, da so spremembe, ki jih izvajate v algoritmu, izboljšane?
  • Navedite svojo metodo za ravnanje z neuravnoteženim naborom podatkov, ki se uporablja za napovedovanje (tj. veliko več negativnih kot pozitivnih razredov).
  • Kakšen je vaš pristop k validaciji modela, ki ste ga ustvarili za ustvarjanje napovednega modela kvantitativne spremenljivke izida z uporabo večkratne regresije?
  • Imate dva različna modela primerljive računalniške zmogljivosti in natančnosti. Prosimo, pojasnite, kako se odločite, kaj izbrati za proizvodnjo in zakaj.
  • Dobite nabor podatkov, sestavljen iz spremenljivk z znatnim delom manjkajočih vrednosti. Kakšen je vaš pristop?

Seznam vprašanj za intervjuje o podatkovni znanosti: Osebna vprašanja

Delodajalci bodo poleg preverjanja vašega znanja in veščin podatkovne znanosti verjetno postavljali tudi splošna vprašanja, da vas bolje spoznajo. Ta vprašanja jim bodo pomagala razumeti vaš stil dela, osebnost in kako bi se lahko vklopili v kulturo njihovega podjetja.

Vprašanja na razgovoru s strokovnjakom za osebne podatke lahko vključujejo:

Kaj naredi dobrega podatkovnega znanstvenika?

Vaš odgovor na to vprašanje bo vodji zaposlovanja povedal veliko o tem, kako vidite svojo vlogo in vrednost, ki jo prinesete organizaciji. V svojem odgovoru bi lahko govorili o tem, kako znanost o podatkih zahteva redko kombinacijo kompetenc in veščin. Dober podatkovni znanstvenik mora združiti tehnične spretnosti, potrebne za razčlenitev podatkov in ustvarjanje modelov, s poslovnim občutkom, potrebnim za razumevanje težav, s katerimi se spopadajo, in prepoznavanje uporabnih vpogledov v svoje podatke. V svojem odgovoru bi lahko razpravljali tudi o podatkovnem znanstveniku, na katerega se zgledujete, ne glede na to, ali gre za sodelavca, ki ga poznate osebno, ali za pronicljivo osebnost v industriji.

  • Prosim povej mi o sebi.
  • Katere so vaše najboljše poklicne lastnosti? Katera so vaša šibka področja?
  • Je kakšen podatkovni znanstvenik, ki ga najbolj občudujete?
  • Kaj je spodbudilo vaše zanimanje za znanost o podatkih?
  • Katere edinstvene veščine ali lastnosti prinašate, da bi pomagale ekipi?
  • Zakaj ste se odločili zapustiti zadnjo službo?
  • Kakšno višino nadomestila pričakujete od tega dela?
  • Ali raje delate sami ali kot del ekipe podatkovnih znanstvenikov?
  • Kje vidite svojo kariero čez pet let?
  • Kakšen je vaš pristop k obvladovanju stresa na delovnem mestu?
  • Kako najdete motivacijo?
  • Kakšna je vaša metoda za merjenje uspeha?
  • Kako bi opisali svoje idealno delovno okolje?
  • Kakšne so vaše strasti ali hobiji zunaj znanosti o podatkih?

Seznam vprašanj za intervjuje o podatkovni znanosti: Vodenje in komunikacija

Vodenje in komunikacija sta dve dragoceni veščini za podatkovne znanstvenike. Delodajalci cenijo kandidate za zaposlitev, ki lahko pokažejo pobudo, svoje strokovno znanje delijo s člani ekipe in sporočajo cilje in strategije podatkovne znanosti.

Tukaj je nekaj primerov vprašanj za intervjuje o vodstvu in komunikacijskih podatkih:

Kaj vam je všeč pri delu v multidisciplinarnem timu?

Data Scientist sodeluje z najrazličnejšimi ljudmi v tehničnih in netehničnih vlogah. Ni nenavadno, da podatkovni znanstvenik sodeluje z razvijalci, oblikovalci, strokovnjaki za izdelke, analitiki podatkov, prodajnimi in marketinškimi ekipami ter vodilnimi na najvišji ravni, da ne omenjamo strank. V svojem odgovoru na to vprašanje morate torej ponazoriti, da ste timski igralec, ki uživa v priložnosti, da se srečuje in sodeluje z ljudmi v celotni organizaciji. Izberite primer situacije, ko ste poročali najvišjim ljudem v podjetju, da pokažete ne le, da vam je udobno komunicirati z vsemi, ampak tudi, da pokažete, kako dragoceni so bili vaši vpogledi na podlagi podatkov v preteklosti.

  • Ali si lahko zamislite poklicno situacijo, v kateri ste imeli priložnost pokazati vodenje?
  • Kakšen je vaš pristop k reševanju konfliktov?
  • Kakšen je vaš pristop k gradnji profesionalnih odnosov s sodelavci?
  • Kateri je primer uspešne predstavitve, ki ste jo dali? Zakaj je bilo tako prepričljivo?
  • Če se pogovarjate s kolegom ali stranko iz netehničnega okolja, kako razložite zapletene tehnične težave ali izzive?
  • Spomnite se situacije, ko ste morali ravnati z občutljivimi informacijami. Kako ste pristopili k situaciji?
  • Kako bi iz svojega zornega kota ocenili svoje komunikacijske sposobnosti?

Seznam vprašanj za intervjuje o podatkovni znanosti: vedenjska

Z vprašanji za vedenjske razgovore delodajalci iščejo posebne situacije, ki kažejo določene veščine. Anketar želi razumeti, kako ste se spopadali s situacijami v preteklosti, kaj ste se naučili in kaj lahko prinesete v njihovo podjetje.

Primeri vedenjskih vprašanj v intervjuju za znanost o podatkih vključujejo:

Se spomnite situacije, ko ste morali očistiti in organizirati velik nabor podatkov?

Študije so pokazale, da podatkovni znanstveniki porabijo večino svojega časa za pripravo podatkov, v nasprotju z rudarjenjem podatkov ali modeliranjem. Torej, če imate kakršne koli izkušnje kot podatkovni znanstvenik, je skoraj gotovo, da imate izkušnje s čiščenjem in organiziranjem velikega nabora podatkov. Res je tudi, da je to naloga, v kateri malokdo zares uživa. Toda čiščenje podatkov je tudi eden najpomembnejših korakov za vsako podjetje. Zato bi morali vodjo zaposlovanja popeljati skozi postopek, ki mu sledite pri pripravi podatkov: odstranjevanje podvojenih opazovanj, odpravljanje strukturnih napak, filtriranje izstopajočih, obravnavanje manjkajočih podatkov in preverjanje veljavnosti podatkov.

  • Pomislite na podatkovni projekt, na katerem ste delali, kjer ste naleteli na težavo ali izziv. Kakšna je bila situacija, kaj je bila ovira in kako ste jo premagali?
  • Prosimo, navedite konkreten primer uporabe podatkov za izboljšanje izkušnje stranke ali zainteresirane strani?
  • Navedite konkretno situacijo, ko ste dosegli cilj. Kako ste to dosegli?
  • Navedite konkretno situacijo, ko niste dosegli cilja. Kaj je šlo narobe?
  • Kakšen je vaš pristop k upravljanju in izpolnjevanju kratkih rokov?
  • Se lahko spomnite časa, ko ste se v službi soočili s konfliktom? Kako ste se s tem spopadli?

Seznam vprašanj v intervjuju za podatkovno znanost od vrhunskih podjetij (Amazon, Google, Facebook, Microsoft)

Da bi vam dali predstavo o nekaterih drugih vprašanjih, ki se lahko pojavijo v intervjuju, smo sestavili seznam vprašanj za intervjuje o podatkovnih znanostih nekaterih vrhunskih tehnoloških podjetij.

  • Kakšna je razlika med strojem podpornega vektorja in logistično regresijo? Prosimo, navedite primere situacij, ko bi se odločili za uporabo enega in ne drugega.
  • Če odstranite manjkajoče vrednosti iz nabora podatkov, povzročite pristranskost, kaj bi storili?
  • Ko gledate na zdravje, zavzetost ali rast izdelka, katere meritve bi ocenili?
  • Ko poskušate obravnavati ali rešiti poslovne težave, povezane z našim izdelkom, katere meritve bi ocenili?
  • Kako ocenjujete učinkovitost izdelka?
  • Kako veste, ali je novo opazovanje presežek?
  • Kako bi opredelili kompromis pristranskosti in variance?
  • Kakšna je vaša metoda za naključno izbiro vzorca iz populacije uporabnikov izdelka?
  • Kakšen je vaš postopek za prepiranje in čiščenje podatkov pred uporabo algoritmov strojnega učenja?
  • Kako bi pristopili k neuravnoteženi binarni klasifikaciji?
  • Kako ločite dobro in slabo vizualizacijo podatkov?
  • Ustvarite funkcijo, ki preveri, ali je beseda palindrom.

Kategori: Novice