Humbjet më të mëdha në Data Science nuk rrjedhin nga gabime të rastësishme ose analiza të pasakta. Ato rrjedhin nga të metat në planifikim dhe komunikim. Gabimet marrin kohë një ose dy ditë për t’u rregulluar, por gabimet në planifikim mund të marrin javë dhe muaj për t’u rregulluar. Në këtë blog mund të lexoni pesë mënyra se si mund të shmangni bërjen e këtyre gabimeve.
Caktoni objektivin e duhur
Matematicienti dhe analisti i të dhënave John Tukey tha se “një përgjigje e përafërt në pyetjen e duhur është më e mirë sesa një përgjigje e saktë në pyetjen e gabuar.”
Algoritmet që përdorim cdo ditë mundohen të zgjidhin gjërat në mënyrën më të lehtë, makineritë nuk mund t’ju tregojnë nëse jeni duke maksimizuar gjënë e duhur në kohën e duhur. Periodikisht ju duhet të siguroheni që funksioni juaj objektiv të pasqyrojë përparësitë dhe vlerat tuaja aktuale. Për shembull, një kompani e fazës së hershme mund të mos shqetësohet aq shumë për përfitimin; në vend të kësaj ata mund të duan të maksimizojnë të ardhurat në mënyrë që të përpiqen të rrisin pjesën e fitimit të tregut. Një kompani që kërkon IPO mund të dëshirojë të demonstrojë përfitim, kështu që mund të përqëndrohet në minimizimin e kostove, duke ruajtur të njëjtin nivel të pjesës së tregut. Vetëm kapja e metrikës (të ardhurave) aktualisht të rëndësishme në pika të caktuara kohore (tremujore) do të pengojë aftësinë tuaj për të parashikuar funksione të reja të kostos (përfitueshmëria) në kohë të ndryshme.
Shkencëtarët e të dhënave gjithashtu mund të bien në kurthin e optimizimit të metrikave të modelit, dhe jo metrikave të biznesit. Për shembull, shkencëtarët e të dhënave mund të marrin në konsideratë përdorimin e një karakteristike specifike për të vlerësuar performancën e përgjithshme të modelit, por ato nuk garantojnë domosdoshmërisht në suksesin e biznesit. Në vend të kësaj, vendosja e një objektivi spcifik është më e rëndësishme sesa vendosja e një objektivi më të gjerë. Mbledhja e të dhënave të para-grumbulluara të bazuara në ngjarje dhe rishqyrtimi periodik i problemit që po përpiqeni të zgjidhni do t’ju lejojë të vazhdoni të lëvizni në drejtimin e duhur, në vend që të optimizoheni për problemin e gabuar.
Rrini në të njëjtën faqe
Ekziston një ndryshim i madh midis “Kishte një rritje prej 100 pikë në në grupin e testit prej 100,000 shembujsh” dhe “Nëse do të kishim këto përmirësime në vend, do të kishim kursyer 20,000 dollarë në tremujorin e fundit të biznesit.” “100,000 shembuj” dhe “rritje me 100 pikë” janë të vështira për t’u përfytyruar, ndërsa “20,000 dollarë” dhe “tremujori i fundit i biznesit” kanë tendencë të jenë shumë më të lehta për t’u kuptuar nga palët e interesuara të biznesit. Standardizoni njësitë tuaja të analizës në mënyrë që ekipi juaj dhe drejtuesit e biznesit të kalojnë më pak kohë duke përkthyer dhe më shumë kohë duke ideuar.
Pikat në kohë që janë kritike gjithashtu mund të ndryshojnë nga palët e interesuara të biznesit. Një praktikues i shitjeve ose suksesit të klientit mund të ketë nevojë për masa javore, mujore ose të bazuara në ngjarje. Ndërsa një drejtues i të ardhurave mund të ketë nevojë për modele për segment biznesi, përfaqësues të shitjeve ose linjë produktesh në baza tremujore ose vjetore. Mblidhni të dhëna në një nivel ngjarjeje për të mbështetur këto kohë të ndryshme llogaritëse kur ato lindin.
Krijoni hapësirë për zbulim
Data Science është gjithmonë në përpjekje për të sjell dicka të re, shpesh përparimet në modele vijnë nga vende të papritura. Përparimet më të mëdha vijnë nga eksplorimi i rrugëve të reja dhe mundësive të reja. Një nga gjërat e bukura në lidhje me Data Science është se ajo merr ide dhe metoda nga një grup i gjerë diciplinash shkencore. Algoritmet e zhvilluara për gjenetikën përdoren për të analizuar literaturën, metodat për të analizuar literaturën mund të përshtaten për të bërë ndeshje romantike në një aplikacion takimesh ose për të dhënë rekomandime për një pushim.
Përparimet në zgjidhjet shpesh vijnë nga shikimi i të njëjtit problem nga një kënd ose kornizë tjetër referimi. Për shembull, disa nga modelet e para nuk morën parasysh informacionin demografik. Për një kohë të gjatë tani, shkencëtarët e të dhënave kanë kuptuar se përfshirja e të dhënave demografike mund të ndihmojë reklamat të arrijnë tek personi i duhur ose të matin paragjykimet e padëshiruara. Pastaj kur u prezantua korniza e psikologjisë, shkencëtarët e të dhënave filluan ta shikojnë problemin nga një kënd psikografik: A mundet që demografia dhe interesi i demonstruar të përmirësojnë rezultatet? Për shembull, shtimi i të dhënave në lidhje me atë që dikush ndau në mediat sociale mund të sigurojë një lidhje me atë që ka të ngjarë të blejë. Kohët e fundit, të dhënat e sjelljes të bazuara në ngjarje, në kohë reale, kanë hyrë në hapësirë duke sjellë informacione të reja dhe kohë në figurë. Bërja e blerjeve shumë të vogla të stacionit të karburantit, pastaj një blerje shumë e madhe e televizorit minuta më vonë mund të sinjalizojë një kartë krediti të vjedhur.
Ndërsa nuk doni të kaloni gjithë kohën tuaj duke vrapuar nëpër vrima lepuri dhe duke ndjekur patat e egra, duke lënë mënjanë kohën për të provuar zgjidhje të reja dhe krijuese ose për të eksploruar kënde të ndryshme, do të paguani në afat të gjatë në aftësi të reja, modele më të mira dhe më shpejt. koha për rezultate. Pavarësisht nëse po lini kohë çdo javë për të ndjekur drejtime të reja ose për të provuar gjëra të reja, ose duke lejuar detyra eksplorimi në rrjedhën tuaj të punës, në planin afatgjatë do të keni shkencëtarë më të lumtur dhe rezultate më të mira afatgjata duke i lejuar ata të gjejnë zgjidhje ose perspektiva të reja për problemet në fjalë.
Flisni me konsumatorin tuaj
Nëse ndërtoni një model pa e kuptuar përdoruesin tuaj përfundimtar dhe problemet që ata po përpiqen të zgjidhin, modelit tuaj do t’i mungojë konteksti jetik. Drejtuesit e biznesit kanë tendencë t’i shikojnë gjërat nga 50,000 kënde, ndërsa modelet tuaja shpesh vendosen në nivelin e tokës me përfaqësues të shitjeve. Kushtet në terren kurrë nuk përputhen plotësisht me atë që shihet nga lart, dhe kështu që nëse merrni vetëm kontekstin atë që mund të shihni në atë nivel më të lartë, do të humbisni informacionin jetësor. Ne kemi kaluar muaj duke ndërtuar modele për drejtuesit e biznesit, vetëm për të zbuluar se sistemi që kemi ndërtuar për ta bërë jetën më të lehtë, i ka bërë gjërat më të vështira për përfaqësuesin e shitjeve. Ne kursyem paratë e kompanisë, por mund të kishim një ndikim shumë më të madh, më të shpejtë nëse ndërtonim sisteme që ishin më të përafruara me përdoruesit tanë përfundimtarë.
Ka gjëra të vogla që përdoruesit tuaj i marrin si të mirëqena, dhe pa folur me klientët tuaj duke u munduar për t’i kuptuar ata, ju do të humbisni detaje të rëndësishme. Biseda me përdoruesit tuaj do të sigurojë që modelet tuaja të zgjidhin nevojat e tyre. Për shembull, një përfaqësues i shitjeve mund të caktohet në një territor dhe linjë produktesh dhe të presë që modeli që ata ofrojnë të pasqyrojë këtë. Një drejtues i të ardhurave po shikon të gjithë përfaqësuesit për të parashikuar biznesin. Për më tepër, një drejtues i të ardhurave kujdeset më shumë për parashikimin e saktë në fillim të një tremujori dhe muaji. Një përfaqësues i shitjeve kujdeset se kur dhe çfarë mund të bëjnë për të rritur suksesin e tyre në një llogari specifike. Ky kontekst nënkupton që ju duhet të ndërtoni të paktën tre modele të ndryshme me karakteristika të llogaritura në pika të ndryshme në kohë për të rritur saktësinë.
Zgjidhjet optimale kanë tendencë të jenë jo optimale
Zgjidhjet shumë të optimizuara kushtojnë më shumë për t’u zbatuar, më shumë për t’u mirëmbajtur dhe kanë tendencë të jenë më pak fleksibil. Ndërtoni zgjidhje më të thjeshta kurdo që të jetë e mundur. Vetëm sepse diçka është teorikisht më e mirë, nuk do të thotë se është praktikisht më mirë. Shkenctarët ishin duke punuar në një bazë të dhënash të thjeshta parashikimesh të regjistrimit për të qenë në gjendje të korrigjojnë dhe përsëritin parashikimet e prodhimit. Në fillim, ata donin të merrnin një konfigurim të AWS Athena pa server që nuk do të kërkonte drejtimin e vazhdueshëm të një makine të dhënash. Ata kaluan një ditë duke gërmuar në AWS Athena duke u përpjekur për ta vendosur atë para se të kuptonim që kishim shpenzuar më shumë para në kostot e pagave sesa një makinë e re e vazhdueshme që do të kushtonte për të funksionuar për dy vjet.
Kjo lidhet me “vendosjen e objektivit të duhur”. Zgjidhjet e optimizuara optimizohen vetëm nëse funksioni juaj objektiv është 100% i saktë dhe nuk ka gjasa të ndryshojë. Kur ndryshon, atëherë zgjidhja juaj shumë e optimizuar ka të ngjarë të optimizohet në drejtimin e gabuar. (Si një model shumë i optimizuar për të rritur të ardhurat dhe pjesën e tregut, por biznesi duhet të zhvendoset drejt përfitimit). Një zgjidhje që është pak më pak e optimizuar, por më fleksibile, e kuptueshme dhe e adaptueshme ka të ngjarë t’ju shërbejë më mirë në planin afatgjatë pasi prioritetet ndryshojnë, dhe ju i kuptoni më mirë kostot që lidhen me hapësirën e problemit.
Do të vini re se shumë prej tyre punojnë së bashku. Për të vendosur funksionin e duhur objektiv, do të dëshironi të flisni me konsumatorin tuaj dhe të dilni në të njëjtën faqe me palën tuaj të interesit. Aftësia për të drejtuar funksionin tuaj objektiv për të përmbushur kërkesat në ndryshim vjen nga mos ndërtimi i një zgjidhjeje hiper-optimale për problemin lokal, por ndërtimi i diçkaje që është fleksibil. Dhe sigurisht, lejimi i hapësirës për zbulim mundëson eksplorimin e optimave të reja të mundshme ose hapësirave problemore. Problemet e biznesit dhe modelit tuaj do të ndryshojnë me kalimin e kohës; vendoseni për sukses jo vetëm sot, por në të ardhmen. Këto ndryshime nuk do t’ju kursejnë 5 ose 10 minuta këtu apo atje, por përkundrazi do t’ju kursejnë javë të tëra përpjekjesh, duke minimizuar kohën e shpenzuar për ndërtimin e zgjidhjeve të gabuara.
Lexoni artikullin e plotë këtu.