Business IntelligenceTilastot

Simpsonin paradoksi ja Business Intelligence

Toimitusjohtajat ja talousammattilaiset harvoin viettävät päiviään pohtien tilastollisia kummallisuuksia, mutta joitakin on hyvä tuntea – varsinkin jos niiden takia “tiedolla johtaminen” johtaa munauksiin. Simpsonin paradoksi on yksi niistä.

Ja ei, tällä ei ole kuvasta huolimatta mitään tekemistä Homer Simpsonin kanssa.

Mikä on Simpsonin paradoksi?

Simpsonin paradoksissa on karkeasti kyse hätäisien päätelmien tekemisestä, kun vertaillaan kahden muuttujan välisiä keskiarvoja käyttämättä maalaisjärkeä.

Simpsonin paradoksi esiintyy usein lääketieteessä, jossa käytetään kontrolliryhmiä. Klassinen esimerkki on, että lääke osoittautuu lumelääkettä tehokkaammaksi, kun tarkastellaan kaikkia ihmisiä yhtenä joukkona – mutta kun tarkastellaan miehiä ja naisia erikseen, niin lumelääke on tehokkaampi sekä miesten että naisten kohdalla.

Tuntuuko järjenvastaiselta? Siksi tämä on paradoksi.

Bisnesesimerkki Simpsonin paradoksista

Kuvittele olevasi toimitusjohtaja, joka saa Power BI -raportin, jossa on yksinkertainen budjettivertailu myymälöittäin. Ja näet tämän:

Kaikki hyvin maan päällä ja taivaan alla. Vai onko sittenkään?

Poraudut seuraavalle tasolle raportissa ja näet tilanteen myyjittäin:

Asiaan olisi varmaan syytä kuitenkin perehtyä ja kysyä vähän myyjiltä, että mistä on oikein kyse!

Tieto olisi kuitenkin kadonnut, jos oltaisiin menty vain pintapuolisen ensimmäisen havainnon mukaan.

Yllä oleva ei ole varsinaisesti Simpsonin paradoksi, mutta siitä on hyvä lähteä liikkeelle, jotta asian ydin alkaa hahmottua. Kun poraudutaan pintaa syvemmälle, niin asiat eivät ole sitä, miltä ne näyttävät.

Otetaan toinen esimerkki. Ja tämä on Simpsonin paradoksi. Verrataan tuotteiden A ja B myyntikatteita. Kummankin tuotteen osalta on analysoitu 70 kauppaa. Ostajista puolet on miehiä ja puolet naisia. Power BI:n tulostaulu näyttää seuraavalta:

Tuote A tuottaa selvästi parempaa myyntikatetta kuin tuote B niin miesten kuin naistenkin keskuudessa. Mutta kun vedetään tulokset yhteen, niin:

Mitä ihmettä? 🤔

Ennen kuin menet blogissa eteenpäin, niin pohdipa hetki, miten tämä on mahdollista. Vinkki: mieti aikaisempaa esimerkkiä.

Uskon, että olet oikeilla jäljillä. Pitää päästä lukujen taakse. Tältä näyttävät kaupat prosenttien takana:

Miehet ovat ostaneet selvästi enemmän tuotetta B ja naiset selvästi enemmän tuotetta A. Kun tuotteita tarkastellaan yhdessä, niin kateprosenttien painotettu keskiarvo kääntyy tuotteen B eduksi, koska miesten ostosten myyntikateprosentti on naisia selvästi korkeampi.

Ja samanaikaisesti tuotteen A myyntikateprosentti on korkeampi, kun tarkastellaan sukupuolia erillisinä.

Tuote A on katteellisempi, kun sitä myydään naisille. Tuote A on katteellisempi, kun sitä myydään miehille. Tuote B on katteellisempi, kun sitä myydään ihmisille.

Tämä on Simpsonin paradoksi.

Kuvittele nyt olevasi Business Controller. Sinulta tiedustellaan suositusta näiden lukujen valossa. Kumpaa tuotetta sinusta kannattaa myydä?

Simpsonin paradoksi syvenee

Jatketaan harjoituksia ja mennään toiseen esimerkkiin.

Entäpä jos uusi markkinointipäällikkö päättää heittäytyä aktiiviseksi ja tehdä pikapäätelmiä seuraavien testikampanjalukujen pohjalta:

Markkinointipäällikkö toteaa, “naiset ostavat selvästi huonommin. Keskitytään vain miehiin nyt”.

Niinkö? Entä tämä perspektiivi – katsotaan kampanjan tilauksia tuotteittain:

Muuttaa päätelmiä hiukan, eikö vain? Naiset tuovatkin selvästi enemmän rahaa sisään.

Huomio keskittyy nyt erittäin hyvin myyvään kultaiseen juustohöylään, joka on selvästi naisten tuote jopa 29-kertaisesti. Kampanja kannattaa ehdottomasti kohdentaa naisille!

Entä jos selviää, että tämän huipputuotteen eli kultaisen juustohöylän ostaneet ovat iältään alle kymmenvuotiaita. Katsotaan seuraavaksi kampanjaan valikoituneiden asiakkaiden ikäjakaumaa:

 ❗️ Kaikki kampanjaan valitut pikkulapset ostivat kultaisen juustohöylän sukupuolesta riippumatta – 100 % – ja kukaan muu ei! Tämän tuotteen kohdalla sukupuolitiedolla ei ole mitään tekemistä myynnin kanssa!

Miesten ja naisten välinen ikäjakauma on täysin vinoutunut. Kampanjaan on valittu iältään vertailukelvoton populaatio!

Voi rähmä mikä soppa – mitä suosituksia nyt teet Business Controllerina markkinointipäällikkölle?

On helppoa päätyä Simpsonin paradoksiin

Simpsonin paradoksi on siis suomeksi omenoiden ja appelsiinien vertaamista keskenään – vahingossa ja huomaamatta.

Jos osapopulaatiot eivät ole keskenään täysin vertailukelpoisia, niin niiden yhdistelyssä tulee olla erityisen varovainen. Muuten menee mestään.

Vaikka varsinkin viimeinen esimerkki oli fiktiivinen ja absurdi, niin tätä tapahtuu tosielämässä todella paljon. Ja sitä tapahtuu paljon, koska lukuja ei kyseenalaisteta. Ja lukuja ei usein kyseenalaisteta, koska kyseenalaistamiseen tarvittavaa tietoa ei ole.

Mitä jos markkinointijohtajan Power BI -raportissa ei olisi ollut mahdollista porautua ikäjakaumaan? Jonkun pitää rakentaa tämä malliin ennen kuin kukaan voi sitä tarkastella. Ja ennen kuin se voidaan rakentaa mihinkään malliin, niin tietokantaan pitää kerätä asiakkaiden ikätieto.

Eli jonkun pitää oikeasta ajatella, mikä tietoa tarvitaan ja mikä voi vääristää tuotettua tietoa ennen kuin mitään raportteja tehdään ja julkaistaan. Tilastoharhan luominen on usein helpompaa kuin oikean tiedon tuottaminen.

Mistä tiedät, etteivät ne luvut, joita kutsut KPI:ksi, ole vain vastaavia tilastovääristymiä?

Tarinan opetus on seuraava: Business Intelligence ja tiedolla johtaminen voivat viedä harhaan ja pahasti. IT-taidot ja laskentaosaaminen eivät ole takeita siitä, että tehty BI-raportti on hyödyllinen. Keskiluvut eivät ole aina sitä, miltä ne näyttävät. Lukujen takana olevat muuttujat pitää tuntea syvällisesti ja siihen vaaditaan vähintään tilastotieteiden perusteiden hallintaa sekä roimasti markkinoinnillista älyä ja pelisilmää.

Jos haluat johtaa tiedolla, ole tarkka siitä, että tilaat raporttisi näiden riskien päälle ymmärtäviltä asiantuntijoilta.

0 0 Äänestä
Artikkelin arvosana
Tilaa
Ilmoita
guest
0 Kommentit
Inline Feedbacks
Katso kaikki kommentit