Suomen SAS-käyttäjien yhdistyksen laivaseminaari 15.-17.3.

Jari Putula SAS

Avarean yksi perustajajäsenistä ja arvostettu Senior Consultant Jari Putula vieraili Suomen SAS-käyttäjien yhdistys SUGIF ry:n laivaseminaarissa maaliskuun puolessa välissä puhumassa elefanteista ja mammuteista. Lisäksi hän esitteli Avarean MAD-konseptin, eli uudenaikaisen Marketing Analytics Dashboardin, jonka avulla tiedetään kuka puhuu ja kenestä.

SAS-käyttäjäpiireissä on tullut tavaksi syksyisin kokoontua SAS Forum -käyttäjäseminaariin Helsinkiin, mutta menneenä vuosikymmenenä SAS-fanittajat pitivät tapana myös risteillä yhdessä Itämerellä. Tämä käytänne kuitenkin hautautui ties miksi ja nuoremmat SAS-käyttäjät tuskin ovat siitä kuulletkaan. Nyt oli perinteen elvytyksen vuoro ja luonnollisesti halusin mukaan itsekin jo kokeneena SAS -vaarina (kuten itseni seminaarissa esittelin). Alla käyn läpi kaikki laivalla nähdyt esitykset yksi kerrallaan muutamalla lauseella luonnehtien.  

Satu Kullström, Keskinäinen Vakuutusyhtiö Fennia : Järjestelmän alasajon suunnittelu

Sadulla oli tarinana aihe, jonka syvällistä merkitystä en ollut aiemmin tullut pohtineeksi; järjestelmän alasajo. Jotenkin olin naiivisti ajatellut, että otetaan vain töpseli irti härpäkkeestä ja poltetaan dokumentaatio juhannuskokon sytykkeenä samalla muistellen edesmennyttä huojentuneena. Mitä vielä; kalvosetti osoitti konkreettisesti millä laajuudella asia yritystä koskettelee, mitä pitää huomioida ja miten ylipäätään asiakokonaisuutta tulee lähestyä.

Ari Hovi, Ari Hovi Oy: Analytiikka vai käsitemallinnus

Legendaarinen tietovarasto- ja mallinnusguru kävi myös seminaarissa esityksensä verran. Arin hyvin keskustelevassa esityksessä oli aihepiirinä analytiikan pohtiminen käsitemallinnuksen näkökulmasta; mikä on mallinnuksen tarkoitus, miten se suhtautuu uusiin maailman tuulien analytiikan asettamiin arkkitehtuurillisiin ja eri tietolähteiden ja tietotyyppien – lähinnä rakenteellisen ja ei-rakenteellisen – luomiin vaatimuksiin ja tarpeisiin. Ari testasi esityksessään erilaisia ajatuksia näiden asioiden kategorioimisesta ja niistä keskuteltiinkin hyvin vilkkaasti – ja tietenkin analyyttisesti.

Pertti Viitamäki, SAS Institute Oy: Tekstistä numeroiksi – Tekstianalytiikka ja SAS

Pertti esitteli demon avulla miten käytetään SAS Content Categorisation tuotetta. Käyttöliittymä on melko pelkistetty webportaali, jolla voi hyvin yksinkertaisen näköisesti nopeastikin tehdä valitsemastaan tekstistä, vaikkapa keskustelupalstan kommenteista, avainsanoihin perustuvaa analyysia. Tarina sivusi myös sentiment analyysiä sekä Text Mining sovelluspakettia joista jälkimmäisellä voi tehdä vielä huomattavan edistyksellisempää ja muokattavampaa analyysia. Aihepiiri herätti kohtuullisen runsasta keskustelua.

Arto Karatmaa, Aureolis Oy: Tietovaraston tiedon laadun hallinta

Arto kävi kiinni tiedon laatuun määrittelemällä ensin melko venyvän ja vanuvan aihepiirin(niin, mitä laatu tarkkaanottaen on?)  ja sitten esittelemällä tilastolukuja jenkkitutkimuksesta miten yrityksissä on tiedon laatuun liittyviin asioihin varauduttu (vai onko), niitä havainnoitu ja reagoitu. Suhtautuminen tiedon laatuun jää usein hieman taka-alalle, vaikka sen problematiikka ja tärkeys pääsääntöisesti tunnistetaankin. Kyse on myös paljolti kustannuksista, kuinka paljon ollaan valmiita hyvälaatuisesta tiedosta.

Eeva Sairanen, Aureolis Oy: IoT on oikeasti analytiikkaa

Eeva esitteli käytännönläheisesti Iot –asiaa pääosin teollisuuden näkökulmasta, kun yleensä SAS –seminaareissa näkee enemmän tavaraa muiden sektoreiden (esim. finanssi-) kuvioista. IoT saattaa olla hieman hypetetty ja ’overloaded’ termi, mutta juuri teollisuuden puolelta ymmärrettävästi käytännön sovellukset ja käyttötarpeet kumpuavat. Eikä se siellä todellakaan ole mikään uusi juttu.

Mika Leivo: Kokemuksia reaalielämästä

Mika ei päässyt fyysisesti paikalle Viking Linen minkä-lie-politiikan takia vaan piti esityksensä Skypen avustamana lahden toiselta puolelta. Mikan omintakeinen ja hauska esiintymistapa naulitsi kuulemaan jokaisen sanan mitä kaiuttimista ulos virtasi. Hän poimi pitkältä uraltaan nipun hyvin erilaisia asiakascaseja jotka löyhemmin tai tiukemmin kutoutuivat analytiikkaan ja esim. IoT:n ja jotka olivat mielenkiintoisen erilaisia kuin mitä olen itse tottunut kuulemaan vastaavissa seminaareissa.

Virpi Virtanen, S-Pankki ja Janne Eränen, Perigeum Oy: Aineiston laadun hallinta

Virpi ja Janne esittelivät tuotoksessaan miten tiedon laatua voidaan helposti SAS -ohjelmilla analysoida, seurata ja raportoida. Esitys oli huippukonkreettinen ongelman esittelyssä ja siihen näytettävässä ratkaisussa. Yksinkertaisillakin SAS ohjelmilla saadaan helpohkosti pätevää laadun seurantaa ilman sen suurempia kommervenkkejä kunhan vähän mielikuvitusta ja maalaisjärkeä käytetään. Ja hyvää ohjelmointitaitoa ja SAS -makroja.

Henrik Lähdeniemi, Perigeum Oy, ja Tiina Pohjalainen, S-Pankki Oy: Viranomaisraportoinnin datamart, taival kohti laadukkaampaa raportointia

Henkka ja Tiina kertoivat viranomaisraportoinnin uusimisen ja/tai päivittämisen etukäteishaasteista, pohdinnoista, kohdatuista ongelmista ja siitä miten niitä ratkaistiin. Tässä ei puhutakaan ihan pienistä ongelmista kun tehdään järjestelmäfuusiota ja samalla määritellään uusia rajapintoja joiden speksejä ja datoja saadaan vain arvailla, puhumattakaan tiedon laadun ja raportoinnin yhtenäisyyden varmistamisesta – pitkä matka todellakin.

Teemu Ojalehto, Perigeum Oy: Hadoop, Big Data & Analytiikka

Teemulla oli sylintäyteisesti materiaalia, demottavaa ja kerrottavaa jo esityksen nimestäkin pääteltävissä olevasta laajasta aihealueesta. Alun Hadoop -maailman kontekstin luonnin jälkeen oli ohjelmassa SAS-tuotteiden kirjo esityksen aihepiiriin liittyen. Eikä niitä ole ihan vähän; demoissa ehdittiin läpikäydä jonkin verran SAS Data Loader for Hadoop -tuotetta, lopun runsas materiaali käytiin nopealla vauhdilla läpi ja niihin kannattaa ehdottomasti tutustua jos haluaa saada aihepiiristä kattavan ymmärryksen.

Jari Putula, Avarea Oy: Elefantti vs. mammutti

Itse pyrin esityksessäni esittelemään ja antamaan pohtimisen aihetta seuraavissa asioissa:

  • mikä on elefantti-mammutti arkkitehtuuri-baseline
  • mikä on Hadoop –ohjelmistoarkkitehtuuri ja ekosysteemi
  • esimerkkinä lukuisista Hadoop-ekosysteemin ohjelmistoista poimin mukaan Sparkin ja esittelin mikä se on, mitä sillä tehdään, missä se on hyvä, missä ei ja lopuksi kerroin meidän käyttökokemuksemme sen parissa työskennelleenä
  • verrataan elefantti- ja mammuttimaailmojen eroja, sekä käydään läpi molempien vahvuuksia ja heikkouksia
  • ihmetellään mistä elefanttimaailman ohjelmistoja putkahtelee niin kovalla vauhdilla
  • pohdiskellaan, liittyykö tämä kaikki uberisaatioon, mediakentän myllerykseen, somemaailmaan, johonkin muuhun vai ei mihinkään
  • käydään läpi ’SAS Solutions in Hadoop Ecosystem’
  • esitellään Avarean ’Marketing Analytics Dashboard’
  • lopuksi kirjavinkkejä ja toteuta haaveesi -osio