R-playground

Tällä sivulla esitetään esimerkkejä data-analytiikan sovelluksista. Esimerkit on toteutettu R-kielellä; R on integroitu ohjelmistoratkaisu joka on kehitetty erityisesti datan manipulointia varten. R käsittää:

  • tehokkaan ympäristön datan käsittelyä ja tallennusta varten
  • joukon matriisilaskentaan soveltuvia operaattoreita
  • laajan joukon työkaluja yleisimpiä data-analyysin algoritmeja varten
  • työkalut analyysin tulosten visulaisointia varten
  • kehittyneen, mutta helposti omaksuttavan ja tehokkaan ohjelmointikielen.

Esimerkit hyödyntävät Web-sovellusympäristöä Shiny, joka muuttaa R-kielellä toteutetut sovellukset interaktiivisiksi Web-sovelluksiksi. Sovellusympäristö toimii tällä hetkellä rajoitetuin resurssein ja siitä johtuen viiveitä voi ilmetä esimerkkien välilehtien avaamisessa sekä esimerkkien suorittamisessa.

Tiedote: WEB-sovellusympäristö muuttaa toiselle palvelimelle

(17.9.2018) Siirrämme R/Shiny-esimerkkejä toiselle palvelimelle (newotula.pori.tut.fi). Siirrosta johtuen osa esimerkkien linkeistä voi viitata uuteen ja osa vanhaan palvelimeen.

Esimerkki 1: Tekstin analyysi

R-playground esimerkki nro 1
R-playground esimerkki nro 1

Mallissa käyttäjä voi kopioida selainikkunaan kappaleen tekstiä ja analysoida sen ominaisuuksia, kuten sanojen esiintymistiheys, sanojen jakauma sanan pituuden mukaan tai tekstin tunnelataus. Analysointia tuetaan toistaisseksi vain englanninkieliselle tekstille. Voit verrata esimerkiksi verrata englanninkielisiä tiedotteita ja niiden tunneprofiilia suomenkielisiin vastaaviin. Voit myös kokeilla, miltä yrityksesi englanniksi julkaitava teksti näyttäisi analytiikan ”silmin”.

Testaustekstejä

Esimerkki 2: Datan 3D-visualisointi

R-playground esimerkki nro 2
R-playground esimerkki nro 2

Mallissa on esiladattuna kolme datasettiä: 1) Timattien ominaisuuksia, 2) Autojen ominaisuuksia (1974 Motor Trend US magazine), 3) Kukkien iiriksen dataa (Ronald Fisher 1936). Datasetistä valitaan datat X-, Y- ja Z-akseleille. Neljännen akselin data kuvataan värisävyin. Käyttäjä voi ladata sovellukseen myös oman aineistonsa .csv muodossa (.csv tai .txt). Valitusta datasta voidaan visualisoida valitut sarakkeet 3D-kuvaajana. Kuvaajan rakennetta voi muuttaa ja sitä voi zoomata. Myös tallennus .png -kuvaksi onnistuu.
Jos haluat tarkastella aineistoa 2D-tasolla, voit käyttää esimerkkiä Datan 2D-visualisointi

Testausdataa

(17.9.2018) Pieni timanttien ominaisuuksien vertailudatatiedosto (.CSV)

Esimerkki 3: Osakekurssien korrelaatioanalyysi

Käyttäjä voi tarkastella kahden valitsemansa pörssiyrityksen osakekurssien välistä korrelaatiota haluamaltaan aikaväliltä. Kurssit haetaan Yahoo Finance Web-rajapinnasta. Myös kummankin yrityksen kurssikehitys ja kaupanteon volyymi esitetään erillisinä käyrinä.

Testauskohteita

Vinkki: Vertailtavien pörssiyritysten lyhenteitä voi etsiä Yahoo Finance -palvelusta (Quote Lookup -hakukentästä). Ohessa muutamia esimerkkejä: Apple = AAPL, Google = GOOG, Amazon = AMZN, Facebook = FB, Finnair = FINN, Kone Oy = KNYJY, Microsoft Corporation = MSFT, Nokia = NOK, UMP Kymmene Oyj = UMPKY, Tesla = TSLA, Volkswagen = VLKAY, Yahoo! = YHO)

Tiedote: Esimerkki pois käytöstä

(18.9.2018) Rajapinnan toiminassa tapahtuneiden muutosten vuoksi sovellus ei ole tällä hetkellä toiminnassa. Asiaa tutkitaan..

 

Esimerkki 4: Osakekurssien korrelaatiomatriisi

Käyttäjä voi vertailla viiden pörssiyrityksen osakekurssien lineaarista korrelaatiota valitsemaltaan aikaväliltä. Tulos esitetään matriisina, jossa kunkin solun väri esittää vastaavan kahden yrityksen pörssikurssien välistä korrelaatiota. Korrelaatio esitetään myös graafina. Klikkaamalla matriisin solua, saadaan näkyviin vastaavien yritysten osakekurssien kehityksen aikasarja.

Vinkki: Käytössä on vastaavat pörssiyritysten lyhenteet kuin esimerkki 3:ssa

Tiedote: Esimerkki pois käytöstä

(18.9.2018) Rajapinnan toiminassa tapahtuneiden muutosten vuoksi sovellus ei ole tällä hetkellä toiminnassa. Asiaa tutkitaan..

Esimerkki 5: Twitter-palaute

R-playground esimerkki nro 5
R-playground esimerkki nro 5

Mallissa käyttäjä voi arvioida twitter-viestien pohjalta yleisön mielipiteitä tietystä aiheesta, tuotteesta tai yrityksestä. Data haetaan reaaliaikaisesti Twitter:istä. Viesteissä esiintyneistä sanoista arvioidaan negatiiviset ja positiiviset (englanninkieliset) ilmaukset ja sanoista luodaan sanapilvi-esitys. Analysoidut twitter-viestit listataan ja kuvataan myös kartalle siltä osin kuin niistä löytyy paikkatieto.

Vinkki:Kokeile vaikka Tesla, Microsoft, facebook, @ScienceChannel, @Tiviuutiset tai oman yrityksesi nimeä. Huomaa, että analyysi tehdään englanninkielisistä sanoista ja että haettujen twiittien määrän kasvaessa analyysin suoritus hidastuu. Kannattaa siis kokeilla kansainvälistä kohdetta ja hakea ensin pienemmällä twiittimäärällä.

Esimerkki 6: Suurimman korrelaation pörssiyhtiö

R-playground esimerkki nro 6
R-playground esimerkki nro 6

Sovellus etsii kaikkien pörssiyritysten joukosta käyttäjän määrittelemän yhtiön kanssa parhaiten korreloivan osakekurssin. Mallikuvassa on tehty vertailu Googlesta (GOOG) ja stä parhaiten testihetkellä korreloi lääkintätarvikkeita toimittava Stryker Corporation (SYK).  Toistaiseksi sovellus toimii AMEX, NASDAQ ja NYSE pörsseillä. NB! skannaus saattaa kestää useita minuutteja; skannauksen eteneminen näkyy oikeassa yläkulmassa.

 

Tiedote: Esimerkki pois käytöstä

(18.9.2018) Rajapinnan toiminassa tapahtuneiden muutosten vuoksi sovellus ei ole tällä hetkellä toiminnassa. Asiaa tutkitaan..

Esimerkki 7: Pörssiyhtiön osakkeen hinnan ennakointi

R-playground esimerkki nro 7
R-playground esimerkki nro 7 pörssikurssin ennusteesta (punainen) verrattuna toteutuneeseen (musta)

Sovellus hakee Yahoo finance reaaliaikapalvelusta halutun pörssikurssin, ja laskee siitä ennusteita tulevaisuuteen. Ennuste on siis täysin pörssikurssidataan pohjautuva, eikä ota huomioon muita mahdollisia ulkoisia seikkoja, jotka voivat vaikuttaa kurssiarvon muodostumiseen. Ennuste lasketaan random forest nimisellä luokittelutekniikalla. Menetelmä opetetaan aikaisemmalla datalla, ja opittua tietoa käytetään hyväksi uuden ennusteen tekemisessä. Datan kerääminen ja ennusteen tuottaminen saattavat kestää tovin; prosessin eteneminen näkyy ikkunan oikeassa alakulmassa.

Tekijä: Juho Uusi-Luomalahti (15.4.2017)

Testattavia pörssiyhtiöitä

(18.9.2018) Sovelluksessa toimiviksi todettuja mallikohteita: AAPL = Apple, GOOG = Google

EHDOTA UUTTA ESIMERKKIÄ

Yhteystiedot -lomake (Google Forms)

 

Lisätietoja:

Shiny (RStudio)RStudio logo

Esimerkkejä (RStudio)

Tekniset kaaviot (RStudio)