R-playground

Tällä sivulla esitetään esimerkkejä data-analytiikan sovelluksista. Esimerkit on toteutettu R-kielellä; R on integroitu ohjelmistoratkaisu joka on kehitetty erityisesti datan manipulointia varten. R käsittää:

  • tehokkaan ympäristön datan käsittelyä ja tallennusta varten
  • joukon matriisilaskentaan soveltuvia operaattoreita
  • laajan joukon työkaluja yleisimpiä data-analyysin algoritmeja varten
  • työkalut analyysin tulosten visulaisointia varten
  • kehittyneen, mutta helposti omaksuttavan ja tehokkaan ohjelmointikielen.

Esimerkit hyödyntävät Web-sovellusympäristöä Shiny, joka muuttaa R-kielellä toteutetut sovellukset interaktiivisiksi Web-sovelluksiksi. Sovellusympäristö toimii tällä hetkellä rajoitetuin resurssein ja siitä johtuen viiveitä voi ilmetä esimerkkien välilehtien avaamisessa sekä esimerkkien suorittamisessa.

Esimerkki 1: Tekstin analyysi

Käyttäjä voi kopioida selainikkunaan kappaleen tekstiä ja analysoida sen ominaisuuksia, kuten sanojen esiintymistiheys, sanojen jakauma sanan pituuden mukaan tai tekstin tunnelataus (vain englanninkieliselle tekstille). Voit esimerkiksi verrata presidenttiehdokkaiden puheita niiden käyttämien sanojen tunnelatauksen pohjalta!

Esimerkki 2: Datan 3D-visualisointi

Käyttäjä voi ladata sovellukseen oman aineistonsa .csv muodossa ja visualisoida siitä haluamansa sarakkeet 3D-kuvaajana. Kuvaajan rakennetta voi muuttaa ja sitä voi zoomata. Myös tallennus .png -kuvaksi onnistuu.
Jos haluat tarkastella aineistoa 2D-tasolla, voit käyttää esimerkkiä Datan 2D-visualisointi

Esimerkki 3: Osakekurssien korrelaatioanalyysi

Käyttäjä voi tarkastella kahden valitsemansa pörssiyrityksen osakekurssien välistä korrelaatiota haluamaltaan aikaväliltä. Kurssit haetaan Yahoo Finance Web-rajapinnasta. Myös kummankin yrityksen kurssikehitys ja kaupanteon volyymi esitetään erillisinä käyrinä.

Vinkki: Vertailtavien pörssiyritysten lyhenteitä voi etsiä Yahoo Finance -palvelusta (Quote Lookup -hakukentästä). Ohessa muutamia esimerkkejä: Apple = AAPL, Amazon = AMZN, Facebook = FB, Finnair = FINN, Microsoft Corporation = MSFT, Nokia = NOK, Tesla = TSLA, Volkswagen = VLKAY, Yahoo! = YHO)

Esimerkki 4: Osakekurssien korrelaatiomatriisi

Käyttäjä voi vertailla viiden pörssiyrityksen osakekurssien lineaarista korrelaatiota valitsemaltaan aikaväliltä. Tulos esitetään matriisina, jossa kunkin solun väri esittää vastaavan kahden yrityksen pörssikurssien välistä korrelaatiota. Korrelaatio esitetään myös graafina. Klikkaamalla matriisin solua, saadaan näkyviin vastaavien yritysten osakekurssien kehityksen aikasarja.

Vinkki:käytössä vastaavat pörssiyritysten lyhenteet kuin esimerkki 3:ssa

Esimerkki 5: Twitter-palaute

Käyttäjä voi arvioida twitter-viestien pohjalta yleisön mielipiteitä tietystä aiheesta, tuotteesta tai yrityksestä. Data haetaan reaaliaikaisesti Twitter:istä. Viesteissä esiintyneistä sanoista arvioidaan negatiiviset ja positiiviset (englanninkieliset) ilmaukset ja sanoista luodaan sanapilvi-esitys. Analysoidut twitter-viestit listataan ja kuvataan myös kartalle siltä osin kuin niistä löytyy paikkatieto.

Vinkki:Kokeile vaikka Tesla, Microsoft, facebook, @ScienceChannel, @Tiviuutiset tai oman yrityksesi nimeä. Huomaa, että analyysi tehdään englanninkielisistä sanoista ja että haettujen twiittien määrän kasvaessa analyysin suoritus hidastuu. Kannattaa siis kokeilla kansainvälistä kohdetta ja hakea ensin pienemmällä twiittimäärällä.

Esimerkki 6: Suurimman korrelaation pörssiyhtiö

Sovellus etsii kaikkien pörssiyritysten joukosta käyttäjän määrittlemän yhtiön kanssa parhaiten korreloivan osakekurssin. Toistaiseksi sovellus toimii AMEX, NASDAQ ja NYSE pörsseillä. NB! skannaus saattaa kestää; skannauksen eteneminen näkyy oikeassa yläkulmassa

Esimerkki 7: Pörssiyhtiön osakkeen hinnan ennakointi

R-playground esimerkki nro 7
R-playground esimerkki nro 7 pörssikurssin ennusteesta (punainen) verrattuna toteutuneeseen (musta)

Sovellus hakee Yahoo finance reaaliaikapalvelusta halutun pörssikurssin, ja laskee siitä ennusteita tulevaisuuteen. Ennuste on siis täysin pörssikurssidataan pohjautuva, eikä ota huomioon muita mahdollisia ulkoisia seikkoja, jotka voivat vaikuttaa kurssiarvon muodostumiseen. Ennuste lasketaan random forest nimisellä luokittelutekniikalla. Menetelmä opetetaan aikaisemmalla datalla, ja opittua tietoa käytetään hyväksi uuden ennusteen tekemisessä. Datan kerääminen ja ennusteen tuottaminen saattavat kestää tovin; prosessin eteneminen näkyy ikkunan oikeassa alakulmassa.

EHDOTA UUTTA ESIMERKKIÄ

Yhteystiedot -lomake (Google Forms)

 

Lisätietoja:

Shiny (RStudio)

RStudio logo

Esimerkkejä (RStudio)

Tekniset kaaviot (RStudio)