sunnuntai 8. joulukuuta 2013

Työkalut finanssidatan käsittelyyn

Hamppi on silloin tällöin seurannut piensijoittajalle sopivasti hinnoiteltujen finanssidatan käsittelyyn soveltuvien ohjelmien ja datalähteiden tarjontaa. Bloombergin terminaalin käyttömaksun kattamiseksi salkkua on vielä jonkin aikaa lihotettava.

Quandl on palvelu, joka koostaa aikasarjoja ympäri verkkoa yhteen paikkaan. Siellä on jo paljon dataa hieman sekalaisessa järjestyksessä, mutta datan käyttö sivuston omalla palvelulla on hankalaa.

Toisaalta on olemassa Python-ohjelmointikieli ja sille alkujaan finanssipuolen aikasarjojen käsittelyä helpottamaan tehty paketti nimeltä pandas. Näiden yhdistelmällä voisi päästä itse asiaan, eli käyttämään omat resurssit tehokkaasti tiedon käsittelyyn ja näkemysten saamiseen sen sijaan, että dataformaattien konversioon ja tietojen päivitykseen menee törkeästi aikaa.

Olen keskustellut Quandlin kehittäjien kanssa myös omien aikasarjojen lisäämisestä palvelun alle. Heidän ideansa näyttävät hyviltä, ja toivottavasti pian saamme saman rajapinnan alle pienempien markkinoiden tietoja, rahastoja sekä yhtiöiden tilinpäätöstietoja.

Tässä vielä ohjeet mainittujen työkalujen käyttöönottoon Mäcissä:
  1. Asennetaan Anaconda paketti osoitteesta http://continuum.io/downloads
  2. Tehdään pieni korjaus ainakin käyttöjärjestelmäversiossa Snow Leopard notebookin käynnistykseen. Oletuksena LOCALE ympäristömuuttujan arvo on UTF-8, jota notebook ei tunnista. Se pitää muuttaa esimerkiksi en_US.UTF-8 arvoon siten, että lisätään rivit
    export LC_ALL=en_US.UTF-8
    export LANG=en_US.UTF-8

    Tiedostoon ~/anaconda/bin/ipython_mac.command
  3. Asennetaan Quandl API paketti
    ~/anaconda/bin/pip install Quandl
Nyt se on valmis käytettäväksi. Helsingin pörssin osakkeiden vaihdon perustietoja voi katsella esimerkiksi näin.

EDIT 9.12.2013. Sormiharjoituksena autoregressiomalli osakkeen hinnalle. Järjetön esimerkki, mutta statsmodelin APIn syntaksiesimerkkinä hyväksyttäköön tämän kerran.

Kotitehtävä: minimum variance portfolion rakentaminen, sopivat rajoitteet ja backtestaus Helsingin lapuilla. Taas järjetön esimerkki, sikäli mikäli Fama-French mallin faktorit selittävät ylituoton. Mutta olisipahan jotain tekemistä käsillä olevalla kurssidatalla.

Keskustelua: http://quant.stackexchange.com/questions/2870/why-does-the-minimum-variance-portfolio-provide-good-returns


Ei kommentteja:

Lähetä kommentti