Quandl on palvelu, joka koostaa aikasarjoja ympäri verkkoa yhteen paikkaan. Siellä on jo paljon dataa hieman sekalaisessa järjestyksessä, mutta datan käyttö sivuston omalla palvelulla on hankalaa.
Toisaalta on olemassa Python-ohjelmointikieli ja sille alkujaan finanssipuolen aikasarjojen käsittelyä helpottamaan tehty paketti nimeltä pandas. Näiden yhdistelmällä voisi päästä itse asiaan, eli käyttämään omat resurssit tehokkaasti tiedon käsittelyyn ja näkemysten saamiseen sen sijaan, että dataformaattien konversioon ja tietojen päivitykseen menee törkeästi aikaa.
Olen keskustellut Quandlin kehittäjien kanssa myös omien aikasarjojen lisäämisestä palvelun alle. Heidän ideansa näyttävät hyviltä, ja toivottavasti pian saamme saman rajapinnan alle pienempien markkinoiden tietoja, rahastoja sekä yhtiöiden tilinpäätöstietoja.
Tässä vielä ohjeet mainittujen työkalujen käyttöönottoon Mäcissä:
- Asennetaan Anaconda paketti osoitteesta http://continuum.io/downloads
- Tehdään pieni korjaus ainakin käyttöjärjestelmäversiossa Snow Leopard notebookin käynnistykseen. Oletuksena LOCALE ympäristömuuttujan arvo on UTF-8, jota notebook ei tunnista. Se pitää muuttaa esimerkiksi en_US.UTF-8 arvoon siten, että lisätään rivit
export LC_ALL=en_US.UTF-8
export LANG=en_US.UTF-8
Tiedostoon ~/anaconda/bin/ipython_mac.command - Asennetaan Quandl API paketti
~/anaconda/bin/pip install Quandl
EDIT 9.12.2013. Sormiharjoituksena autoregressiomalli osakkeen hinnalle. Järjetön esimerkki, mutta statsmodelin APIn syntaksiesimerkkinä hyväksyttäköön tämän kerran.
Kotitehtävä: minimum variance portfolion rakentaminen, sopivat rajoitteet ja backtestaus Helsingin lapuilla. Taas järjetön esimerkki, sikäli mikäli Fama-French mallin faktorit selittävät ylituoton. Mutta olisipahan jotain tekemistä käsillä olevalla kurssidatalla.
Keskustelua: http://quant.stackexchange.com/questions/2870/why-does-the-minimum-variance-portfolio-provide-good-returns
Ei kommentteja:
Lähetä kommentti