Das Stinktier

The Skunk ist ein Stockscreener den ich mal kurz mit PHP und Ajax zusammen gebaut habe. Die Idee war eher spontan. Ich selbst handle seit über 10 Jahren mit Wertpapieren und zwei Kollegen von mir ebenfalls. Dabei kam dann irgendwie heraus das jeder von uns so 6-10 verschiedene Seiten besucht um eine Aktie zu bewerten.

Man sammelt diverse Informationen in nem Spreadsheet zusammen und am Ende überlegt man sich obs ne gute Aktie ist oder nicht. Aufwand pro Analyse gut und gerne mal 10 – 15 Minuten.

Datenbasis

Ich habe dann beschlossen das zu beschleunigen und herausgekommen ist theskunk.cc. Gestern habe ich die ALPHA veröffentlicht und ich bin schon ein bisschen zufrieden damit.

Wichtig für so ein Tool sind natürlich die Daten. Soweit es geht versuche ich diese über öffentliche APIs zusammen zu sammeln (Danke Yahoo) aber an vieles kommt man dann doch nicht so einfach ran.

Anbieter von guten Finanzmarkt Daten lassen sich in der Regel fürstlich entlohnen .. und da ist man dann schnell bei ein paar tausend Euro für ein paar einfach API Calls.

Die feine Englische ..

Was macht man also wenn man sich nicht weiterhelfen kann .. man scraped die Daten aus seinen Lieblingsseiten knallhart heraus.

Das ist nicht die feine Art (darum wohl auch The Skunk) .. aber oft die einzige Möglichkeit. Scrapen bedeutet, daß ich die Seiten wie ein normaler Browser lade und mir dann die Infos die ich haben möchte herauskratze.

Das ist natürlich alles andere als wirklich zuverlässig. Aber die Idee hinter Skunk ist einen generischen Scraper zu entwickeln der sich selbst meldet wenn er an Daten nicht mehr herankommt. Idealerweise hat man dann höchstens eine kleine Anpassung im Selector zu machen um die Daten wieder zu sehen.

Das steckt jetzt alles noch in den Kinderschuhen. Aber da ich mich scrapetechnisch mit dem Endgegner (Google) schon angelegt habe .. und dementsprechend weiß was da alles an Hürden auf mich zukommen kann .. wir das sicher ganz lustig.

Außerdem brauche ich ein leichtgewichtiges Projektchen .. SEORCH ist mittlerweile so umfangreich das ich mir schon 2-3 Stunden Zeit nehmen muss wenn ich was anpassen möchte.

The Skunk soll klein, schnell und flexibel bleiben ..