超簡單台股每日爬蟲教學

今天教大家如何下載今日的股價,並從中篩選本益比較低的股票,重點是超簡單,只要15行以內就可以辦到!以後這個blog會偶爾釋放一些程式片段,讓大家組裝成一個功能健全的回測+當日選股的架構。

大家最終最終會學到:

  1. 如何爬取每日資訊
  2. 如何爬取財報
  3. 利用上述資料來篩選股票
  4. 觀察篩選後的股票在歷史回測中是否能獲利
  5. 每日計算當天獲利與明天操作

只要長期追蹤這個blog,當我某天心血來潮就會放上一些code,讓大家能夠自行學習並拼裝成自己的系統,以下是我的系統的截圖:

可以看到我的系統內每天都有數個程式交易策略在運行,選股策略每天會公布隔天的操作方式,也可以利用這個介面編寫回測,並驗證策略的效果。磁力回測是我們之前黑客松比賽用的名字,其實我們是台大黑客松第一名得獎團隊,後來又於中信金控黑客松得到第一名,才開始了量化回測之路,現在由於大家比較忙,目前只剩我還在使用這套系統而已XDD。

這套系統非常完善,我們編寫了幾套策略在上面,獲利還算OK,當然我不可能直接把這套系統公布出來,畢竟這是大家一起做的心血,然而有一些簡單卻重要的功能,我會在這個blog上面分享給大家。只要持續關注本blog,最後大家可以拼裝出自己的系統!

那就廢話不多說,來看看如何使用 python 爬取當天大盤,首先,我們得先安裝 python 的 package:

  1. requests :幫我們抓取 csv 檔
  2. pandas:幫我們選股

然後就可以開始了,首先抓取台股的資料表:

crawler
1
2
3
4
5
6
7
8
9
10
11
12
13

import requests
from io import StringIO
import pandas as pd
import numpy as np

datestr = '20180131'

r = requests.post('http://www.twse.com.tw/exchangeReport/MI_INDEX?response=csv&date=' + datestr + '&type=ALL')

df = pd.read_csv(StringIO("\n".join([i.translate({ord(c): None for c in ' '})
for i in r.text.split('\n')
if len(i.split('",')) == 17 and i[0] != '='])), header=0)

基本上這個 code 可以直接複製貼上就可以用了!我們可以把df印出來:

可以看到我們有了所有上市上櫃的股票,當天所有的資料!

接下來就是選股時間,我們想要選擇 本益比 < 15 的所有股票:

select stocks
1
df[pd.to_numeric(df['本益比'], errors='coerce') < 15]

搭拉!是不是發現選股好簡單!
我們之後還會有更多的教學,讓大家不只是選取本益比,還有更多更多的財報數據喔!

敬請期待!

假如覺得文章不錯,那更不能錯過我們的影音課程喔!
或我們按個 鼓勵一下吧!