HKJC Data 101:公開數據 vs. 整理後數據的分別
為何爬蟲得到的原始數據和經清洗的 dataset 有本質差距?從 encoding、缺漏、重複條目說起。
Coming soon
Resources
免費下載 race-day 樣本 CSV,查閱完整數據集一覽,或索取為你團隊度身訂造的方案文件。
跑馬地 2025-07-16 全日賽事樣本,包含完整 9 場賽事的賽果、檔位、評分、騎練及終場賠率。可直接以 Python / R 載入驗證 schema 及欄位完整度。
直接傳送你關心的數據範圍、用例及預算考量,我們會以 PDF 形式準備一份適合你團隊的方案 — Coverage、交付方式、合作條款,一頁看清。
Datasets
四大類別,30+ 個數據產品,按賽季交付。
賽前資料
Race info · 排位表 · 場地報告 · 預測配速 · 分析評論 · 等
賽後資料
賽事結果 · 分段位置/時間/配速 · 派彩 · 彩池 · 練評 · 重播影片
馬匹一般資料
馬匹資料 · 獸醫紀錄 · 晨操 · 馬匹新聞 · 試閘場次/結果/評語/影片
賠率數據
獨贏 · 位置 · 連贏 · 連位 · 單 T · 孖寶 — 含終場及時間序列
Blog
為何爬蟲得到的原始數據和經清洗的 dataset 有本質差距?從 encoding、缺漏、重複條目說起。
Coming soon
Look-ahead bias 如何偷偷進入你的 feature pipeline,以及 PIT store 的正確設計方式。
Coming soon
以 Polars + DuckDB 構建一個低成本、可重現的 HK 賽馬 feature store 的實踐分享。
Coming soon