WD
王东 量化研究 · 数据管线 · 小市值策略
Microcap Strategy Research

把小市值策略研究做成可复用的数据、信号和展示系统。

这页只展示个人策略研究里可公开的一层:研究对象、数据快照、信号验证、因子检验和本地管线结构。

核心主线是先在本地完成历史数据整理、QMT 增量更新、候选池筛选和 RankIC 检验,再把能够公开复核的摘要输出到网页展示层。

Tushare 历史数据 QMT 增量行情 小市值选股 RankIC / IC 衰退 Python · Pandas
Strategy Modules

当前展示的 3 个策略研究模块

这里更关心研究问题、方法、输出证据和可复用程度,而不是个人履历信息。

Research Infrastructure

微盘股与全 A 估值研究平台

Python Requests Pandas AkShare

围绕微盘股风格观察,自行维护一套数据采集、清洗和展示流程。项目目标不是单次比赛,而是把微盘指数、全 A 估值、交易日历和历史序列做成可以复用的个人研究基础设施。

  • 通过 Wind 公开网页接口与 AkShare 获取微盘股指数、全 A 指数和估值相关数据,整理为 JSON / CSV 资产。
  • 编写脚本抽取网页图表数据、修正时间序列并生成交易日历、回撤快照与可视化页面。
  • 将研究结果部署到 stoneinvestment.asia,形成可供展示的小市值风格观察站。
Research 2023

基于月份效应的 LightGBM 预测择时策略

LightGBM 月份效应 行业筛选

以 8、9 月份行业季节效应为研究切口,筛选在历史统计中表现更稳定的细分行业,再利用机器学习模型预测开盘价并生成交易信号。

  • 统计新申万三级行业历年 8、9 月收益表现,结合季节性与行业逻辑筛选股票池。
  • 使用昨日开盘价变化率、交易量变化率、换手率等因子构造训练集和测试集,基于 LightGBM 建模。
  • 通过年化收益、夏普比率和最大回撤等指标评估策略表现,并把结果整理成可复核的策略报告。
Research 2024

基于小市值风格的 GBDT 择时对冲策略

GBDT 小市值风格 IM 对冲

围绕小市值股票收益弹性与波动风险并存的特征,用 GBDT 预测开盘价,并引入股指期货空头对冲,力求把风格收益和回撤控制结合起来。

  • 基于 Fama-French 尺寸因子思路,筛选 8、9 月表现较强的一组行业,并选择市值较小且流动性较好的个股组成股票池。
  • 以中证 1000 指数、行业龙头、前一交易日涨跌幅、交易量变化率和换手率作为预测因子,构建 GBDT 模型。
  • 在策略层加入 IM 指数期货空头对冲,使用近两年历史数据回测并以夏普、年化收益与最大回撤做评估。
Microcap Snapshot

微盘指数样本快照

读取中...
说明:这里展示的是研究对象的历史数据快照,用来说明风格表现、波动和回撤位置;它不是实盘收益曲线。
样本区间
读取中...
最近快照
读取中...
近一年涨跌
读取中...
相对历史峰值回撤
读取中...
Data Pipeline

从历史数据到网页展示,交易相关内容全部先留在本地。

这条链路的目标是把研究、实盘观察和作品展示分层:底层连接数据源,中间生成可审计信号,网页只读取脱敏结果。

Tushare 历史底仓

抓取 A 股基础信息、日线、每日指标和复权因子,原始数据落到本地 data/local/quant/raw,后续报告与信号产物统一写入 output/quant

QMT 增量更新

QMT 客户端启动后,通过 `xtdata` 拉取最新行情,追加去重到本地数据湖,不把行情库和交易接口暴露到网页。

小市值信号

在 `close < 50` 的约束下按市值排序,输出候选股票池;后续可叠加 ST、停牌、流动性和行业暴露过滤。

网页摘要层

只发布汇总 JSON、候选池摘要、RankIC 曲线和回测图,不发布 token、账户、订单、持仓明细或原始行情文件。

本地原始层
Parquet / CSV

面向研究复现,不进入公开页面。

信号分析层
RankIC + 股票池

用于验证市值、股价等因子的稳定性。

网页展示层
JSON 摘要

只展示状态、曲线、统计和可公开结论。

Workflow

小市值策略研究按这条链路推进

01

定义研究问题

先明确是抓季节效应、风格暴露、择时信号还是回撤控制,而不是先套一个模型名词。

02

整理数据与因子

根据问题搭建股票池、基准、输入特征和标签,先保证数据能解释、能追溯、能重复。

03

建模与策略化

把模型输出转换成买卖规则,必要时加入风控或对冲,让研究结果能进入交易层。

04

回测与展示

用收益、夏普、回撤等指标做评估,并把过程整理成报告、图表和可公开展示的研究证据。

Boundary

这页展示研究摘要,不直接展示实盘收益曲线

原因很简单:交易与账户信息全部留在本地,网页只展示可公开、可复核、可解释的研究证据。

页面展示什么

  • 微盘指数样本区间、近一年涨跌和相对历史峰值回撤。
  • 小市值风格研究模块、策略假设、因子验证和公开数据快照。
  • 本地数据管线结构,以及从原始数据到网页摘要的分层方式。

页面不展示什么

  • 实盘收益曲线、账户净值、持仓明细、订单记录和真实执行日志。
  • Tushare token、QMT 连接配置、原始行情文件和本地交易接口细节。
  • 任何不能公开脱敏、也不适合放到网页层的私有数据。