课程  因子投资  机器学习  Python  Poetry  ppw  tools  programming  Numpy  Pandas  pandas  算法  hdbscan  聚类  选股  Algo  minimum  numpy  algo  FFT  模式识别  配对交易  GBDT  LightGBM  XGBoost  statistics  CDF  KS-Test  monte-carlo  VaR  回测  过拟合  algorithms  machine learning  strategy  python  sklearn  pdf  概率  数学  面试题  量化交易  策略分类  风险管理  Info  interview  career  xgboost  PCA  wavelet  时序事件归因  SHAP  Figures  Behavioral Economics  graduate  arma  garch  人物  职场  Quantopian  figure  Banz  金融行业  买方  卖方  story  量化传奇  rsi  zigzag  穹顶压力  因子  ESG  因子策略  投资  策略  pe  ORB  Xgboost  Alligator  Indicator  factor  alpha101  alpha  技术指标  wave  quant  algorithm  pearson  spearman  tushare  因子分析  Alphalens  涨停板  herd-behaviour  momentum  因子评估  review  SMC  聪明钱  trade  history  indicators  zscore  波动率  强化学习  顶背离  freshman  resources  others  AI  DeepSeek  network  量子计算  金融交易  IBM  weekly  LLT  backtest  backtrader  研报  papers  UBL  quantlib  jupyter-notebook  scikit-learn  pypinyin  qmt  xtquant  blog  static-site  duckdb  工具  colors  free resources  barra  world quant  Alpha  openbb  数据  risk-management  llm  prompt  CANSLIM  Augment  arsenal  copilot  vscode  code  量化数据存储  hdf5  h5py  cursor  augment  trae  Jupyter  jupysql  pyarrow  parquet  数据源  quantstats  实盘  clickhouse  notebook  redis  remote-agent  AI-tools  Moonshot  回测,研报,tushare 

25-股改对量化的影响回测时间是不是越长越好?

25-股改对量化的影响回测时间是不是越长越好?


Table of Content

Flora: 量化好声音,每晚都要听。哈喽大家好,我是 Flora。

Aaron: 大家好,我是 Aaron。今天我们要聊一个有点硬核但很重要的话题 —— 股改对量化数据处理的影响,以及量化回测时间是不是越长越好。不过在聊这些之前,咱们得先搞明白一个基础问题:股改到底是啥?Flora,你给大家科普一下?

Flora: 好啊。股改全称是 “股权分置改革”,简单说就是把中国股市早期存在的 “非流通股” 和 “流通股” 这两种股票分置的状态改成 “全流通”。这里我们先解释一下什么是流通股和非流通股。流通股嘛,顾名思义就是能在二级市场自由买卖的股票,像咱们散户在证券公司开户后买的股票,还有机构投资者在交易所公开交易的股票,都属于流通股,价格随行就市,想买就能买,想卖就能卖。而非流通股主要包括国有股、法人股这些。国有股就是国家持有的股份,比如一些央企、国企上市时,国家手里攥着的那部分股份;法人股则是企业法人或者其他机构持有的股份。这部分股票在股改前是不能在二级市场交易的,只能通过协议转让等特殊方式变更持股,并且转让范围也很有限。

那为什么国有股、法人股这些不能够交易呢?这就得说到当时的背景了。上世纪 90 年代中国股市刚起步时,咱们对资本市场的认识还在摸索阶段,最大的顾虑是怕国有资产流失。你想啊,要是国家持有的股份能随便在市场上卖,万一被低价买走了,不就相当于国有资产缩水了吗?所以当时就规定,上市公司股票里,一部分是能在二级市场交易的流通股,方便融资和散户参与;另一部分是国有股、法人股等非流通股,牢牢握在国家或特定机构手里,不能自由买卖,以此保证国有资产的控制权和安全性。

Aaron: 这么一说就清楚了,相当于用 “分置” 的方式在探索中求稳,既让市场能运转起来,又守住了当时最核心的底线。但正是存在这两种股票状态,“同股不同权、不同价“的问题就很突出了。比如公司开股东大会投票,非流通股股东因为持股比例高,几乎能决定所有大事,流通股股东手里那点股份,投票权基本可以忽略不计。随着市场发展 “不同价”的问题更明显,非流通股当初拿股的成本可能就几块钱,甚至更低,流通股股东却是在二级市场花几十块买的,成本差了好几倍。到了 2000 年后,股市长期低迷,大家意识到了这种分置状态制约了市场发展,所以 2005 年左右,股改就全面推开了。

Flora: 没错,所以进行股改,最核心的目的就是解决前面说的同股不同权问题,让所有股东的利益能真正绑定到一起。

不过呢,这里我有点好奇,股改具体是怎么解决同股不同权问题,又如何让股东利益绑定的呢?

Aaron: 你想啊,股改前,非流通股股东手里的股票不能在二级市场交易,他们的利益更多和公司的净资产、控制权相关,不太在乎股价的涨跌。比如一家公司的国有股股东,可能更看重公司的规模、就业这些,股价涨了跌了对他们影响不大。但流通股股东就不一样了,股价直接关系到他们的收益,股价跌了,他们的资产就缩水了。

Flora: 这么说来,两者的利益驱动完全不同啊。那股改后呢?

Aaron: 股改后,非流通股获得了流通权,这些股东可以在二级市场卖出股票了。这时候,股价的高低就和他们的利益直接挂钩了。股价涨了,他们手里的股票增值,卖出能赚更多钱;股价跌了,他们的资产也会受损。这样一来,不管是原来的非流通股股东还是流通股股东,大家的利益都和股价紧密联系在一起了。

Flora: 原来是这样。那在公司决策方面,股改也能让大家的意见更一致吗?

Aaron: 没错。股改前,非流通股股东因为持股比例高,在公司决策中话语权很大,可能会做出一些有利于自己但损害流通股股东利益的决策。比如高价增发股票,稀释流通股股东的权益,他们自己因为股票不能卖,影响不大。但股改后,他们的股票能流通了,这种损害股价的决策也会损害他们自己的利益,所以在做决策时就会更慎重,会综合考虑所有股东的利益。

Flora: 这么说,股改确实从根本上改变了股东们的利益导向,让大家能朝着同一个方向努力,都是为了让公司发展得更好,股价能上涨。

Aaron: 就是这个道理。而且,股改还有个很关键的操作,就是非流通股股东得给流通股股东一些 “好处”,也就是所谓的 “对价支付”。这就好比你家有个院子,以前另一半一直锁着不让用,现在要打开一起用了,那是不是得给一直用着前院的人点补偿?

Flora: 那为啥非要给这个补偿呢?

Aaron: 你想啊,以前大家都知道那些非流通股早晚要解禁流通,就像知道未来会有一大批同类商品涌入市场,现在的价格肯定会被压低一块,这就是所谓的 “预期折价”。流通股股东买股票的时候,其实已经默默承受了这个潜在的损失。所以股改时,非流通股股东送点股票、分点现金啥的,就相当于把这部分预期损失补上了。

Flora: 哦,这么说就明白了。就好比买东西时,商家说以后会降价,现在先给点优惠券补偿一下,大家心里就平衡了。

Aaron: 对喽。这样一来,双方的利益起点就公平多了。以前可能流通股股东总觉得自己亏了,非流通股股东觉得理所当然,现在补偿到位,大家没了心结,往后公司要融资、要扩张,股东们才能真心实意地一起商量,劲往一处使。

Flora: 听你这么一说,就清楚多了。股改通过让非流通股流通,把所有股东的利益都和股价绑在了一起,从而解决了同股不同权带来的利益分歧。

Aaron: 对,这就是股改在这方面的关键作用。而且,当时很多优质企业因为股权结构问题没法很好地利用资本市场融资发展,股改也是为了完善资本市场功能,让股市能更好地服务于企业和经济发展。

Flora: 这么说的话,股改也是为了提高市场的有效性吧?毕竟如果股价不能真实反映公司价值,投资者也很难做出正确决策。

Aaron: 没错。股改能让股价更准确地反映公司的经营状况和市场预期,吸引更多长期资金进入,促进市场的健康发展。同时,也是为了和国际成熟市场接轨,当时咱们股市要发展,就得解决这种特有的股权分置问题,提升在国际市场的竞争力。

Flora: 所以股改确实是很有必要的。那股改的过程具体是怎样的呢?是把非流通股直接变成流通股就行?

Aaron: 没那么简单。核心是 “对价支付”。非流通股要获得流通权,得向流通股股东支付补偿,比如送股、派现、转增股份啥的。比如某公司可能每 10 股送 3 股,流通股股东拿到补偿后,非流通股就逐步解禁流通了。整个过程从 2005 年开始,到 2007 年左右基本完成,上千家上市公司都参与了。

Flora: 听起来是个大工程。那股改对二级市场交易有啥直接影响呢?我记得那几年股市好像挺热闹的。

Aaron: 影响可太大了。最直接的是解决了同股不同权的问题,让所有股东利益绑定,股价更能反映公司价值。另外,非流通股逐步解禁后,市场供给增加了,流动性也变好了。还有个很重要的点是,股改后并购重组更活跃了,因为股权可以自由转让了。你觉得对普通投资者来说,感知最明显的是什么?

Flora: 我觉得是市场逻辑的变化吧。以前非流通股占比高,股价可能被炒作得脱离公司基本面;股改后,机构投资者更看重公司业绩,价值投资的理念慢慢起来了。不过刚开始的时候,大家也担心解禁潮会打压股价,所以股改初期市场还有点波动。

Aaron: 没错,短期确实有解禁压力,但长期来看,股改让 A 股更市场化了,为后来的融资、退市等制度改革打下了基础。聊到这,咱们该切入正题了 —— 股改对量化数据处理有啥影响?量化交易很依赖历史数据,股改会不会让数据 “断层”?

Flora: 这确实是个大问题。比如股改前的非流通股不算在流通盘里,而股改后流通盘变大了,那量化模型里的 “市值”“换手率” 这些指标的计算方式就得调整。如果直接用原始数据回测,可能会出错。Aaron,你接触过的量化模型里,有没有因为股改数据处理不当导致回测失效的案例?

Aaron: 太多了。比如有些模型用 “流通市值” 来选股,股改前的流通市值和股改后的计算口径完全不同,如果不做复权或调整,回测结果会失真。还有送股、转增这些对价支付,会导致股价除权,历史价格数据必须复权处理才能反映真实走势。另外,股改前后公司的股权结构变化,可能影响因子的有效性,比如 “股权集中度” 这个因子,股改前后的含义都不一样了。

Flora: 那量化团队是怎么解决这些问题的呢?是不是要对历史数据做大量清洗?

Aaron: 对,必须做数据标准化。比如统一流通盘的计算口径,用后复权价格还原股价走势,甚至对股改前后的因子进行分段测试,看看因子有效性有没有突变。有些团队还会把股改作为一个 “事件节点”,在模型里加入事件驱动的调整逻辑。

Flora: 说到这里,就引出另一个问题了:量化回测时间是不是越长越好?有人觉得回测时间越长,模型越稳健,但股改这种大事件会让历史数据的 “可比性” 下降,那太长的回测反而可能有问题吧?

Aaron: 这是个经典争论。我的观点是 “不是越长越好,而是越有效越好”。比如回测时间包含股改前的话,必须确保数据经过正确调整,否则 10 年的回测可能不如 5 年的有效。另外,市场结构在变,股改后 A 股的投资者结构、交易规则都和以前不同,太老的数据可能不反映当前市场特征。Flora,你觉得多长的回测周期比较合适?

Flora: 我觉得得结合策略类型。比如高频交易策略,可能回测 1-2 年就够了,因为市场短期波动特征相对稳定;但中长期策略,可能需要覆盖一个完整的牛熊周期,比如 5-10 年,但必须剔除股改等重大事件导致的数据断层期,或者单独处理。

Aaron: 而且还要看因子的生命周期。有些因子在股改前很有效,股改后可能就失效了,比如依赖 “壳资源” 的因子,股改后随着退市制度完善,壳价值下降,这种因子就不能用太久的历史数据回测。

Flora: 所以总结下来,股改让量化数据处理的复杂度大幅提升,但也推动了量化团队更注重数据质量和逻辑严谨性。而回测时间的选择,关键不在于长短,而在于数据的一致性和市场环境的相似性。

Aaron: 没错。最后想跟大家说的是,量化交易的核心是 “拟合规律”,但市场规律会因制度变革而变化,股改就是一个典型案例。对历史数据保持敬畏,同时灵活调整模型,才能让量化策略在不断变化的市场中存活下来。

Flora: 今天的话题就聊到这里,感谢大家的收听,我们下期再见!

Aaron: 再见!