机构散户交易识别:算法指纹与动量反转
两大券商研报揭露A股市场惊人秘密!国泰君安用傅里叶变换『透视』机构算法交易,如同基因检测般精准识别大资金动向;东吴证券发现散户与机构的交易占比竟能预测股价反转!当传统动量因子失效,新的量化武器悄然崛起。机构的每一笔算法单都在高频数据中留下『指纹』,而散户的羊群效应正被精确量化。这场看不见的博弈中,谁掌握了交易者结构的密码,谁就握住了市场的脉搏。
Table of Content
Flora: 量化好声音,每晚都要听~,Hello大家好,我是Flora
Aaron: 我是Aaron,欢迎收听今天的播客
Aaron: Flora,咱们今天的任务繁重啊
Flora: 哦,怎么说呢?
Aaron: 我们上一期的播客提到了可以从高频数据中识别养老金在交易
Aaron: 有位同学听了之后比较好奇,
Aaron: 就加入我们群,提了一个问题,怎么识别哪些交易是养老基金的操作?
Flora: 这个题目有点大啊
Aaron: 对,投资者ID识别没有那么容易,并且还需要一些特别的数据,比如机构席位数据
Aaron: 没有这些数据,是无法最终知道某一笔交易是由谁发起的。
Flora: 但是,即使不能最终确定投资者身份,只要能像人工智能转录会议记录一样,把各个说话人识别出来,也非常有用。这方面有相关的研究吗?
Aaron: 对,今天我们将介绍国泰君安的<利用高频数据监测机构动向>
Aaron: 以及东吴证券的<交易者结构对动量因子的改进>
Aaron: 这两篇研报不仅对投资人ID识别进行了探索
Aaron: 而且进一步探讨了如何利用识别出来的身份,构建更好的策略
Flora: 这听起来就很有意思
Flora: 那我们直接切入正题
Flora: 来拆拆这些背后的逻辑吧
Aaron: 好的,那我们先聊国泰君安的这份研报
Aaron: 它关注的是 “算法交易”
Aaron: 认为机构更爱用高频、定时的算法交易
Aaron: 比如把大单拆成小单定时成交
Aaron: 而散户更多是低频、随机的交易
Aaron: 那怎么把这两种交易区分开呢?
Aaron: 他们用了个信号处理的工具,也就是傅里叶变换
Flora: 傅里叶变换?这个我知道
Flora: 简单来说,傅里叶变换能把交易数据从 “时间维度” 转到 “频率维度”
Aaron: 是的!这里的关键发现就是:机构爱用高频、定时的算法交易
Aaron: 比如把大单拆成小单,每隔固定时间成交
Aaron: 这种规律性会在频域里形成明显的 “峰值”
Aaron: 而散户交易频率低、随机性强,频域里就很难有突出的峰值
Aaron: 所以,找到这些高频峰值,就像抓住了机构交易的 “指纹”。
Flora: 哎,我越听越觉得
Flora: 这跟我以前做植物基因序列分析的研究有点类似。
Flora: 以前在研究植物抗病基因时
Flora: 我们常常会用拟南芥的某个已知抗病基因结构域作为 “种子序列”
Flora: 通过 BLAST 比对,在其他植物的基因组里找相似序列
Flora: 如果发现了高相似度的片段
Flora: 就可能是功能类似的同源基因
Flora: 这和傅里叶变换的思路简直异曲同工
Flora: 拟南芥的抗病基因结构域
Flora: 就像机构算法交易的 “高频峰值特征”
Flora: BLAST 比对工具
Flora: 就像傅里叶变换
Flora: 而庞大的基因组数据
Flora: 就像咱们的高频交易数据
Flora: 本质上都是从复杂数据中
Flora: 用已知特征去定位目标信息
Aaron: 非常形象!或者说我们也可以把交易者身份识别看成是声纹识别
Aaron: 毕竟声音跟金融数据一样,也是一种典型的时间序列。
Flora: 对,我最近在看Ernest P Chan的《量化交易:如何建立自己的算法交易业务》这本书,就发现Ernest P Chan在转入量化之前,是在IBM做语音识别。
Flora: 对,所以,这种跨学科的背景应该对他转入量化帮助很大。
Flora: 那研报中,他们找到机构交易的指纹之后,又是怎么用的?
Aaron: 那研究员们通过找这些峰值,最终构造了三个特征,即
Aaron: B+S(买卖单峰值总和,反映机构整体活跃度)
Aaron: B-S(买卖单峰值差)和
Aaron: B/S(买卖单峰值比,反映交易方向)
Flora: 那这些特征和股价有啥关系?
Aaron: 这篇研报最终得出的结论是这样的
Aaron: 那就是:机构越活跃(B+S 越高),中短期股价越容易跌
Aaron: 而机构交易的方向(B/S)和股价变动是一致的
Aaron: 比如买的峰值比卖的高,股价更可能涨
Flora: 好,这是第一份研报,第二份研报是?
Aaron: 接下来我们就聊一聊东吴证券的这篇报告
Aaron: 它的核心是想解决什么问题呢
Aaron: 他们研究了交易者结构是如何影响动量因子的表现
Aaron: 这个其实要从动量因子的一个背景说起
Flora: 动量因子?
Aaron: 对的,其实在量化投资领域
Aaron: 动量因子是一个非常经典的选股因子
Aaron: 但是一般认为,它在A股市场
Aaron: 却表现出了非常明显的
Aaron: 中长期的反转
Aaron: 而且这个反转效应还是不太稳定的
Flora: 怎么理解这个中长期反转?
Aaron: 动量因子作为经典的选股工具
Aaron: 其核心逻辑是历史收益趋势的延续性
Aaron: 即 “强者恒强”
Aaron: 这在美股等成熟市场得到了广泛验证
Aaron: 然而,这一因子在 A 股市场却呈现出显著的中长期反转特征
Aaron: 即过去表现好的股票在长期反而表现不佳
Aaron: 而过去表现差的股票可能出现反弹
Aaron: 这种现象的形成与 A 股市场的特殊结构、投资者行为及制度环境密切相关
Aaron: 今天时间原因我们就不铺展开讲啦
Flora: 好的,大致明白啦,那我们继续
Aaron: 好的,那东吴证券的这篇研报呢
Aaron: 就是把成交量按照交易者的类型
Aaron: 做了一个更细致的划分
Aaron: 他们先是把交易者
Aaron: 按照它的挂单金额的大小
Aaron: 分成了机构、大户、中户和散户
Aaron: 这四大类
Aaron: 然后呢去统计了一下
Aaron: 它从10年到23年
Aaron: 这整个的A股市场的交易数据
Aaron: 他们就发现啊
Aaron: 中户和散户
Aaron: 他们的交易占比是非常高的
Aaron: 两者加起来平均能占到70%以上
Aaron: 所以这就直接决定了
Aaron: 这个市场的基本的交易特征
Flora: 听起来好像这个中户和散户,他们的这个主导地位还挺强的
Aaron: 对,然后更有意思的是
Aaron: 通过将资产按照某一类投资者的交易占比,从低到高排序
Aaron: 然后分成五组去考察每一组的这个局部的因子的表现
Aaron: 就发现 大单的交易占比越高
Aaron: 这个动量因子的反转效应就越强
Aaron: 而小单的交易者
Aaron: 比如说散户和中户
Aaron: 他们的占比越低的话
Aaron: 这个反转效应同样也是越强的
Aaron: 对,而且更有意思的是
Aaron: 这个散户和机构的这个交易占比
Aaron: 它对于这个涨跌幅因子的区分能力是最强的
Aaron: 就是你可以看到一个非常明显的
Aaron: 从反转到动量的一个变化的趋势
Flora: 那我们能不能基于这个交易者的结构
Aaron: 构造出一个新的动量因子
Flora: 并且这个新的因子会有更好的选择标的能力呢
Aaron: 当然可以啊
Aaron: 他们还是以这个散户的交易占比为例
Aaron: 去提取出信息最强的那个部分
Aaron: 然后构造了一个新的因子
Aaron: 回测下来发现这个新的因子
Aaron: 它的月度的IC均值可以达到-0.051
Aaron: 年化收益可以达到23.23%
Aaron: 而且它的这个月度的胜率也非常的高
Aaron: 达到了72.46%
Aaron: 就是它的表现各个方面
Aaron: 都远远的超过了传统的动量因子
Flora: 哇 听起来这个新的因子真的很厉害
Flora: 那它跟其他的风格因子
Flora: 有没有什么比较特别的关系
Aaron: 研报也做了分析
Aaron: 就是这个新的因子
Aaron: 它跟常见的Barra风格因子的相关性
Aaron: 都是非常低的
Aaron: 然后我们甚至可以通过回归的方法
Aaron: 去剔除掉市场的风格和行业的影响
Aaron: 得到一个更纯净的新因子
Aaron: 那这个因子的表现也是非常好的
Aaron: 就是它可以进一步的
Aaron: 去提高这个选择标的的精度和稳定性
Flora: 好的,那我来总结一下东吴这篇研报的核心内容啊。
Flora: 它呢是把交易者按挂单金额分成了机构、大户、中户、散户,
Flora: 发现不同群体的交易占比
Flora: 会显著影响股价的动量或反转效应
Flora: 比如机构、大户这类 “大单交易者” 占比越高,股价反转效应越强;
Flora: 而散户占比越高,动量效应越明显。
Flora: 最后,研报还基于散户交易占比,构造了新的动量因子,效果呢比传统因子好不少。
Flora: 听到这,感觉和国泰君安的研究能对上了
Flora: Aaron麻烦你帮我们捋捋这两者的 “默契”吧
Aaron: 好勒!首先第一点,这两篇研报啊都抓住了 “机构和散户交易行为的本质差异”
Aaron: 东吴证券是按 “金额大小” 分群体,国泰君安是按 “交易频率” 分类型
Aaron: 前者看 “谁在交易”,后者看 “交易方式”,
Aaron: 但最终都指向了同一个核心
Aaron: 机构和散户的交易逻辑不同,对股价的影响也不同
Flora: 嗯嗯,确实是这样的
Aaron: 对的,那第二点呢,他们都发现 “机构交易占比高时,股价更容易反转”
Flora: 这个还挺好理解的
Flora: 东吴证券说机构、大户占比高,反转效应强
Flora: 国泰君安说机构算法交易活跃(B+S 高),中短期股价会跌
Flora: 这不就是 “机构交易密集时,股价容易回调” 的两种表述吗?
Flora: 背后可能的逻辑是:机构交易量大、容易短期推高股价,之后获利了结导致反转
Flora: 而散户交易占比高时,更可能延续原来的趋势,也就是动量效应
Aaron: 哎!Flora,你的进步很大嘛!概括的很好!为你点赞!
Aaron: 那第三呢,我们说,这两篇研报啊,都为量化投资提供了 “细分数据” 的新思路。
Flora: 哦,此话怎讲呢?
Aaron: 东吴证券通过拆分交易者结构改进了动量因子
Aaron: 国泰君安通过高频算法交易特征预测收益
Aaron: 本质上都是跳出 “整体交易数据”,去挖 “结构性信息”
Aaron: 这告诉我们,市场不是铁板一块,把交易拆开来看,才能抓到更精准的信号。
Aaron: 当然,两者的方法也有区别
Aaron: 东吴证券更偏向 “截面分类”
Aaron: 比如把股票按散户占比分成几组,看不同组的动量表现
Aaron: 那国泰君安就是 “时序 + 频率分析”
Aaron: 用傅里叶变换从高频数据里扒机构的痕迹咯
Flora: 嗯!这么看,他们一个像 “给交易群体贴标签”
Flora: 一个像 “给交易行为拍 X 光”
Flora: 但最终,殊途同归!
Flora: Aaron,那这些研究对咱们实际投资都有啥用呢?
Aaron: 我认为啊,至少有两个启示
Aaron: 一是别只看股价涨跌
Aaron: 得琢磨琢磨到底是谁在买、谁在卖
Aaron: 机构和散户的脚印中啊,藏着未来的趋势
Aaron: 二是传统的动量、涨跌因子不够用了
Aaron: 结合交易者结构或高频特征,能让策略更精准
Aaron: 比如今天提到的东吴证券的新动量因子
Aaron: 和国泰君安的 B/S 特征能辅助判断机构方向
Aaron: 都是很好的例子
Flora: 最后也得提一句风险
Flora: 两篇研报都强调 “历史数据不代表未来”
Flora: 市场结构在变
Flora: 机构和散户的交易习惯也可能调整
Flora: 所以这些因子得动态跟踪
Flora: 啊!今天也是收获满满的一天啊!
Flora: 总结一下,无论是按交易者结构拆分
Flora: 还是用傅里叶变换抓高频算法单
Flora: 核心都是在 “读懂市场参与者的心思”
Flora: 下次咱们可以再聊聊
Flora: 这些方法能不能结合起来用
Flora: 比如既看机构的交易金额
Flora: 又看他们的交易频率
Flora: 会不会挖出更厉害的信号?
Aaron: 好的,如果大家对我们的播客内容感兴趣,欢迎订阅「量化好声音」
Aaron: 此外呢,我们的微信公众号:量化风云
Aaron: 也提供了非常多与量化相关的干货
Aaron: 欢迎关注哦!
Flora: 那我们下期再见啦!
Flora: 咱们下期再见~