课程  因子投资  机器学习  Python  Poetry  ppw  tools  programming  Numpy  Pandas  pandas  算法  hdbscan  聚类  选股  Algo  minimum  numpy  algo  FFT  模式识别  配对交易  GBDT  LightGBM  XGBoost  statistics  CDF  KS-Test  monte-carlo  VaR  回测  过拟合  algorithms  machine learning  strategy  python  sklearn  pdf  概率  数学  面试题  量化交易  策略分类  风险管理  Info  interview  career  xgboost  PCA  wavelet  时序事件归因  SHAP  Figures  Behavioral Economics  graduate  arma  garch  人物  职场  Quantopian  figure  Banz  story  量化传奇  rsi  zigzag  穹顶压力  因子  pe  ORB  策略  Xgboost  Alligator  Indicator  factor  alpha101  alpha  技术指标  wave  quant  algorithm  pearson  spearman  tushare  因子分析  Alphalens  涨停板  herd-behaviour  因子策略  momentum  因子评估  review  SMC  聪明钱  trade  history  indicators  zscore  波动率  强化学习  顶背离  freshman  resources  others  AI  DeepSeek  network  量子计算  金融交易  IBM  weekly  LLT  backtest  backtrader  研报  papers  UBL  quantlib  jupyter-notebook  scikit-learn  pypinyin  qmt  xtquant  blog  static-site  duckdb  工具  colors  free resources  barra  world quant  Alpha  openbb  数据  risk-management  llm  prompt  CANSLIM  Augment  arsenal  copilot  vscode  code  量化数据存储  hdf5  h5py  cursor  augment  trae  Jupyter  jupysql  pyarrow  parquet  数据源  quantstats  实盘  clickhouse  notebook  redis  remote-agent  AI-tools  Moonshot  回测,研报,tushare 

【10月14日】 量化新因子怎么挖?verition的一则招聘泄露天机


Table of Content

常常有人问,挖不到新因子,怎么办?其实,我们可以从招聘信息中,一窥一流基金公司现在的方向。

Verition 是一家实力较强的量化基金,总部在康涅狄格州格林威治,在全球多个金融重镇设有办公室,包括纽约、伦敦、迪拜、新加坡和香港等地。最近,他们正在招聘的一个量化分析师岗位,显示了业界领先的基金公司在因子挖掘方面的一种动向。

这个岗位的要求是这样的:

  1. 收集、清理和组织来自多个来源的大型数据集,包括船舶跟踪系统、炼油厂生产报告和市场数据提供商。
  2. 建立和维护数据管道,以确保准确及时地向交易台传递信息。
  3. 开发量化模型和工具来识别交易机会和风险。
  4. 创建仪表板和可视化效果,以便有效地向交易员、分析师和管理层传达见解。
  5. 与交易、风险和运营团队合作设计和实施数据驱动的解决方案。
  6. 探索自动化手动流程和简化数据工作流程的机会

如果你对此感兴趣,这个职位可以在这里投递。不过,我最感兴趣的是,这个职位透露出什么样的策略研究的动向?

JD 的第一项我们最感兴趣。我问了问 GPT,Verition 为何要招这个岗位? 这个岗位有哪些研究方向?这是 GPT 给出的分析。

Verition 为何时要招这个岗位? 因为汽油/柴油等成品油价格强烈受航运、炼厂产量和库存影响,招聘此岗能把 AIS、炼厂报告等替代数据转成可交易的短期/中期因子。

这个岗位有哪些研究方向? 从数据源来看,主要处理船舶跟踪(AIS)、炼油厂与产量数据、市场基本面与成交数据及卫星与替代数据;从因子生成来看,可以构建出供给偏差类、流动性/拥堵类、价差/加工类、先导指标/传导类、图/网络因子。

在 AIS 数据中主要有以下数据: 1. 航次流量(port-to-port flow volumes):口岸间净流入/流出变化可预示区域库存或需求。 2. 船速与滞留异常(speed/loitering anomaly):突然减速或在附近长驻可能表示装卸拥堵、偷油、罐区卸货延迟。 3. ETA 偏差与早到/延迟率:预期到港时间偏离上游预告,影响短期供给预期。 4. 船型/载重结构变化(油轮 vs 成品油船):揭示货物从原油到成品油的运输链变化。

在烧油厂与产量数据中,主要有以下数据: 1. 产量冲击(refinery throughput surprise):实际产量与市场一致预期差异。 2. 配套产出比(gasoline/diesel/jet yields):产品切换(crack spread)信号。 3. 计划检修与突发停产:对供给中断的短期Alpha非常敏感。

相对于市场基本面与成交数据,上述数据基本上是一手数据,需要通过一定的技术手段才能获取。比如,用卫星光学/红外验证 AIS 轨迹和装卸活动(防止遮蔽/欺骗),提高对库存的“真实观察”能力。同时,这些数据的总量很大,所以,在数据处理能力上,这个岗位也特别提到了云计算相关技术,比如 Snowflake, Databricks 平台等,要求有使用实时或者高频数据源的经验和技能。