笔趣阁 > 股海弄潮 > 第238章:确立研究范式

第238章:确立研究范式


实验室墙上的工作流程

2010年5月10日,星期一,上午九点整。

车公庙,三十平米的办公室里,所有人到齐了。

陈默站在那块白板前,手里拿着一支新买的马克笔。旁边,周寻靠墙站着,陆方坐在电脑前,小林、小吴、王涛挤在剩下的座位上。赵姐坐在角落,手里拿着本子,准备记录。

白板上还留着昨天讨论时画的那些图——低PE因子的回测曲线、多因子框架的草图、周寻写的那些分段表现数字。

但陈默今天要讲的,不是这些。

他拿起板擦,开始擦。

从左边擦到右边,从上边擦到下边。

曲线消失了,数字消失了,框架图消失了。

白板重新变得一片空白。

他转过身,看着那六个人。

“过去两周,我们做了一件事。”他说,“测了一个因子。”

他顿了顿:

“结果,你们都看到了。不怎么样。”

没有人说话。

“但这不意味着我们白干了。”陈默继续说,“这次失败,让我们明白了一件事——”

他在白板上写下几个字:

不能瞎测

“如果我们继续这样,今天测PE,明天测PB,后天测PS。测完一百个因子,可能还是不知道自己在干什么。”

他放下笔,看着周寻:

“周寻,你来。”

周寻走到白板前。

他从口袋里掏出一张折得整整齐齐的A4纸,展开,贴在白板上。

那是一张手绘的流程图,用黑色签字笔画得密密麻麻,但每个方框、每个箭头都清清楚楚。

标题只有一行字:

“默石量化研究标准流程”

周寻转过身,指着那张图:

“从今天开始,我们所有的因子研究、策略开发,必须走完这四步。”

他指着第一个方框:

“第一步:提出假设”

“不是随便找个指标跑一跑。是先问自己一个问题:为什么这个因子应该能赚钱?背后的经济逻辑是什么?是人性的弱点?是市场结构的缺陷?还是制度的套利机会?”

他顿了顿:

“没有逻辑支撑的因子,哪怕回测再漂亮,也不值得信。”

小林举手:“周老师,那如果逻辑很完美,但回测不行呢?”

周寻看着他:

“那就说明,要么逻辑是错的,要么市场的反应方式和你想的不一样。这个因子,该扔就扔。”

小林点头。

周寻指向第二个方框:

“第二步:回测检验”

“用严格的历史数据模拟交易。必须考虑交易成本、冲击成本、滑点。不能用收盘价买卖——那是自欺欺人。”

他看着陆方:

“陆方,你来说说,我们现在回测的假设条件是什么?”

陆方站起来,走到电脑前,调出一段代码:

“目前回测框架默认的假设是:按当日收盘价成交,双边佣金千分之二,印花税千分之一,滑点千分之一。对于流动性差的股票,我们还会额外加一个‘流动性惩罚系数’——市值越小,惩罚越大。”

他顿了顿:

“这个设置,比市面上的回测软件都严格。”

周寻点头:

“宁愿严格,不能宽松。一个在严苛条件下还能赚钱的策略,才是真的策略。”

他指向第三个方框:

“第三步:统计分析”

“回测跑完之后,不是看一眼年化收益就完了。要算夏普比率、最大回撤、卡玛比率、胜率、盈亏比。要画净值曲线,看它是不是平稳。要分时段看表现——牛市怎么样,熊市怎么样,震荡市怎么样。”

他指着第四个方框:

“第四步:归因分析”

“也是最容易被忽视的一步。要问自己:这个策略赚的钱,到底是从哪里来的?是来自市场的涨跌——那是贝塔,不是阿尔法。是来自某个因子的暴露——那是因子收益,不是选股能力。还是真的来自我们自己的独特洞察?”

他放下手,看着所有人:

“走完这四步,一个策略才能进入候选名单。走不完,或者走不通,那就说明这个策略还不够成熟,继续改进,或者直接放弃。”

房间里安静了几秒。

小林举手:“周老师,那如果一个策略回测很好,但走完这四步发现,它赚的钱全是来自小市值因子——这种算合格吗?”

周寻看着他,眼睛里有一丝赞许:

“问得好。”

他走到白板前,在“归因分析”下面加了一行小字:

“必须剥离贝塔和已知因子,才能算真正的阿尔法。”

他转过身:

“如果一个策略赚的钱,全是靠小市值、低估值这些烂大街的因子,那它没有独立存在的价值。我们要找的,是那些在这些因子之外,还能创造超额收益的东西。”

小林点头,在本子上飞快地记着。

陈默一直站在旁边,没有说话。

等周寻讲完,他才开口:

“还有一条。”

他走到白板前,在那四步流程的旁边,写下一行大字:

“严禁根据近期市场表现倒推”

他放下笔,看着所有人:

“什么叫‘倒推’?就是看到最近某个板块涨得好,就去编一个因子来解释它。比如新能源涨了,就编一个‘新能源因子’。创业板涨了,就编一个‘创业板因子’。”

他顿了顿:

“这种因子,十有八九是过拟合的。它们在历史上可能根本没有意义,只是恰好拟合了最近几个月的行情。一旦风格切换,第一个死的就是它们。”

他看着周寻:

“这个叫什么来着?”

周寻说:

“数据窥探偏差。Data  Snooping  Bias。”

陈默点头:

“对,就是这个。我们做研究,不能用‘后视镜’去看问题。必须回到过去,站在当时的信息条件下,模拟真实的决策过程。”

他指着墙上那张流程图:

“所以,这四个步骤,必须严格按顺序来。先有假设,再回测验证。不准先看到好结果,再回头编故事。”

他扫视一圈:

“能做到吗?”

没有人说话。

但每个人都点了点头。

---

上午十点,流程讨论进入细节。

小林举手:“陈总,您说的那个‘数据窥探’,如果我们在研究过程中,看到一些有意思的规律,能不能反过来去想背后的逻辑?”

陈默看向周寻。

周寻想了想:

“可以。但要分两步走。”

他走到白板前,画了一条时间轴:

“假设你观察到,过去三个月,某类股票表现特别好。你可以去想,这是什么原因?然后提出一个假设——比如,可能是财报超预期的股票在季报后有持续动量。”

他指着时间轴上的“观察点”:

“这个观察,可以作为假设的来源。但验证这个假设,不能用观察到的这段数据。必须用观察点之前的数据做训练,观察点之后的数据做验证。”

他顿了顿:

“这叫‘样本外测试’。如果观察点之后的表现和观察期内一致,那这个假设才值得信。”

小林在本子上飞快地记着。

小吴忽然举手:

“周老师,那如果我们跑了很多因子,发现其中几个表现特别好——这算不算数据窥探?”

周寻看着她:

“算。而且是很典型的一种。”

他走到白板前,画了一个新图:

因子A  因子B  因子C  因子D  因子E

回测1  好  差  好  差  差

回测2  差  好  好  差  好

回测3  好  差  差  好  好

“如果你测了一百个因子,然后挑出表现最好的五个——这五个,大概率是运气。因为在随机数据里,总会有一批因子表现特别好,哪怕它们毫无意义。”

他看着小吴:

“这叫‘多重测试偏差’。测的因子越多,偶然发现好结果的概率越大。所以,我们必须用‘样本外测试’来验证——选出来的因子,必须在没见过的数据上重新跑一遍,才能证明它不是运气。”

小吴点头。

陈默听着这些,忽然想起什么。

“周寻,”他问,“你说的这些,在学术界有标准做法吗?”

周寻点头:

“有。一般会把历史数据分成三部分:训练集、验证集、测试集。”

他走到白板前,画了一个新图:

```

历史数据

├──  训练集  (60%):  用来开发策略、调整参数

├──  验证集  (20%):  用来验证策略稳定性、防止过拟合

└──  测试集  (20%):  只在最后用一次,评估真实表现

```

“训练集可以反复用,不断优化。验证集可以偶尔用,检查策略是否过拟合。测试集——只能跑一次,跑完就不能再改。这个结果,才是真正有说服力的。”

他看着陈默:

“我们现在的数据只有五年,分三段的话,每段太短了。但至少,我们可以留出最后一年做‘样本外测试’。”

陈默想了想:

“那就从2009年1月到现在,作为样本外。2005到2008年,作为样本内。所有因子开发,只能用2008年底之前的数据。2009年以后的数据,谁也不许碰。”

他看着所有人:

“这是纪律。”

没有人说话。

但每个人的表情,都比刚才更认真了。

---

中午十二点,流程讨论暂告一段落。

陈默让赵姐去楼下买盒饭,自己站在白板前,看着那张流程图。

周寻走到他身边。

“陈总,”他说,“您刚才说的那些,比我想象的更细。”

陈默看着他:

“细吗?我觉得还远远不够。”

他指着那张图:

“假设、回测、分析、归因——这只是框架。里面还有无数细节:数据怎么清洗,参数怎么调,过拟合怎么防,因子怎么组合……每一步,都可能踩坑。”

他顿了顿:

“但如果不先把框架立起来,那些坑,我们一个也躲不过。”

周寻点头。

两人沉默了几秒。

“周寻,”陈默忽然问,“你在华尔街的时候,这些流程,是必须遵守的吗?”

周寻想了想:

“理论上,是。但实际上,很多人不守。”

“为什么?”

“因为压力。”周寻说,“老板要业绩,客户要收益,市场不等人。有时候看到最近某个策略赚钱,谁都想赶紧上,哪管什么样本外测试。”

他顿了顿:

“我也是因为这个,栽过跟头。”

陈默看着他。

周寻没有细说。

但他懂那种感觉——在压力面前,纪律是第一个被牺牲的东西。

“那我们,”陈默说,“就从一开始,把纪律刻进去。”

他看着墙上那张图:

“不管以后规模多大,不管市场多疯狂,不管客户多急——这个流程,不能破。”

周寻没有说话。

但他点了点头。

---

下午两点,赵姐买回来一块新的白板。

原来的那块太小了,写不了太多东西。

新白板一米五宽,一米高,钉在进门左手边的墙上。

陈默拿起马克笔,把那四个步骤,一字一字抄上去:

默石量化研究标准流程

第一步:提出假设

·  基于经济逻辑或市场观察

·  必须有可验证的因果链

·  严禁“先看结果后编故事”

第二步:回测检验

·  考虑交易成本、冲击成本、滑点

·  使用严格的历史数据

·  不得用收盘价模拟买卖

第三步:统计分析

·  计算关键绩效指标(年化收益、夏普、最大回撤等)

·  分时段分析(牛市/熊市/震荡市)

·  评估稳定性和一致性

第四步:归因分析

·  剥离贝塔(市场涨跌)

·  剥离已知因子(规模、估值、动量等)

·  确认真正的阿尔法来源

特别规定

·  样本外测试:任何策略必须经过至少一年的样本外数据验证

·  数据窥探禁止:严禁根据近期表现调整参数或筛选因子

·  多重测试惩罚:每测试100个因子,显著性阈值需相应提高

抄完最后一个字,他退后一步,看着这块白板。

白花花的底,黑色的字,工工整整。

像一道刚立下的军令状。

小林凑过来看,念出声:

“数据窥探禁止……多重测试惩罚……”

他转过头,看着陈默:

“陈总,这个会不会太严了?”

陈默看着他:

“你觉得严?”

小林想了想:

“有点。万一我们跑了几百个因子,一个都通不过怎么办?”

陈默没有立刻回答。

他走到窗边,看着窗外车公庙的街道。

“那就通不过。”他说,“总比跑出几个假的好因子,然后实盘亏钱强。”

他转过身:

“小林,你要记住一件事——在这个行当,活得久,比跑得快重要一万倍。”

小林沉默了几秒,然后点头。

---

傍晚六点,其他人陆续下班了。

陈默还站在那块白板前。

沈清如从外面回来,推门进来,看见他一个人站在那里。

“还在看?”她问。

“嗯。”陈默说,“在看这面墙。”

沈清如走到他身边,和他并肩站着。

“写得好。”她说。

“不是写得好。”陈默摇头,“是……把以前没有的东西,立起来了。”

他顿了顿:

“以前我们做研究,靠的是感觉。觉得这个公司好,就买。觉得那个行业有前途,就重仓。没有流程,没有纪律,没有检验。”

他指着墙上那四步:

“现在有了。”

沈清如没有说话。

她只是轻轻握住他的手。

两人站在那块白板前,看着那些字。

窗外,车公庙的夜色渐浓。

远处,深南大道上的车流开始亮起灯光。

这间三十平米的办公室里,只有两个人,和一面墙。

但那面墙上,有一个流程。

一个能让他们从“感觉”走向“科学”的流程。

一个能让他们在下一次风暴来临时,不至于再次全军覆没的流程。

陈默忽然想起老陆笔记本上的那句话:

“所有伟大的投资者,最终都是哲学家。因为他们交易的不仅是股票,是对世界的理解,对人性的洞察,对时间的敬畏。”

也许,他们离“伟大”还很远。

但至少,他们开始学会敬畏了。


  (https://www.95ebook.com/bi/291128/36124197.html)


1秒记住笔趣阁:www.95ebook.com。手机版阅读网址:m.95ebook.com