← 返回索引 · 2026-02-08 · 0005

构建精准、高速的撮合引擎回测系统：从历史数据回放到策略验证（摘要）

承接页（交易系统解决方案）：https://technologynova.org/solution/

TL;DR

工业级回测的本质是一个确定性的离散事件模拟（DES）：所有逻辑以事件时间推进，靠最小堆事件队列按因果顺序驱动，才能从根上避免“未来函数 / look-ahead bias”。
回测里要跑的不是“简化模型”，而是生产撮合的状态机副本：同一输入事件序列，必须得到同一订单簿状态与成交输出（可复现、可对账）。
两大地雷：行情乱序/重复/丢包（必须用交易所序列号清洗重建确定性事件流）以及同时间戳事件的次级排序（否则两次回测可能跑出不同结果）。
性能上别幻想“多线程事件循环”：确定性通常要求核心循环单线程；吞吐靠数据列式存储 + 异步预取 + 缓冲、以及对订单簿/内存布局的极致优化；真正的并行来自任务级并行（多参数、多策略网格）。

1. 为什么很多回测会“看起来赚钱、实盘送钱”

核心心智模型

市场状态只在“事件”发生时改变：新单、撤单、成交、行情更新、定时任务…… 回测时钟不连续流动，而是直接跳到下一个事件时间点。这要求你用一个中心化的事件优先级队列（最小堆）驱动整个系统。

事件时间 vs 处理时间：所有判断与状态变更只能基于事件时间；处理时间只用于性能指标。混用两者是逻辑 Bug 的温床。
状态机复制：撮合引擎本身就是状态机（核心状态：订单簿）。回测的“仿真撮合”必须是生产逻辑的高保真副本，才能做一致性对账与复现。
并发的边界：为了确定性，事件处理通常要定义清晰的顺序；同时间戳事件必须有 tie-break（例如：行情先于策略订单），否则会出现“时间旅行”或结果漂移。

事件循环的核心很朴素：不断从堆顶取出最早的事件 → 推进模拟时钟 → 分发处理 → 产生新事件再入堆。真正的工程难点不在“写出循环”，而在确保任何一次运行都严格相同：

原始交易所 Feed 天生就“脏”：UDP/多路分发会带来乱序、重复、丢包。直接拿来回放，等于在随机噪声上做科学实验。

工程建议

承接页 CTA

如果你要把“回测”从研究工具升级为生产级基础设施（数据管道、仿真撮合、结果存储与可视化），更推荐按交易系统整体架构来做顶层设计与落地拆解： https://technologynova.org/solution/