为什么要先做底层系统
玩家说某个地牢房间生成后无路可走,另一个玩家说 Boss 连续三次释放同一招。团队如果不知道当时随机种子,就只能重复试玩碰运气。随机种子测试夹具能让这些问题变成可复现样例。
随机不是不能用,而是不能不可追踪。掉落、地牢、AI、天气、刷怪都可能用随机数。若它们都直接 Math.random,测试和回放会很困难。需要统一 RandomService 和种子日志。 这类系统通常不直接出现在宣传截图里,却决定项目进入内容生产后是否还能稳定迭代。本文从数据、状态、调试和验证四个角度拆解,不把问题停留在 API 调用层。
核心架构
flowchart TD
N1["SeedSource"] --> N2["RandomService"]
N2["RandomService"] --> N3["DropTable"]
N3["DropTable"] --> N4["GenerationTool"]
N4["GenerationTool"] --> N5["AIDecision"]
N5["AIDecision"] --> N6["ReplayLog"]
N6["ReplayLog"] --> N7["TestHarness"]
架构图里的 SeedSource、RandomService、DropTable、GenerationTool、AIDecision、ReplayLog、TestHarness 要保持单向依赖。Phaser Scene 可以触发输入、播放动画和展示 UI,但不应该保存唯一规则事实。只要核心模型可以在没有 Canvas 的环境下运行,就能写测试、做批量验证,也能在玩家反馈问题时复现。
禁止散落 Math.random
项目里所有玩法随机都应经过 RandomService。美术粒子可以用非确定随机,但掉落、关卡和战斗决策必须可追踪。代码检查可以搜索 Math.random,发现后要求说明是否允许。
落地时建议先做最小可视化:把关键范围、状态、队列、版本或数值画出来,再接正式美术。很多系统的风险并不在第一版能不能跑,而在后续没人能解释它为什么这样跑。
种子来源要记录
SeedSource 可以来自关卡 id、日期、服务器下发或测试输入。每局开始记录 rootSeed,再为子系统派生 seed,例如 lootSeed、mapSeed、aiSeed。这样某个系统复现时不会被其他随机调用干扰。
落地时建议先做最小可视化:把关键范围、状态、队列、版本或数值画出来,再接正式美术。很多系统的风险并不在第一版能不能跑,而在后续没人能解释它为什么这样跑。
掉落表要可模拟
DropTable 使用 RandomService 抽样,测试夹具可以用固定 seed 跑一万次,输出分布。稀有掉落不应只靠肉眼试玩验证。
落地时建议先做最小可视化:把关键范围、状态、队列、版本或数值画出来,再接正式美术。很多系统的风险并不在第一版能不能跑,而在后续没人能解释它为什么这样跑。
程序关卡要保存种子和版本
同一个 seed 在不同生成器版本下可能不同。ReplayLog 必须记录 generatorVersion。修 bug 后旧 seed 生成不同结果是可以接受的,但要知道差异来自版本。
落地时建议先做最小可视化:把关键范围、状态、队列、版本或数值画出来,再接正式美术。很多系统的风险并不在第一版能不能跑,而在后续没人能解释它为什么这样跑。
AI 随机也要分流
Boss 选招可以随机,但要用 aiSeed。若掉落先消耗了随机数,Boss 行为不应变化。为每个子系统分流随机能减少隐藏耦合。
落地时建议先做最小可视化:把关键范围、状态、队列、版本或数值画出来,再接正式美术。很多系统的风险并不在第一版能不能跑,而在后续没人能解释它为什么这样跑。
测试夹具要能批量跑
TestHarness 输入 seed 范围和规则断言,例如地图必须连通、奖励总价值在范围内、Boss 十秒内不能重复同一大招三次。批量跑能在上线前发现极端 seed。
落地时建议先做最小可视化:把关键范围、状态、队列、版本或数值画出来,再接正式美术。很多系统的风险并不在第一版能不能跑,而在后续没人能解释它为什么这样跑。
日志要能复制命令
开发日志里输出 seed 和复现命令,例如 test-map –seed abc –version 4。让 bug 从截图变成命令,是随机系统工程化的关键。
落地时建议先做最小可视化:把关键范围、状态、队列、版本或数值画出来,再接正式美术。很多系统的风险并不在第一版能不能跑,而在后续没人能解释它为什么这样跑。
TypeScript 实现骨架
class RandomService {
constructor(private seed: number) {}
next() {
this.seed = (this.seed * 1664525 + 1013904223) >>> 0;
return this.seed / 0xffffffff;
}
int(max: number) { return Math.floor(this.next() * max); }
fork(salt: number) { return new RandomService((this.seed ^ salt) >>> 0); }
}
function weighted<T>(rng: RandomService, rows: Array<{ value: T; weight: number }>) {
const total = rows.reduce((sum, row) => sum + row.weight, 0);
let roll = rng.next() * total;
for (const row of rows) { roll -= row.weight; if (roll <= 0) return row.value; }
return rows[0].value;
}
代码骨架只表达核心边界。真实项目里还需要配置 schema、错误码、日志字段、调试开关和测试样例。重点是把不稳定的浏览器事件、动画状态和资源加载结果转换成可记录的业务状态。
落地步骤
- 先写纯数据模型和两组固定样例,不启动 Phaser 也能跑通。
- 接入 Phaser 输入或加载流程,但只提交意图,不直接改深层状态。
- 增加开发面板,显示当前状态、最近事件、失败原因和配置版本。
- 准备边界测试,包括暂停、切后台、重复点击、读档、低端机降级。
- 给内容团队留校验入口,让错误配置在发布前暴露。
边界测试
边界测试要覆盖三类情况:第一类是玩家快速操作,例如连点、跳过动画、重复进入场景;第二类是环境变化,例如断网、切后台、设备降频、WebGL 上下文丢失;第三类是内容错误,例如缺失资源、非法 id、过长文本、不可达路径。每个失败都应该返回可读原因,而不是让 Scene 静默停住。
调试与观测
记录每局 rootSeed、子系统 seed、生成器版本、随机断言失败和复现命令。随机系统的目标不是消灭偶然,而是让偶然可复现。 如果这些指标只能靠人工观察,就很难在内容扩张后保持质量。建议至少在开发包中支持一键导出最近事件,让 QA 的反馈从“这里怪怪的”变成一份可复现记录。
工程化扩展
随机种子测试夹具 做到能用之后,下一步要把它变成团队能长期依赖的工具。首先是配置版本化:任何影响规则的字段都要有 schemaVersion,旧配置进入系统前先迁移或拒绝。其次是错误码标准化:不要只抛出 Error,而是返回能被 UI、日志和测试同时使用的 reason。第三是调试入口固定化:开发包里应该有一个稳定按钮或快捷键打开面板,而不是临时在 Scene 里写几行 console。最后是文档化,把字段含义、默认值、边界行为写在内容团队能看到的位置。底层系统一旦没有文档,就会被误用;被误用后再追查,成本远高于一开始写清楚。
验收场景
验收时建议至少覆盖这些场景:同 seed 重放掉落、地图连通性批测、Boss 选招分布、生成器版本升级、子系统 fork seed。每个场景都要记录 rootSeed、subSeed、generatorVersion、断言失败和复现命令。如果测试失败,报告里应能看出失败发生在输入层、规则层、资源层还是表现层。移动端还要额外检查切后台、恢复音频、低电量降频和触摸误差。桌面端则要检查窗口缩放、键鼠和手柄切换。验收标准不是“没有报错”,而是系统在异常路径上仍能给出稳定、可解释、可恢复的结果。
发布前检查
发布前确认:front matter 与路由一致,配置版本可识别,关键状态可存档恢复,动画跳过不影响结算,低画质不改变规则,调试入口能关闭。若系统涉及奖励、排行榜或玩家资产,还要检查幂等 id 和重复提交保护。
团队协作方式
随机种子测试夹具 不是某一个 Scene 的私有逻辑,最好从第一天就明确负责人和数据边界。程序负责 rootSeed、子系统 seed、生成器版本、断言脚本 的结构和校验,策划或内容团队负责具体配置,QA 负责边界用例和回归记录。每次字段变更都要能回答三个问题:旧内容怎么迁移,错误配置在哪里报出,玩家存档是否受影响。若答案不清楚,就不要把字段直接塞进线上配置。实际项目里,许多事故不是算法不会写,而是字段含义没人维护,某个活动临时复制旧配置后触发了隐藏分支。
协作时还要准备一份最小样例库。样例库不追求覆盖所有玩法,而是保留最能说明规则的几个状态:一个正常状态、一个边界状态、一个故意错误状态。开发调系统时用它,QA 回归时用它,内容团队学习配置时也用它。这样讨论会从“我觉得这里不对”变成“样例 B 的第三步发生了变化”。对底层系统来说,这种共同语言比任何口头约定都可靠。
回归策略
随机种子测试夹具 每次改动后都应该至少跑一次轻量回归。回归不一定是完整自动化,但必须可重复:固定输入、固定配置、固定期望输出。重点检查 不可复现随机 是否再次出现。若系统参与奖励、存档、热更新、设备适配或输入路由,还要额外检查重复提交、读档恢复、切后台恢复和低端机降级。很多 Phaser 项目的问题并不是首次实现失败,而是后续某次“顺手优化”改变了隐含行为。把这些隐含行为写成回归清单,才能让系统长期稳定。
回归结果最好能留下短摘要,例如用 JSON 记录通过用例、失败原因、配置版本和客户端版本。摘要不需要复杂平台,放在开发日志或 QA 附件里就能发挥作用。等项目进入高频内容生产阶段,这些摘要会成为判断问题归属的证据:是这次配置错了,是引擎层变了,还是某个设备档位才会失败。没有证据时,团队往往会把时间花在互相复现上。
上线风险与降级
随机种子测试夹具 上线前要准备降级策略。降级不是承认系统不可靠,而是承认真实环境会比测试环境复杂。可以禁用某个高级表现、回退到旧配置、缩短录制窗口、降低资源档位、关闭某个活动入口,或者把待确认奖励标记为 pending。关键是降级后规则仍然一致,玩家不会丢进度,也不会获得重复收益。降级开关应集中管理,并写入日志;否则临时开关越多,后续越难知道线上到底运行在哪种状态。
最后要给客服或运营留一段能读懂的状态描述。玩家不会说“manifest hash mismatch”或“gesture capture owner error”,他们只会说打不开、没反应、奖励没到。系统内部的错误码需要映射成可沟通的解释,例如资源更新失败、输入被弹窗拦截、奖励等待联网确认。这个映射越早设计,线上问题越容易被正确分流。
常见误区
不要把工具系统写成一次性调试代码。越底层的系统越会被长期依赖,命名、日志和错误码都要认真。也不要为了短期省事绕过统一入口,例如某个 Scene 直接 Math.random、某个按钮直接发奖励、某个资源直接从远程 URL 加载。这些捷径都会在回放、热更新或低端机适配时变成维护成本。
结语
随机种子测试夹具:可复现掉落、关卡和 AI 决策 的目标不是让代码显得复杂,而是让复杂问题可解释、可复现、可回滚。Phaser 足够灵活,既能快速搭玩法,也能支撑工具化工程;关键是从第一版就把规则层和表现层的边界立住。
继续阅读
探索更多技术文章
浏览归档,发现更多关于系统设计、工具链和工程实践的内容。