Game

Phaser 随机种子测试夹具：可复现掉落、关卡和 AI 决策

讲解 Phaser 项目中随机种子的管理方式，覆盖确定性随机、掉落表、关卡生成、AI 决策、测试夹具和日志追踪。

Leeting Yan 2026-01-27 8 分钟阅读 3990 字

为什么要先做底层系统

玩家说某个地牢房间生成后无路可走，另一个玩家说 Boss 连续三次释放同一招。团队如果不知道当时随机种子，就只能重复试玩碰运气。随机种子测试夹具能让这些问题变成可复现样例。

随机不是不能用，而是不能不可追踪。掉落、地牢、AI、天气、刷怪都可能用随机数。若它们都直接 Math.random，测试和回放会很困难。需要统一 RandomService 和种子日志。这类系统通常不直接出现在宣传截图里，却决定项目进入内容生产后是否还能稳定迭代。本文从数据、状态、调试和验证四个角度拆解，不把问题停留在 API 调用层。

核心架构

flowchart TD
  N1["SeedSource"] --> N2["RandomService"]
  N2["RandomService"] --> N3["DropTable"]
  N3["DropTable"] --> N4["GenerationTool"]
  N4["GenerationTool"] --> N5["AIDecision"]
  N5["AIDecision"] --> N6["ReplayLog"]
  N6["ReplayLog"] --> N7["TestHarness"]

架构图里的 SeedSource、RandomService、DropTable、GenerationTool、AIDecision、ReplayLog、TestHarness 要保持单向依赖。Phaser Scene 可以触发输入、播放动画和展示 UI，但不应该保存唯一规则事实。只要核心模型可以在没有 Canvas 的环境下运行，就能写测试、做批量验证，也能在玩家反馈问题时复现。

禁止散落 Math.random

项目里所有玩法随机都应经过 RandomService。美术粒子可以用非确定随机，但掉落、关卡和战斗决策必须可追踪。代码检查可以搜索 Math.random，发现后要求说明是否允许。

落地时建议先做最小可视化：把关键范围、状态、队列、版本或数值画出来，再接正式美术。很多系统的风险并不在第一版能不能跑，而在后续没人能解释它为什么这样跑。

种子来源要记录

SeedSource 可以来自关卡 id、日期、服务器下发或测试输入。每局开始记录 rootSeed，再为子系统派生 seed，例如 lootSeed、mapSeed、aiSeed。这样某个系统复现时不会被其他随机调用干扰。

掉落表要可模拟

DropTable 使用 RandomService 抽样，测试夹具可以用固定 seed 跑一万次，输出分布。稀有掉落不应只靠肉眼试玩验证。

程序关卡要保存种子和版本

同一个 seed 在不同生成器版本下可能不同。ReplayLog 必须记录 generatorVersion。修 bug 后旧 seed 生成不同结果是可以接受的，但要知道差异来自版本。

AI 随机也要分流

Boss 选招可以随机，但要用 aiSeed。若掉落先消耗了随机数，Boss 行为不应变化。为每个子系统分流随机能减少隐藏耦合。

测试夹具要能批量跑

TestHarness 输入 seed 范围和规则断言，例如地图必须连通、奖励总价值在范围内、Boss 十秒内不能重复同一大招三次。批量跑能在上线前发现极端 seed。

日志要能复制命令

开发日志里输出 seed 和复现命令，例如 test-map –seed abc –version 4。让 bug 从截图变成命令，是随机系统工程化的关键。

TypeScript 实现骨架

class RandomService {
  constructor(private seed: number) {}
  next() {
    this.seed = (this.seed * 1664525 + 1013904223) >>> 0;
    return this.seed / 0xffffffff;
  }
  int(max: number) { return Math.floor(this.next() * max); }
  fork(salt: number) { return new RandomService((this.seed ^ salt) >>> 0); }
}
function weighted<T>(rng: RandomService, rows: Array<{ value: T; weight: number }>) {
  const total = rows.reduce((sum, row) => sum + row.weight, 0);
  let roll = rng.next() * total;
  for (const row of rows) { roll -= row.weight; if (roll <= 0) return row.value; }
  return rows[0].value;
}

代码骨架只表达核心边界。真实项目里还需要配置 schema、错误码、日志字段、调试开关和测试样例。重点是把不稳定的浏览器事件、动画状态和资源加载结果转换成可记录的业务状态。

落地步骤

先写纯数据模型和两组固定样例，不启动 Phaser 也能跑通。
接入 Phaser 输入或加载流程，但只提交意图，不直接改深层状态。
增加开发面板，显示当前状态、最近事件、失败原因和配置版本。
准备边界测试，包括暂停、切后台、重复点击、读档、低端机降级。
给内容团队留校验入口，让错误配置在发布前暴露。

边界测试

边界测试要覆盖三类情况：第一类是玩家快速操作，例如连点、跳过动画、重复进入场景；第二类是环境变化，例如断网、切后台、设备降频、WebGL 上下文丢失；第三类是内容错误，例如缺失资源、非法 id、过长文本、不可达路径。每个失败都应该返回可读原因，而不是让 Scene 静默停住。

调试与观测

记录每局 rootSeed、子系统 seed、生成器版本、随机断言失败和复现命令。随机系统的目标不是消灭偶然，而是让偶然可复现。如果这些指标只能靠人工观察，就很难在内容扩张后保持质量。建议至少在开发包中支持一键导出最近事件，让 QA 的反馈从“这里怪怪的”变成一份可复现记录。

工程化扩展

随机种子测试夹具做到能用之后，下一步要把它变成团队能长期依赖的工具。首先是配置版本化：任何影响规则的字段都要有 schemaVersion，旧配置进入系统前先迁移或拒绝。其次是错误码标准化：不要只抛出 Error，而是返回能被 UI、日志和测试同时使用的 reason。第三是调试入口固定化：开发包里应该有一个稳定按钮或快捷键打开面板，而不是临时在 Scene 里写几行 console。最后是文档化，把字段含义、默认值、边界行为写在内容团队能看到的位置。底层系统一旦没有文档，就会被误用；被误用后再追查，成本远高于一开始写清楚。

验收场景

验收时建议至少覆盖这些场景：同 seed 重放掉落、地图连通性批测、Boss 选招分布、生成器版本升级、子系统 fork seed。每个场景都要记录 rootSeed、subSeed、generatorVersion、断言失败和复现命令。如果测试失败，报告里应能看出失败发生在输入层、规则层、资源层还是表现层。移动端还要额外检查切后台、恢复音频、低电量降频和触摸误差。桌面端则要检查窗口缩放、键鼠和手柄切换。验收标准不是“没有报错”，而是系统在异常路径上仍能给出稳定、可解释、可恢复的结果。

发布前检查

发布前确认：front matter 与路由一致，配置版本可识别，关键状态可存档恢复，动画跳过不影响结算，低画质不改变规则，调试入口能关闭。若系统涉及奖励、排行榜或玩家资产，还要检查幂等 id 和重复提交保护。

团队协作方式

随机种子测试夹具不是某一个 Scene 的私有逻辑，最好从第一天就明确负责人和数据边界。程序负责 rootSeed、子系统 seed、生成器版本、断言脚本的结构和校验，策划或内容团队负责具体配置，QA 负责边界用例和回归记录。每次字段变更都要能回答三个问题：旧内容怎么迁移，错误配置在哪里报出，玩家存档是否受影响。若答案不清楚，就不要把字段直接塞进线上配置。实际项目里，许多事故不是算法不会写，而是字段含义没人维护，某个活动临时复制旧配置后触发了隐藏分支。

协作时还要准备一份最小样例库。样例库不追求覆盖所有玩法，而是保留最能说明规则的几个状态：一个正常状态、一个边界状态、一个故意错误状态。开发调系统时用它，QA 回归时用它，内容团队学习配置时也用它。这样讨论会从“我觉得这里不对”变成“样例 B 的第三步发生了变化”。对底层系统来说，这种共同语言比任何口头约定都可靠。

回归策略

随机种子测试夹具每次改动后都应该至少跑一次轻量回归。回归不一定是完整自动化，但必须可重复：固定输入、固定配置、固定期望输出。重点检查不可复现随机是否再次出现。若系统参与奖励、存档、热更新、设备适配或输入路由，还要额外检查重复提交、读档恢复、切后台恢复和低端机降级。很多 Phaser 项目的问题并不是首次实现失败，而是后续某次“顺手优化”改变了隐含行为。把这些隐含行为写成回归清单，才能让系统长期稳定。

回归结果最好能留下短摘要，例如用 JSON 记录通过用例、失败原因、配置版本和客户端版本。摘要不需要复杂平台，放在开发日志或 QA 附件里就能发挥作用。等项目进入高频内容生产阶段，这些摘要会成为判断问题归属的证据：是这次配置错了，是引擎层变了，还是某个设备档位才会失败。没有证据时，团队往往会把时间花在互相复现上。

上线风险与降级

随机种子测试夹具上线前要准备降级策略。降级不是承认系统不可靠，而是承认真实环境会比测试环境复杂。可以禁用某个高级表现、回退到旧配置、缩短录制窗口、降低资源档位、关闭某个活动入口，或者把待确认奖励标记为 pending。关键是降级后规则仍然一致，玩家不会丢进度，也不会获得重复收益。降级开关应集中管理，并写入日志；否则临时开关越多，后续越难知道线上到底运行在哪种状态。

最后要给客服或运营留一段能读懂的状态描述。玩家不会说“manifest hash mismatch”或“gesture capture owner error”，他们只会说打不开、没反应、奖励没到。系统内部的错误码需要映射成可沟通的解释，例如资源更新失败、输入被弹窗拦截、奖励等待联网确认。这个映射越早设计，线上问题越容易被正确分流。

常见误区

不要把工具系统写成一次性调试代码。越底层的系统越会被长期依赖，命名、日志和错误码都要认真。也不要为了短期省事绕过统一入口，例如某个 Scene 直接 Math.random、某个按钮直接发奖励、某个资源直接从远程 URL 加载。这些捷径都会在回放、热更新或低端机适配时变成维护成本。

结语

随机种子测试夹具：可复现掉落、关卡和 AI 决策的目标不是让代码显得复杂，而是让复杂问题可解释、可复现、可回滚。Phaser 足够灵活，既能快速搭玩法，也能支撑工具化工程；关键是从第一版就把规则层和表现层的边界立住。

继续阅读

探索更多技术文章

浏览归档，发现更多关于系统设计、工具链和工程实践的内容。

全部文章返回首页