<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>稳定性 on PlumePHP</title><link>https://plumephp.com/tags/%E7%A8%B3%E5%AE%9A%E6%80%A7/</link><description>Recent content in 稳定性 on PlumePHP</description><generator>Hugo</generator><language>zh-CN</language><lastBuildDate>Mon, 01 Jun 2026 21:47:00 +0800</lastBuildDate><atom:link href="https://plumephp.com/tags/%E7%A8%B3%E5%AE%9A%E6%80%A7/index.xml" rel="self" type="application/rss+xml"/><item><title>游戏服务器幂等 API 设计模式</title><link>https://plumephp.com/game-server-idempotent-api-design-patterns/</link><pubDate>Mon, 01 Jun 2026 21:47:00 +0800</pubDate><guid>https://plumephp.com/game-server-idempotent-api-design-patterns/</guid><description>&lt;p&gt;游戏服务器里的很多接口都不能假设只会被调用一次。客户端超时会重试，网关可能重发，消息队列可能至少一次投递，后台任务可能崩溃后重跑。领取奖励、战斗结算、支付发货、邮件附件、活动兑换，如果没有幂等设计，重复请求就会变成重复发奖或重复扣费。&lt;/p&gt;</description></item><item><title>在线游戏服务器蓝绿发布实战</title><link>https://plumephp.com/game-server-blue-green-deployment-for-live-games/</link><pubDate>Mon, 01 Jun 2026 09:18:00 +0800</pubDate><guid>https://plumephp.com/game-server-blue-green-deployment-for-live-games/</guid><description>&lt;p&gt;蓝绿发布听起来像一个标准运维动作：准备两套环境，把流量从蓝切到绿，出问题再切回去。放到在线游戏里，它会变得更复杂。玩家不是一次 HTTP 请求，连接可能持续几十分钟；房间里有进行中的战斗；后台还有任务队列、支付回调和排行榜结算。发布如果只切入口，不处理业务状态，玩家很容易在切换中掉线或丢进度。&lt;/p&gt;</description></item><item><title>在线游戏服务器容灾演练实战</title><link>https://plumephp.com/game-server-disaster-recovery-drill-for-live-games/</link><pubDate>Sat, 30 May 2026 23:13:00 +0800</pubDate><guid>https://plumephp.com/game-server-disaster-recovery-drill-for-live-games/</guid><description>&lt;p&gt;没有演练过的容灾方案，基本等于没有。文档里写着数据库可恢复、服务可切区、缓存可重建，只有真正演练时才会发现脚本权限不够、备份缺字段、DNS 切换慢、支付回调没人处理。&lt;/p&gt;</description></item><item><title>游戏服务器 Leader 选举与服务所有权</title><link>https://plumephp.com/game-server-leader-election-and-service-ownership/</link><pubDate>Thu, 21 May 2026 13:18:00 +0800</pubDate><guid>https://plumephp.com/game-server-leader-election-and-service-ownership/</guid><description>&lt;p&gt;很多游戏服务需要“只有一个实例在做某件事”：排行榜结算、全服邮件发送、活动刷新、跨服战场调度、分片迁移。如果多个实例同时执行，可能重复发奖；如果没有实例执行，任务又会丢。Leader 选举和服务所有权就是解决这个问题。&lt;/p&gt;</description></item><item><title>在线游戏服务器分层架构设计</title><link>https://plumephp.com/game-server-layered-architecture-for-live-games/</link><pubDate>Thu, 07 May 2026 19:26:00 +0800</pubDate><guid>https://plumephp.com/game-server-layered-architecture-for-live-games/</guid><description>&lt;p&gt;很多游戏服务器早期只有一个大进程：接连接、解协议、跑逻辑、写数据库、发奖励都在一起。Demo 很快，但上线后每个问题都互相影响。分层架构不是为了显得复杂，而是让不同变化速度、不同风险等级、不同性能特征的代码放在合适的位置。&lt;/p&gt;</description></item><item><title>在线游戏服务器事故复盘怎么做</title><link>https://plumephp.com/game-server-post-incident-review-for-live-games/</link><pubDate>Thu, 30 Apr 2026 17:48:00 +0800</pubDate><guid>https://plumephp.com/game-server-post-incident-review-for-live-games/</guid><description>&lt;p&gt;在线游戏没有完全不出事故的服务器。真正拉开团队差距的，是事故发生后能不能快速止血、清楚解释、合理补偿，并把教训变成系统能力。复盘不是追责会议，而是让同类问题下次更难发生。&lt;/p&gt;</description></item><item><title>游戏服务器异步任务队列设计</title><link>https://plumephp.com/game-server-task-queue-design-for-async-workloads/</link><pubDate>Thu, 02 Apr 2026 10:17:00 +0800</pubDate><guid>https://plumephp.com/game-server-task-queue-design-for-async-workloads/</guid><description>&lt;p&gt;游戏服务器里有很多事情不适合在玩家请求里同步完成。批量发邮件、排行榜结算、活动补偿、数据归档、离线奖励、跨服同步，这些任务耗时长、失败概率高、还需要重试。异步任务队列就是把这些工作从实时链路里拆出来的基础设施。&lt;/p&gt;</description></item><item><title>游戏客户端内存泄漏排查：越玩越卡通常不是错觉</title><link>https://plumephp.com/client-memory-leak-detection/</link><pubDate>Tue, 24 Mar 2026 10:09:00 +0800</pubDate><guid>https://plumephp.com/client-memory-leak-detection/</guid><description>&lt;p&gt;玩家说“越玩越卡”时，团队很容易先怀疑发热或网络。发热确实常见，但内存泄漏和资源残留同样高频。大厅来回切几次、连续打十局、看几段剧情、打开多个活动页后，内存一点点涨，GC 变频繁，系统开始杀后台，最后就是卡顿、闪退和黑屏。&lt;/p&gt;</description></item><item><title>游戏服务器运维干货：稳定在线不是堆机器那么简单</title><link>https://plumephp.com/game-server-operations-guide-2026/</link><pubDate>Sun, 08 Mar 2026 21:08:00 +0800</pubDate><guid>https://plumephp.com/game-server-operations-guide-2026/</guid><description>&lt;p&gt;玩家看到的“服务器炸了”，背后可能是登录服务过载、匹配队列堆积、数据库慢查询、缓存击穿、支付回调延迟、活动配置错误、跨区网络抖动，也可能只是一个不起眼的排行榜接口没有限流。游戏服务器运维不是把机器配置买高一点，而是建立一套能预测、观察、应对和复盘故障的体系。&lt;/p&gt;</description></item><item><title>游戏服务器如何做优雅停服</title><link>https://plumephp.com/game-server-graceful-shutdown/</link><pubDate>Sat, 28 Feb 2026 23:41:00 +0800</pubDate><guid>https://plumephp.com/game-server-graceful-shutdown/</guid><description>&lt;p&gt;停服不是简单地把进程杀掉。对游戏服务器来说，停服时可能还有玩家在副本里，拍卖正在结算，邮件正在发放，排行榜正在锁榜，数据库里还有未落盘数据。粗暴停服看起来省事，实际上会把大量可控状态变成异常状态。第二天开发和客服面对的，可能就是副本次数丢失、奖励没发、玩家卡在线、活动结算不一致。&lt;/p&gt;</description></item><item><title>压测游戏服务器时不要只看在线人数</title><link>https://plumephp.com/do-not-only-look-at-online-users-when-load-testing-game-servers/</link><pubDate>Fri, 30 Jan 2026 19:36:00 +0800</pubDate><guid>https://plumephp.com/do-not-only-look-at-online-users-when-load-testing-game-servers/</guid><description>&lt;p&gt;压测游戏服务器时不要只看在线人数 是游戏服务器端开发里很容易被低估的主题。它看起来像一个单点功能，实际会牵连网络、房间、数据、运营、监控和玩家体验。十万人站在主城不动和十万人同时登录、匹配、战斗、聊天、领奖，对服务器压力完全不同。 如果早期只做一个能跑的版本，后期再补边界，成本通常会更高。&lt;/p&gt;</description></item></channel></rss>