kk Blog —— 通用基础

ELO算法的原理及应用

2022-08-28 18:38:00

https://zhuanlan.zhihu.com/p/57480433

ELO算法原理

预期胜率计算公式

ELO算法基于这样一种假设：一名选手的当前实力受各种因素的影响会在一定范围内波动，某个时刻的用来描述其实力的函数应当符合正态分布：

其中U代表选手的实力平均水平，δ代表实力的稳定性。

经过计算，可以得出两名选手进行对战时的预期胜率：

D为两者的分差。

利用了最小二乘法，我们可以得到与它的函数图向相近的另外的一个函数，这也是我们实际运时更常用的函数：

（里面的常数项都是曲线拟合的结果，是符合上述统计学规律的，别瞎改）

即当玩家A与玩家B的分差为D时，玩家A对玩家B的期望胜率为P(D)。

玩家分数相同时，对战预期胜率为50%，分差越大，玩家之间的胜率差距也就越大，当分差大于400时，低分玩家的预期胜率将不足10%。

显然的，我们的玩家的游戏水平的分布也应当是一个正态分布，即大部分玩家的游戏水平都处于平均值附近，游戏水平顶尖或非常菜的人会是少数。

假如我们认为1200分是玩家的平均水平，则所有玩家的各分值分布情况将大致如下图：各分段玩家比例分布示意图

分数迭代公式

那我们会面临下一个问题：如何知道某个玩家到底是多少分的？

毕竟我们不能用某种机器直接插入玩家大脑测试他的游戏水平吧？

对此，我们的办法是，通过玩家与不同分数的玩家的大量比赛结果，对玩家的分数进行不断地加减修正，直到玩家的分数收敛到其相应的真实水平分数。

下面我们计算玩家在一场比赛后的加减分情况。

玩家在进行一场比赛后的新分数为：

Rn是玩家比赛结束后的新的排位分值。

Ro是比赛前玩家的排位分。

K是一个加成系数，由玩家当前分值水平决定（分值越高K越小）。

W是玩家实际对局结果得分（赢=1，输=0）。

P（D）是预期胜率。

取K=32时，玩家结束一场比赛后的实际得分数如图所示。可以看到玩家战胜比自己低800分的选手后（有近100%的胜率）基本不得分。（这让我想起了守望韩服的猪皇evermore，4950分后打完了一局只加了1分）

ELO算法应用

匹配策略

以1V1的匹配为例，一般来说遵循以下匹配原则

0~N1秒内，仅匹配分差在X1以内的队友

若N1秒内未找到满足条件对手，放宽匹配条件，N1~N2秒内，仅匹配分差在X2（X2＞X1）以内的对手

……

直到找到对手。

收敛期快速收敛

从上面的描述我们可以知道，玩家的一次又一次的比赛过程就是其游戏分数向其真实水平分数收敛的过程。

那么当玩家的游戏分数与真实水平分数相差过大时，其收敛期耗时也会增加，而这一时期参与游戏的玩家的游戏体验都会受到不同程度的影响。

所以我们需要一些特殊的机制来减少这段收敛期。接下来我们按照不同的情况进行讨论。

1、定位赛阶段

当一个新玩家加入游戏时，我们肯定无法得知其真实的游戏水平，只能默认他为1200分（平均值）。

为了缩短其收敛期，我们会加入定位赛的设计。

在定位赛局数内，计算玩家得分的K值将再被乘上一个系数。

2、玩家（账号）实力大幅波动

首先，我们会引入一个【连胜/连败分数加值】的变量。

当玩家连续获胜或者连续失败N次时，我们有理由相信玩家的游戏分数与真实水平分数相差过大，并按照连胜/连败局数去增加【连胜/连败分数加值】

于是在进行匹配索敌时，将按照【玩家游戏分数】+【连胜/连败分数加值】进行索敌。

（这就是守望一个3000玩家10连胜后到了3300分，但是开始匹配到3500+分玩家的原因）

最后进行分数结算时，按照【玩家游戏分数】进行。

3、休眠期的分数衰减

分数衰减的原因是：

（1）我们期望玩家的活跃参与。

（2）我们认为高分段玩家在长时间未进行游戏后，其真实水平也会下降。

所以，一般我们会设计1800分以上的玩家，X天未进行排位后其游戏分数会以Y分/天的速度衰减。

多对多的拓展

ELO积分初期是针对象棋选手而定的，所以考虑的都是象棋选手1V1的情况。但是在NVN的游戏排位赛中，需要进行一些特殊的处理。

在多人比赛中，最终得分为：

其中，Rn、Ro、K、W的值都不用处理。

对P（D）处理如下：

D=自己分数-自己分数/己方总分*敌方总分

低分段打破零和

在之前的讨论中，我们可以很明显的发现：

对于同分段玩家来说，因为K值都是一样的，所以赢方加的分恰好等于输方扣的分。

（玩家能上分是因为把人家的分吃了，大鱼吃小鱼小鱼吃虾米，于是最后所有玩家的分数就成了正态分布）

即所有的分数是零和的。

现在的游戏中，一般会期望玩家玩得多了还是能出坑的，即就算你水平略低于平均线，你也可以玩很多局跳出低分段。

于是我们将在低分段（比如1000以下）将胜负方的K值分离。

即胜方的加分按照K1进行。

负方的扣分按照K2进行。

当K1＞K2时，零和将被打破，玩家的分数分布中1000分以下的玩家数量将显著减少。

ELO积分的包装与隐藏

ELO积分对玩家水平的精确指示会打击玩家的信心，分值收敛结束后，再进行更多的对局几乎不会有任何提高（除非找了代练或者自己不知道为啥突然打通任督二脉）。

所以我们将玩家真实水平隐藏，并用一些模糊柔和的方式去告诉玩家他当前的水平（按照ELO分数包装为青铜白银黄金白金钻石）。

但记得，ELO分不会消失，从显示变成了隐藏，我们的一切计算还是以ELO分数为依据。

Dota自走棋段位MMR算法

2022-08-28 17:46:00

http://dota2.uuu9.com/201904/591872.shtml

MMR算法

算法其实很简明。

MMR变化量 = （MMR均值 - 自己的MMR）*0.1725 + 排名对应的常数

排名对应的常数表：
第1名：+127
第2名：+102
第3名：+77
第4名：+51
第5名：-51
第6名：-77
第7名：-102
第8名：-127

特例：第8名至少-15分，最低到0。
推测：第1名至少+15分。作者保留了疑问，不确定真假。

注意事项

自走棋早期是公开MMR的，后来隐藏了，没有发现获取途径。

因为隐藏了，不好判断MMR系统有没有大改。不过隐藏前后没有体感到变化。

皇后分数上限早期是3400，没多久就突破了上限。

80分一段。房间里所有人同一段位时，第1名+127分，就是1.588个段位。第2名1.275个段位，第3名0.96个段位。第1名和第4名相差76分，第4名和第5名相差102分，这就是吃烂分的理论依据。

（存疑）如果第1名至少+15分，段位会通货膨胀。从整体数据观测，实际情况是主教人数向骑士滑移，主要原因是新账号（新人玩家或者小号）。具体参见：数说自走棋。

举例

下面的例子是模拟结果，感兴趣可以访问GitHub。

8个人分数一样时的情况如下。8个骑士2段和8个皇后的情况是一样的。

1个主教2，6个主教1和1个骑士9开主教局的情况：骑士9小赚，主教2小亏。其他分段情况类似，开局时分数最低的最赚，不过前4还是加分，后4还是掉分，只是数值上有差别。

房间里7个人分数一样，1个高其他人5段的情况。分数最高第4名扣分。

房间里7个人分数一样，1个高其他人7段的情况。分数最高第3名扣分。

房间里7个人分数一样，1个高其他人9段的情况。分数最高第2名扣分。

房间里7个人分数一样，1个高其他人10段的情况。分数最高的人第1名只+15分。

如果没有吃鸡最低+15分的规则，吃鸡不扣分的临界点你比平均分高736分，或者说你比其他7人平均段位高10.5段。高得再多吃鸡也要扣分。

如果没有吃鸡最低+15分的规则，1个3400分皇后号和7个0分士兵号匹配，皇后吃鸡了要扣386分，变成堡垒6段，要是不行第8飞了，对不起，堡垒3段。

如果有吃鸡最低+15分的规则，-386变成+15，其他不变。

骑士1-8各1个的情况。骑士8段的玩家第4名只加2分，第1名加的分很少，比骑士1段的玩家吃鸡加的少很多。

ssl 证书检查

2022-08-25 21:59:00

企业微信https有时正常有时不正常, 但http都正常，检查一下证书配置

https://www.geocerts.com/ssl-checker

https://cloud.tencent.com/document/product/400/35243

apache 证书配置

编辑 /etc/httpd/conf.d 目录下的 ssl.conf 配置文件。修改如下内容：

<VirtualHost 0.0.0.0:443>
	DocumentRoot "/var/www/html" 
	#填写证书名称
	ServerName cloud.tencent.com 
	#启用 SSL 功能
	SSLEngine on 
	#证书文件的路径
	SSLCertificateFile /etc/httpd/ssl/cloud.tencent.com.crt 
	#私钥文件的路径
	SSLCertificateKeyFile /etc/httpd/ssl/cloud.tencent.com.key 
	#证书链文件的路径
	SSLCertificateChainFile /etc/httpd/ssl/root_bundle.crt 
</VirtualHost>

← Older Blog Archives Newer →