【模型研究】炉石模型研究——滞后收益

- # 炉石传说
- # 炉石狂野模式
- # 炉石卡组攻略
- # 炉石卡组投稿区
本文为作者原创内容,未经作者本人和营地同意不得转载
本文主要探讨基于滞后性的收益模型。
在讲正文之前叠个甲:
如果觉得我的文章胡说八道,不要直接喷,讲出你们反驳的点
如果你认为我的模型是错的,我同意。我的模型是错的,当然,所有模型都是错的,我们要研究的是错的不那么离谱的模型——正如牛顿经典力学无法拟合高速运动,相对论眼里经典力学是错的,但是未来也可能会有力学模型推翻相对论。模型重要的是能适用于实战的分析,而非比个谁“对”。虽然相对论比经典力学更加贴近真实性,但是对于低速运动,我们依旧使用的是经典力学,尽管他是“错”的。
讲炉石滞后收益的时候,我们可以拿金钱等生活中可以量化的收益进行对比——如果你现在食不果腹,现在给你两个选择,必须二选一,你选择哪个
A. 立刻获取满足你生存需要的钱,但也仅限于这段时间的温饱
B. 两个月断绝一切经济来源,两个月后,然后获得能当上世界首富的钱
虽然这个问题有点夸张,但是很明显,对于食不果腹的人,生存是必须的,尽管B选项能获取的钱远远高于A获取的钱,两个月无经济来源很难生存下去,因此食不果腹的人选择A一定比B好。这个例子就要引出概念——滞后收益来解释了。B获得的收益是需要时间的,是滞后的;将未来收益折合结算为当前收益,就需要进行时间衰减。
换而言之,如果你消耗当前的10000元,换取一年后的10110元,你觉得如何呢?白嫖是白嫖了110元,但是你花了时间,以及你这一年内不能用的10000元啊!况且这个功能现在就有,你找的是不是:银行存款
因而,我们为了折合未来的收益,使用一个γ数值(折现率discount rate)表示未来收益的损失函数。如果我立刻挣10000元,我的收益值用10000表示;然而如果我一步操作能让明年挣10000元,那么我当下操作的收益值为10000γ。由于未来收益是不如当下收益的,因此γ定义为0<γ<1。
那么我如果后年赚10000元,γ依旧是一年的折现率,那么我能否计算今年的收益吗?能!后年赚10000=明年赚10000γ=今年赚10000γ²,按照等比例计算时间折现率。
明白了这个之后,我们回到炉石上来——当下收益和未来收益,我们准备用回合作为折现率的间隔来解释炉石里延迟收益的问题。
如果只看收益不看回合延迟,就会出现如下谬论
1.武器太超模了啊,剑鱼3费打12,简直是3费的炎爆术;光铸凯瑞尔不考虑别的效果,武器2/∞,能打∞,太过分了吧;
2.休眠随从太超模了,235突袭,都35突袭接近4费的强度,竟然只要2费;
3.腐蚀术太离谱了,别人解牌都是高费的/限制条件的,你这来个无差别的解牌,太逆天了;
当然以上谬论是如何形成的,就是忽略了未来收益导致的。
当然,我们如果理性分析就会发现,剑鱼的3回合内,可能出现各种意外(譬如被吃刀,被冰片冻脸,人被反杀,对面开雷诺回血)而3费打12则能阻断这些意外的发生;光铸凯瑞尔的无限耐久盾,也只能每回合打2,而不能一口气劈无数下消灭对手,这便是延迟收益的问题。
那么,如何计算炉石里的回合收益呢?如果说一把4/3的剑鱼,剑鱼=当前回合打4+下回合打4+下下回合打4,因此收益值可以认为是4+4γ+4γ²,进而用这个数值去拟合剑鱼造成的伤害贡献。2/∞的武器的收益=2+2γ+2γ²+...=2/(1-γ),作为比值小于1的无穷等比数列,和是收敛的,也就解释了收益的有限性(因此,救赎者洛萨克森、野火、图哈特等,都可以近似认为如此)
因此判断几个问题
Q:高费怪为何会日常溢出(费用*2+1=攻+血)的老模型,从低于此模型变成夸张的效果(譬如奥丁已经算空过界的天花板了,9/10/10恶犬在超模的前提下还能吸身材,依旧不配进构筑);
A:高费表示他登场回合晚,而越晚的回合登场,收益就越滞后,所以直接裸拍必须有夸张收益的才能直接携带;因此亚煞极、移动山丘等优质大哥会在大哥萨出场,耐普图隆在大哥萨和大哥牧体系里出场,团本在德鲁伊构筑中出场,都是因为他们能够提前以其他手段登场,而非准时手打,因此4费先祖召唤的耐普图隆比10费手拍的耐普图隆强大1/(γ^6)倍
Q:巨化快攻德为什么走不远,以至于淡出玩家视野(单从森然巨化讨论)
A:森然巨化让随从+1费,看似身材大了好几圈,但是缺点是让部分功能随从变得更笨重;(随便举例几张可能带入构筑的功能牌,怒爪精锐战吼带半个咆哮,223和345相比,223更加轻便,如果你5费,有咆哮+223怒爪可以斩杀,咆哮+345怒爪则没费用了;同理对于小赛布、灰烬元素等功能牌,费用高了1费也压缩了其他功能牌的空间,毕竟功能牌的功能是主题,身材是附加值而已,特效的价值拖延也导致了γ损失)
Q:如何驳斥如下说辞【剑鱼贼,锈水带有软嘲讽,因此先手1费下锈水对面(原,德,法)必须硬币技能解从而赚节奏,下个鱼排对面可以理都不理,赚不到节奏】
A:利用滞后收益理论,1费下鱼排带来的两回合内收益是1+3γ,1费下锈水的两回合内收益是0+γ(2+(1+γ)p)【注释,p是2费转刀并砍的概率,p<1】,由此公式可以看到,单从打脸收益而言,无论存活1/2/3回合,锈水对打脸做出的贡献值一定是低于鱼排的,存活0回合,1>0,存活2回合,4>2+p(1+γ),因此可以看到,虽然锈水能让第二回合(如果转刀不抽刀)收益更高,但是哪怕这样,带来的收益也不如鱼排3攻+战吼1攻的收益(可能说的不是太明白,见谅)
注释:γ是大于0小于1的数,目前我看不出具体值为多少,不过我的理论目前是忽略不同回合见不同的γ的差异的,也就是我默认γ1_2=γ2_3=γ3_4,默认每两个回合间的收益损失率一致,然而事实上很可能是γ1_2>γ2_3>γ3_4....
思考题:
利用这个理论收益的γ模型,计算
1.我剑鱼贼3费探底,没找到海盗,探了右手悦耳嘻哈,假设下回合嘻哈必打,请问该不该砍下第一刀?
2.我后手剑鱼贼,起手留了剑鱼嘻哈,2费硬币剑鱼探底成功,3费打悦耳嘻哈,请问2费该不该砍这一刀?
3.我有个5/1的武器,对手有一个5/3的武器,请问给我的武器+1/+1提升的收益更高还是给对面的武器+1/+1提升的收益更高呢?
注:本理论纯属个人愚见,用来探讨“空过”和回合差异对炉石模型判断的参考和思考而已,有不足之处请多多指正,也希望大家能在我的理论上更进一步,或者“推翻”我的理论,能够拿更靠谱的理论去拟合模型

还没有评论