作者 主题: PF2模型浅析:3A制、MAP设计、成功度设计  (阅读 1075 次)

副标题: 填坑中

离线 晨世宣融

  • Knight
  • ***
  • 帖子数: 353
  • 苹果币: 0
PF2模型浅析:3A制、MAP设计、成功度设计
« 于: 2023-02-04, 周六 19:45:31 »
      本文旨在构建一个以“动作经济”为核心的PF2模型架构,以帮助读者在不需或尽量少使用计算器的情况下,判断一个行为决策在各种情况下的收益情况。模型基础秉承抽象化、简明化,由3A制、MAP设计、成功度设计“三法则”推导得出,并尝试拓展至任意行动。

      本文分为设计思路、模型构建、应用实例三部分。以下使用缩写包括:MAP-multiple attack penalty-多次攻击减值,AB-attack bonus-攻击加值,AC-armor class-护甲等级,DC-difficulty class-困难等级,N1-Natural 1-自然1,N20-Natural 20-自然20。
« 上次编辑: 2023-02-04, 周六 19:52:43 由 晨世宣融 »

离线 晨世宣融

  • Knight
  • ***
  • 帖子数: 353
  • 苹果币: 0
Re: PF2模型浅析:3A制、MAP设计、成功度设计
« 回帖 #1 于: 2023-02-04, 周六 19:46:17 »
一、“三法则”的设计思路(老生常谈可跳过)。
      不得不绕过的一个问题,是PF2为何要采用3A制、MAP设计、成功度设计这三个法则来构建体系。在我看来,这是一个为了促进决策丰富度、维护决策空间的耦合系统。

      3A制,即每个角色在他的回合中,获得可以自由支配的3个行动点(称为动作),并将其自由地、按顺序地分配给可使用的行动。相较于将回合分为标准动作、移动动作、附赠动作的规则,显而易见地,3A制的组合方式更多、决策丰富度更高。然而,由于玩家常常拘泥于强度优化,仅使用3A制往往会使得决策空间坍缩到某些局部最优点。倘若存在一个需要1A的行动X,它的收益在大多数情况下都高于其他任何动作(在此处,以伤害和恢复量作为收益的标准,可以将其他收益转化为一定的伤害和恢复数值),那么3A制会衰退成使用尽量多的X的任务;即使X具有使用频率、或资源的限制,也只是按照一个X1、X2、X3优先级的排序任务。因此,PF2引入了MAP设计。

      MAP设计,即多次攻击减值,作用在任何具有攻击tag的行动(称为攻击行动)上。任何战斗冒险角色冒险游戏中,基础攻击选项(称为打击Strike)总是难以绕开的,因此也可以把打击当作动作的收益基准。通常而言,作为攻击行动,打击需要在每次使用后,增加5点MAP(即减少5点ab),至多累加至10点MAP。MAP,会使得回合中第二次打击的收益远不如第一次打击的收益,第三次或更多次的打击收益远不如第二次打击。因而,打击、以及更多的攻击行动的收益可以相对高,MAP会拉低其后续使用的收益。在这种情况下,回合的最优策略会是,动作首先被分配至一次到两次攻击行动,其次用非攻击行动填充满剩余的动作。

      成功度设计,即大成功、成功、失败、大失败:检定结果大等于DC+10为大成功,大等于DC但未大成功为成功,检定结果低于DC-10为大失败,低于DC但未大失败为失败;额外地,N20成功度上升一级,N1成功度下降一级。成功度设计首先是为了缓解d20系统中,边缘收益突变的情况的。在传统d20系统中,当AC接近敌人AB+20时的边缘收益极其高,当AB接近敌人AC-20时的边缘收益(按比例来看)极其高,该结论易于推导,此处不再赘述。这样一种现象引导了玩家堆数据的倾向,将最优解分散到构筑空间的各个边界值,不利于构筑的多样化。而成功度设计,具体而言,是打击大成功(称为重击)造成双倍伤害这一点,缓解了上述问题。举例说明,假设打击伤害骰的期望为p,敌人AC为20,AB为8,则当骰出12~20(共9点)时能够命中,20时能够重击,期望伤害为0.5p,若将AB提高1点至9,则期望伤害为0.55p,期望伤害提升的比例为0.05p/0.5p=10%;相对地,假设AB为14,则当骰出6~20(共15点)时能够命中,16~20(共5点)时能够重击,期望伤害为1.0p,若将AB提高1点至15,则期望伤害为1.1p,期望伤害提升的比例为0.1p/1.0p=10%。可见,该曲线更加平缓。
« 上次编辑: 2023-02-04, 周六 19:56:02 由 晨世宣融 »

离线 晨世宣融

  • Knight
  • ***
  • 帖子数: 353
  • 苹果币: 0
Re: PF2模型浅析:3A制、MAP设计、成功度设计
« 回帖 #2 于: 2023-02-04, 周六 19:47:24 »
二、决策收益的模型架构。
      在上述分析中,我们论述了“三法则”的必要性,接下来论述其充分性——“三法则”导向了一个怎样的决策模型。
      为便于理解,我们将收益定义为对同级标准生物造成的伤害量和恢复量,并将动作、属性、环境等其他“隐性收益”转化为由该类型伤害量和恢复量定义的收益。

(一)、基于命中点的收益模型
      显然,打击的收益由两部分决定:AB和伤害骰。由于AB和AC相互拮抗,故使用命中率/命中点来描述,例如,敌人AC为20,AB为8时,当骰出12~20(共9点)时能够命中,20时能够重击,命中率为9/20=45%,命中点为9,重击点为1,重击率为5%;AB为14,当骰出6~20(共15点)时能够命中,16~20(共5点)时能够重击,命中率为15/20=75%,命中点为15,重击点为5。记伤害骰的分布为P,Power,尽管伤害骰的期望EP的单点分布与伤害骰分布并不一致,但足够简单,且一定程度上能描述伤害骰,因此直接使用EP来表述。记h为命中点(0≤h≤20),p为伤害骰的期望EP,于是我们有:
      当1≤h≤11时,命中点为h,重击点为1,收益=(h+1)/20*p;
      当11≤h≤19时,命中点为h,重击点为h-10,收益=(2h-10)/20*p;
      另外h=0及h=20的极端情况,在游戏过程中通常不会出现。
      定义等效命中点ћ为命中点与重击点的和。

      观察GMG中的创造生物表(以下简称生物表),我们可以发现,相同等级的怪物的标准AB对抗标准AC,第一打的h约为12~14,考虑等级差异,不妨认为通常情况下h∈[10,16];那么第二打(-5MAP时),h-5∈[5,11];第三或更多打(-10MAP时),h-10∈[0,6]。根据上述公式,第一打的伤害期望=(2h-10)/20*p∈[10/20*p,22/20*p],第二打的伤害期望=(h-5+1)/20*p∈[6/20*p,12/20*p],第三或更多打的伤害期望=(h-10+1)/20*p∈[1/20*p,7/20*p]。不难发现,第二打的伤害期望=第一打的伤害期望*1/2+1/20*p。其中1/20*p来自N20的重击,不妨作为小概率事件舍去。因此我们得到了推论1和推论2:
      推论1:在通常情况下,第二打≈第一打*1/2。
      推论2:在通常情况下,第三打≤第二打*1/2。


      另外,除了我方AB对抗对方AC的情况,PF2中还存在对方豁免对抗我方DC的情况,尤其是基础豁免。基础豁免在大成功时不造成伤害,成功时造成一半伤害,失败时造成全部伤害,大失败时造成两倍伤害。
      遵循上述,将p定义为伤害骰的期望,s定义为成功和大成功点的和。考虑s∈[11,19]的情况,大成功点为s-10,成功点为10,失败点为19-s,大失败点为1;考虑s=10的情况,大成功点为1,成功点为9,失败点为9,大失败点为1;考虑s∈[1,9]的情况,大成功点为1,成功点为s-1,失败点为10,大失败点为10-s。因此有:
      当11≤s≤19时,收益=(26-s)/20*p;
      当9≤s≤11时,收益=(20.5-0.5s)/20*p;
      当1≤s≤9时,收益=(29.5-1.5s)/20*p;

      考虑玩家角色的法术DC=法术AB+10,假设怪物标准豁免=标准AC-10,易得s=22-h,则有:
      当3≤h≤11时,收益=(h+4)/20*p;
      当11≤h≤13时,收益=(0.5h+9.5)/20*p;
      当13≤h≤21时,收益=(1.5h-3.5)/20*p;

      容易发现,对于施法者而言,当3≤h≤12时(面对更为强大的敌人时),若p相同,豁免法术优于AB法术。

(二)、基于动作数的收益模型
      对于非攻击的1A行动,基于决策性原则,一个合适的收益小于第一打、大于第三打,约等于第二打。于是,不妨假设第一打的一半是1A的基准收益。我们得到假设1:
      假设1:在理想设计下,1A=第一打*1/2≈第二打。
      对于第一打,我们可以列出以下式子:第一打=1A+MAP,得到推论3:
      推论3:MAP=1A。其中,MAP表示这是回合中的第一个攻击行为。由此,我们将攻击tag转化为了动作数。
      为了将动作数模型与命中点模型连接起来,我们需要设定一个基本的命中点。由生物表,同级怪物的标准AB对抗标准AC的h为13,则1A=第一打*1/2≈(h-5)/20*p≈0.4p。
      假设2:对于标准怪物,1A=0.4p。其中,p表示伤害骰的期望。
      由此得到,第一打=0.8p,第二打=0.45p,第三打≤0.2p。

(三)、基于等级(待完善)
      然而,并非所有情况下,敌人都是同等级怪物且具有标准AC。因此,1A=0.4p的结论是受限的。

      根据生物表:极端AC为标准AC+3,糟糕AC为标准AC-3;每提升2级,增加3点AC,每降低2级,减少3点AC。
      对于极端AC的+0怪物、或标准AC的+2怪物,易得1A=0.25p;对于糟糕AC的+0怪物、或标准AC的-2怪物,易得1A=0.55p。这些计算在《基于命中点的收益模型》已详细论述,读者应该能够自主计算。

      但另一方面,根据遭遇XP表,怪物每提升2级,XP翻倍,每降低2级,XP减半。即,中等难度的遭遇,由4个-2怪物、2个+0怪物、或1个+2怪物构成。因此它们的生命值的重要程度根据XP的不同而不同,对它们造成相同伤害的收益也不同。这在同时遭遇不同等级怪物时显得尤为突出。

      将收益定义为对同级生物造成的伤害量和恢复量,就无法跟踪由目标数据导致的收益差异,进而难以判断由XP导致的目标生命值重要程度。

      ……
      待完善,现给出根据XP决定的非同级生物造成的伤害量和恢复量与现有收益定义的等式:
      对目标的伤害量/目标怪物的生命值*目标XP = 收益/同级怪物标准生命值*40,其中,40为同级生物的X。即:
      收益=对目标的伤害量 * 同级怪物标准生命值/目标怪物的生命值 * 目标XP/40
« 上次编辑: 2023-07-06, 周四 10:54:41 由 晨世宣融 »

离线 晨世宣融

  • Knight
  • ***
  • 帖子数: 353
  • 苹果币: 0
Re: PF2模型浅析:3A制、MAP设计、成功度设计
« 回帖 #3 于: 2023-02-04, 周六 19:49:42 »
三、应用实例
(一)、基本行动与战技行动
1、打击与武器特性
      通常,打击伤害主要包括伤害骰ndx(分为1dx、2dx的强击武器、3dx的高等强击武器和4dx的上等强击武器)、力量调整值(分为近战和投掷的完整力调、助进的一半力调、远程的无力调)、武器专精伤害(每熟练度1或2伤害)、性能符文给予的额外伤害以及其他状态/环境加值。假设最高进度完整力调、游侠的武器专精进度、全部使用d6伤害骰的性能符文,则伤害中骰子与加值的关系约为ndx+5n,即骰子与加值的比值约为dx:5。
      灵巧、回摆、横扫:由于灵巧的最大伤害骰为单手d6,对应单手最大伤害骰为d8,伤害骰期望p的比例约为17:19。考虑h=13时,二打的等效命中骰为16+9=25,而灵巧二打的等效命中骰为16+10=26,因此标准情况下灵巧特征只会减少强度。可以发现,在h>5时,d6灵巧二打始终难以追及d8二打。回摆有相似的问题,双手最大d10,单手最大d6(需要进阶才有d8);横扫则相对较好,双手最大d12,单手最大d8,不亏伤害骰。
      擒抱、摔绊、猛推:除非流派需要,不建议为此亏伤害骰。
      叠劲、成对:加成非第一打的情况,加成量太少,不值得为此亏伤害骰。假设该特性亏1级伤害骰,那么合理伤害加值约为每伤害骰3点。
      夺命、致命:加成重击的情况,擅长应对h较大的情况(欺负弱怪)。假设致命特性亏1级伤害骰,那么合理(按h=13)伤害加值约为每伤害骰5或更多(如致命d10)。
      远程:假设目标距离需要近战生物移动n次,且近战与远程的等效命中点相同,且双方都有合适的填充动作,得比例等式(移动*n+第一打)/ 第一打 = 近战威力 / 远程威力。其中,移动开销A,第一打开销2A,可得近战威力 / 远程威力 = n/2+1。在不考虑性能符文和武器专精伤害时,近战d12的伤害威力大约是助推远程d6的两倍,对应n=2;随着等级提升,伤害威力的比值减小,在20级时约为1.2倍,对应n=0.4<1,即远程处境相对变好。
      装填远程:同远程,有比例等式(移动*n+第一打)/(装填+第一打) = 近战威力 / 远程威力,可得近战威力 / 远程威力 = (n+2)/3,低级时,n=2.2,弱于远程。
      长触及:假设目标距离需要非长触及移动1次,有比例等式(移动+第一打)/ 第一打 = 近战威力 / 长触及威力,可得近战威力 / 长触及威力 = 3/2。然而d12武器与d10武器的威力比约为1.1,可见合理操作下,长触及的强大。
2、移动(行走、快步、飞行)
      行走花费1A,通常有两种用处:改变距离、改变站位。用于改变距离时,只要速度不达到对方的两倍,都属于动作的1比1互换。用于改变站位时,可以从未夹击变为夹击。
      夹击会使得敌人的AC获得-2环境减值,对于第一打,相当于命中点h增加2点,等效命中点则增加4点。在至少能为夹击的另一方提供4点等效命中点时,达到至少0.4p的提升,接近第二打,是一个合格的填充动作。
      当快步用于改变距离、或用于造成夹击时,与行走等价。
      飞行,能够避免受到近战打击,但每回合需要花费1A飞行。因此当至少有一个同级敌人因此而失去1A或1MAP时,可以考虑在遭遇中飞行。
3、举起盾牌、护盾术、武器格挡
      举起盾牌花费1A,增加2点AC的环境加值。在2个+0敌人或1个+2生物会至少使用第一打攻击你时,举起盾牌就能达到至少0.4p的伤害减少,是一个合格的填充动作。附带的反应盾牌格挡更是血赚。
      而护盾术只提供1点AC的环境加值,不过提供的反应格挡尚可。
     使用武器进行格挡,获得1点AC的环境加值,无法使用反应格挡,至少需要被2个敌人3打,此时价值0.4p,才是合格的填充动作。
4、特技:翻滚
      需要过检定的行走,用于制造夹击时由于成功率,收益偏低;而不用于制造夹击时(指某个在地上打滚的耍帅家伙),几乎无收益。
5、运动:擒抱、摔绊、卸武、推撞
      运动的四个技能动作都是攻击动作,需要MAP,等效花费2A。
      擒抱对应擒拿状态与束缚状态(大成功时),擒拿状态提供了禁足、措手不及。该状态对于不进行移动的生物,等于措手不及 * 1轮;对于需要进行移动的生物,可以得到以下等式:擒拿或束缚 = 措手不及 * 行动轮次 + 逃脱 + (1 - 逃脱成功率) * 擒拿,其中逃脱 = 1A + MAP = 2A。行动轮次依赖合理战术可以接近1轮,则擒拿或束缚 = (措手不及 * 1轮 + 2A)/逃脱成功率。擒拿或束缚的成本为2A / 成功率≈ 1.2p,可见,只要目标试图逃脱,且成功率与逃脱成功率相近,擒抱动作就可以用来取得优势。对于1轮的措手不及,相信读者已经能够自行计算出其价值,在目标不需要移动时,很难达到预期收益。
      摔绊对应倒地状态,倒地状态提供了措手不及、攻击的-2环境、限制爬行和站起。对于倒地生物,他具有站起或不站起的抉择。站起 - 不站起 = 0.3p - 1A +(- 倒地状态)* 永久 - 可能受到的借机,其中0.3p表示二打的收益差值。假设对方仍会尝试摔绊且成功率为13/20,则倒地状态 = 2A / 成功率 ≈ 1.2p。又每次借机可视为0.8p,可见,0.8p < 0.3p - 1A + 1.2p < 2*0.8p,当会额外受到至少2次借机的情况下,不推荐站起;反之,请站起来。基于博弈,摔绊收益考虑目标采取最优策略。如前所述,在至多造成1次借机的情况下,假设目标会站起,则摔绊 - 不摔绊 = ((措手不及 * 行动轮次) + 造成借机次数)* 成功率 - 2A,假设行动轮次中对目标攻击了n次(其中第一打计为两次),则当造成1次借机次数时,n需要大于3.3;当不造成借机次数时,n需要大于12.3;即,当有1次借机次数时,通常是赚的。在至少造成2次借机的情况下,假设目标不会站起,则摔绊 - 不摔绊 = (措手不及 + 攻击的2AB)* 永久 * 成功率 - 2A,假设行动轮次中对目标进行及目标发起了n次攻击(其中第一打计为两次),则n需要大于12.3。设仅有的两个武器输出以及目标会每轮进行2打,则摔绊后的第二轮结束即可达到预期。
      推撞在某些情况下有奇效,推撞的有效成本略高于3A,则只要目标在被推撞后,需要花费3A或更多动作返回时,就是极其有效的。
      卸武卸武需要大成功才能将目标的武器击落,收益仅为捡起武器的0.06p。极其孱弱。
6、欺骗:虚招
      假设总是进行二打,技能动作成功率13/20。则成本1A,收益为3/20*0.3p*2 + 10/20*0.3p = 0.24p < 0.4p。较为孱弱。
7、交涉:当头棒喝
      大成功-3意志和察觉,成功-2意志和察觉。考虑到对于目标意志和察觉的挑战较少,不妨设为n次,机会收益 =(3/20 * 3/20p * 效果价值/A + 10/20 * 2/20p * 效果价值/A)* 效果次数 - 1A = 0.0725p * 效果价值/A * 效果次数 - 0.4p,可得,效果价值*效果次数/A需要大于5.52。满足情况的有,一分钟内至少施放3个有价值的意志豁免的AA法术或相应的对抗意志能力,这通常较难达成。(感谢梅琳指出错误。)
8、威吓:挫败士气
      假设技能动作成功率13/20。则成本1A,收益为0.8 * 相关的等效动作数。假设目标进行2打(提供3A),则至少需要团队对目标支出共计7A(包含打击、法术打击、豁免,且第一次打击计两次)才能合格。这是一个比较容易达到的数量。
9、医疗:战地医疗
      强。
10、宗教:战斗祈祷

11、隐匿:躲藏、潜行

(二)、能力与专长
1、概率换MAP(不亏):击倒、击退打击
2、赚MAP:双重切割、横扫、精通击倒、恶狼拖拽、混合战技、法术打击
3、赚A:疾风连击、猎杀射击、双重攻击
4、A换面板:狂暴、超载、猎杀目标、弱点发掘、制裁邪恶、出谋划策
(三)、法术
1、2A攻击法术
2、2A豁免法术
3、克敌
(四)、物品
« 上次编辑: 2023-07-31, 周一 09:32:39 由 晨世宣融 »

离线 晨世宣融

  • Knight
  • ***
  • 帖子数: 353
  • 苹果币: 0
Re: PF2模型浅析:3A制、MAP设计、成功度设计
« 回帖 #4 于: 2023-02-04, 周六 19:49:50 »
四、补充
1、反应动作
2、指挥仆从
« 上次编辑: 2023-02-04, 周六 23:44:14 由 晨世宣融 »