完全信息动态博弈之Stackelberg Game

Stackelberg Game

斯塔克尔伯格模型(Stackelberg Game)由德国经济学家Heinrich von Stackelberg于1934年提出,是寡头市场理论的重要组成部分。斯塔克尔伯格模型是一种动态博弈论模型,扩展了古诺模型,通过引入决策的时序不对称和市场角色的不对称,描述了厂商之间的竞争。

该模型适用于分析产量竞争但决策时序和市场权力不对称的场景。斯塔克尔伯格模型特别适合描述具有主导厂商的市场,例如电信、能源或航空业,其中一家大型企业(领导者)通过先发制人的产量决策影响市场价格,而其他较小的企业(追随者)则根据领导者的决策调整自己的产量。

斯塔克尔伯格模型的核心假设包括:

  1. 动态博弈:领导者先选择产量,追随者在知晓领导者产量后选择自己的产量。
  2. 不对称地位:领导者具有市场主导地位,可能因为规模、技术或品牌优势;追随者则处于从属地位。
  3. 完全信息:追随者在决策时完全了解领导者的产量决策。
  4. 产量竞争:与古诺模型类似,厂商以产量为决策变量,追求利润最大化。

模型设定

  1. 博弈方:两个生产相同产品的厂商,厂商1为领导者,厂商2为追随者。
  2. 产量:厂商1产量为 q1,厂商2产量为 q2,市场总供给 Q = q1 + q2
  3. 市场需求:市场出清价格为 P = P(Q),满足:
    • P(Q) < 0(严格递减)
    • P(Q) ≤ 0(凹函数或线性)
  4. 成本函数
    • 厂商1:C1(q1),满足 C1(q1) ≥ 0
    • 厂商2:C2(q2),满足 C2(q2) ≥ 0
  5. 利润函数
    • π1 = P(q1 + q2) ⋅ q1 − C1(q1)
    • π2 = P(q1 + q2) ⋅ q2 − C2(q2)
  6. 博弈时序:厂商1先选择 q1,厂商2观测到 q1 后选择 q2

一般形式子博弈精炼纳什均衡推导

子博弈精炼纳什均衡的要求:

  1. 在整个博弈中构成纳什均衡
  2. 在每一个子博弈中都构成纳什均衡
  3. 通过逆向归纳法求解

第二阶段:追随者决策

追随者在观测到 q1 后的子博弈中求解: maxq2π2 = P(q1 + q2) ⋅ q2 − C2(q2) 一阶条件: $$ \frac{\partial \pi_2}{\partial q_2} = P(Q) + P'(Q) \cdot q_2 - C_2'(q_2) = 0 \tag{1} $$ 其中 Q = q1 + q2

二阶条件(确保最大值): $$ \frac{\partial^2 \pi_2}{\partial q_2^2} = 2P'(Q) + P''(Q) \cdot q_2 - C_2''(q_2) < 0 \tag{2} $$ 式(1)隐式定义了反应函数 q2 = R2(q1)

反应函数斜率: $$ \frac{d R_2}{d q_1} = \frac{-P'(Q) - P''(Q) \cdot q_2}{2P'(Q) + P''(Q) \cdot q_2 - C_2''(q_2)} < 0 \tag{3} $$ 表明产量之间存在战略替代关系。

第一阶段:领导者决策

领导者预见反应函数 q2 = R2(q1),求解: maxq1π1 = P(q1 + R2(q1)) ⋅ q1 − C1(q1) 一阶条件: $$ \frac{\partial \pi_1}{\partial q_1} = P(Q) + P'(Q) \cdot \left( 1 + \frac{d R_2}{d q_1} \right) \cdot q_1 - C_1'(q_1) = 0 \tag{4} $$ 代入式(3)的反应函数斜率,联立式(1)和式(4),可解得均衡产量 (q1*, q2*)

线性需求子博弈精炼纳什均衡推导

假设市场需求为 P = a − bQ,其中 a, b > 0,且成本函数为线性 C1(q1) = cq1C2(q2) = cq2,其中 c ≥ 0 为常数边际成本。

第二阶段:追随者决策

追随者利润: π2 = (a − b(q1 + q2)) ⋅ q2 − cq2 一阶条件: $$ \frac{\partial \pi_2}{\partial q_2} = a - b q_1 - 2b q_2 - c = 0 $$ 解得反应函数: $$ q_2 = R_2(q_1) = \frac{a - c - b q_1}{2b} \tag{5} $$ 二阶条件: $$ \frac{\partial^2 \pi_2}{\partial q_2^2} = -2b < 0 $$ 满足最大值条件。反应函数斜率: $$ \frac{d R_2}{d q_1} = -\frac{1}{2} < 0 $$ 确认战略替代关系。

第一阶段:领导者决策

领导者利润: π1 = (a − b(q1 + R2(q1))) ⋅ q1 − cq1 代入 $q_2 = \frac{a - c - b q_1}{2b}$,得: $$ Q = q_1 + q_2 = q_1 + \frac{a - c - b q_1}{2b} = \frac{a - c + b q_1}{2b} $$

$$ P = a - b Q = a - b \cdot \frac{a - c + b q_1}{2b} = \frac{a + c - b q_1}{2} $$

利润函数: $$ \pi_1 = \left( \frac{a + c - b q_1}{2} \right) \cdot q_1 - c q_1 $$ 一阶条件: $$ \frac{\partial \pi_1}{\partial q_1} = \frac{a + c - b q_1}{2} - \frac{b q_1}{2} - c = \frac{a + c - 2b q_1 - 2c}{2} = \frac{a - c - 2b q_1}{2} = 0 $$ 解得: $$ q_1^* = \frac{a - c}{2b} \tag{6} $$ 代入反应函数(5): $$ q_2^* = \frac{a - c - b \cdot \frac{a - c}{2b}}{2b} = \frac{a - c - \frac{a - c}{2}}{2b} = \frac{\frac{a - c}{2}}{2b} = \frac{a - c}{4b} \tag{7} $$ 均衡总产量: $$ Q^* = q_1^* + q_2^* = \frac{a - c}{2b} + \frac{a - c}{4b} = \frac{3(a - c)}{4b} $$ 均衡价格: $$ P^* = a - b Q^* = a - b \cdot \frac{3(a - c)}{4b} = a - \frac{3(a - c)}{4} = \frac{a + 3c}{4} $$ 均衡利润: $$ \pi_1^* = P^* q_1^* - c q_1^* = \frac{a + 3c}{4} \cdot \frac{a - c}{2b} - c \cdot \frac{a - c}{2b} = \frac{(a - c)^2}{8b} $$

$$ \pi_2^* = P^* q_2^* - c q_2^* = \frac{a + 3c}{4} \cdot \frac{a - c}{4b} - c \cdot \frac{a - c}{4b} = \frac{(a - c)^2}{16b} $$

一般性结论

  1. 先动优势:领导者利润 π1* > π2*,通过先选择产量获得战略优势
  2. 反应特性:追随者产量随领导者产量增加而递减 ($\frac{d R_2}{d q_1} < 0$)
  3. 市场效率:斯塔克尔伯格模型总产量高于古诺均衡,价格低于古诺均衡

与相关模型的比较分析

古诺模型

均衡条件(一阶条件为0的等式): P(Q) + P(Q) ⋅ qi = Ci(qi),  i = 1, 2 对于 P = a − bQCi(qi) = cqi$$ q_1^C = q_2^C = \frac{a - c}{3b}, \quad Q_C = \frac{2(a - c)}{3b}, \quad P_C = \frac{a + 2c}{3} $$

$$ \pi_i^C = \frac{(a - c)^2}{9b} $$

单寡头垄断模型

均衡条件: P(Q) + P(Q) ⋅ Q = C(Q) 对于 P = a − bQC(Q) = cQ$$ Q_M = \frac{a - c}{2b}, \quad P_M = \frac{a + c}{2}, \quad \pi_M = \frac{(a - c)^2}{4b} $$

三模型综合比较

指标 单寡头 (Monopoly) 古诺 (Cournot) 斯塔克尔伯格 (Stackelberg)
领导者产量 $Q_M = \frac{a - c}{2b}$ $q_1^C = \frac{a - c}{3b}$ $q_1^S = \frac{a - c}{2b}$
追随者产量 - $q_2^C = \frac{a - c}{3b}$ $q_2^S = \frac{a - c}{4b}$
总产量 $Q_M = \frac{a - c}{2b}$ $Q_C = \frac{2(a - c)}{3b}$ $Q_S = \frac{3(a - c)}{4b}$
价格 $P_M = \frac{a + c}{2}$ $P_C = \frac{a + 2c}{3}$ $P_S = \frac{a + 3c}{4}$
领导者利润 $\pi_M = \frac{(a - c)^2}{4b}$ $\pi_1^C = \frac{(a - c)^2}{9b}$ $\pi_1^S = \frac{(a - c)^2}{8b}$
追随者利润 - $\pi_2^C = \frac{(a - c)^2}{9b}$ $\pi_2^S = \frac{(a - c)^2}{16b}$
总利润 $\pi_M = \frac{(a - c)^2}{4b}$ $\pi_C = \frac{2(a - c)^2}{9b}$ $\pi_S = \frac{3(a - c)^2}{16b}$
消费者剩余 $CS_M = \frac{(a - c)^2}{8b}$ $CS_C = \frac{2(a - c)^2}{9b}$ $CS_S = \frac{9(a - c)^2}{32b}$
产量结构特征
  1. 领导者产量:斯塔克尔伯格 > 单寡头 > 古诺 $$q_1^S = \frac{a-c}{2b} > Q_M = \frac{a-c}{2b} > q_1^C = \frac{a-c}{3b}$$
  2. 市场总产量:斯塔克尔伯格 > 古诺 > 单寡头 $$Q_S = \frac{3(a-c)}{4b} > Q_C = \frac{2(a-c)}{3b} > Q_M = \frac{a-c}{2b}$$
价格水平比较

市场价格:单寡头 > 古诺 > 斯塔克尔伯格 $$P_M = \frac{a+c}{2} > P_C = \frac{a+2c}{3} > P_S = \frac{a+3c}{4}$$

利润分配格局
  1. 领导者利润优势$$\pi_1^S = \frac{(a-c)^2}{8b} > \pi_1^C = \frac{(a-c)^2}{9b}$$
  2. 追随者利润劣势$$\pi_2^S = \frac{(a-c)^2}{16b} < \pi_2^C = \frac{(a-c)^2}{9b}$$
  3. 总利润排序:单寡头 > 古诺 > 斯塔克尔伯格
消费者福利分析

消费者剩余是指消费者愿意支付的最高价格与实际支付价格之间的差额总和,衡量消费者从交易中获得的净收益。对于线性需求函数 P = a − bQ,消费者剩余的计算公式为: $$ CS = \frac{1}{2} \times (a - P^*) \times Q^* $$

其中:a 为需求曲线的纵截距(最高保留价格),P* 为市场均衡价格,Q* 为市场均衡数量。

消费者剩余:斯塔克尔伯格 > 古诺 > 单寡头 $$CS_S = \frac{9(a-c)^2}{32b} > CS_C = \frac{2(a-c)^2}{9b} > CS_M = \frac{(a-c)^2}{8b}$$

总结与心得

斯塔克尔伯格模型描述了领导者先选择产量、追随者后反应的动态博弈。子博弈完美纳什均衡通过追随者的反应函数和领导者的优化求解,均衡产量满足战略替代关系。领导者因先动优势获更高利润,总产量高于古诺模型,价格更低,消费者剩余增加。


完全信息动态博弈之Stackelberg Game
http://horizongazer.github.io/2025/10/17/完全信息动态博弈之Stackelberg Game/
作者
HorizonGazer
发布于
2025年10月17日
许可协议