Deep learning for revenue-optimal auctions with budgets

1. 研究的问题:

这篇论文研究的问题是如何设计收入最大化的拍卖机制,特别是针对具有私人预算限制的环境中的拍卖。在这种环境下,竞拍者由于财务约束,无法支付超过他们预算的金额。论文探讨了即使在单一物品和两个竞拍者的情况下,带有私人预算约束的最优主导策略激励相容(DSIC)设计也是未知的。作者尝试使用深度学习方法来解决这个问题。

2. 研究的对象:

研究的对象是多物品拍卖环境中的私人预算约束,包括但不限于单一物品拍卖、多物品拍卖、具有附加价值的竞拍者和单位需求竞拍者的拍卖。这些拍卖场景中的竞拍者具有私人价值和预算限制,论文尝试设计出在这些约束下能够最大化预期收益的拍卖规则。

3. 使用的技术:

作者使用了深度学习技术,特别是神经网络来模拟拍卖规则,并使用机器学习进行最优拍卖的自动化设计。具体来说,他们扩展了RegretNet框架,以处理私人预算约束和贝叶斯激励相容性(BIC)。他们还使用了增强拉格朗日方法来解决基于样本的优化问题,并通过Adam优化器来逼近解决内层优化问题。此外,他们还使用了TensorFlow深度学习库进行实验,并采用了增强拉格朗日方法中的拉格朗日乘数更新技术来处理约束条件。

扩展RegretNet的部分

预算约束(Budget Constraints):

原始的RegretNet框架没有考虑预算约束。在这篇论文中,作者扩展了框架以包括预算约束,即确保拍卖机制不会让竞拍者支付超过其预算的金额。
这是通过在损失函数中加入预算约束(BC)罚分来实现的,以确保每个竞拍者的支付不超过其预算。
贝叶斯激励相容性(Bayesian Incentive Compatibility, BIC):

除了主导策略激励相容性(DSIC),作者还扩展了框架以支持BIC,这是一种在竞拍者类型分布未知的情况下的激励相容性。
在BIC拍卖中,竞拍者在报告自己的类型时,说真话是其最优策略,从期望上讲,相对于其他竞拍者的类型。
条件激励相容性(Conditional Incentive Compatibility):

作者还考虑了条件激励相容性,即竞拍者只能低估自己的预算,而不是高估。
这需要对RegretNet框架进行进一步的调整,以处理这种单向的激励约束。

公式变化:(3.1)

regret
原始RegretNet:
regret
现在的loss function:
regret
原始RegretNet:
regret
其实就是加上考虑了budget和IR,pay要小于budget,收益不能为负
regret

网络结构变化:

本文:
Budgeted RegretNet: (a) Allocation rule a and (b) Payment rule p for a setting withm distinct items and n unit-demand buyers.
regret
原始RegretNet:
regret
regret
其实就是输入的从只有bid变成value(可能不truthful)+budget