返回主页

“沙漠掘金”游戏不同情景设定下以最大收益为目标的决策模型

比赛官网: http://www.mcm.edu.cn/

模型论文 :点击获取

模型PPT展示 :点击获取

解决问题

玩家拥有地图,可利用初始资金购买一定数量的水和食物,从起点出发,在 沙漠中行走。游戏目标是在规定时间内到达终点,并保留尽可能多的资金,具体设定参数见论文与赛题。 该模型需要解决的问题如下

(1) 假设只有一名玩家,在整个游戏时段内每天天气状况事先全部已知,给 出一般情况下玩家的最优策略,并求解附件中的“第一关”和“第二关”。

(2) 假设只有一名玩家,玩家仅知道当天的天气状况,可据此决定当天的行 动方案,试给出一般情况下玩家的最佳策略,并对附件中的“第三关”和“第四 关”进行具体讨论

(3) 现有 n 名玩家,他们有相同的初始资金,且同时从起点出发。假设在整个游戏时段内每天天气状况事先全部已知,每名玩家的行动 方案需在第0 天确定且此后不能更改。试给出一般情况下玩家应采取的策略,并 对附件中的“第五关”进行具体讨论。假设所有玩家仅知道当天的天气状况,从第1天起,每名玩家在当天行 动结束后均知道其余玩家当天的行动方案和剩余的资源数量,随后确定各自第二 天的行动方案。试给出一般情况下玩家应采取的策略,并对附件中的“第六关” 进行具体讨论

模型概述

本文针对沙漠掘金问题进行了研究,在不同的条件之下给出了多种简化方法 以及决策模型,以针对最多金钱路线进行探究。

针对问题 1,考虑确定信息,本文利用资源无剩余、最短路径策略、无向图 简化、多余边去除的简化方法和晴朗天气不停留、最多挖矿、补货贪心的通用策 略,以及动态规划最小花费下界策略来进行路径选择。

针对问题 2,考虑不确定天气情况,对于沙漠地图进行最初路线规划一致性、 无向图简化、多余边去除、晴朗天气不停留、预决策进行信息决策简化。同时利 用天气概率,提出基于天气概率的直达终点最短花费模型,得到高温下在花费和 天气信息下的决策行为,并结合玩家决策倾向综合考虑各种因素最优策略的玩家 最终决策。对于挖矿行为,本文提出基于逃离阈值的挖矿停止指导策略,以玩家 设定逃离阈值(因为资源缺少而中途结束游戏的概率)计算村庄补货、前往终点 的逃离时机

针对问题 3,我们做出最短路径简化,以基于混合 Nash 模型给出博弈决策 形式,在具体情况之下,同时对于多人挖矿情形给出基于资源相似度的考虑法则 和提早补货的决策

本文模型方法多样,涵盖有等效简化、降维简化、综合指导策略、定量决策 判定等思想,同时原理直观、最终形式直接,符合一般直觉。缺点是无法给予通 用的定量策略