【原创】【博弈游戏】（杀拉的私人活动）——警察与小偷

21457 · 发表于 2017-12-9 09:47:33

附图，然后a一波大家
@Rubp @Vt超新星 @c.c @Amummy @侦探小虎队 @漆黑の追迹者 @名偵探小品 @茶七.阳

不知道大家的重点主要在哪，反正我是立刻注意到小腐的战绩简直闪瞎

37855 · 发表于 2017-12-11 20:10:29

有趣有趣，占个楼
smart_police和careful_police都是黑盒对吧
补充:我来一波警察

方案一：
第①步，第一个点随机50：50；
第②步，如果抓到了小偷，则下次继续留着这里，如果没抓到下次则换另一个地方；

37855 · 发表于 2017-12-11 21:07:07

方案二：（这个有点长，而且涉及到学习，所以另开一楼）

第①步，第一个点随机50：50，反正第一个没所谓啦；
第②步1，如果没抓到，则 x1% 换另一个地方；
第②步2，如果抓到了，则 y1% 留下。x1、y1预设值为75；
step = 4
第③步1，前100次比赛后（假设实验次数是1w次以上）调整一次x和y，这100次里面，换地方胜率是a1；
第③步2，x2=70继续进行100次实验，得出换地方胜率a2；
第③步3，如果a1>a2，则x3=x1+step，如果a1<a2，则x3=x2-step；
第④步，重复第③步10次，得出a1-a10，选取其中最理想的两个结果，b1和b2（对应x1'和x2'），然后让x11=(x1' * b1+x2' * b2)/(b1+b2)，step=step/2，继续进行第③步3，每10次再按第④步照调整一次x和step；
（y和x的调整一样）

第③④步的学习方案我预想要根据方案一的结果来调整；
第③④步的学习方案其实有两套，一套是针对胜率的，另一套是针对收益的，现在先做一套胜率出来；

这个方案好像有点复杂。。。有不理解的地方我再解析

37855 · 发表于 2017-12-11 22:00:20

不行了，被专家方案约束了，理论上来说应该是猴子2的以德报德方案是最好的

37855 · 发表于 2017-12-12 12:54:27

感觉这个游戏很好玩啊，楼主大大可以考虑租个服务器，然后向上面塞警察和贼的方案，然后自己跑结果

48059 · 发表于 2017-12-22 23:31:47

警察策略，始终选择上次小偷的选择。和ls的策略进行500天对战。

[逻辑推理] 【原创】【博弈游戏】（杀拉的私人活动）——警察与小偷