| 楼主| 发表于 2017-12-9 09:47:33 | 显示全部楼层
附图,然后a一波大家
@Rubp    @Vt超新星   @c.c   @Amummy   @侦探小虎队   @漆黑の追迹者   @名偵探小品   @茶七.阳

不知道大家的重点主要在哪,反正我是立刻注意到小腐的战绩简直闪瞎
本帖子中包含更多图片或附件资源

您需要 登录 才可以下载或查看,没有帐号?加入学院

登录帐号可查看完整回帖内容
| 发表于 2017-12-11 20:10:29 | 显示全部楼层
有趣有趣,占个楼
smart_police和careful_police都是黑盒对吧
补充:我来一波警察

方案一:
第①步,第一个点随机50:50;
第②步,如果抓到了小偷,则下次继续留着这里,如果没抓到下次则换另一个地方;
| 发表于 2017-12-11 21:07:07 | 2017-12-11 21:59编辑 | 显示全部楼层
方案二:(这个有点长,而且涉及到学习,所以另开一楼)

第①步,第一个点随机50:50,反正第一个没所谓啦;
第②步1,如果没抓到,则 x1% 换另一个地方;
第②步2,如果抓到了,则 y1% 留下。x1、y1预设值为75;
step = 4
第③步1,前100次比赛后(假设实验次数是1w次以上)调整一次x和y,这100次里面,换地方胜率是a1;
第③步2,x2=70继续进行100次实验,得出换地方胜率a2;
第③步3,如果a1>a2,则x3=x1+step,如果a1<a2,则x3=x2-step;
第④步,重复第③步10次,得出a1-a10,选取其中最理想的两个结果,b1和b2(对应x1'和x2'),然后让x11=(x1' * b1+x2' * b2)/(b1+b2),step=step/2,继续进行第③步3,每10次再按第④步照调整一次x和step;
(y和x的调整一样)

第③④步的学习方案我预想要根据方案一的结果来调整;
第③④步的学习方案其实有两套,一套是针对胜率的,另一套是针对收益的,现在先做一套胜率出来;


这个方案好像有点复杂。。。有不理解的地方我再解析
登录帐号可查看完整回帖内容
| 发表于 2017-12-11 22:00:20 | 显示全部楼层
不行了,被专家方案约束了,理论上来说应该是猴子2的以德报德方案是最好的
登录帐号可查看完整回帖内容
| 发表于 2017-12-12 12:54:27 | 显示全部楼层
感觉这个游戏很好玩啊,楼主大大可以考虑租个服务器,然后向上面塞警察和贼的方案,然后自己跑结果
登录帐号可查看完整回帖内容
| 发表于 2017-12-22 23:31:47 | 发自安卓客户端 | 显示全部楼层
警察策略,始终选择上次小偷的选择。和ls的策略进行500天对战。
登录帐号可查看完整回帖内容
返回版块
1234
尚未登录
您需要登录后才可以回帖 登录 | 加入学院