1. 众所周知,在样本总量比较大时,统计结果会集中趋向于概率模型下的期望值。我在本次统计时选取了569个样本,包含150人的发帖际遇记录。
2. 我在上一次写帖的时候通过统计结果说明黑际遇扣得比红际遇多。为了保证本次统计结果受到的无关影响尽可能少,我只选取了近二十来天之内的发帖际遇。
3. 因为际遇统计区总是出现新的发帖际遇,将会导致翻页时可能存在的数据重复。我在统计之初并没有考虑到这个问题,导致出现了重复数据。虽然我经过简单思考得出数据重复的出现是随机的,因此不应该造成统计结果偏差。但是这样无疑会降低【可行性讨论】第一条所带来的统计结果精确度。我曾一度想要通过扩大50%的样本空间来强拉硬拽回这个精准度,但是由于【可行性讨论】第二条的限制,我最终没敢冒险,还是把EXCEL删了重列。(这里补充一下,由于我发现问题时没控制好情绪,借题发挥地把@funckfasss. 怼了一通,在这里道个歉。)
4. 这一点是@是我没错 提出来的。“那你还得问问别人什么时候买的招财猫吧?这工作量不是登天?”“万一它提升的概率很小比如只有10%怎么办?”不得不说,这个问题确实是在我考虑范围之外的,但是我想了一下,这一点实际上不会造成太大阻力。
4.1. 虽然很有可能存在最近二十几天内才买招财猫勋章的人,但是毕竟是少数人。毕竟我统计的时间只在近二十天内。
4.2. 我这只是在强调“招财猫是否有用”,对这个问题的研究是定性的而非定量的。如果招财猫勋章真的有用的话,那么必定能看到两种人的总计结果存在差值。那么就到了下一个问题,也就是幅度。
4.3. 我一开始做出的预判是:只要最大值和最小值的差距不到最大值的3%,那么就可以证明招财猫勋章没有用。这个预判应该够保守了。如果招财猫勋章甚至还有负作用的话,那么就可以枪毙了……(这里也要补充一下,因为我没考虑到黑际遇按照负数来计算,最终结果很接近于0,因此后来这个标准被我取缔了。而最终的统计结果则表明,我压根不用考虑那么多。)
误差分析:
1. 由于统计结果本身存在着不可避免的误差,所以并不能精确地反映概率模型下的期望值。
2. 由于统计样本还是不够大(569个样本其实挺小的,只是由于我太懒了加上【可行性讨论】第二条的限制,样本空间没有进一步增大)而导致可能存在的的较大偶然性问题,因此本统计结果只供参考。如果想知道招财猫勋章确实有没有用,不能妄听我这一面之言。
3. 关于统计时可能存在的输入错误问题(不小心多敲了个0之类的),我已经对全表格中超过10小于等于99的数据检索了一番,目前并未发现类似问题。但是这不表明该种输入错误不存在(不小心多敲了两个0之类的问题呢……我没来得及查啊)。我把链接【https://pan.baidu.com/s/145Zqr4bVhB4o3n8DVQmhkQ】和提取码【ppx0】放在这儿,如果有兴趣,可以下载这个EXCEL帮忙检查。
4. 其它主客观原因造成的误差。我已经将我能想到的误差降到尽可能低,但是不保证我的想法是全面的。
制表&解读:
我一直都在想,这个表格该怎么建呢?按照在上一个帖子里的制表思路,我把红际遇和黑际遇分开统计。不过上一次的制表思路比较简单,因为不用录入每个人的ID,直接顺着表格往下敲就行了。这种制表方式,我将其称为一维制表。也就是说,表头是固定的,录入数据的时候往下拖就行了。
但是这次不同。为了统计每个人是否招财猫,我必须要把每个人的ID列出来。而且统计时还要随时添加新的ID,表头并非是固定的。这种制表方式,我将其称为二维制表。在反复思考和吸取上一次制表的经验之后,我决定采取这样的制表方式:
ID | 红际遇数据1 | (留空) | 红际遇数据3 | 红际遇数据4 | 红际遇数据5 | (留空) | (留空) | 红际遇数据8 | …… |
标记有招财猫:1 标记无招财猫:0 | (留空) | 黑际遇数据2 | (留空) | (留空) | (留空) | 黑际遇数据6 | 黑际遇数据7 | (留空) |
其中,纵向排列的是ID和此ID是否购买了招财猫勋章的标记(二进制标记1和0,学过编程的人应该懂)。横向的分别是:ID一行对应此ID的红际遇数值,标记一行对应此ID的黑际遇数值。
后面,我在录入完毕之后,又建了两个新的表格,分别统计购买了招财猫的和没购买招财猫的ID对应的总数值(标记的重要性)。
好了,我就扯到这里,接下来看结果吧。