查看: 4287|回复: 0

[扔一点节操] 如何编造一组符合正态分布的数据

简洁模式
发表于 2020-5-17 10:13:56
我此前在 杨辉三角与正态分布 这个帖子中论述了杨辉三角和正态分布之间的关系,并且在此之前也在天马等人帮助下解释过扔硬币和杨辉三角的关系。
今天,这个知识终于有用了。
先来看一张图。

这就比较坑人了。今天(其实是昨天)才发给我们这么一个东西来记录前几天的体温?这不是逼我们编造数据么?而且这只是一张表,前面还有14天的表等待我去填写编造,这就更坑人了。
为了解决这个问题,我只好选择用一种比较好的方法来把数据编造出来了。
一开始是纯粹靠大脑生成随机数,只要符合一定的前提,想怎么写怎么写。可是这样总是逃脱不了平均主义的壁垒:今天早上的温度写低了,明天早上的温度就稍微高一点,最后搞来搞去是个人都能看出这是编造的。


就在这时,我想到了正态分布。
我可以给定一个区间,数次体温分布在这个区间基本满足正态分布。那么我想,怎么算出来每个温度范围的概率呢?又怎么从这个面积中间随便抽出一块作为本次的结果呢?
于是我突然联想到一个动作:抛硬币。


话不多说,直接看我是怎么做的。
第一步,我先给早上和中午的体温数各自设定一个区间。早上的体温区间是36.3~36.9摄氏度,中午的体温区间是36.8~37.4摄氏度,分度值0.1摄氏度。可以看出每个温度区间对应着7个可能的数字。
第二步,已知有7种可能性,按照我在之前解释过的,我应该寻找杨辉三角第7行的7个数字,即:1,6,15,20,15,6,1。这些就是7种可能性对应的7个概率的比例。
第三步,根据天马等人解释给我的扔硬币与杨辉三角之间的关系,我找来了6个一元硬币。摇匀之后扔出6个硬币,得到的正面朝上的个数有7中可能性:0,1,2,3,4,5,6。这7种可能性的概率比例也对应杨辉三角第7行的7个数字,即:1,6,15,20,15,6,1。
第四步,我只需要在扔硬币的正面向上个数和体温值之间建立联系就可以了,即,对应的概率相等,扔硬币的结果能直接反应体温值。
第五步,列表,如下表所示:
正面向上的硬币个数(个)早间体温值(摄氏度)午间体温值(摄氏度)
0 36.3 36.8
1 36.4 36.9
2 36.5 37.0
3 36.6 37.1
4 36.7 37.2
5 36.8 37.3
6 36.9 37.4

第六步,扔就是了。


好的,由此,我们也可以发现一个用若干个硬币就可以编造出一组符合正态分布的数据的方法。我要说的也就这么多了。
剩下的,你可以自己思考。不过我也要说一点,那就是我非常不建议不分场合不分情况地编造数据。有些事情的确是很坑人那没办法,但是如果要是做一些统计学研究的话,那么编造数据就是科学态度有问题了。
本帖子中包含更多图片或附件资源

您需要 登录 才可以下载或查看,没有帐号?加入学院

尚未登录
您需要登录后才可以回帖 登录 | 加入学院