欢迎来到Dr.Liu的5分钟系列讲座。上一讲我们提到数据分析的两种基本类型,其中较简单的一种就是对于单个变量的统计总结。其实这也是我们在做所有更复杂的数据分析工作之前都应该做的一种基本分析。这一讲就来谈谈都有哪些通用的方法可以用于单变量数据的检验和统计总结。 首先我们要明确的是样本数据和总体数据的区别,也就是sample和population的区别。通常情况下,由于资源条件的限制,我们所采集和分析的数据往往数量有限,它们往往只是来自我们所关注的研究对象的总体中的一部分样本。我们通常需要通过对样本数据的统计分析得出样本的性状,然后再据此对研究对象总体的性状作出推论。比如通过计算样本的Standard deviation,我们可以估算出样本均值相对于总体均值的Standard error。样本相对于总体的Standard error不仅和样本的Standard deviation有关,还受到样本数量n的影响。对于同样的Standard deviation,样本数量越大, 总体的Standard error就越小