中的关联分析和相关分析,关联分析在中的潜在价值。看到这个题目,也许我们首先想到的是相关分析,其实关联分析与相关分析是不同的。相关分析(包括pearson相关、spearman相关分析)是研究一个变量随另外一个变量的变化情况,如两个变量是正相关,我们认为随着一个变量值的升高,另外一个变量的值也升高。而关联分析则是用于发现隐藏在大型数据中令人感兴趣的联系,描述了一个事物中某些属性同时出现的规律和模式。
网购已经成为我们生活中的一部分。在我们网购时,我们有时候会发现,我们购买或者搜索了一个物品后,网站会自动推荐一些我们还想购买的物品。这些推荐是根据很多算法推算出来的,其中重要的一种方法就是关联分析。比如某超市对购物的小票进行研究,然后把尿布与啤酒这两种风马牛不相及的商品居然摆在一起。但这一奇怪的举措居然使尿布和啤酒的销量大幅增加了。这可不是一个笑话,而是一直被商家所津津乐道的发生在美国沃尔玛连锁超市的真实案例。原来,美国的妇女通常在家照顾孩子,所以她们经常会嘱咐丈夫在下班回家的路上为孩子买尿布,而丈夫在买尿布的同时又会顺手购买自己爱喝的啤酒。正是基于这种理论,无论是超市还是大型购物网站,都会基于关联分析进行物品摆放和物品推荐。
关联分析的理论其实很简单,,就是发现存在于大量数据集中的关联性或相关性,比如在上面例子中,通过了解哪些商品频繁地被顾客同时购买,这种关联的发现可以帮助零售商制定营销策略。可从数据库中关联分析出形如“由于某些事件的发生而引起另外一些事件的发生”之类的规则。如“67%的顾客在购买啤酒的同时也会购买尿布”,因此通过合理的啤酒和尿布的货架摆放或捆绑销售可提高超市的服务质量和效益。
近些年来,有些研究将关联分析应用于医药卫生行业,并认为在卫生系统中的应用关联度进行分析并与相关分析进行比较,有助于对卫生系统内部各因素之间的关系进行恰当分析,从而为各层次的决策提供准确客观的依据。关联分析在遗传分析、分子生物学、诊断以及中医药研究中应用较多。而未来将是大数据时代,而医药的大数据将是更大的数据集,关联分析可用于相关分析。例如中医药配伍的研究中,可以将老中医的药方与相应的疾病进行关联分析,找出相关疾病最常用的配伍。在诊断研究中,可以将相关症状、检验结果与相关疾病进行关联分析,找出某疾病最常伴随的症状、检验结果、疾病、生活习惯等,从而为诊断提供参考依据。