• 从榜单看黑茶“热” 首批中国黑茶类制茶大师公布 2019-02-19
  • 随笔:“欧洲国足”,你快乐吗?快乐就完事了 2018-12-07
  • 南昌重拳整治酒驾毒驾 2018-12-01
  • 一语惊坛(6月8日):友谊勋章是给国际友人的最高荣誉。 2018-11-28
  • 加载中........
    ×

    香港赛马会app破解:回归分析方法大杂谈——Weibull回归

    2018-11-15 作者:小白学统计   来源:小白学统计 我要评论0
    Tags: 回归分析  

    Weibull回归,有的将其音译为威布尔回归??赡苡械娜瞬⒚挥刑倒?,但是相信大多数人都听说过cox回归。前面也简单说了,在生存分析中,cox回归几乎是一统江湖。然而,这并不是说生存的预后分析中,就只有cox回归了。事实上,很多时候,cox回归未必是最佳选择,或者说,有时其它一些回归也许比cox回归更合适,这里所说的“其它一些回归”就包括Weibull回归?;蛘咭部梢运?,主要是Weibull回归。

    所以,先说应用场景,Weibull回归跟cox回归一样,也是用于生存分析中,可以用于分析生存预后的危险因素,可以建立回归模型,可以根据模型中的自变量预测生存情况。

    现实中的一个现象时,很多人在分析生存预后因素的时候,几乎想都不想就选择cox回归。为什么呢?绝对不是因为Weibull回归不如cox回归有效(事实上,很多时候,Weibull回归比cox回归有效)。我个人的看法是,主要还是因为cox回归简单易用,几乎不大用考虑什么前提条件(当然,其实也需要考虑等比例假定条件,这个后面再谈)。但是Weibull回归就不同了,需要考虑一定的前提才能用,简单地说,需要符合Weibull分布。一旦提到分布,对于临床医生来说就头大了,所以肯定就对其敬而远之。所以就选择不用考虑数据分布的cox回归。

    当然,可能很多情况下,你用cox回归也没问题,但是,Weibull回归可能会更好。什么意思呢?统计学中往往就是这样,一份数据,你用a方法说不上错,但是如果用b方法可能得到的结果更为可靠。这种情形经常出现。所以,从非统计学专业角度来看,一般人不会去考虑这些差别,只要做到不错就行了。但是,从统计学专业角度来看,我们需要考虑的不仅仅是“不错”,而是要做到“最优”,或者说“相对最优”。就像广告中说的,没有最好,只有更好。统计学家会帮你选择一个“更好”的模型。

    那cox回归跟Weibull回归有什么不一样呢?简单来说,Weibull回归属于参数模型,cox回归属于非参数模型(确切地说,是半参数模型)。估计你又着急了,什么参数、非参数。你先别着急扔手机。相信下面这些解释你能看得懂。

    所谓参数,就像是一个限制,比如我们说一个图形是三角形,三角形就有三角形的限制,你脑海里一定能想象出三角形是什么样子。这就是参数。因为它有规则,有限制,但是正因为有这些限制,所以我们很清楚它们的样子。

    而非参数,你可以认为是没有限制。比如我说我画了一个不规则图形,我让你想象一下这个什么样子。我相信几乎没有人能够想象的出,因为“不规则”这个范围太大了,没有任何限制,你没法想想它的样子,这就是非参数。

    任何分布都有一定的参数,可能是一个,也可能是两个,等等。比如正态分布,它的参数是均数和标准差。当你知道了均数和标准差,基本上就可以大致确定正态分布的样子(就像是你知道了一个矩形的长和宽,基本上就可以确定一个矩形的样子)。Weibull分布也一样,也有固定的参数,一个控制形状,一个控制位置(其实大多数的分布都是这样,一个参数决定形状,一个参数决定位置)。当你知道了Weibull分布的形状参数和位置参数,基本上就可以确定Weibull分布的样子。这就叫参数。

    所以,对于Weibull回归这样的参数回归,它的优点和缺点同样明显。优点是:如果你发现数据符合weibull分布,那么直接套用weibull回归当然是最理想的选择,可以给出最合理的估计。缺点是:如果数据不符合weibull分布,而你却还用weibull回归,那就套用错误,肯定结果就会有很大偏离。

    因此,如果你有能力判断出你的数据是否符合weibull分布,那当然最好就是使用Weibull回归这种参数回归。这时候它的估计结果比cox回归更为可靠,而且可以给出很好的预测效果。

    可惜的是,现实中可能不少人并没什么多大的信心去判断数据分布,所以我想这可能也是为什么这么多人用cox回归而不是Weibull回归的原因吧。

    cox回归可以看作是非参数的,无论数据服从什么分布都能用,但正因为它什么数据都能用。它的缺点和有点也是并存的,优点是:不用考虑数据的分布,数据是服从指数分布也好,服从Weibull分布也好,都可以用cox回归,而且结果都不会偏离太大。缺点则是:cox回归对每个数据可能都达不到最佳的拟合效果,只能是差不多的样子。

    打个比方来说,Weibull回归就像是量体裁衣,把体形看做数据,衣服看做模型,Weibulll回归就是根据你的体形做衣服,做出来的肯定对你正合身,但是对别人就不一定合身了。而且,万一量错了,那就绝对不合身了。而cox回归呢,就像是到商场去买衣服,衣服对大多数人都合适,但是对每个人都达不到最佳的合适,只能说是差不多都能穿上,但始终觉得好像有的地方不合身。

    至于到底是选择麻烦的方式量体裁衣,还是图简单到商场直接去买现成的,那就根据你的喜好了,也根据你对自己体形的了解程度,如果非常熟悉,当然就量体裁衣了。如果不大了解,那就直接去商场买大众化衣服吧。

    最后补充一下,实际中,除了Weibull回归,其实可用于生存预后的回归还有指数回归、对数正态回归、对数logistic回归等等各种回归方法,这些方法跟Weibull回归一样,对应着各自的分布。符合什么分布,就用什么回归可以达到最佳。

    最后强调一下,其实用什么分布、什么方法,并不仅仅是一个学术问题,用的恰当的话,也可以帮你得到更合理的结果,从更实用的角度来说,帮你发文章。如果你查查文献,应该就会发现。



    小提示:78%用户已下载梅斯医学APP,更方便阅读和交流,请扫描二维码直接下载APP

    只有APP中用户,且经认证才能发表评论!马上下载

    hkjc香港赛马会
  • 从榜单看黑茶“热” 首批中国黑茶类制茶大师公布 2019-02-19
  • 随笔:“欧洲国足”,你快乐吗?快乐就完事了 2018-12-07
  • 南昌重拳整治酒驾毒驾 2018-12-01
  • 一语惊坛(6月8日):友谊勋章是给国际友人的最高荣誉。 2018-11-28