求助大神matlab如何做wild bootstrap检验

2024-05-17

1. 求助大神matlab如何做wild bootstrap检验

function f=Gamma_bootstrap(k,gamma,lambda,tao,N,n,B,arfa) X= gamrnd(k,lambda,1,N); Y= gamrnd(gamma,tao,1,N); X_bar=mean(X); Y_bar=mean(Y); lambda_bar=k/X_bar; tao_bar=gamma/Y_bar; rou_hat=tao_bar/lambda_bar; R_hat=1-fcdf(gamma/...

求助大神matlab如何做wild bootstrap检验

2. bootstrap怎么对异方差检验

  Bootstrap方法根据给定的原始样本复制观测信息对总体的分布特性进行统计推断,不需要额外的信息,Efron(1979)认为该方法也属于非参数统计方法。Bootstrap方法从观察数据出发,不需任何分布假定,针对统计学中的参数估计及假设检验问题,利用Bootstrap方法产生的自举样本计算的某统计量的数据集可以用来反映该统计量的抽样分布,即产生经验分布,这样,即使我们对总体分布不确定,也可以近似估计出该统计量及其置信区间,由此分布可得到不同置信水平相应的分位数——即为通常所谓的临界值,可进一步用于假设测验。因而,Bootstrap方法能够解决许多传统统计分析方法不能解决的问题。在Bootstrap的实现过程中,计算机的地位不容忽视(Diaconis et al.,1983),因为Bootstrap涉及到大量的模拟计算。可以说如果没有计算机,Bootstrap理论只可能是一纸空谈。随着计算机的快速发展,计算速度的提高,计算费时大大降低。在数据的分布假设太牵强或者解析式太难推导时,Bootstrap为我们提供了解决问题的另一种有效的思路。因此,该方法在生物科学研究中有一定的利用价值和实际意义

  非参数统计中一种重要的估计统计量方差进而进行区间估计的统计方法,也称为自助法.其核心思想和基本步骤如下:
(1) 采用重抽样技术从原始样本中抽取一定数量(自己给定)的样本,此过程允许重复抽样.
(2) 根据抽出的样本计算给定的统计量T.
(3) 重复上述N次(一般大于1000),得到N个统计量T.
(4) 计算上述N个统计量T的样本方差,得到统计量的方差.
应该说Bootstrap是现代统计学较为流行的一种统计方法,在小样本时效果很好.通过方差的估计可以构造置信区间等,其运用范围得到进一步延伸.
具体抽样方法举例:想要知道池塘里面鱼的数量,可以先抽取N条鱼,做上记号,放回池塘.
进行重复抽样,抽取M次,每次抽取N条,考察每次抽到的鱼当中有记号的比例,综合M次的比例,在进行统计量的计算.。

3. R语言中wild bootstap怎么实现

wild.boot(x, nboot = 1), x是 a vector of regression residuals. nboot is the number of bootstrap replicates. Usually this will be a single positive integer.

package是fANCOVA

R语言中wild bootstap怎么实现

4. r语言 bootstrap能做预测吗

拔靴法属于重复抽样(resampling)方法,与Monte Carlo相比,二者真实的母体不同。它是将已有的观察值作为母体重复抽样,
以求取原先资料不足二无法探讨的资料特性。
举个例子,假设x1,x2,...,xn为来自同一分配的观察值,我们想了解这个分配的中位数。
设一组有Poisson分配抽出的随机样本,6 7 7 7 7 8 ... 15 15 17 20,共30个。已知样本中位数为10。
这里我们分别用MC方法和拔靴法模拟10000次,看中位数的分布。

5. 在R语言中,用bootstrap来计算均值方差,怎样写语言

Meta分析是一种对同一主题下的多个独立实验(研究)进行综合的统计分析方法。它萌芽于本世纪初[2];1976年由美国教育学家定义为Meta分析,并揭开了它在教育学、心理学及医学中的应用的新篇章[3]。Meta分析在这些学科的应用中取得了极大的成功,发展出了多种分析方法。Mann称其为医学方法学研究中的一次革命,且羽翼渐丰[4]。
直到90年代,此方法才被生态学家发现,虽然目前它在生态学中的应用实例还很少,但已引起了生态学界的高度重视。Gurevitch(1993)出版了第一部生态学中的Meta分析专著[5],并与人合作于1997年发行了MetaWin软件包。
在我国,彭少麟(1988)首次将此方法引入我国生态学界[6],并利用此方法进行生态学分析[7]。
Meta分析目前主要应用于对照实验的综合研究中,目的为判断实验中的处理会对实验对象产生正或负效应;效应是大还是小;同一主题下不同独立实验的结果是否一致,变异程度有多大等问题。
但Meta分析决不仅仅是一个数学分析过程,它本身也是一项研究,需要认真设计。主要步骤如下所述。
提出所要解决的问题并制定搜集、选择文献的标准。搜集文献,这是一项非常繁重且关键的工作。为了能搜集到全面的文献,通过各种途径来最大可能地收集已发表的和未发表文献(包括正式期刊中的论文、会议论文、摘要以及各种私人交换资料等)。
标定各研究的特点,并对其进行分类。根据研究背景特点的不同将所有研究分为几个级别(class),以作比较。
定量测度研究特点。为了避免分析时对质量不等的研究给予相同的结合标准,导致分析结果的不准确,分析家们提出了定性Meta分析,即制定标准,对研究特点进行打分评估;综合研究结果并结合研究特点来分析结果。也有人称这一步为定量Meta分析,以相对于定性Meta分析。
研究特征分析(敏感性分析),分析研究的基本特征(研究对象、研究环境等的特征)和方法学特征对效应值之间的协变关系。
目前已有发展出多种定量Meta分析方法。但它们的基本思想是一致的,那就是先提出假设,构造一个结合统计量,然后计算各研究的结合统计量,并用其在定性Meta分析中所得分数去权重它的结合统计量;计算各级别研究中的加权平均结合统计量(在平均过程中,要根据其各结合统计量的方差进行权重);做各级别研究间统计量的异质性检验。
定量Meta分析方法的不同主要在于结合统计量和统计假设的不同。
2  MetaWin软件的特点
MetaWin是一个主要为生态学工作者设计的定量Meta分析软件,其主要特点如下所述。
2.1  提供了两种假设模型
这两种假设模型为固定效应模型和混合效应模型,具体计算过程见文献[6]。两者的区别主要在于前者假设所综合的研究共享一个真实效应大小,实际测量的效应大小不同是由于随机取样所导致,而后者却假设研究间具有不同的真实效应大小,即所测效应大小的不同是由两部分组成,真实效应的不同,随机取样造成误差。后者更切合实际,区间估计较保守,更受Meta分析家们欢迎。
2.2  提供多种可选择的结合统计量
在生态学领域内的Meta分析中最常用的结合统计量为Hedges’d效应值:d =(Xe -Xc)/(SJ)(其中,Xe、Xc分别为实验组和对照组的测量平均值,S为两组共同标准差,J为小样本较正值),MetaWin还提供了反应比(response ratio):ln(Xe /Xc)(Xe、Xc的意义同上)这是从医学Meta中新引进的一种结合统计量;此外,MetaWin还为对Meta分析较为熟悉的分析者提供了更多的选择机会,如相关系数(correlation coefficient)等。
2.3  提供了两种数据输入方式
对有经验的分析者可直接输入效应值、样本方差等所需数据,其格式称效应数据格式。这种数据输入法的好处在于分析者可根据所收集的文献的实际情况来自己构造结合统计量,也即MetaWin为分析者提供了较大的自由。在文献数据满足前两种结合统计量计算情况下,分析者可以输入原文献中的统计数据,如平均值、样本方差、样本大小来进行计算,比较方便,称原始数据格式。
2.4  提供了一项非参数检验——重取样检验
上述参数模型检验是在假设所有研究中的实验组和对照组观测值均遵循正态分布情况下进行的;许多Meta分析方法基于大样本近似原理,即当实验组和对照组样本大小不小于10时,效应值才趋于正态分布。但如果样本太小,实验组和对照组样本大小太悬殊或效应值太大时,大样本近似原理就变得不准确了[8]。但事实上,许多生态学观察值却违背了上述情况[9]。此外,只有当上述假设被满足时,用于检验研究间效应异质性的Q值才有近似的X 2分布[7]。重取样检验法是取代传统参数和非参数检验的一种好方法。
重取样检验是一种计算机加强(computer intensive)非参数检验方法[10]。MetaWin中提供了随机化检验法(randomization test)和自助法或靴襻法(bootstrap)。前者常被用来决定一个统计量的显著性水平,后者则用于给出统计量的置信区间。
MetaWin中用自助法来计算所有研究总效应值和每一级别加权平均效应值的置信区间,对于样本含量为i的每一级别,我们均以放回式取样选取i个研究并计算其加权效应值,然后重复上述取样方法多次,按大小顺序将效应值排列起来,在两端取2.5%处的值做为5%至信区间的上下限,置信区间包括零在内的级别被认为没有显著不等于零。但当样本含量太小时,会出现区间估计过低,此时,可用偏差较正法[9]。
MetaWin中用随机检验来判断级别间效应大小的差异是否显著。首先用原始数算出QB,然后将j个级别里的所有研究混在一起,再随机将它们分成j个级别,级别含量仍与原来相同,算出QB值,重复此过程多次,得出一个QB值的分布,QB的显著性水平为随机QB值大于等于实际QB值数占重复随机取样数的百分比。
3  MetaWin软件的使用方法
3.1  MetaWin软件构成
运行MetaWin,只需一台装有Windows95、Windows3.1或WindowsNT的IBM兼容机,其中共包括8个文件。(1)MetaWin.exe:在Windows95和WindowsNT下的可执行文件。(2)MetaWin.hlp:在Windows95和WindowsNT下的帮助文件。(3)MetaWin.cnt:在Windows95和WindowsNT下的帮助文件的内容。(4)MetaW16.exe:在Windows3.1下的可执行文件。(5)Meta16.hlp:在Windows3.1下的帮助文件。(6)Raw.dta:以原文献统计数据输入数据的格式示范文件。(7)Effect.dta:以效应大小输入数据的格式示范文件。(8)Gur-hed.dta:作者的示范数据格式文件。
Windows95和Windows3.1版本的不同之处主要在于研究特征类型量、每一特征类型中级别数、每一数据文件中所含研究量及非参数检验中的重复数的最大值的不同,Windows95比Windows3.1范围更广。
3.2  MetaWin软件使用方法
3.2.1  数据输入
打开MetaWin文件,下拉file菜单,点击edit data file,进入数据输入状态,可直接在弹出的窗口中输入数据,也可从file菜单中点击load a file上载已有的文件。原始数据输入格式如下:
sex tree state +/- Nc Ne Xc Xe Sc Se Label
m oak pa + 7 7 78.14 79.71 40.650 40.650 study1
m maple ny + 7 7 18.86 26.00 9.170 9.170 study2
f maple ny - 6 6 -1.80 -2.10 0.490 0.490 study3
其中,第一行为标题行,前3项为级别分类标准,事实上,Windows95版本可允许10个分类标准,Windows3.1为5个;+/-为方向符,如果你所期待的效应值为正值时(即实验中的处理会对实验对象产生正效应),在按所期待趋势应该出现正效应值的研究项中加+,负效应值的研究中加-,它必须紧跟级别组,否则程序运行时不能识别数据文件中共有几项划分级别标准;Ne、Nc分别为实验组和对照组的样本含量;Xe、Xc分别为实验组和对照组的测量平均值;Se、Sc分别为实验组和对照组的标准差;Label为各研究的标记。标题行下面的每一行为一个研究的效应数据。效应数据输入格式为:
sex tree state +/- Nc Ne effect var Label
m oak pa + 7 7 78.0.036 0.286 study1
m maple ny + 7 7 0.565 0.347 study2
f maple ny - 6 6 1.533 0.517 study3
其中,effect一列为效应值;var为效应方差;其它同原始数据格式。
3.2.2  数据分析
在打开MetaWin文件的同时,会自动弹出一个Meta-Analysis窗口。在此窗口上部Type of Input一项中点击raw或 effect(确定数据为原始还是效应格式),原来灰色的Data file就会加亮,点击,从弹出的‘打开’窗口中选定并打开要分析的数据文件。
在Meta-Analysis窗口中部选择固定效应或混合效应模型,结合统计量,也可增加重复检验;窗口下部gourp by中可选择划分级别的标准,并在Refine Analysis中可以在不改变数据文件的情况下去掉一些级别或研究来纯化分析。
所有这些选项选择好后,即可点start键进行运算。运算结束后,会自动弹出一个Meta-Analysis output窗口,显示分析结果。
3.2.3  结果显示
在分析结果中,可看到分析时间,数据来源路径,以及名为Parametric methods和 Meta-Analysis results for groups的两个表。前者为所有研究的效应值表,每一行代表一个研究,包括其名称、所属级别、小样本校正值(J)、对照和实验两组的共有标准差(spool)、效应值(d)、95%的置信区间(95%CI)、各研究的方差(V)、权重(W)。
一般先假设所有研究享有共同的d值进行分析,此时在第二个结果表中可看到所有研究的总平均效应值(d++)、95%的置信区间、同质性(Qwi),自由度(df)、X 2检验的p值。如果其级别内异质性经X 2检验显著,则说明假设不正确,此时按一定的标准将所有研究划分为几个级别,再进行分析。此时的第二个结果表中会显示各级别内所有研究的加权平均效应值(di+)、95%的置信区间、同质性(Qwi),自由度(df)、X 2检验的p值以及级别间同质性(Qb)、级别内总同质性(Qw),总的同质性(Qtotal)。如果级别间同质性(Qb)经检验后显著,则说明级别间差异显著;如果某一级别内同质性(Qwi)经检验显著,说明这一级别内各研究的效应值差异较大,应该进一步划分此级别,再分析,直到Qwi经检验不显著。
如我们在做捕食关系的Meta分析中发现,捕食者导致被捕食者种群数量降低,d++=-0.3855(固定效应模型)d++=-0.4589(混合效应模型);但不同标准划分的级别的效应大小有差异,捕食效应随地带性而变化,热带效应值最大,亚热带、温带、寒带也有效应,其中亚热带最小;按所在生态系统划分级别时,陆生生态系统级别为中效应,淡水生态系统为小效应[10]。
MetaWin是一个操作简单且功能较全的Meta分析软件,以Windows作支持,用户通过界面与机器直接对话,分析过程简单易学,结果输出明了。遗撼的是MetaWin中没有考虑定性Meta分析所得出的研究质量评估值,所以利用原始数据直接输入法不能对效应值进行研究质量权重。同时值得注意的是MetaWin只提供了定量Meta分析方法,而Meta分析本是一项研究,数量分析前需要认真设计,分析后也需对结果进行研究特征分析。一个好的Meta分析不仅要选择好的定量分析方法,而且分析前设计和分析后的特征分析都非常重要,因为统计的目的是为解决问题提供科学依据。
另外,团IDC网上有许多产品团购,便宜有口碑

在R语言中,用bootstrap来计算均值方差,怎样写语言

6. 求教:用bootstrap方法估计参数估计值的方差

bootstrap常用于做页面的,方差数据计算逻辑,使用什么语言都可以计算吧。
使用bootstrap设计完页面,使用js来计算结果并展示,
--itjob

7. 同样的数据,为什么每一次分析的Bootstrap值不同

  很正常的,特别是当一些分枝之间的遗传距离很相近,没办法确定分枝之间的进化关系。我不知道你清不清楚bootstrap的算法。如果你用的是序列的话,简单的讲就是把序列的位点都重排,重排后的序列再用相同的办法构树,如果原来树的分枝在重排后构的树中也出现了,就给这个分枝打上一分,如果没出现就给0分,这样经过你给定的repetitions次(至少1000次)重排构树打分后,每个分枝就都得出分值,计算机会给你换算成bootstrap值。
  重排的序列有很多组合,值越小说明分枝的可信度越低,如果数据本身的信息量不足以判断亲缘关系的,这样构出来的树肯定每次都不一样,算出来的值也不同,一般50以下的值都都要剔除。而且值mega的话,会在你的original tree上给出bootstrap值,也会给你总结出一个consensus tree,你会看到这两个树可能topology都不大一样。
​  当然如果你repetitions的次数很大的话,可能会好点,不过机器可耗不起,特别是构mp树的时候,据文献说2000次的话能得到一个95%confidence。数据比较好的话,100次重复也能得到很高的bootstrap的。最好根据数据的情况选用不同的构树方法和模型。

同样的数据,为什么每一次分析的Bootstrap值不同

8. 偏差校正的百分位bootstrap怎么做

两独立样本的非参数检验(WilcoxonM-W U检验)+Bonferroni检验(Bonferroni correction)。楼主碰到的是参见的多重检验校正问题multiple testing或者称为post hoc,不管是在方差籂叮焚顾莳该锋双福晶分析、卡方检验还是非参数检验都会碰到。