注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

星海微萤

为天文研究工作者、天文爱好者和大众提供有用的信息

 
 
 

日志

 
 

近距 M 型矮星周围小质量行星的出现率估计(Tuomi 等人 2014)(上)  

2014-06-11 10:25:53|  分类: 外论选译 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

arXiv:1403.0430v1 [astro-ph.EP] 3 Mar 2014

MNRAS 441, 1545–1569 (2014), 21 Jun 2014

近距 M 型矮星周围小质量行星的贝叶斯搜索——基于整体可检测性统计的出现率估计

Bayesian search for low-mass planets around nearby M dwarfs – Estimates for occurrence rate based on global detectability statistics

 

米科·图奥米Mikko Tuomi1,2 *  休·琼斯(Hugh R. A. Jones1  约翰·巴恩斯(John R. Barnes1  纪莲·安格拉达埃斯库德Guillem Anglada-Escudé3  詹姆斯·詹金斯(James S. Jenkins4

1 英国哈特菲尔德赫特福德郡立大学科学和技术研究院天体物理研究中心(University of Hertfordshire, Centre for Astrophysics Research, Science and Technology Research Institute, College Lane, AL10 9AB, Hatfield, UK

2 芬兰皮基奥图尔库大学物理和天文系图奥尔拉天文台(University of Turku, Tuorla Observatory, Department of Physics and Astronomy, Vaisalantie 20, FI-21500, Piikkio, Finland

3 英国伦敦玛丽女王伦敦大学数学科学学院天文系(Queen Mary, University of London, Astronomy Unit, School of Mathematical Sciences, London, UK

4 智利圣地亚哥智利大学天文系(Departamento de Astronomía, Universidad de Chile, Camino del Observatorio 1515, Las Condes, Santiago, Chile

* E-mail: mikko.tuomi@utu.fi; m.tuomi@herts.ac.uk

 

2014 2 20 日接受。2014 2 18 日收到;2013 10 25 日初稿

摘要

M 型矮星由于具有较高的行星与恒星质量比,对于使用多普勒分光方法来检测围绕近距恒星运行的小质量行星来说,是最容易的目标。此外,因为它们的质量小和光度低,所以多普勒测量可以检测到它们的宜居带中的小质量行星,它们与太阳型恒星相比,宜居带离开它们的距离也相应地更近。我们对文献中的 41 颗近距 M 型矮星用紫外和目视阶梯摄谱仪(UVES)获得的视向速度,结合已公开发表的用欧洲南方天文台的高准确度视向速度行星搜索仪(HARPS)的摄谱仪获得的这些恒星的光谱,作了重新分析,试图确定任何小幅的开普勒信。我们运用贝叶斯信号检测判据,与后验取样方法一起,与计入了数据相关性的噪声模型相结合,从而获得了样本中待定行星的数量估计。更一般地,我们使用估计的检测概率函数来计算近距 M 型矮星周围小质量行星的出现率。我们报告了样本中的八颗新的待定行星(围绕 GJ 27.1 GJ 160.2 GJ 180 GJ  229 GJ 422 GJ 682 运行),其中包括两个新的多行星系统,并且根据合并的 UVES HARPS 视向速度数据中不能用与恒星活动有关的周期性和(或)准周期性现象解释的开普勒信号的检测,确认了 GJ 433 系统中的两颗以前已知的待定行星。最后,我们使用估计的检测概率函数来计算近距 M 型矮星周围小质量行星的出现率。按照我们的研究结果,M 型矮星是众多小质量行星的寄主,质量小于 10 ME * 的行星的出现率大约是每颗恒星一颗行星,也有可能更多。我们的研究结果还表明,在 M 型矮星的宜居带中,常见的是质量在 3 10 ME 之间的行星,估计的出现率是每颗恒星 0.210.030.05 颗行星。

 


       * 本文中 ME 表示地球质量。——译注

 

关键词:方法:数值 方法:统计 行星和卫星:检测 恒星:个例:GJ 27.1 GJ 160.2 GJ 180 GJ 229 GJ 422 GJ 433 GJ 682 方法:视向速度

1 引言

近年来,已经在质量最小的恒星 M 型矮星的周围发现了行星,这些行星的轨道特性和质量相差很大,有着多种多样的不同的组态[例如恩德尔(Endl)等人 2006 年论文、邦菲尔斯(Bonfils)等人 2013 年论文 a 和其中的参考文献]。例如,在若干颗 M 型矮星周围,存在着由众多行星组成的系统,但仅仅包含了一些可以称为超地球或海王星的小质量行星,如围绕 GJ 581[邦菲尔斯等人 2005 年论文、 乌德里(Udry)等人 2007 年论文、梅厄(Mayor)等人 2009 年论文][1] GJ 667C[(安格拉达埃斯库德等人 2012 年论文、2013 年论文、德尔佛斯(Delfosse)等人 2013 年论文]和 GJ 163(邦菲尔斯等人 2013 年论文 b 、图奥米和安格拉达埃斯库德 2013 年论文)运行的系统就是如此。最近的精密速度巡天还揭示了有更大质量的行星状伴星围绕一些近距 M 型矮星运行[例如里韦拉(Rivera)等人 2010 年论文、安格拉达埃斯库德和图奥米 2012 年论文],表明这样的伴星确实存在,但并不是很多[邦菲尔斯等人 2013 年论文 a 、蒙泰特(Montet)等人 2014 年论文],并且比 K G F 型星的这类情况更不常见(恩德尔等人 2006 年论文)。然而,围绕这些恒星运行的最令人感兴趣的行星状伴星,还是小质量的、围绕着它们的寄主恒星运行的轨道间距在关于大气特性的一定的假设下可以估计在这些行星的表面上能使水以液体形式存在的行星[例如塞尔西斯(Selsis)等人 2007 年论文、柯帕拉普(Kopparapu)等人 2013 年论文]。这种类型的行星——有时称为宜居带超地球—— M 型矮星周围比在更大质量的恒星周围更容易检测到,这是因为行星与恒星的质量比使得信号提高到了足够高的幅度,以及较短的轨道周期允许覆盖一个固定的时间长度的数据取样时可包含更多轨道相位,使得它们能够检测到(例如梅厄等人 2009 年论文、安格拉达埃斯库德等人 2013 年论文、图奥米和安格拉达埃斯库德 2013 年论文)。

 


[1] 我们注意 GJ 581 周围的行星数量尚不确定,不同的研究人员报告的数量从三颗到六颗不等[见佛格特(Vogt)等人 2010 年论文、2012 年论文、格里戈里(Gregory2011 年论文、图奥米 2011 年论文、巴路耶夫2013 年论文]。

 

近日,对于“开普勒”星场中行星出现率的准确估计已经报告了若干研究工作[例如霍华德Howard)等人 2012 年论文、德雷辛(Dressing夏博诺Charbonneau2013 年论文、莫顿Morton斯威夫特Swift2013 年论文]。“开普勒”样本中最令人感兴趣的特性之一,是一些恒星周围行星的出现率似乎从 F2 型恒星周围的每颗恒星大致 0.05 颗行星增加到 M0 型矮星周围的每颗恒星 0.3 颗行星(霍华德等人 2012 年论文),虽然这一关系的函数形式还远不能确定。鉴于“开普勒”数据的现可利用的时间跨度,这种增加仅适用于轨道周期短于 50 天的行星。尽管“开普勒”将能够提供轨道周期更长的行星的出现率,最长有可能达 200 300 天,可是视向速度巡天将需要探测轨道周期比这更长的行星的出现率。此外,与被“开普勒”太空望远镜大量地作为目标的质量较大的 K G F 型恒星周围的行星不一样,M 型矮星的亮度使得它们在“开普勒”星场内不足以找到与前者差不多的数量,这使得要具体地估计这样的恒星周围行星的出现率和统计特性变为很困难。

按照德雷辛和夏博诺 2013 年论文,“开普勒”的样本中包含有 3897 颗估计的有效温度低于 4000 开的恒星,其中仅 64 颗是待定行星的寄主恒星,一共有 95 颗待定行星围绕它们运行。德雷辛和夏博诺 2013 年论文的结论是,就周期(P)短于 50 天的情况而言,半径在 0.5 RE < rp < 4 RE * 之间的行星出现率是每颗恒星 0.900.040.03 颗行星;半径在 0.5 RE < rp < 1.4 RE 之间的行星出现率是每颗恒星 0.510.130.06 颗行星,尽管这个估计可能被低估达两倍(莫顿和斯威夫特 2013 年论文);并且 rp > 1.4 RE 的行星出现率随着恒星温度的减小而减小。此外,行星出现率在 2 4 RE 之间急剧减小,这表明小半径并因此小质量的行星是超量地多的(莫顿和斯威夫特 2013 年论文)。这些发现是对使用视向速度巡天得到的结果的挑战,这些巡天能够检测到的行星应该得出类似的统计结果,虽然与“开普勒”结果的比较很难,因为挑战在于比较中是把用行星的半径和最小质量来描述的群体作比较,而对于行星的组成成分并因而密度并没有准确的群体模型。由于诸如背景中的恒星为双星而导致的一些天体物理效应,依据用“开普勒”望远镜检测到的凌星作的估计也可能受到约 10 的假阳性率的污染[莫顿和约翰森(Johnson2011  年论文、弗雷辛(Fressing)等人 2013 年论文]。

 


        * 本文中 RE 表示地球半径。——译注

 

M 型矮星的视向速度巡天所获知的这类恒星周围的行星远远少得多(例如邦菲尔斯等人 2013 年论文 a ,他们报告了他们的样本中的 9 颗待定行星)。不过,已知的那些行星都是在行星的数量、它们的轨道间距和动力学拥挤性以及它们的质量之小方面最丰富多彩和最令人感兴趣的太阳系外的行星系统(例如梅厄等人 2009 年论文、里韦拉等人 2010 年论文、安格拉达埃斯库德和图奥米 2012 年论文、安格拉达埃斯库德等人 2013 年论文、图奥米和安格拉达埃斯库德 2013 年论文)。在一定程度上,在 M 型矮星周围已知行星的这种缺乏,是由于事实上早期的视向速度巡天并没有以小质量恒星为目标而引起的观测偏差造成的,因为那时很难获得这些恒星的具有足够高信噪比的观测结果,它们在 V 通带的光子的缺乏导致无法获得高品质的视向速度测量结果。另一个原因是——依据整个样本的大小——太阳型恒星被认为是行星系统的更有希望的寄主。这种观测上的偏差也有可能是如下的情况造成的,即与光谱型为 F G K 的恒星相比,在 M 型矮星周围大质量的巨行星并不那么众多(邦菲尔斯等人 2013 年论文 a),而且这些行星的存在,如果它们确实存在,也有可能是如此之小,以致它们产生的视向速度信号的幅度与目前的高精密度测量结果中的噪声水平差不多,这使得对它们的检测很难达到最好的程度。

邦菲尔斯等人 2013 年论文 a ,根据使用高准确度视向速度行星搜索仪(HARPS)的摄谱仪获得的视向速度测量结果,报告了围绕 M 型矮星运行的行星状伴星的出现率。按照他们的结果,在 M 型矮星周围,最小质量在 1 10 ME 之间的超地球很多,对于周期在 1 10 天之间的,出现率为 0.360.250.10 ,而对于周期在 10 100 天之间的,出现率则为 0.52+0.500.16 。此外,他们报告了 M 型矮星的宜居带(HZ)中超地球的出现率估计为每颗恒星 0.410.540.13 颗行星。

在太阳邻近区域中,M 型矮星是数量最多的一类恒星。因此,这些恒星周围的行星的出现率将在行星出现率的任何一般的估计中起主导作用。出于这个原因,我们重新分析了泽赫迈斯特Zechmeister)等人(2009 年论文)使用甚大望远镜的 2 号单元镜上紫外和目视阶梯摄谱仪(UVES)获得的 M 型矮星样本视向速度,在我们的行星信号贝叶斯搜索中,我们采用了后验取样方法。我们还从欧洲南方天文台(ESO)存档的可被公众使用的光谱中提取了这些恒星的 HARPS 视向速度,并把 UVES HARPS 的速度结合起来进行分析。这些方法都在第 2 节里详细给出,而在第 3 节里我们给出根据合并后的 HARPS UVES 数据得到的结果。在第 4 节中,我们给出了我们检测到的新的待定行星的统计数据,并把所获得的出现率与其他的以 M 型矮星为目标的行星巡天比较,而在第 5 节中,我们更为详细地描述了一些令人感兴趣的新的行星系统和有利于它们的存在的证据,并在第 6 节中对这些结果进行了讨论

2 统计方法和基准模型

我们使用后验取样算法和贝叶斯证据估计方法,以 k = 0 1 …… 个开普勒信号的模型,对视向速度数据集作了分析。在所有这些分析中,我们如最近几年的若干天文学论文中所讨论和应用的那样[例如福特(Ford2005 年论文、2006 年论文、特洛塔(Trotta2007 年论文、费罗兹(Feroz)等人 2011 年论文、格雷戈里(Gregory2011 年论文、罗雷多(Loredo)等人 2012 年论文、图奥米 2012 年论文、图奥米等人 2013 年论文 a 、论文 b],均采用一种完全贝叶斯数据分析的框架。尤其是,我们运用了 哈里奥(Haario)等人 2001 年论文中的自适应梅特罗波利斯Metropolis后验取样算法,这种算法可以很容易地运用于视向速度数据的分析(例如图奥米 2012 年论文、图奥米等人 2013 年论文 a 、论文 b)。我们通过使用牛顿(Newton)和拉夫特里(Raftery1994 年论文的估计,依据从先验和后验两种密度提取的统计样本,估计了支持给定的信号数(即支持含有 k 个信号的模型 Mk)的贝叶斯证据,并使用最大后验(MAP)估计和99%的贝叶斯置信区间(BCS)报告了参数估计。我们注意到,缩写 BCS 代表贝叶斯置信度集,当后验密度并不具有多个显著模式时,这由一个单一维度的区间来表示。对一个后验密度 π (θ | m) 这一具有概率阈值 δ 的置信度集,被定义为一个集合 Dδ

近距 M 型矮星周围小质量行星的出现率估计(Tuomi 等人 2014)(上) - wangjj586 - 星海微萤

 

,                                         1

 

其中,Ω 是参数矢量 θ 的参数空间,π (θ | m) 是给出测量结果 m 的后验概率密度函数,дDδ 表示集合 Dδ 的边界,而 c 是某个正的常数。正式的定义和讨论可以在贝叶斯统计的教科书中找到,例如伯杰(Berger1980 年专著以及凯皮奥(Kaipio)和索默萨洛(Somersalo 2005 年专著。

我们的基准统计模型包含了线性加速度和相关性组分。按照这个模型,我们像图奥米等人 2013 年论文 a 、论文 b 中那样来描述在历元 ti 用仪器 l 获得的视向速度测量结果(mi,l),并把它写成

近距 M 型矮星周围小质量行星的出现率估计(Tuomi 等人 2014)(上) - wangjj586 - 星海微萤

 

                                           2

 

其中,其中 γl dγ/dt 分别是表示第 l 架仪器的参考速度和线性加速度的模型的自由参数,而 εi, j 是描述仪器 l 的第 i 个测量结果高斯白噪声量值的具有零均值和方差 σi 2σl 2 的高斯随机变量。参数 φl 表示第 i 个测量结果和第 i1 测量结果与平均值的偏差之间的相关性,即第 i 个测量结果对于第 i1 个测量结果与平均值的偏差的依赖性,因为任何因果关系不可能以其他方式出现 [2] 。于是,一架仪器不含有开普勒信号的“基线”模型的参数矢量 θ θ = (γl , dγ/dt, σl , φl)。在我们的符号体系中,函数 fk k 个开普勒信号的叠加。

 


        [2]  不必对因果性作任何假定,因为这个模型简单地就是要消除掉相关性,并因此只是一个描述数据的合理的准确度的统计模型。

 

在(2)式中,参数 α 对应于移动平均(MA)组分中指数平滑的时标(图奥米等人 2013 年论文 b)。我们选择这个参数使得它可以计入几天时标上的相关性,因为在这个时标内的相关性已知会发生在视向速度中[巴卢耶夫(Baluev2013 年论文、图奥米等人 2013 年论文 b],但是时间彼此相隔足够远即大于十几天左右的测量结果,则不太可能相关。因此,我们选择 α = 0.01 小时1 ——一个受到最大的 UVES 数据集(GJ 551 GJ 699)支持的数值。这个数值还被发现能很好地描述这些数据集,因为对于拥有大量测量结果的数据集,改变这一数值最多只导致统计模型同样良好的表现。没有必要把这个参数作为统计模型的自由参数,因为在大多数情况下,由于数据点很少,它根本不会受到约束,并且在这样一些情况下,应该运用简约的原则来减少自由参数的数量,并且例如我们在本研究工作中已经做的那样把这个时标参数固定住。 数值 α = 0.01 小时1 对应于相关性时标大致 4 天。对于时标的这一选择可能会影响某些数据集的分析结果,这些数据集的确具有时标不是几天的而为几个小时(或十几天)的更短(或更长)的相关性。然而,因为大多数数据集中的测量结果数量很少,所以我们认为这是相当不可能的。因此,我们还注意到,如果被用于获得这些数据的仪器数量是 j 架,那么在我们的模型中的自由参数就是 3j5k1 个。

2)式中的我们的基准模型虽然可以预料不会是对视向速度的一种完美的描述(例如图奥米和詹金斯 2012 年论文、图奥米等人 2013 年论文 b),但是我们依然估计它包含了一个良好的视向速度模型的大部分重要特征。尤其是,它包含了线性加速度,只要有一颗以前尚未知的长周期亚恒星伴星,这种加速度是有可能存在的。即使没有证据表明存在一颗这样的伴星(即这样的加速度),我们把这一线性加速度包括在模型中,构建一个标准模型,就可以把它应用于我们分析的所有数据集。如果在一个给定的数据集中没有线性加速度,那么把它包括在模型中会使得模型过度参数化,因为按照简约的原则,公式体系中相应的项的减少将提供一个更好的模型。然而,我们愿意冒这种过度参数化的风险,以便能够对所有数据集使用相同的通用基准模型,并尽可能获取值得信赖的结果。同样的原则也适用于参数 φl ,这个参数把使用第 l 架仪器获得的数据内在的相关性程度加以量化(例如图奥米和詹金斯 2012 年论文、图奥米等人 2013 年论文 b)。我们在模型中使用这个移动平均组分,即使我们不能证明它确实与零有显着差异,这使得模型更加复杂,但能使我们始终如一地看到数据中的过量的噪声是否具有显著的红色组分。

我们还注意到,即使没有证据表明存在加速度或者相关性,即参数 dγ/dt φl 都具有与零一致的后验密度,然而在模型中纳入相应的项,也能使结果更稳健,因为这些项的不确度就可以直接计入。而且,这将确保我们检测到的任何一个信号都不是由这两个因素结合在一起造成的虚假现象。

2.1 先验选择

因为模型参数的先验密度是贝叶斯分析的一个不可缺少的组成部分,所以我们简要地讨论一下我们的先验选择。在整个分析过程中,我们像图奥米 2012 年论文中所述的那样使用先验概率密度,但有一个小而可能显著的例外。与图奥米 2012 年论文中的选择相比较,我们在我们的分析中遵循图奥米和安格拉达埃斯库德 2013 年论文中的做法,并使用更为严格的先验偏心率,即采用 π(e) N(0 , 0.12 ) 。我们做出这样的选择,除了对先验偏心率来说是比均匀的形式更加合适的函数形式之外[也见基平(Kipping2013年论文中的比较],还因为我们分析的数据集已经由泽赫迈斯特尔等人 2009 年论文作过分析,他们没有报告在 UVES 数据集中有任何行星状的信号。因此,如果在这些数据集中存在任何显著的信号,那么它们很可能会被深深地嵌埋在噪声中,即它们的幅度与噪声水平相近,这会导致轨道偏心率的高估[扎卡姆斯卡(Zakamska)等人 2011 年论文]。然而,由于小质量的行星大多是在近圆轨道上发现的(图奥米和安格拉达埃斯库德 2013 年论文),我们宁愿略微低估轨道偏心率,而不是对它高估。我们注意到,这一先验选择,通常所做的决定是先验地把偏心率固定为零,这对应于先验地选择一个例如 π(e) = δ(e) 这样的德尔塔函数,而我们的选择仍然是远为保守的。对于作出这一先验选择的进一步的理由,我们提请参考安格拉达埃斯库德等人 2013 年论文中的附录 A

也有可能,我们的先验偏心率降低了实际上由例如在一个适度偏心的轨道上的行星引起的信号的显著性。然而,我们认为这是不太可能的,因为在目前的样本中,我们检测到的任何行星的信号的幅度都和测量结果中的噪声相差不多。这意味着相应的偏心率是病态地在低值方向受到限制的,并因此使用一个如上文所述的先验密度,甚或由基平 2013 年论文提出的选择,都不太会显著地影响结果,即使样本中的某些恒星具有处在偏心轨道上的小质量行星。

2.2 后验取样

自适应梅特罗波利斯算法尽管是在参数之间几乎没有非线性相关性的单峰后验情况下抽取在统计上具有代表性的样本的有效工具,可是它不一定非常适合多峰后验情况下作这样的取样,而这种多峰的情况是很常见的,特别是在搜索周期性的行星信号时,就信号的周期参数来说,更是如此。因此,当搜索第 k 个信号时,我们简单地把这个信号的周期空间划分成多个部分,每一部分只包含一个明显的极大值,由于这个极大值的显著性,它将有效地防止形成不同的模之间的“跳跃”链。这使得我们能够使用自适应梅特罗波利斯算法。于是,这些不同的部分就可以独立地取样,并作为不同的(先验)模型来处理,以评估相应的极大值的相对显著性。然而,在实际工作中,这样的情况极少,因而我们只对两个目标的数据运用了对周期空间的这种划分。

在估计这些解的显著性时,即马尔可夫链足够接近收敛时,我们如福特 2006 年论文中所述的那样,使用了格尔曼—鲁宾统计[格尔曼(Gelman)和鲁宾(Rubin1992 年论文]。特别是,我们要求,当马尔可夫链接近收敛时,从大于 1 的一侧逼近 1 的检验统计量 R(θ) ,根据至少四个链的情况,要小于 1.1 ,以便表明这些链都足够地接近所有参数 θ 收敛。这对应于这样一种情况,即链之间的参数方差链比链内部的参数方差小,标志着所有的链均具有相同的不变的分布。

2.3 信号检测判据

在整个分析中,我们使用图奥米 2012 年论文中的信号检测判据。这些判据最近已被应用于例如安格拉达-埃斯库德等人 2013 年论文、图奥米等人 2013 年论文 a 、图奥米等人 2013 年论文 b 以及图奥米和安格拉达-埃斯库德 2013 年论文,并且就它们不是特别容易出现误报来说似乎是值得信赖的(图奥米和詹金斯 2012 年论文),还能使得使用更传统的依据模型残差功率谱中的误报概率(FAP)的检测判据不能发现的信号被检测到(安格拉达 -埃斯库德和图奥米 2012 年论文、安格拉达-埃斯库德等人 2013 年论文、图奥米等人 2013 年论文 b)。作为例子,我们提请参考图奥米和安格拉达-埃斯库德 2013 年论文,他们仅用 35 的数据,与邦菲尔斯等人 2013 年论文 b 一样,独立地发现了围绕 GJ 163 运行的三颗相同的待定行星。这表明贝叶斯信号检测判据对于检测视向速度数据中的小质量行星的微弱信号来说确实是非常敏感和稳健的。

第一个判据是,一个具有 k1 个信号的模型,表示为 Mk1 ,它的后验概率至少是只有 k 个信号的模型对应的概率的 s 倍大,即 P(Mk1 | m) sP(Mk | m) 。如果这个判据不满足,那么第 k1 个信号就有相当大的概率是噪声所产生的,而不是这些数据中的真正的周期性。当用 k = 0 1 、……来分析这些数据时,可能会出现 P(Mk | m) < sP(Mk1 | m) P(Mk1 | m) sP(Mk | m) 。这意味着不能说显然有 k 个信号,而且如果模型 Mk1 还没有测试过,那么结论就将是在这些数据中只有 k1 个信号。 因此,如果我们观测到不满足检测判据的模型 Mk 在参数空间中的假定的概率极大值,那么我们通常就用模型 Mk1 Mk2 来分析这些数据,以及看看多于 k 信号的叠加是否使得只有 k 个信号的检测变得不可能。

我们注意到,概率阈值 s 必须主观地选择。通常选择 s = 150 ,因为它已被解释为对应于强有力的证据,并由卡斯(Kass)和拉夫特里 1995 年论文依据杰弗里斯(Jeffreys1961 年论文的论证予以建议,不过也有人认为,应该选择更加保守的阈值 1000[埃维特(Evett1991 年论文]。这一 s = 150 的阈值已被成功地应用在视向速度数据的分析中(例如费罗兹等人 2011 年论文、格雷戈里 2011 年论文、图奥米 2012 年论文、图奥米等人 2013 年论文 a 、论文 b)。然而,当用来描述数据的统计模型并不能很好地代表这些数据时,这种选择也可能会导致对显著程度的过度的解释。对于像本研究工作这样的群体研究的目的来说,在接受新的待定行星时应该要比通常的情况下更加谨慎,避免出现率的估计受到误报的污染。因此,我们对于用低阈值检测到的信号的解释,仍持谨慎态度,并使用一个更保守的阈值 s = 104 作为对一颗待定行星的要求。

第二个判据是与第一个判据相联系的,它的意义在于,它指出,视向速度的变幅必须在统计学意义上显著地(例如以 99 的显著程度)大于零。如果不是这种情况,那么将有相当大的概率,信号的幅度实际上是可以忽略不计的,并因此这一信号实际上是不存在的。第三个判据指出,一个信号的周期,必须受到来自上、下两个方向的很好的约束,才能认为它是一个真正的周期。同样,这一判据的理由是很简单的,因为周期参数如果不能很好地受到约束,它就不能声称数据中的相应变化确实具有周期的性质。我们注意到,实际上,根据本研究工作中所作的分析,一个显著性超过 s = 104 的信号,在参数空间中总是能够受到很好的约束。相反,如果一个给定的信号在周期和幅度空间中受到约束,那么显著性就总是超过某一 s > 1 的数,虽然不一定 s = 150 或者 s = 104 。这意味着,这些检测判据在检测小幅度信号方面是互补的和稳健的。

为了评估在合并后的数据集中观测到的任何给定的信号是否受到原来的两个数据集的支持,我们使用共同的加权均方根(RMS)统计量检查了每个模型的残差。如果在把一个信号加到这个模型中时两个数据集的这些统计量数据都减小,那么我们就说,即使这个信号不能在两个独立的数据集中检测到,这两个数据集也都还是支持相应信号的存在。这一选择还作为一个给定的弱信号是否可能是噪声和相应的不够准确的模型所产生的虚假信号的检验。一个给定的信号,如果确实是由恒星产生的真实信号(相反则是由仪器产生的虚假信号),即有可能是由正在围绕着转动的行星引起的多普勒变化造成的,那么这应该导致两个数据集的均方根估计出现下降,虽然这也是??随机的,并当只有少量的测量结果时不一定是这样

最后,为了使检测尽可能地稳健,我们对于可以称为待定行星的信号,设定如下的判据。首先,我们要求这样的一些信号是选择 s = 104 检测到的,并且可以结论性地认为在对应的合并后的数据集中是非常显著地存在的。如果这些信号对应的数据不能在由 UVES HARPS 光谱计算的活动性指数中找到,那么它们就被认为是待定行星,我们就按照规范的命名法则通过赋予字母 b c 、…… 来称呼它们。然而,如果:(1)相应的信号只能 s < 104 的显著性检测到,(2)如果现可利用的数据是仅由一架摄谱仪获得的,使得一个信号的存在由于没有一个独立的数据集可以利用而不能得到这样的数据集支持,或者,(3)如果由于其他的数据集中测量结果的数量少或者品质差,因此一个信号只存在于一个数据集中(即是说,当把这个信号添加到模型中的时候,其他的数据集的均方根并没有减小),以致这个数据集主导了给出合并后的数据的后验密度,那么我们就不称它们为待定行星。

我们注意到,如果后验密度在参数空间由若干其他的(局部)极大值组成,这些极大值位于若干不同的周期处,具有相当高的概率[例如,对所有的 i ,在 θLi , i = 1, ..., n 处的 n 个局部极大值,有 π(θLi |m) 0.01 π(θMAP |m) ,其中 θMAP 是最大后验估计],那么有可能,是在此周期空间中,还有若干具有显著意义的解,能够满足检测判据。这样的情况很难可靠地加以解释,但可以由两大原因引起。首先,所有的具有显著意义的周期都可以与速度数据中的真正的周期信号对应起来——数据中的若干行星状信号的幅度也许很接近,并且可以以大致相同的置信度检测到(例如 GJ 667c ,它的多普勒数据被发现含有 6 个幅度大致相等的信号;安格拉达—埃斯库德等人 2013 年论文)。另外,这种情况也可能是代表了噪声建模做得很差,其中周期性、准周期性的特征和(或)噪声中的相关性错误地被解释成了真正的信号。在这类情况中,我们通过进一步增大 k 来对数据进行分析,但按我们的检测判据,如果没有有利于存在着更多信号的强有力的证据,那么就报告对应于整体极大值的解。

2.4 具有显著意义的周期的搜索

我们对数据集中具有显著意义的周期进行的搜索分成几个步骤。首先,我们由不含任何开普勒信号的模型的后验密度获得一个样本。第二步,我们通过使用一些回火链使得后验密度上升到 β (0,1) 的一个幂,来对 k = 1 的模型的后验密度取样。特别是,我们使用 β = 0.30.8 来寻找周期空间中最有希望的区域,因为选择这样的一个 β 能使得对整个周期空间 [T0 ,  Tobs] 的快速搜索成为可能,其中 Tobs 是数据的基线,而我们选择 T0 = 1天。然而,如果有明显的迹象表明概率极大超出了一个等于 Tobs 的周期,那么我们就把上限增加到 2Tobs 。我们在这些周期搜索中使用的不是自适应梅特罗波利斯算法(哈里奥等人 2001 年论文),而是标准梅特罗波利斯—哈斯廷斯(Hastings)版本(梅特罗波利斯等人 1953 年论文、哈斯廷斯 1970 年论文),以防止提出的密度适应后验密度中可能非常窄的整体极大值,因为这些取样的目的是要识别出参数(周期)空间中那些最显著的概率极大值的位置,而不是要使得这个链能够适应其中的某一个极大值。

对于大多数数据集,我们以一个带有“冷”链的试验取样作为开始,也就是说,这个链具有 β = 1 。当测量结果的数量少于 15 时,这些冷取样在整个周期空间的探索中是足够的,因为通常在这一参数空间中并没有任何显著的极大值将会妨碍这个链迅速探索整个周期空间。当这样的冷取样由于参数空间中存在大量相当高的极大值而变得不可能、并因此周期空间中马尔可夫链的混合很差时,我们通过设置 β = 0.3 0.5 ,改而使用回火链,其中 β 的具体数值取决于测量结果的数量。最低的数值 0.3 用于最大的数据集 GJ 699NUVES = 226)、GJ 551 NUVES = 229)和 GJ 433NUVES = 166)。这些取样得出了周期空间中最显著最大值的位置的估计。然而,必须注意,使用回火取样实际上对应于在分析中使用不同的先验模型和似然模型,即分别使用 π β ( θ ) l β ( m | θ ) 代替 π ( θ ) l ( m | θ ) 用作先验密度和似然函数。因此,后验密度的形状,就像依据回火取样估计的那样,不一定对应于实际的后验密度。不过,极大值的位置并不会改变。

鉴于根据回火取样对周期空间内概率极大值位置的粗略估计,我们一开始使用观测到的极大值邻近区域内的初始值作若干冷取样,以便能够快速收敛。如果这些极大值中有一个(或一些)按照在我们在上面(第 2.3 节)所述的检测判据对应于一个(或一些)显著的周期信号,那么我们就继之以增大 k ,并完成带有又一个开普勒信号的模型的参数空间中的回火取样。这些取样之所以使用冷链来完成,是因为在最强的信号被模型计入之后,通常就是以 β = 0.6 0.8 的取样为基础去访问另外的具有约数百万个链成员的信号的周期空间整个区域的。

最后,我们获得的样本是从一个带有 k1 个开普勒信号的模型的后验密度取出的,这时相应的数据已被发现含有显著的证据支持只有 k 个信号,即只有 k 个信号满足检测判据。这些取样的完成,就是为的要估计在这些数据中还可能会有哪一些信号存在,并因此哪一些信号可以被排除(例如图奥米 2012 年论文)。

我们注意到,某些数据集只有两个 UVES 的测量值和(或)少于两个 HARPS 的测量值。因此,由于我们使用了模型中的线性趋势,我们没有分析少于三个测量值的 UVES 数据集。此外,,我们没有分析无论是 UVES 还是 HARPS 的测量值个数均小于 2 的合并数据集。这意味着,我们也许会分析一个只有三个测量值的单独的数据集以及具有四个测量值的(两个 UVES 的和两个 HARPS 的)合并数据集。即使在如此极端的情况下,当统计模型的自由参数的个数超过了测量值的数量时,我们还是有希望能够获得有意义的结果,因为我们使用了信息的先验密度,并因为我们使用的贝叶斯统计方法采用了简约的原则,从而像这样的过度参数化可能造成的影响已被加以考虑,并且不依赖于有关参数个数或测量值个数的假设。

2.5 例:GJ 229

为了证明我们的周期搜索方法的实用性,我们详细地给出了 GJ 229 UVES 速度的分析结果,因为它是样本中具有相当多测量值(NUVES = 73)、显示出支持周期性变化的证据的一个代表性目标。我们用 k = 0 的基准模型开始对它的数据的分析。

 

近距 M 型矮星周围小质量行星的出现率估计(Tuomi 等人 2014)(上) - wangjj586 - 星海微萤

 

1.  GJ 229 UVES 数据中不含开普勒信号基准模型的残差。

 

我们发觉 GJ 229 UVES 数据含有 φUVES = 0.85 [0.45, 1.00] 的显著程度的相关;线性趋势的证据为 dγ/dt = 1.26 [0.39, 2.17] 米·秒1·年1 ,其中由长期加速度 [3] 引起的仅是很小的一部分,即 0.070 米·秒1·1(泽赫迈斯特尔等人 2009 年论文);而额外的高斯白噪声为 σUVES = 2.51 [1.29, 3.74] 米·秒1 ,这是相当低的,意味着这颗恒星的速度变化非常小,而且(或者)UVES 的仪器不确度在泽赫迈斯特尔等人 2009 年论文内的速度中也许被高估了。消去最大后验趋势和相关性,所得到的残差我们画在图 1 中。这些残差的确可以用“平直”来描述,这表明,在这些速度中,不可能有幅度大于大致 10 米·秒1 的周期性变化。这些残差的均方根为 3.61 米·秒1 ,明显小于原来的速度 5.26 米·秒1

 


      [3] 长期加速度在这时并未从泽赫迈斯特等人 2009 年论文的 UVES 数据中减去。不过,我们在分析与 HARPS 速度合并后的 UVES 数据时,已经减去了它,HARPS 速度中的长期加速度已由 TERRA 处理过程减去。

 

 

近距 M 型矮星周围小质量行星的出现率估计(Tuomi 等人 2014)(上) - wangjj586 - 星海微萤

 

2.  一个开普勒信号的对数后验密度随对数周期参数的变化,这一信号用回火取样()取自 GJ 229 UVES 数据。水平线表示对于最大后验值而言的 10%(点线)、1%(虚线)和 0.1%(实线)概率阈值,这一最大后验值用红色箭头指出。

 

我们对周期性作了回火搜索,并得到由与选择 β = 0.3 对应的后验密度取出的样本。我们在图 2 中画出了一个对应的取样的例子。正如可以看到的那样,这一链在单开普勒模型的周期空间中识别出了一个整体极大值,它位于周期为 2.8 天处(红色箭头)。这一链还访问了GJ 229 Tobs 1 天到 2325 天的整个周期空间。图 2 中的链还表明,在上述周期空间中,相对于整体极大值,另外还有一些超出 10% 1% 和(或)0.1% 概率水平(分别用水平的点线、虚线和实线表示)的局部极大值,它们位于周期大致为 1.5 10 200 450 天处。在标定后的后验样本中这样的多重极大值的存在,意味着它们之中没有一个可以可信地被认为是一个解,并因此是一个在这些数据中可靠地检测到的周期信号。我们的取样还意味着在上述周期空间中很可能没有其他可考虑的概率极大值,或者说,如果它们存在的话,它们也是如此地窄,以至于这些链不大可能访问到它们。我们进行若干次这样的取样,得到的结果一致地表明,不存在任何其他的具有类似后验值的极大值。

由于有了待定的周期,我们在最高的极大值邻近区域内以初始周期启动冷链(图 2),并得以识别出两个满足上面讨论的检测判据的周期。这两个周期位于周期 1.5 206 天处,幅度分别为 5.3 4.3 米·秒1 ,但这并不能就得出结论说我们已经可信地识别出了这样的信号,因为后验密度具有多个与最大后验估计中的后验值差不多大的极大值。所以,我们只能得出结论说如果在 UVES 数据中存在周期信号,那么它们很可能位于与后验密度中的这些极大值对应的周期处(图 2)。

我们用包含两个开普勒信号的模型对 UVES 数据进行取样,但并不能找到对于这些数据来说具有显著意义的双开普勒解。

应该注意,图 2 中的由(标定后的)后验密度取出的样本可以粗略地以与例如通常的洛姆—斯卡格周期图[洛姆Lomb1976 年论文、斯卡格(Scargle1982 年论文]类似的方式来解释。这是因为画出的密度代表了不同周期的相对显著性,并因此可以大体上按照在垂直轴中给出的概率来加以解释,这些概率以后验值的对数表示。然而,对应周期的相对概率以及它们是否确实显著得可以满足检测判据,只能用另外的一些取样并看一看这些周期能不能从上、下两个方向加以约束来判定。

近距 M 型矮星周围小质量行星的出现率估计(Tuomi 等人 2014)(上) - wangjj586 - 星海微萤

 

3.  同图 2 ,但系 GJ 229 合并后 HARPS UVES 数据中的第一个信号(上图),以及画为双开普勒模型第二个信号函数的冷取样,表明了没有另外的周期信号(下图)。

 

对于一个信号的显著性的最后的一种检验是这一信号在两个独立的数据集中是否都存在。按照我们的结果,在 UVES 数据中被推定的位于周期 1.5 206 天处的周期没有被这一检验证实,因为 HARPS 数据有效地排除了它们的存在。这可以通过看一下合并后的数据中对应的对数后验密度随信号周期的变化看到(图 3 上图)。据此,只有在周期大致为 470 天处的一个很强的而且孤立的整体极大值能满足上面讨论过的全部检测判据。因为这一信号在 UVES 数据中仅作为一个局部极大值清楚地存在,并且在给出合并后数据的周期空间中没有差不多大小的局部极大值, 所以我们得出结论,在 GJ 229 的合并后的 HARPS UVES 速度中存在一个显著的周期信号,位于周期 471459493]天处,变幅为 3.832.155.57]米·秒1 ,它对应于围绕着这颗恒星运行的一颗新的和以前未知的待定行星,这颗待定行星的最小质量为 321649ME 。这一信号之所以可以称为待定行星,是因为它的存在按照我们的要求受到了两个数据集的支持,并且在合并后的数据中非常可信地被检测到。此外,如我们在第 3.1 节中讨论的,这一信号与 GJ 229 的活动数据中的变化对应不起来。为了证明它的显著性,我们在图 4 中画出了相位折叠信号。我们注意到,在合并数据中没有任何支持还存在第二个信号的证据,正如在图 3 的下图中也可以看到的,在周期空间中并没有很强的和孤立的极大值存在。

 

近距 M 型矮星周围小质量行星的出现率估计(Tuomi 等人 2014)(上) - wangjj586 - 星海微萤

 

4.  GJ 229 的合并后 HARPS(蓝色)和 UVES(红色)数据中的相位折叠信号。

 

2.6 检测概率和行星出现率

为了得到我们的样本中潜在的行星出现率的估计,必须要估计由于视向速度数据集对较大的行星质量和较短的轨道周期更敏感这一事实而引起的目前的数据的检测偏差。另外还必须要考虑每一个数据集的数量和品质,以及它们各自的时间跨度。为此,我们使用例如在图 3 的下图中所示的参数空间取样来对这个样本的合并后 UVES HARPS 数据集计算了检测概率。

首先,我们为简短起见,把在任何给定的数据集(第 i 个数据集)中的一个给定的周期区间 ΔP 和最小质量区间 ΔM 记为 ΔP, M ,在这个区间中观测到的信号数量,可以写为 f obs,i (ΔP, M) = f occ,i P, M) pi P, M) ,其中 f occ,i 是样本中围绕第 i 颗恒星运行的行星的数量,而 pi 是检测率函数,用于表示一颗参数处在区间 ΔP, M 内的行星是否可以在数据集 mi 中检测到。然而,尽管 f obs,i 很容易得到,因为它直接就是我们在数据集 mi 中在各个质量和周期区间中检测到的行星的数量,可是 pi 的计算却是比较困难的。

为了估计 pi ,当在数据集中只有 k 个信号时,我们使用带有 k1 个开普勒信号的模型的后验取样。这一通过使用后验取样提取的样本使得我们能够重新构建参数空间中用于描述假定的 k1 个被访问信号的参数所在的区域。因为信号不能被检测到,也就是说它的变幅和周期不能被约束,所以链所访问的是周期空间内所选取的周期范围(从一天到数据的时间跨度)允许的全部区域。此外,鉴于混合特性足够地好,以致链频繁地访问参数空间中的所有有关的区域,因此链在数据所允许的所有周期处都访问了所有的变幅,即变幅可以很小,但因为似然函数仍有相当高的数值而不能被数据排除。在每一周期处,链不能访问超出某一极限幅度的变幅,因为它们将对应于如此低的似然率,以致具有这样的变幅的行星状信号实际上应被排除。因此,取样得出的参数空间中的那些区域是可能存在信号的区域。于是,参数空间的其余区域,就是依据这些数据(非常可能)不会再有另外的信号的区域。

 

近距 M 型矮星周围小质量行星的出现率估计(Tuomi 等人 2014)(上) - wangjj586 - 星海微萤

 

5.  合并后的 GJ 229 的数据的检测阈值。白色区域对应于数据中可以检测到信号(检测概率为 1)的质量和周期空间内的参数值,而黑色区域表明了信号不能被检测到(检测概率可以忽略)的相应质量和周期空间。待定行星 GJ 229 b 用带圈的红点表示,因为它是能检测到的,所以位于前一区域内。

 

我们使用 GJ 229 作为例子证明这一点。它有一颗待定的行星,因此我们使用有两颗待定行星的模型来估计可检测性函数。在图 5 中,黑色区域表示质量和周期空间中的一个子集,这个子集是在马尔科夫链取样过程中访问的第二个信号的质量和周期参数。因此,这一区域对应于 GJ 229 的数据中可能存在、但因我们没有发现第二个信号而没有能检测到的信号。白色区域对应于这些链未访问并因此排除了行星状信号的质量和周期空间,因为这些区域中的似然函数数值小得使白色区域内存在一颗行星的可能性近似可以忽略不计。待定行星 GJ 229 b 显然在上述阈值的上方,这是理所应当的,因为它被检测到了。我们注意到,尽管这颗待定行星的参数接近阈值,但它比那一周期处可以检测到的质量最小的行星依然重了几倍的地球质量。事实上,如果它在阈值的上方很远,那么很可能,仅仅依据 UVES 或者 HARPS 的数据集,就已经可以报告它的存在。

因此我们估计,在马尔科夫链没有访问的区域(图 5 中的白色区域)内的待定行星是可以被检测到的。之所以是这样一种情况,是因为它们对应于行星不能被检测到的区域的补集。然而,实际上,阈值并非那么严格,因为检测概率是参数的(连续)函数。在本研究工作中,我们并不试图更准确地估计这一函数,而是对每一数据集使用如图 5 中所示的那样的“阶梯函数”作为对于 GJ 229 的一级近似。

假定在参数空间中有某些区域,由于例如取样很不好而没有被链访问,然而因为这些区域具有足够高的似然率,因此它们是应该要被访问的,那么从效果来说我们将高估检测概率,并因此低估出现率。这意味着我们的出现率估计是一些下限,不过由于样本中行星的数量很少,因此不大可能会低很多,以至于使得结果显著地偏离,从而给出相当大的不确度。我们把函数 p^i = 1pi 设置为在马尔科夫链确实访问过的区域内等于 1 ,而在这些链没有访问过的区域内等于零,作为检测率的近似。

我们把由数据集 m1 ... mN 检测到的整个恒星样本的行星频度表示为对所有这些数据集中观测到的信号数量的求和,其中假定对于样本中的所有恒星来说出现率是一样的,以致对于所有的 i focc = focc , i(以每颗恒星的行星颗数为单位)。浴室我们得到:

近距 M 型矮星周围小质量行星的出现率估计(Tuomi 等人 2014)(上) - wangjj586 - 星海微萤

 

 ,                                      3

 

 

这意味着可以用一种简单的方式来计算整个样本的出现率 focc 。在这个式子中,右侧方括号内的项在除以 N 后就是我们的样本的检测概率函数,它近似就是在区间 ΔP, M 中能够检测到行星的概率。利用我们的取样,我们可以相当准确地估计这个函数——通常是在对数参数空间内,从最小的周期 1 天到最大值 104 天,从最小的质量 1 ME 到最大值 100 ME ,在此范围内使用 100×100 的网格。这样一种精细的网格对于估计出现率来说不是一种实际可行的选择,因为从根本上说,要获得任何有意义的估计,至少需要在大多数网格点上有一个行星的信号。因此,在计算出现率时,我们把上述区间划分为 4×4 的网格。

在估计一个给定的区间 ΔP, M 中出现率的不确度时,我们相当保守地分别使用这一区间内的最低和最高检测概率(使用更精细的网格来得到)来计算下限和上限。

 

3 样本和开普勒信号

一个 M 型矮星样本的 UVES 速度发表在泽赫迈斯特尔等人 2009 年论文中,这个样本包含了一组近距星,其中的两颗是最近的 M 型矮星,即 GJ 551 GJ 699 ,它们分别是离开太阳最近和第四近的恒星。我们在表 1 中列出了这个样本中的恒星,这个表中还一起给出了它们的物理特性的估值。它们的视差得自《伊巴谷星表》[范莱文(van Leeuwen2007 年论文],而质量估计取自泽赫迈斯特尔等人 2009 年论文,同时,我们使用卡萨格让德(Casagrande)等人 2008 年论文和波亚将(Boyajian)等人 2012 年论文中的经验关系估计有效温度和光度。根据估计的光度和有效温度,我们还按照柯帕拉普等人 2013 年论文中的式子计算了恒星宜居带的内边缘和外边缘,并把它们也列在表 1 中。我们注意到,这个样本中的恒星还曾作过大量的褐矮星伴星搜索。例如,迪特里希(Dieterich2012 年论文报告,在间距 10 70 天文单位之间,L T 型伴星的出现率为 0.03.50.0 % 。此外,这些样本恒星并没有任何证据表明存在暖星周物质[例如阿文豪斯(Avenhaus)等人 2012 年论文]或冷星周物质[例如列斯特拉德(Lestrade)等人 2009 年论文]。

 

1.  目标星、它们的伊巴谷视差和物理特性,一起还列出了依据柯帕拉普等人 2013 年论文估计的恒星宜居带内边缘和外边缘。

近距 M 型矮星周围小质量行星的出现率估计(Tuomi 等人 2014)(上) - wangjj586 - 星海微萤

a 除了另外注明的以外,均为科恩(Koen)等人 2010 年论文中报告的光谱型。另外注明的则为:(1)恩德尔等人 2006 年论文;(2)托里斯(Torres)等人 2006 年论文;(3)詹金斯等人 2009 年论文;(4)里德(Reid)等人 2004 年论文;(5)格雷(Gray)等人 2006 年论文;(6)蒙茨(Montes)等人 2001 年论文。

b 伊巴谷视差(范莱文 2007 年论文)。

c 泽赫迈斯特尔等人 2009 年论文中的估值。

d MC)有迹象表明存在轨道未能约束的大质量亚恒星伴星;(PC)行星状伴星(德尔佛斯等人 2013 年论文);(DI)直接成像褐矮星伴星[中岛(Nakajima)等人 1995 年论文];(BD)褐矮星伴星[居尔斯特尔(Kürster)等人 2008 年论文]。

e 泽赫迈斯特尔等人 2009 年论文采用的光谱型为 M0 ,而更近的科恩等人 2010 年论文报告的光谱型为 K7

 f 光度和有效温度看来与光谱型 M2 不一致。

 

我们由公开可以利用的光谱 [4] 使用安格拉达—埃斯库德和巴特勒(Butler2012 年论文中的数据处理算法获得了 HARPS 的模板增强视向速度再分析应用(TERRA)速度。我们选择使用 TERRA 速度,而不是通常使用的 HARPS 的交叉相关函数(CCF)速度,这是由于它们的散射较低,并因此对 M 型矮星有更好的精密度(安格拉达—埃斯库德和巴特勒 2012 年论文、安格拉达—埃斯库德和图奥米 2012 年论文、安格拉达—埃斯库德等人 2013 年论文、图奥米和安格拉达—埃斯库德 2013 年论文)。尽管对于每一颗恒星不能得到大量的这类速度,因为我们的样本中的很大一部分恒星并不是 HARPS 的保时观测(GTO)巡天(邦菲尔斯等人 2013 年论文 a)的主要目标,然而还是有若干恒星,由于数据的高精密度,可以很容易地预料到,它们的现可利用的 HARPS 数据,能够提供对于围绕它们运行的可能的待定行星的更好约束,或者有助于对 UVES 数据中误判的虚假信号的存在提出质疑。HARPS 测量结果的数量和对应的数据的时间跨度在表 2 中列出,对应的 HARPS-TERRA 速度在附录 B 的表中列出。

 


        [4] 我们为增加 HARPS 数据的时间跨度,还得到了 GJ 699 的另外三个 HARPS 光谱。

 

我们在表 2 中给出了我们对含有 k = 0 1 2 个开普勒信号的模型所作比较的结果,给出了合并后的数据集内最有可能的信号数量,以及 UVES HARPS 两个数据集的测量结果数量和时间跨度。按照这些结果,在合并后的数据中,有 10 个显著的信号满足我们的检测判据,并按照我们的要求受到两个数据集的支持。

泽赫迈斯特尔等人 2009 年论文在发表同一个 UVES 数据集的分析结果时,没有报告对待定行星的检测。按照我们用标准的洛姆—斯卡格周期图(洛姆 1976 年论文、斯卡格 1982 年论文)对 UVES 数据作的周期图分析,上述结论确实是合理的,因为,排除了 GJ 477 GJ 1046 GJ 3020 GJ 3916 周围的大质量恒星或亚恒星伴星 [5] ,并排除了泽赫迈斯特尔等人 2009 年论文报告信号是由数据取样和活动性引起的 GJ 551 GJ 699 UVES 数据集中就没有一颗恒星在它们的洛姆—斯卡格周期图中具有对应于小质量行星状伴星的显著影响力。 我们报告的待定行星信号检测的不可能性并不令人感到吃惊,因为所有这些信号的变化幅度都非常低, 没有大量的测量结果和很高的精密度,是很难检测到它们的。

 


        [5] 尽管对应的轨道不能被约束,然而可以看到约几百米·秒1 的变化。

 

令人感兴趣的是,在 GJ 699 的速度中,与泽赫迈斯特尔等人 2009 年论文不同,我们没有能够找到他们报告的 44 天的信号。 我们相信,原因在于这一信号很可能是由与活动性有关的现象引起的(泽赫迈斯特尔等人 2009 年论文),并因此是准周期的和(或)与时间有关的,并可以用 UVES 测量结果中的相关性相当好地加以解释。确实,参数 φUVES 的估值被求得等于 0.810.620.99],这意味着在 UVES 数据中有着相当高程度的相关性,如果不加考虑,当与数据取样耦合在一起的时候,可以在周期图中产生显著但虚假的影响。

在我们的样本中,除了我们找到的信号之外,还有 5 颗目标星表明了具有不为零的线性加速度,这意味着还有未知的长周期亚恒星伴星存在(表 2)。

 

2.  UVES HARPS 数据集的特性,包括测量结果数量(NUVES NHARPS)和数据的时间跨度(ΔUVES ΔHARPS)。当按照我们的检测判据存在有利于至少一个开普勒信号的证据时,就给出对数贝叶斯证据比或者说贝叶斯因子[ln Bi1,i = ln P(m|Mi1)ln P(m|Mi)]。GJ 190 GJ 263 未列入这个表中,因为它们只有两个速度测量结果。4 颗视向速度数据中存在大质量伴星证据的恒星也没有给出。

近距 M 型矮星周围小质量行星的出现率估计(Tuomi 等人 2014)(上) - wangjj586 - 星海微萤

a T)在合并后的数据中有显著的线性趋势。(D)解与德尔佛斯等人 2013 年论文一致。

 

3.1 活动性指标分析

为了确定我们在 UVES 视向速度中观测到的信号是由行星状伴星和(或)亚恒星伴星的多普勒指纹引起的,还是与恒星的活动性有关的周期性或非周期性和(或)准周期性现象,我们分析了由欧洲南方天文台存档数据中现可利用的 UVES 光谱得到的线性二等分(BIS)跨度。 这种二等分值表明了线性不对称,并可以用来作为由恒星的活动性引起的变化的印记[例如奎洛兹(Queloz)等人 2001 年论文、波意塞(Boisse)等人 2011 年论文]。就我们观测了视向速度的恒星的大多数来说,速度与二等分值之间的相关系数在 0.1 0.1 之间,这意味着没有显著的相关性。不过,GJ 842 的视向速度与二等分值之间显示出了 0.43 的正相关系数,这看起来是很显著的,尽管对应的数据集只有 16 个数据点 [6]

 


       [6]  我们只能得 GJ 842 16 幅光谱,因为在泽赫迈斯特尔等人 2009 年论文的数据集(也见表 2里虽然有 17 个视向速度,但是欧洲南方天文台的存档数据中没有用于校准的光谱图像

 

我们还由 HARPS 光谱得到了二等分值,并检验了这些值与视向速度之间的相关性。没有一个数据集显示出二等分值与速度之间有显著的相关性,这表明了速度数据的变化不大可能是由恒星表面的一些与活动性有关的现象——例如恒星黑子和(或)活动区——引起的。被求得的相关系数通常是在 0.1 0.1 之间,这与我们观测到的信号是真正的具有行星性质的多普勒印记这一解释一致的。

3.2  UVES 的误判

UVES 数据含有的某些信号并没有得到 HARPS 速度的支持。这意味着我们的基准模型不是最佳的,UVES 的测量噪声中的一些特征,或者甚至一些偏差,一些与仪器有关的变化稳定性问题,等等,都可以产生一些被解释为开普勒信号的变化。此外,按照我们的分析,甚至当我们确实在 UVES 数据中检测到了一个信号的时候,周期空间通常还是会遍布若干其他的几乎同样高的局部极大值,在这些局部极大值可以被剔除之前,它们应该会被解释为另外的一些解。在 UVES 数据中出现这种多峰情况的,例如 GJ 160.2 GJ 229(见图 2)、GJ 377 GJ 27.1

我们在 UVES 数据中只识别出了两个误判,它们已被 HARPS 速度从根本上剔除。其中的第一个误判是 GJ 377 14 UVES 速度测量结果中 15 天的周期性。这一信号使得模型概率相对于零开普勒模型增高了 700 倍,这并没有超过我们的检测阈值 104 。在这种情况下,HARPS 数据并未证实这个信号的存在,而是相当肯定地排除了它。在 UVES 数据中的这一很弱的信号迹象的疑似存在,还因为这一信号的周期参数在 2 5 50 200 700 天附近具有局部概率极大值,这些极大值超过了整体极大值的概率阈值的 0.1 % 甚至 1.0 % 。我们把这一结果解释为暗示着在 UVES 数据中存在有一个信号,但由于测量结果的数量很少,它的周期和变幅尚不能准确地测定。然而,在合并后的数据集中,周期参数的整体极大值是在周期大致 80 天处找到的,但它并不满足检测判据。

另一个例子是由 GJ 357 UVES 数据的解给出的,这个解包括两个周期,分别在 5 天和 26 天处。这两个信号的显著性对于仅有 5 个值的 HARPS 速度来说降低到低于检测阈值。这意味着——即使 HARPS 数据不足以约束合并后的数据集里的任何信号——可以排除在 UVES 数据中存在的某些局部极大值 [7] ,而其余的则或许实际上对应于一些信号,它们的存在可以在将来的高精密度数据变为可以利用时得到证实。

 


[7] 这里的“排除”不能解释成非常严格的排除,因为排除一个信号的存在一般地说远比检测到一个信号难。

 

我们注意到,在 UVES 中使用碘泡来得到精密的参考光谱线,这相对于 HARPS 中使用的钍氩法可能会产生系统差。这意味着与 UVES 数据中的取样无关的某些虚假信号和(或)虚假的局部极大值可以由 UVES 仪器中小尺度的不稳定性产生。同样的论证也可以运用于 HARPS 速度,尽管 HARPS 具有远高得多的长期稳定性和精密度。 然而,UVES 数据中的那些显著性很低的信号,因为不能对应于合并后的数据中的整体极大值,而被解释为误判,眼下尚不能区分它们是由这样的不稳定性、噪声中的周期或准周期特征、与恒星活动性和磁现象有关的周期性引起的,还是(或者同时是)由小质量行星引起的真正的多普勒印记。在理想的情况下,由仪器问题产生的信号可以通过它们得到两个数据集的支持而被排除,而由恒星表面现象产生的信号则原则上可以由它们或者它们的一级谐波在两个数据集中都没有呈现出任何对应的活动性指标来排除。可是,余下的任何信号依然可以由其他未知的周期性变化源引起。

  

(致谢和参考文献目录被略去,需要者请查阅原文。)

  评论这张
 
阅读(104)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017