CNV致病性评分标准 补充说明 (上) (ACGS v1.2版本 2024年)

CNV致病性评分标准 补充说明 (上) (ACGS v1.2版本 2024年)

技术教程gslnedu2025-03-09 16:40:089A+A-

任何疑问、批评、指导,请毫不犹豫地私信作者!

ACGS质量小组委员会于2024年2月20日批准了最新版本v1.2,对CNV和SNV的致病性判读标准进行了补充和说明。

同时,也很多刚学习这块内容的同学会私信询问作者,现整理出相关内容,仅供参考学习,建议阅读原文。


总体说明

1. 在使用CNV分类评分标准[包括拷贝数缺失分类评分标准(以下简称缺失标准),拷贝数重复分类评分标准(以下简称重复标准)]时,假定CNV已达到实验室报告的大小阈值和质量阈值。

2. 评分标准主要为了评估涉及孟德尔显性遗传疾病相关的基因或基因组区域的CNV,通常这些CNV是单拷贝的缺失或重复(拷贝数为1或3)。在评估时,需要使用与其类型相同的证据类型。

虽然CNV分类评分标准的制定并不是为了独立应用于X连锁基因/区域或那些外显不全和/或可变临床表型相关的基因,但是目前仍可使用

ACGS对第2部分进行修改,以便纳入功能丧失是已确定的疾病机制的常染色体隐性基因

3. 对其他拷贝数的评估:评分标准也可用于评估其他拷贝数类型,如纯合缺失(拷贝数为0)或多拷贝重复(拷贝数为4)。在评估时,需要使用与其类型相同或相似的证据。例如:使用重复标准对4拷贝重复进行评估,主要使用4拷贝重复相关的证据,但3 拷贝重复的证据也可纳入评价。对于纯合缺失,患者可能导致更严重的常染色体显性疾病(纯合缺失非致死性)或常染色体隐性疾病

4. 对于复杂重排,如非平衡易位既有缺失又有重复,应先单独评估每个 CNV,例如使用缺失标准评估缺失片段,使用重复标准评估重复片段。整体评 估应使用最严重的分类。例如当缺失归类为致病性,重复归类为临床意义未明,则整体最终归类为致病性。

5. 位于X染色体的CNV:虽然X染色体在女性和男性中的拷贝数不一致, 但评分标准仍可用于评估X染色体上的缺失和重复。大多数情况下,男性为X连锁疾病患者,而女性则为无症状携带者;但有些X连锁疾病,女性为患者(由于男性致死)或临床症状表现严重程度不同的女性携带者[由于X染色体失活偏倚和(或)其他因素]。在评估X染色体上的CNV时,应基于现有证据进行分类,而不考虑性别因素,但应当在报告中注明患者或携带者状态。涉及X连锁隐性遗传疾病基因的女性X染色体上的缺失分类,应基于该缺失在男性中的评估

6. CNV的评级在不同个体间应当保持一致性,而不因年龄、性别、表型等因素进行改变。

7. 当评分≥0.99或≤-0.99时,CNV就可以分类为致病或良性。但应当充分考虑评分标准的其他部分,尤其是文献评估部分,以明确是否有其他相关临床信息需要报告。例如, 一个涉及多基因缺失的CNV,其中一个基因是明确的单倍剂量不足敏感(HI)基因,就可分类为致病性。若有文献提示该区段内的其他基因可能有与之相关的表型,那么该CNV的致病性分类不变,但应在报告中描述其他基因相关的表型,以便于临床诊疗


评分标准说明

第一部分

基因组含量的初步评估使用“利用染色体组分资源建立的人类基因组变异和表型数据库”(DatabasE of genomiC varIation and Phenotype in Humans using Ensembl Resources, DECIPHER)查询,并勾选“protein-coding ”选项。

1A:包含蛋白质编码基因或其他已知的有重要功能的元件。除蛋白编码基因外,还需考虑可能存在的重要功能元件(如启动子、增强子、编码序列附近其他调控区域)与临床的相关性,及其对基因表达的影响。比如,在基因附近~1Mb范围内的上游或下游侧翼序列的CNV,与高度特异性的表型相关,该表型也在患者身上发生,然后进行文献检索,确定该区域是否包含该基因的重要功能元件(如SHH、SOX、HOX、FOX基因家族等基因的~1Mb范围内的CNVs)。例如,位于SHOX基因下游160 kb的增强子、影响SHH基因极化活性调控序列(ZRS)区域等。如有证据,可根据文献证据的强度和专业判读,判定CNV为可能致病(0.90)。

1B:不包含蛋白质编码基因或任何已知的有重要功能的元件。不包含任何基因的CNV,如内含子序列、重复元件或假基因,由于未包含基因,该基因组区域可能没有任何证据可供查询。在没有证据支持或反对致病性的情况下,CNV分类应为不明确。CNV断裂位点由于探针或覆盖范围间隙而无法精确定 位。在假设CNV为良性之前,考虑CNV的最大范围内的所有基因尤为重要(报告通常仅考虑最小的CNV范围)。除CNV片段超过实验室报告大小阈值外,由于未查询到相关文献证据,实验室可不报告此类CNV。

如果CNV的最小和最大间隔是内含子,但该基因与高度特异性的表型相关,该表型也在患者身上发生,并且有文献证据表明内含子是重要的,那么继续进行下一步评估。


第二部分

与明确HI/TS区域重叠,使用ClinGen基因剂量敏感性数据库查询。

如果本部分的评分≥0.99分(致病),则不需要进行后续部分评分。

单倍剂量不足(haploinsufficient, HI):一个等位基因突变或者缺失,另一个等位基因能正常表达,但这只有正常水平50%的蛋白质不足以维持细胞正常的生理功能,然后出现特定表型。

三倍剂量敏感(triplosensitive, TS):包含三倍剂量敏感的基因或基因的一部分而致病。

MANE:为了促进临床参照的一致性,美国国家生物技术信息中心(National Center for Biotechnology Information, NCBI)和欧洲分子生物学实验室-欧洲生物信息学研究所(European Molecular Biology Laboratories-European Bioinformatics Institute, EMBL-EBI)合作发布了参考转录本数据库MANE (Matched Annotation from NCBI and EMBL-EBI)。MANE旨在收录和整理人类基因的转录本注释信息,并且提供编码基因最具代表性转录本和相应的蛋白质。每个MANE转录本代表Refseq转录本与其在Ensembl/GENCODE注释中的对应转录本之间的外显子区域的精确匹配,以便这两个标识符可以同义使用。MANE转录本与GRCh38参考基因组组装完全匹配,并根据转录本表达水平和编码区保守性等生物学相关标准进行选择。MANE的主要子集有两个:MANE select 和 MANE plus。

MANE Select:MANE Select子集是由基因的一个代表性转录本组成,经过严格的计算机预测结合专家组的人工审核,最终选择出的一个转录本,能代表该区域的生物学特征。MANE Select的转录本通常作为临床报告的通用标准、基因组浏览器的默认配置等,对于日常出报告,一般来说是非常有用的。MANE转录本是和临床最相关的转录本,但却不是唯一相关的转录本

MANE Plus Clinical:MANE Plus Clinical集合包括了一些基因的特殊转录本,考虑到某些基因会组织特异性表达,仅靠MANE Select不足以报告公共资源中所有的“致病”或“可能致病”的临床变异,因此采用MANE Plus Clinical作为补充

使用第二部分评分标准时,需注意:

1)一些基因可能只被报道过LoF序列变异。因此,整个基因缺失预期可能会产生与LoF序列变异一样的效应。

2)在ClinGen基因剂量敏感性数据库查询时,要注意最后一次评估的日期。因为,后续可能会出现新的证据来支持或反驳当时的评估结果。

3)ClinGen基因剂量敏感性评分为2或Gene2Phenotype(G2P)数据库提示基因与表型的关系为“中度”和“缺乏基因产物”,这类基因可能会有足够的现有证据达到至少可能致病的分类,但仍需要对证据和指南的应用进行仔细审查。

4)当选择性转录本是MANE Plus Clinical子集里面的或被认为是生物学上最相关的表达转录本,在上调或下调分值时,才考虑使用MANE Select的选择性转录本。

已明确的良性基因/区域,有以下特征:

1)ClinGen基因剂量敏感性评分为40;

2)频率>1%(在自建平台或DGV gold standard dataset或gnomAD v4.0 SV dataset)。


不同类型CNV适用的指南(CNV或SNV)不同

2A (1分):如果待评估的CNV完全覆盖明确HI/TS致病基因或关键区域,推荐得分(points, Pts)为1.00,为致病性CNV。可以不要求进一步收集证据;然而,仍然需要研究CNV的临床意义、CNV与患者表型/管理的关联性。



2B (0分):如果待评估的CNV与明确HI/TS区域部分重叠,则需要明确是否包含其致病基因或关键区域(需注意ClinGen基因剂量敏感性数据库中有些区域给出的基因是位置标记基因而非关键剂量敏感基因)。


2H:(重复标准, 0分), HI基因的完整重复不应被认为(should not be presumed to be)是致病性的,除非与重复剂量敏感性疾病相关。例如PMP22基因缺失引起遗传性压力易感性周围神经病;重复引起脱髓鞘型腓骨肌萎缩症。


2C、2D评分标准

下面部分的评分标准需要考虑三个方面

1)breakpoint location;

2)involvement of coding sequence

3)evidence from the literature

2C:如果涉及基因的5’端,必须考虑缺失是否包含了编码序列(2C-1),或仅限于基因的5’非翻译区域(untranslated region, UTR;2C-2)。

2C-1 (推荐0.9, 范围0.45~1.00):一般来说,这样的缺失会导致基因转录起始点的丢失,从而使得基因产物缺失,引起HI。

功能丧失(loss of function, LoF)基因的5’UTR外显子、第一编码外显子、基因内外显子的缺失通常(typically)是有害的

缺失后,要考虑,其下游是否存在框内可替代的ATG(起始密码子)来“挽救”前面的起始密码子缺失。在缺失下游,可存在其他已知的转录本/可变剪接体,仍有产生功能性蛋白的可能性,此时应考虑下调分值(下调至0.45)。

如果该基因的大部分编码序列缺失,或已知重要的功能结构域缺失,可考虑上调分值(上调至1.00)。

2C-2 (推荐0, 范围0~0.45):当仅涉及5’UTR时,推荐得分为0

如果缺失仅包含基因的5’UTR,但缺失片段包含了明确的启动子,可考虑上调分值(上调至0.45)。

如果有文献证据表明,该基因的5’UTR变异、缺失,或其上游非编码序列缺失(比如启动子缺失)会导致LoF,引起HI(疾病),那么可上调分值(上调至0.45)。


2D:如果缺失范围与基因的3’末端重叠,必须考虑基因的蛋白质产物是否会发生无义介导的mRNA降解(nonsense mediated decay, NMD)

2D-1 (推荐0):如果仅涉及3’UTR,一般不会导致LoF,推荐得分为0。

2D-2 (推荐0.9, 范围0.45~1.00):HI/LoF基因最后一个外显子的缺失不一定会引起NMD,通常不致病。因此,截短的蛋白也可能(或不能)有正常的功能。但如果有明确的文献证据表明最后一个外显子对蛋白质的功能是重要的(比如已经有文献报道或功能验证,有明确的致病变异位于该外显子),则该缺失可能为致病。建议得分0.9 (范围0.45~0.9)。

如果仅有文献报道最后一个外显子上的致病变异,但尚未完全确定外显子对蛋白质的重要性,下调至0.45或0.60 (根据功能证据的可信程度)。

2D-3 (推荐0.3, 范围0~0.45):无证据表明最后一个外显子对基因功能是重要的(没有任何文献报道致病变异位于该外显子)。

2D-4 (推荐0.9, 范围0.45~1.00):缺失范围包括基因的3’端重叠,最后一个外显子、其他外显子预测会发生NMD,推荐得分为0.90。

如有额外证据表明对蛋白质产生有害影响(例如预测大部分蛋白质缺失),可上调分值至1.00。


2J 2K 2L (N/C端的基因重复)

重复范围涉及基因的5'或3'端,通常被认为是串联的、正向的(typically expected to be in tandem and in direct orientation),不会导致疾病,因为基因的结构可能没有被破坏。

如果变异对基因造成影响,预计是HI/LoF效应;因此,应该评估部分基因重复是否产生HI/LoF效应,而不是TS。当然这类变异是罕见的,前提是该基因是已确定的HI/LoF疾病相关基因,患者的表型高度特异,与该基因功能丧失所致的表型高度一致。

2J (推荐0):见上图。

2K (推荐0.45):这个证据没有分值范围。患者没有特异性表型的话,这个证据很难使用到。如果重复被证实是串联的、正向的,那么这个证据就不能用。

2L (推荐0)如果重复涉及的基因不是已确定的HI/LoF致病基因,则不加分,并继续下一步评估。当两个断裂点都在与疾病无关的基因内时也适用。


2E、2I评分标准

涉及HI/LoF基因内del/dup(两个断裂点在基因内)

1)适用于发生在第二个至倒数第二个外显子之间或基因开放阅读框(open reading frame)内的CNVs。

2)框外(out-frame)缺失预测会导致NMD,引起HI。框外(out-frame)重复可能会导致NMD。

3)框内缺失(in-frame)一般不会导致NMD,但需要注意,缺失的外显子对基因的正常功能是否必需。


内含子存在3n+0、3n+1以及3n+2三种相位(phase)类型。

如果CNV的断裂点两侧是相同的内含子相位,则CNV为框内

若两侧不相同,则为框外

另外一个简单的方法,将CNV区间内的编码的核苷酸的数量3,=整数的话,则为框内CNV。


2E(缺失标准)

对于单个基因内缺失,必须考虑:

1)缺失是否会破坏开放阅读框架

2)是否会导致NMD;

3)缺失的外显子是否包含在生物相关的转录本中;

4)截短或改变的区域对蛋白质功能是否重要;

5)一般人群中缺失外显子的LOF变异发生的频率;

6)缺失导致截短蛋白质的大小。


2I(重复标准)

对于单个基因内重复,必须考虑

1)重复是否是串联的;

2)是否会破坏开放阅读框;

3)预测是否会导致NMD。

单个基因的重复通常被认为是串联重复, 而不是插入或易位到基因组的其他位置

包含末端编码外显子(第一个或最后一个外显子)的部分基因重复,通常不是有害的,因为基因的结构可以被保留。

断裂点完全位于基因内且不涉及末端外显子的重复可能是有害的,因为它们会破坏阅读框或影响剪接。

以上判断是基于以往研究做出的通用推断。若要排除一些特殊情况,最好的方式进一步实验验证,如DNA测序验证明确断裂点、mRNA测序明确RNA剪接是否受到影响,体内或体外细胞实验明确RNA/蛋白表达是否受到影响,明确是否发生NMD等

如果无法获得使用PVS1流程图(PMID: 30192042)所必需的信息,则默认选 择影响最小的评估流程。

如果可获得使用PVS1流程图所必需的信息,由于CMA平台探针分布、间隔区间的局限性,为了更准确地确定基因内缺失或重复,建议对患者进行其他分子检测,以便更好地解释该片段


举 例

例1,下图为框外缺失(2E)PVS1 0.9 (results in NMD)


例2,下图为框内缺失(2E)PVS1_Strong upgraded to 0.90 (deletes key domain)。


例3,下图为框内缺失(2E)N/A 0分 (Exon is absent from other biologically relevant transcripts)。第30号外显子可发生选择性剪接,即存在其他有功能的转录本,可以没有30号外显子。携带该缺失的人没有表现出基因相应表型。


例4,下图为框外重复(假设是串联重复):2I:PVS1_Strongupgraded to 0.90 (most likely in tandem and may result in NMD, similar CNVs in patients with HBOC)】


2F(缺失标准)与2C(重复标准):待评估CNV完全处于明确良性CNV区域内,即在ClinGen基因剂量敏感性数据库中评分为40,说明不太可能为剂量敏感的区段。

2D(重复标准):待评估CNV完全处于明确良性CNV区域内,且没有破坏区域内蛋白编码基因。

2F(重复标准):待评估CNV与明确良性CNV区域重叠,且没有破坏其他的蛋白编码基因。

若待评估CNV与明确良性CNV重叠,但片段较大且包含其他疾病相关基因或重要功能元件(如附近HI基因的调控区域),则不适用此标准,建议进一步评估,此项适用2G。



2H(缺失标准)

≥2个HI预测指标提示CNV内至少有一个基因是HI基因(建议得分0.15,最高得分0.15)。

HI预测的评估,这一证据的使用仅限于包含临床意义未明基因的缺失,不适用于已经明确的HI基因。

目前常用的两个HI预测指标是gnomAD数据库的pLI评分(或LOEUF评分)、DECIPHER数据库的pHaplo评分

CNV覆盖的基因中,至少有一个基因,它的pLI评分≥0.9(且观察或理论置信区间上限<0.35)+pHaplo评分≥0.86。

此证据只能赋分一次,不可多次计算,即使在该区域有多个基因被预测为HI

pHaplo(predicted Probability of Haploinsufficiency)单倍剂量不足预测概率,这一指标是基于950,278名个体的微阵列芯片数据。pHaplo评分经过145个基因的机器学习模型生成。与一般人群相比,预测在重度早发性疾病队列中,基因完全缺失的可能性。pHaplo评分≥0.86表明,基因缺失的效果与已知的蛋白截短变异造成基因的LoF效果相同(Karczewski et al 2020)。同样,pTriplo(predicted Probability of Triplosensitivity)评分用于基因三倍剂量预测,阈值为≥0.94。

pLI(the probability of being loss‐of‐function intolerant, pLI)评分反映了某个基因对其变异引起功能丧失(loss-of-function)的耐受程度(tolerance)。变异类型是蛋白截短类型(Protein Truncating Variants, PTV) ,如移码突变、剪接体变异、剪接受体变异。pLI分值是一个把基因归类到Haploinsufficient 类别中的概率,分值越高,越不耐受(intolerant);分值越低,越耐受(tolerant)。pLI阈值推荐0.9(范围0~1)

LoF观察/期望上限评分(loss-of-function observed/expected upper bound fraction, LOEUF)旨在评价基因对功能丧失变异的不耐受。由于gnomAD v2.1.1和v4.0之间LOEUF分布的预期变化,现在建议将v4.0的LOEUF阈值设置为<0.6(而v2的LOEUF<0.35),值越小越受限,即对LoF变异越不耐受。

pLI、LOEUF不要一起使用,用一个就行,因为都是基于gnomAD数据库的,只是呈现的方式不一样。

有时候会发现HI评分pLI、LOEUF不一致。对于检测到LoF变异,如果在一个群体数据集中观察到的越少,表明该基因越不耐受。Karczewski等(2022)基于gnomAD v.2.1.1 数据库中的每个基因开发了LOEUF,比较了125,748例个体中观察到的LoF变异数量与预期的LoF数量。同样pLI评分也是基于gnomAD v.2.1.1 数据库的人群。因此,pLI、LOEUF的使用要考虑疾病的严重程度和发病年龄,晚发性疾病和/或疾病严重程度较轻的疾病可能是不适用的。


2H(重复标准):包含HI基因/区段,继续后续评分。

点击这里复制本文地址 以上内容由朽木教程网整理呈现,请务必在转载分享时注明本文地址!如对内容有疑问,请联系我们,谢谢!
qrcode

朽木教程网 © All Rights Reserved.  蜀ICP备2024111239号-8