[国产剧情]麻豆正在播放,久久久久人妻精品一区蜜桃,中国人妻被两个老外三P

  • <input id="s8s22"><s id="s8s22"></s></input>
  • <nav id="s8s22"><u id="s8s22"></u></nav>
  • <code id="s8s22"><label id="s8s22"></label></code>
    咨詢熱線:400-1792-998
    當前位置:主頁 > 新聞動態 > 公司新聞公司新聞

    【文獻熱點】值得警惕的外顯測序雷區3:變異識別算法局限性

    發布時間 :2021-07-02 13:10 閱讀 :
     

    雷區3:變異識別算法局限性

    外顯子組測序已成為孟德爾遺傳病的有效診斷方法,但是即使采用了ACMG指南對變異進行分類,不同實驗室的測序質量差距仍然較大。原因之一是由于國內目前沒有統一或推薦的用于臨床中外顯子組測序的生物信息學分析工具,導致在分析過程中產生一些錯誤,包括變異識別錯誤、變異注釋錯誤和過濾錯誤等。此外,即使對于使用類似“軟件組件“的實驗室來說,在質量控制(QC)度量上也尚缺乏共識 [1]。目前,實驗室中不同的生物信息學工具之間的比較,以及它們在現實場景中的相對優點和精度均尚無研究。


    1、變異識別工具

    在一項研究中,通過使用商業化試劑盒(illumina HiSeq 2000平臺和安捷倫SureSelect version 2捕獲試劑盒)對四個家庭的15個外顯子組進行測序,其平均測序深度約為120X,采用五種不同的校準和變異識別工具(SOAP、BWA-GATK、BWA SNVer、GNUMAP和BWA SAMtools)的近似默認參數對原始數據進行分析。結果顯示,illumina測序平臺的檢測數據在近似默認的軟件參數下,不同變異識別工具對SNV和Indel的識別仍然存在顯著差異,提示這些常用工具之間采用了不同的生物信息學方法,其中所有15個外顯子的5個變異識別工具之間的SNV一致性為57.4%(如圖1),三個Indel識別工具之間的Indel一致性僅為26.8%(如圖2)。因此,在醫療背景下分析個體的基因組信息時,對待Indel變異的識別應尤其謹慎 [2]。

     

    SAMtools與GATK是目前應用最廣泛的兩種變異識別工具,對這兩個工具的評估研究顯示,基因組分析工具GATK比SAMtools的識別更加準確(陽性預測值分別為92.55%和80.35%)(如圖3)[3]。

    2、測序平臺

    以上兩個下一代測序(NGS)平臺(illumina HiSeq 2000平臺和安捷倫SureSelect version 2捕獲試劑盒)之間的變異也存在顯著差異。相對較新的CG 2.0 WGS工具檢測到一組外顯子變異,92%位于安捷倫SureSelect 2.0版捕獲試劑盒捕獲的區域內,但是即使是在高可映射性區域,仍然有11%沒有被illumina的外顯子組分析工具識別 [2]。

     

    在其他測序平臺的對比研究中,包含3種識別工具(HaplotypeCaller, Strelka2 和Samtools-Varscan2),5種測序平臺(華大公司的的BGISEQ500,、MGISEQ2000、illunima公司的 HiSeq4000、NovaSeq和HiSeq Xten)組成的15種組合;對于WES數據集,華大平臺在SNPs識別中表現出更優的性能,而illumina平臺在Indels識別中表現出更優的性能。這可能是由于兩家公司在測序策略上存在差異而產生長度不同的reads(BGI平臺均為100bp讀長,illumina平臺均為150bp讀長)。對于WGS數據集,Xten-SK2(HiSeq Xten測序平臺和Strelka2識別工具)和HiSeq4000-SK2(HiSeq4000測序平臺和Strelka2識別工具)在所有組合中SNPs和Indels識別的F值最高 [4]。

     

    3、其他

    除此之外,通過多代家庭的測序數據來過濾遺傳突變,可以提高基因組測序的整體準確性 [2]。SAMtools與GATK識別工具的研究中發現SNV識別之前,映射讀取的重新排列和基本質量分數的重新校準對變異識別的準確性也至關重要 [3]。

     

    因此,臨床中基因組測序數據的質量與測序平臺、生物信息學工具等息息相關。通過以上研究中的對比數據可為下一代測序技術在臨床中的進一步推廣和應用提供指導和建議。

     

    圖片

    圖1,五個校準和變異識別工具之間15個外顯子的平均單核苷酸變異(SNV)一致性。使用的校準方法以及SNV變異識別算法在這里用簡寫方式注釋:BWA-GATK、SOAP alignment-SOAPsnp、BWA-SNVer、BWA-SAMTools和GNUMAP-GNUMAP。

    (A) 通過匹配每個檢測到的SNV的基因組坐標以及堿基對變化和合子性來確定每個工具之間的SNV平均一致性。

    (B) (B)與(A)中的分析相同,但過濾后僅包括dbSNP135中已發現的SNV。

    (C) 與(A)中的分析相同,但過濾后包括新的SNV(即dbSNP135中未發現的SNV)。

     

    圖片

    圖2,三個indel識別工具:GATK、SOAPindel和SAMtools之間超過15個外顯子組的平均indel一致性。

    (A) 所有的indels,(B)已知的indels (dbSNP135中發現的indels)和(C)未知的indels (dbSNP135中沒有發現的indels)之間的平均一致性。

     

    圖片

    圖3,通過30個受試者的數據比較GATK和SAMtools對SNV識別。在比較過程中,分別使用了GATK中的UnifiedGenotyper算法和SAMtools中的mpilup算法。并通過Sanger測序評估這些變異的準確性。

     

     

    參考文獻:

    [1] Zhang K, Lin G, Han D, Han Y, Wang J, Shen Y, Li J. An Initial Survey of the Performances of Exome Variant Analysis and Clinical Reporting Among Diagnostic Laboratories in China. Front Genet. 2020 Nov 2;11:582637.

    [2] O'Rawe J, Jiang T, Sun G, Wu Y, Wang W, Hu J, Bodily P, Tian L, Hakonarson H, Johnson WE, Wei Z, Wang K, Lyon GJ. Low concordance of multiple variant-calling pipelines: practical implications for exome and genome sequencing. Genome Med. 2013 Mar 27;5(3):28.

    [3] Pirooznia M, Kramer M, Parla J, Goes FS, Potash JB, McCombie WR, Zandi PP. Validation and assessment of variant calling pipelines for next-generation sequencing. Hum Genomics. 2014 Jul 30;8(1):14. doi: 10.1186/1479-7364-8-14.

    [4] Chen J, Li X, Zhong H, Meng Y, Du H. Systematic comparison of germline variant calling pipelines cross multiple next-generation sequencers. Sci Rep. 2019 Jun 27;9(1):9345.

    雷區3:變異識別算法局限性

    外顯子組測序已成為孟德爾遺傳病的有效診斷方法,但是即使采用了ACMG指南對變異進行分類,不同實驗室的測序質量差距仍然較大。原因之一是由于國內目前沒有統一或推薦的用于臨床中外顯子組測序的生物信息學分析工具,導致在分析過程中產生一些錯誤,包括變異識別錯誤、變異注釋錯誤和過濾錯誤等。此外,即使對于使用類似“軟件組件“的實驗室來說,在質量控制(QC)度量上也尚缺乏共識 [1]。目前,實驗室中不同的生物信息學工具之間的比較,以及它們在現實場景中的相對優點和精度均尚無研究。

     

    1、變異識別工具

    在一項研究中,通過使用商業化試劑盒(illumina HiSeq 2000平臺和安捷倫SureSelect version 2捕獲試劑盒)對四個家庭的15個外顯子組進行測序,其平均測序深度約為120X,采用五種不同的校準和變異識別工具(SOAP、BWA-GATK、BWA SNVer、GNUMAP和BWA SAMtools)的近似默認參數對原始數據進行分析。結果顯示,illumina測序平臺的檢測數據在近似默認的軟件參數下,不同變異識別工具對SNV和Indel的識別仍然存在顯著差異,提示這些常用工具之間采用了不同的生物信息學方法,其中所有15個外顯子的5個變異識別工具之間的SNV一致性為57.4%(如圖1),三個Indel識別工具之間的Indel一致性僅為26.8%(如圖2)。因此,在醫療背景下分析個體的基因組信息時,對待Indel變異的識別應尤其謹慎 [2]。

     

    SAMtools與GATK是目前應用最廣泛的兩種變異識別工具,對這兩個工具的評估研究顯示,基因組分析工具GATK比SAMtools的識別更加準確(陽性預測值分別為92.55%和80.35%)(如圖3)[3]。

     

    2、測序平臺

    以上兩個下一代測序(NGS)平臺(illumina HiSeq 2000平臺和安捷倫SureSelect version 2捕獲試劑盒)之間的變異也存在顯著差異。相對較新的CG 2.0 WGS工具檢測到一組外顯子變異,92%位于安捷倫SureSelect 2.0版捕獲試劑盒捕獲的區域內,但是即使是在高可映射性區域,仍然有11%沒有被illumina的外顯子組分析工具識別 [2]。

     

    在其他測序平臺的對比研究中,包含3種識別工具(HaplotypeCaller, Strelka2 和Samtools-Varscan2),5種測序平臺(華大公司的的BGISEQ500,、MGISEQ2000、illunima公司的 HiSeq4000、NovaSeq和HiSeq Xten)組成的15種組合;對于WES數據集,華大平臺在SNPs識別中表現出更優的性能,而illumina平臺在Indels識別中表現出更優的性能。這可能是由于兩家公司在測序策略上存在差異而產生長度不同的reads(BGI平臺均為100bp讀長,illumina平臺均為150bp讀長)。對于WGS數據集,Xten-SK2(HiSeq Xten測序平臺和Strelka2識別工具)和HiSeq4000-SK2(HiSeq4000測序平臺和Strelka2識別工具)在所有組合中SNPs和Indels識別的F值最高 [4]。

     

    3、其他

    除此之外,通過多代家庭的測序數據來過濾遺傳突變,可以提高基因組測序的整體準確性 [2]。SAMtools與GATK識別工具的研究中發現SNV識別之前,映射讀取的重新排列和基本質量分數的重新校準對變異識別的準確性也至關重要 [3]。

     

    因此,臨床中基因組測序數據的質量與測序平臺、生物信息學工具等息息相關。通過以上研究中的對比數據可為下一代測序技術在臨床中的進一步推廣和應用提供指導和建議。

     

    圖片

    圖1,五個校準和變異識別工具之間15個外顯子的平均單核苷酸變異(SNV)一致性。使用的校準方法以及SNV變異識別算法在這里用簡寫方式注釋:BWA-GATK、SOAP alignment-SOAPsnp、BWA-SNVer、BWA-SAMTools和GNUMAP-GNUMAP。

    (A) 通過匹配每個檢測到的SNV的基因組坐標以及堿基對變化和合子性來確定每個工具之間的SNV平均一致性。

    (B) (B)與(A)中的分析相同,但過濾后僅包括dbSNP135中已發現的SNV。

    (C) 與(A)中的分析相同,但過濾后包括新的SNV(即dbSNP135中未發現的SNV)。

     

    圖片

    圖2,三個indel識別工具:GATK、SOAPindel和SAMtools之間超過15個外顯子組的平均indel一致性。

    (A) 所有的indels,(B)已知的indels (dbSNP135中發現的indels)和(C)未知的indels (dbSNP135中沒有發現的indels)之間的平均一致性。

     

    圖片

    圖3,通過30個受試者的數據比較GATK和SAMtools對SNV識別。在比較過程中,分別使用了GATK中的UnifiedGenotyper算法和SAMtools中的mpilup算法。并通過Sanger測序評估這些變異的準確性。

     

     

    參考文獻:

    [1] Zhang K, Lin G, Han D, Han Y, Wang J, Shen Y, Li J. An Initial Survey of the Performances of Exome Variant Analysis and Clinical Reporting Among Diagnostic Laboratories in China. Front Genet. 2020 Nov 2;11:582637.

    [2] O'Rawe J, Jiang T, Sun G, Wu Y, Wang W, Hu J, Bodily P, Tian L, Hakonarson H, Johnson WE, Wei Z, Wang K, Lyon GJ. Low concordance of multiple variant-calling pipelines: practical implications for exome and genome sequencing. Genome Med. 2013 Mar 27;5(3):28.

    [3] Pirooznia M, Kramer M, Parla J, Goes FS, Potash JB, McCombie WR, Zandi PP. Validation and assessment of variant calling pipelines for next-generation sequencing. Hum Genomics. 2014 Jul 30;8(1):14. doi: 10.1186/1479-7364-8-14.

    [4] Chen J, Li X, Zhong H, Meng Y, Du H. Systematic comparison of germline variant calling pipelines cross multiple next-generation sequencers. Sci Rep. 2019 Jun 27;9(1):9345.

    雷區3:變異識別算法局限性

    外顯子組測序已成為孟德爾遺傳病的有效診斷方法,但是即使采用了ACMG指南對變異進行分類,不同實驗室的測序質量差距仍然較大。原因之一是由于國內目前沒有統一或推薦的用于臨床中外顯子組測序的生物信息學分析工具,導致在分析過程中產生一些錯誤,包括變異識別錯誤、變異注釋錯誤和過濾錯誤等。此外,即使對于使用類似“軟件組件“的實驗室來說,在質量控制(QC)度量上也尚缺乏共識 [1]。目前,實驗室中不同的生物信息學工具之間的比較,以及它們在現實場景中的相對優點和精度均尚無研究。

     

    1、變異識別工具

    在一項研究中,通過使用商業化試劑盒(illumina HiSeq 2000平臺和安捷倫SureSelect version 2捕獲試劑盒)對四個家庭的15個外顯子組進行測序,其平均測序深度約為120X,采用五種不同的校準和變異識別工具(SOAP、BWA-GATK、BWA SNVer、GNUMAP和BWA SAMtools)的近似默認參數對原始數據進行分析。結果顯示,illumina測序平臺的檢測數據在近似默認的軟件參數下,不同變異識別工具對SNV和Indel的識別仍然存在顯著差異,提示這些常用工具之間采用了不同的生物信息學方法,其中所有15個外顯子的5個變異識別工具之間的SNV一致性為57.4%(如圖1),三個Indel識別工具之間的Indel一致性僅為26.8%(如圖2)。因此,在醫療背景下分析個體的基因組信息時,對待Indel變異的識別應尤其謹慎 [2]。

     

    SAMtools與GATK是目前應用最廣泛的兩種變異識別工具,對這兩個工具的評估研究顯示,基因組分析工具GATK比SAMtools的識別更加準確(陽性預測值分別為92.55%和80.35%)(如圖3)[3]。

     

    2、測序平臺

    以上兩個下一代測序(NGS)平臺(illumina HiSeq 2000平臺和安捷倫SureSelect version 2捕獲試劑盒)之間的變異也存在顯著差異。相對較新的CG 2.0 WGS工具檢測到一組外顯子變異,92%位于安捷倫SureSelect 2.0版捕獲試劑盒捕獲的區域內,但是即使是在高可映射性區域,仍然有11%沒有被illumina的外顯子組分析工具識別 [2]。

     

    在其他測序平臺的對比研究中,包含3種識別工具(HaplotypeCaller, Strelka2 和Samtools-Varscan2),5種測序平臺(華大公司的的BGISEQ500,、MGISEQ2000、illunima公司的 HiSeq4000、NovaSeq和HiSeq Xten)組成的15種組合;對于WES數據集,華大平臺在SNPs識別中表現出更優的性能,而illumina平臺在Indels識別中表現出更優的性能。這可能是由于兩家公司在測序策略上存在差異而產生長度不同的reads(BGI平臺均為100bp讀長,illumina平臺均為150bp讀長)。對于WGS數據集,Xten-SK2(HiSeq Xten測序平臺和Strelka2識別工具)和HiSeq4000-SK2(HiSeq4000測序平臺和Strelka2識別工具)在所有組合中SNPs和Indels識別的F值最高 [4]。

     

    3、其他

    除此之外,通過多代家庭的測序數據來過濾遺傳突變,可以提高基因組測序的整體準確性 [2]。SAMtools與GATK識別工具的研究中發現SNV識別之前,映射讀取的重新排列和基本質量分數的重新校準對變異識別的準確性也至關重要 [3]。

     

    因此,臨床中基因組測序數據的質量與測序平臺、生物信息學工具等息息相關。通過以上研究中的對比數據可為下一代測序技術在臨床中的進一步推廣和應用提供指導和建議。

     

    圖片

    圖1,五個校準和變異識別工具之間15個外顯子的平均單核苷酸變異(SNV)一致性。使用的校準方法以及SNV變異識別算法在這里用簡寫方式注釋:BWA-GATK、SOAP alignment-SOAPsnp、BWA-SNVer、BWA-SAMTools和GNUMAP-GNUMAP。

    (A) 通過匹配每個檢測到的SNV的基因組坐標以及堿基對變化和合子性來確定每個工具之間的SNV平均一致性。

    (B) (B)與(A)中的分析相同,但過濾后僅包括dbSNP135中已發現的SNV。

    (C) 與(A)中的分析相同,但過濾后包括新的SNV(即dbSNP135中未發現的SNV)。

     

    圖片

    圖2,三個indel識別工具:GATK、SOAPindel和SAMtools之間超過15個外顯子組的平均indel一致性。

    (A) 所有的indels,(B)已知的indels (dbSNP135中發現的indels)和(C)未知的indels (dbSNP135中沒有發現的indels)之間的平均一致性。

     

    圖片

    圖3,通過30個受試者的數據比較GATK和SAMtools對SNV識別。在比較過程中,分別使用了GATK中的UnifiedGenotyper算法和SAMtools中的mpilup算法。并通過Sanger測序評估這些變異的準確性。

     

     

    參考文獻:

    [1] Zhang K, Lin G, Han D, Han Y, Wang J, Shen Y, Li J. An Initial Survey of the Performances of Exome Variant Analysis and Clinical Reporting Among Diagnostic Laboratories in China. Front Genet. 2020 Nov 2;11:582637.

    [2] O'Rawe J, Jiang T, Sun G, Wu Y, Wang W, Hu J, Bodily P, Tian L, Hakonarson H, Johnson WE, Wei Z, Wang K, Lyon GJ. Low concordance of multiple variant-calling pipelines: practical implications for exome and genome sequencing. Genome Med. 2013 Mar 27;5(3):28.

    [3] Pirooznia M, Kramer M, Parla J, Goes FS, Potash JB, McCombie WR, Zandi PP. Validation and assessment of variant calling pipelines for next-generation sequencing. Hum Genomics. 2014 Jul 30;8(1):14. doi: 10.1186/1479-7364-8-14.

    [4] Chen J, Li X, Zhong H, Meng Y, Du H. Systematic comparison of germline variant calling pipelines cross multiple next-generation sequencers. Sci Rep. 2019 Jun 27;9(1):9345.

    [国产剧情]麻豆正在播放,久久久久人妻精品一区蜜桃,中国人妻被两个老外三P