GÜNCELLEME: Bir güncelleme olarak, Sarah Walker (posterdeki ortak yazar) GATK
forumunda soruma yanıt verdi. Aşağıdaki ifadeyle durumu açıklığa kavuşturdu:
30X (ve 150X üzeri) civarındaki sitelerin düşük haritalama kalitesi nedeniyle filtrelendiğine inanıyoruz (tüm genom olduğu için zor olan birçok alan var haritaya), bu alanlardaki düşük hassasiyetleri açıklar. Hata çubuklarının gösterdiği gibi, haritalama kalitesi düşük olan bu alanlarda çok az değişken var.
Ardından, hepimizin beklediğimizle çok daha fazla aynı hizaya gelen aşağıdaki grafiği yayınladı. Bu, NA12878
için NIST gerçeğine kıyasla duyarlılığı gösteren bir komplodur.
shlee, GATK forumlarından yazarların HiSeqX ve NovaSeq enstrümanlarını karşılaştırdığı AGBT 2018'den bir postere işaret etti. Şekil 3, spike-in'lerden gelen çok sayıda allelik fraksiyon (AF) boyunca SNP'ler ve kısa INDEL'ler için duyarlılığı gösterir. AF = 0,4 olan SNP'lerin ~ 25x kapsama alanında yalnızca ~% 50, ~ 50x kapsamda yalnızca ~% 75 hassasiyete sahip olduğunu görünce şaşırdım .
Poster somatik varyasyonu hedeflemektedir, ancak şekil 3'teki veriler standart bir diploid germ hattı varyantı gibi davranmalıdır çünkü genellikle germ hattı varyantlarından çok çeşitli alelik fraksiyonlar görürsünüz. Şekil 3 için sivri uçlar kullandılar. Şekil 3'te HaplotypeCaller kullanıp kullanmadıkları açık değil, ancak Şekil 1 & 2'de yaptıkları gibi Mutect2'yi nasıl kullanabileceklerini bilmiyorum.
Bu bilgilere dayanarak, standart 30x genom genişliğindeki kapsama alanı genellikle birçok heterozigot mutasyonu güvenle çağırmak için yetersiz ve ~ 90-100x ideal görünüyor.
Bir şey mi kaçırıyorum? Standart WGS / WES'deki bu kadar çok heterozigot mutasyonu gerçekten özlüyor muyuz?
Başkalarının yorumlama vb. konulardan haberdar olmasını sağlamak için bu soruyu şimdilik cevapsız bırakacağım. Ek düşüncelerimi takdir ediyorum.