Soru:
ChIP-seq tarzı verilerde varyant çağırma: minimal filtrelerle samtools mpileup
719016
2017-05-26 18:23:01 UTC
view on stackexchange narkive permalink

Samtools mpileup'ı (v1.4) çok dalgalı kapsama alanına sahip bir bam dosyasında (ChIP-seq tarzı veriler) çalıştırıyorum. SNV'lerle ilgili ilk geçiş pozisyonlarının bir listesini ve okuma sayılarına göre bildirilen sıklıklarını almak istiyorum, ancak ne yaparsam yapayım, tüm SNV'leri QC'yi geçemediği için filtrelemeye devam ediyorum.

Nedir SNV'lerin ve frekansların başlangıç ​​listesi için sihirli parametre seti?

DÜZENLE: Bu, "diğer" web sitesinde yayınladığım ancak orada yanıt alamadığım bir soru.

Sadece kontrol etmek için başka bir arayanı deneyebilir misiniz? [Varscan] (http://dkoboldt.github.io/varscan/) gibi bir şey?
@nuin Bir deneyebilirim, varscan filtrelemeyi kapatmaya izin veriyor mu?
Denediğiniz bazı komut örnekleri ekleyebilir misiniz?
@719016 Bunu [komutu] deneyin (http://dkoboldt.github.io/varscan/using-varscan.html#v2.‌ 3_pileup2snp) ve _-- min-kapsama _, _-- min-reads2_ gibi seçenekleri değiştirin ve _-- min-ortalama-qual_. Bu aynı zamanda probleminizin samtools ile mi yoksa BAM dosyasıyla mı ilgili olduğunu kontrol etmenize yardımcı olacaktır.
Derinlik yüksek değilse ve ayrıca ChIP-Seq verilerinde önyargılar varsa, bunun yüksek güvenilirlikli SNP'ler olmadığı konusunda biraz endişeliyim. HC SNP'nin tüm noktası, geleneksel ChIP-Seq'te çok fazla olmayan okuma derinliğidir.
Evet, belki arama zirveye yakın zirvelerle sınırlandırılmalı, ardından bu tür SNV'lerin alt kümesindeki numuneyle numuneyi karşılaştırmalıdır.
Iki yanıtlar:
#1
+7
burger
2017-05-27 06:16:16 UTC
view on stackexchange narkive permalink

Bunu geçmişte ChIP-seq verileri için kullandım ve SNV'ler oluşturdu:

  samtools mpileup \ - sıkıştırılmamış --max-deep 10000 --min-MQ 20 --ignore -RG --skip-indels \ - fasta-ref ref.fa file.bam \ | bcftools call --consensus-caller \ > out.vcf  

Bir fark yaratması durumunda bu samtools 1.3 idi.

Bu parametrelerle çalışmasını sağladım. Teşekkürler!
#2
+5
user172818
2017-05-29 19:47:27 UTC
view on stackexchange narkive permalink

Diğer bir yaklaşım da htsbox. Aşağıdakilerle bir aday listesi alabilirsiniz:

  htsbox pileup -Cvcf ref.fa -q20 -Q20 -s5 file.bam > out.vcf  

Burada , -q minimum eşleme kalitesini ayarlar, -Q minimum temel kaliteyi belirler, -v yalnızca varyantları çıkarır -c çıktılar VCF, -C size her iki sarmalın temel sayılarını verir ve son olarak -s5 bir aleli çağırmak için en az 5 yüksek kaliteli baz gerektirir. Verileriniz tipik varyant arayanlar tarafından yapılan varsayımlarda başarısız olduğunda kullanışlıdır.

Neden samtools + bcftools veya varscan değil? Şeffaflık ve hız. Bu komut satırı, kullandığınız parametrelere göre sayılır. Ek işlemler uygulamaz. Ve bu nedenle, samtools mpileup veya varscan'dan bir kat daha hızlıdır. Samtools'un varsayılan olarak BAQ kullandığını ve bu da zaman zaman FP'leri düşürdüğünü belirtmek gerekir. Ancak, daha uzun Illumina okumaları için BAQ çok gerekli değildir ve aynı zamanda hassasiyeti de bozar.

Ben kesinlikle htsbox'ı deneyeceğim, dediğiniz gibi, sadece parametrelere göre sayarak çalışır.


Bu Soru-Cevap, otomatik olarak İngilizce dilinden çevrilmiştir.Orijinal içerik, dağıtıldığı cc by-sa 3.0 lisansı için teşekkür ettiğimiz stackexchange'ta mevcuttur.
Loading...