Soru:
MACS2'nin dar tepe ve geniş tepe algoritmaları nasıl farklıdır?
Ian Sudbery
2017-05-20 05:21:09 UTC
view on stackexchange narkive permalink

Zirve arama aracı MACS2, dar tepe modunda (ChIPseq transkripsiyon faktörü gibi odaklanmış sinyaller için) veya geniş tepe modunda (belirli histon modifikasyonları gibi daha fazla etkisizleştirme sinyalleri için) zirveleri çağırabilir.

Dar tepe arama algoritması, MACS yayınında iyi açıklanmıştır. Ancak, yoğun zirve modunda yoğun aramanın ne kadar farklı olduğuna dair fazla belge bulamıyorum. Kılavuz yalnızca aşağıdakileri içerir:

--geniş

Bu bayrak açıkken, MACS geniş bölgeleri BED12'de (gen modeli benzeri bir format) birleştirmeye çalışacaktır. ) yakındaki oldukça zengin bölgeleri gevşek kesimli geniş bir bölgeye koyarak. Geniş bölge, başka bir kesim tarafından --geniş kesim yoluyla kontrol edilir. Geniş bölge uzunluğunun maksimum uzunluğu MACS'den d'nin 4 katıdır

Ancak bu, bunun nasıl yapıldığını tam olarak açıklamaz.

Peki, MACS'nin geniş zirveleri çağırmak için kullandığı algoritma nedir?

[Algoritmayı] buldum (https://github.com/taoliu/MACS/blob/24a1eab9fe7e885c27a37dbac2efb99d6da8dc74/MACS2/IO/BedGraph.pyx#L594), ama dürüst olmak gerekirse 629. satırdaki deneme / hariç yapımını gerçekten alamadım. ..
Bir cevap:
#1
+10
Daniel Kim
2017-05-21 02:38:55 UTC
view on stackexchange narkive permalink

Temel işlev call_broadpeaks 'dir:

İşleve ekli açıklama şunu söylüyor:

Bu işlev 1. seviye için puanların belirli bir sınırdan sürekli olarak yüksek olduğu zenginleştirilmiş bölgeler bulmaya çalışın ve bunları 2. seviye sınırın üzerindeki boşluğu kullanarak maksimum lvl2_max_gap uzunluğuyla ilişkilendirin.

skorlama_function_s: işlevlerin sembolleri puanı hesapla. pscore için 'p', qscore için 'q', kat değişimi için 'f', çıkarma için 's'. örneğin: ['p', 'q']

lvl1_cutoff_s: puanlama işlevlerine karşılık gelen, yüksek düzeyde zenginleştirilmiş bölgelerdeki sınırların listesi.

lvl2_cutoff_s: daha az zenginleştirilmiş bölgelerdeki sınırların listesi , puanlama işlevlerine karşılık gelir.

min_length: minimum tepe uzunluğu, varsayılan 200.

lvl1_max_gap: yakındaki zenginleştirilmiş zirveleri birleştirmek için maksimum boşluk, varsayılan 50.

lvl2_max_gap : maksimum bağlantı bölgeleri uzunluğu, varsayılan 400.

BroadPeakIO'da hem yüksek düzeyde zenginleştirilmiş bölgeler hem de aralıklı geniş bölgeler için genel PeakIO nesnesini döndürün.

Bazı temel açıklamalar vermek gerekirse, algoritma (kısaca) aşağıdaki gibi görünmektedir:

  1. İki ayrı tepe seviyesi olarak adlandırılır, seviye 1 (daha yüksek bir pval, yani daha anlamlı) ve seviye 2 (daha düşük bir pval ). Seviye 1, -p tarafından kontrol edilir ve seviye 2, --broad-cutoff tarafından kontrol edilir. Her tepe küme çağrıldığında, hemen her küme için maksimum boşluk parametresi ile bağlanırlar.

  2. Daha sonra, tüm 1. düzey tepe noktalarının 2. düzey tepe noktalarının içinde olması gerektiği varsayılır (bu, MACS2'nin açık bir varsayımı), algoritma, geniş bir zirve oluşturmak için seviye 2 zirveleri içindeki seviye 1 zirvelerini gruplandırır.

...

Bu, birkaç çıkarım:

  1. Geniş yoğun aramalar gerçekten yalnızca 2. seviye zirvelerden gelir (+ bağlantı). Seviye 1 zirve çağrıları, alt zirveleri ayırt etmenize olanak tanır (böylece aralıklı zirvelere sahip olabilirsiniz).

  2. Bağlantı dışında, her ikisini de aynı pval eşiğiyle aradıysanız (örneğin, --broad-cutoff 0.1 geniş tepe modunda ve dar tepe modu için -p 0.1 )

Cevabınızda, "daha yüksek pval" nin aslında "daha düşük" veya "daha anlamlı" p değeri olduğunu ve "düşük pval" nin aslında "daha yüksek" veya "daha az anlamlı" p değeri olduğunu açıklayabilir misiniz? İfadelerden birinin kafasının karıştığını görüyorum.
Bir açıklama eklendi - yakaladığınız için teşekkürler!


Bu Soru-Cevap, otomatik olarak İngilizce dilinden çevrilmiştir.Orijinal içerik, dağıtıldığı cc by-sa 3.0 lisansı için teşekkür ettiğimiz stackexchange'ta mevcuttur.
Loading...