Soru:
BWA-MEM algoritması eşleme niteliklerini nasıl atar?
Karel Brinda
2017-05-31 02:36:46 UTC
view on stackexchange narkive permalink

Haritalama niteliklerini atamak için BWA-MEM algoritmasını açıklayan herhangi bir kaynak (kağıt, blog yayını, Github özeti vb.) var mı? Bir yerlerde SE okumaları için

$ C * (s_1 - s_2) / s_1, $

gibi görünen ve $ s_1 $ ve $ s_2 gibi görünen bir formül gördüğümü belli belirsiz hatırlıyorum $, en iyi iki hizalamanın hizalama puanlarını gösterdi ve C bir miktar sabitti.

Bu algoritmanın bazı komut dosyası dillerinde yeniden uygulanmasının biyoinfo topluluğu için çok yararlı olabileceğine inanıyorum. Örneğin, bazen çeşitli haritalama yöntemlerini test ediyorum ve bazıları iyi hizalamalar bulma eğiliminde, ancak uygun nitelikleri atamada başarısız oluyor. Bu nedenle, bir SAM dosyasındaki tüm eşleme niteliklerini BWA-MEM algoritmasıyla yeniden atamak istiyorum.

Btw. Bu algoritma zaten BWA dışında uygulanmış olmalı, BWA-MEM makalesine bakın:

GEM, eşleme kalitesini hesaplamaz. Haritalama kalitesi, optimum altı hizalamaları olan BWA benzeri bir algoritmayla tahmin edilir.

Ne yazık ki, BWA-MEM kağıt deposu yalnızca sonuçta ortaya çıkan kodunu içerir. eval dosyaları.

Güncelleme: Soru, hizalama puanlarını hesaplama algoritması değil . Eşleme nitelikleri ve hizalama puanları iki farklı şeydir:

  • Hizalama puanı, iki sekans arasındaki benzerliği ölçer (örneğin, bir okuma ve bir referans sekansı)
  • Haritalama kalitesi (MAQ) bir okumanın yanlış bir konuma hizalanma olasılığını ölçer.

Yüksek puanlarla hizalamalar bile çok düşük bir eşleme kalitesine sahip olabilir.

Maalesef BWA-MEM'in cevabını bilmiyorum (BWA'dan farklı olduğu için!) Ama hemen hemen tüm diğer araçlar burada açıklanmaktadır: https://sequencing.qcfail.com/articles/mapq-values-are-really- kullanışlı-ama-onların-uygulamaları karmaşa /
Belki bu sayfa http://genome.sph.umich.edu/wiki/Mapping_Quality_Scores yardımcı olabilir. Bir okumanın hizalayabileceği en iyi ve alternatif konumları (hatta yalnızca en iyiyi ve en iyiyi mi?) Öğrendiğinizde, uygulanması çok zor değil sanırım.
Bir cevap:
Kamil S Jaron
2017-05-31 03:15:54 UTC
view on stackexchange narkive permalink

Evet, bwa-mem bir ön baskı olarak yayınlandı

BWA-MEM’in çekirdek uzantısı, iki yönden standart çekirdek uzantısından farklıdır. İlk olarak, belirli bir uzatma adımında, y sorgu konumunda elde edilen en iyi uzantı puanına sahip x referans konumuna geldiğimizi varsayalım.

...

İkinci olarak, bir çekirdek, BWA'yı genişletirken -MEM, sorgu dizisinin sonuna ulaşan en iyi uzantı puanını izlemeye çalışır

Ayrıca, bwa-mem 'ün kaynak kodunda doğrudan puanlama algoritmasının bir açıklaması vardır (22 - 44. satırlar), ancak belki de tek çözüm, kaynak kodu üzerinden gitmektir.

Cevabınız için teşekkür ederim. Ancak soru daha çok haritalama niteliklerinin atanması ile ilgilidir. Hizalama puanı çok yüksek olan okumalar bile sıfıra eşit bir eşleme kalitesine sahip olabilir.
Kaynak kodunu kontrol ettiniz mi? satır 22 - 44.
@KamilSJaron Vay be, bunu anlamak çok zor. [Gerçek kod] (https://github.com/lh3/bwa/blob/master/bwamem.c#L945-L969) maalesef daha iyi değil. :-( Her halükarda cevabınızı bunu daha belirgin bir şekilde içerecek şekilde güncelleyebilir misiniz?
@ KamilSJaron yaptım ve tek uçlu okumaların daha kolay olması durumunda bile benim için hala tam olarak net değil.
Aslında skoru açıklamaya hiç niyetim yoktu (çünkü gerçekten bilmiyorum ve soru kaynaklar hakkında açıkça soruldu). Sadece ön baskıyı biliyordum ve ayrıca puanlamayı açıklıyor gibi görünen 22 satırlık matematiği bulduğum kaynak koduna bakma fikrini aldım.


Bu Soru-Cevap, otomatik olarak İngilizce dilinden çevrilmiştir.Orijinal içerik, dağıtıldığı cc by-sa 3.0 lisansı için teşekkür ettiğimiz stackexchange'ta mevcuttur.
Loading...