Haritalama niteliklerini atamak için BWA-MEM algoritmasını açıklayan herhangi bir kaynak (kağıt, blog yayını, Github özeti vb.) var mı? Bir yerlerde SE okumaları için
$ C * (s_1 - s_2) / s_1, $
gibi görünen ve $ s_1 $ ve $ s_2 gibi görünen bir formül gördüğümü belli belirsiz hatırlıyorum $, en iyi iki hizalamanın hizalama puanlarını gösterdi ve C
bir miktar sabitti.
Bu algoritmanın bazı komut dosyası dillerinde yeniden uygulanmasının biyoinfo topluluğu için çok yararlı olabileceğine inanıyorum. Örneğin, bazen çeşitli haritalama yöntemlerini test ediyorum ve bazıları iyi hizalamalar bulma eğiliminde, ancak uygun nitelikleri atamada başarısız oluyor. Bu nedenle, bir SAM dosyasındaki tüm eşleme niteliklerini BWA-MEM algoritmasıyla yeniden atamak istiyorum.
Btw. Bu algoritma zaten BWA dışında uygulanmış olmalı, BWA-MEM makalesine bakın:
GEM, eşleme kalitesini hesaplamaz. Haritalama kalitesi, optimum altı hizalamaları olan BWA benzeri bir algoritmayla tahmin edilir.
Ne yazık ki, BWA-MEM kağıt deposu yalnızca sonuçta ortaya çıkan kodunu içerir. eval
dosyaları.
Güncelleme: Soru, hizalama puanlarını hesaplama algoritması değil . Eşleme nitelikleri ve hizalama puanları iki farklı şeydir:
- Hizalama puanı, iki sekans arasındaki benzerliği ölçer (örneğin, bir okuma ve bir referans sekansı)
- Haritalama kalitesi (MAQ) bir okumanın yanlış bir konuma hizalanma olasılığını ölçer.
Yüksek puanlarla hizalamalar bile çok düşük bir eşleme kalitesine sahip olabilir.