Soru:
Uzun okumalara dayalı genom montajının cilalanması sırasında heterozigotluk ile nasıl başa çıkılır?
Kamil S Jaron
2017-05-21 16:49:59 UTC
view on stackexchange narkive permalink

Tüm uzun okunan dizileme platformları, baz başına daha yüksek hata oranlarına neden olan tek molekül dizilimine dayanmaktadır. Bu nedenle, genom birleştirme işlem hatlarına bir cilalama adımı eklendi - ham okumaları bir araya getirmeye geri döndürmek ve montaj ayrıntılarını düzeltmek.

Oldukça heterozigot model olmayan türlerin tek tek genomunun yeterli PacBio RSII veri kümesine sahibim. . Montaj iyi gitti, ancak montajı sadak kullanarak cilalamaya çalıştığımda, birkaç yinelemede birleşemedi ve bahse girerim haplotiplerin çok büyük farklılıkları yüzünden.

Bu tür özelliklere sahip bir genomu parlatmanın başka bir yolu var mı? Örneğin, uzun okumaları haplotipe göre ayırmanın bir yolu var mı, böylece sadece bir haplotip kullanarak parlatma yapabilir miyim?

Iki yanıtlar:
#1
+4
roblanf
2017-05-22 08:36:12 UTC
view on stackexchange narkive permalink

Birkaç olasılık:

Falcon

Şahin ve şahin fermuarını açmayı deneyin. Bunlar tam olarak sizin sorununuz ve verileriniz için tasarlanmıştır: https://github.com/PacificBiosciences/FALCON

Falcon Değil

Haplotipleri bir araya getirdiğinizi düşünüyorsanız (ki bu yeterli kapsama verilmesini beklemek mantıklı görünüyor), iki haplotipi sadece kontiglerinizin tüm ikili hizalamalarını yaparak görebilmelisiniz. Haplotipler, diğer çiftlerden ÇOK daha benzer (çok sayıda haplotip farklılığı olsa bile) bitişik çiftler olarak görünmelidir. Bu tür çiftlerin tümüne sahip olduğunuzda, cilalamak için her çiftten birini seçmeniz yeterlidir.

Aslında her iki haplotip sekansım var. Onları [haplomerger2] (http://www.ncbi.nlm.nih.gov/pubmed/22555592) adlı aracı kullanarak aldım. Ancak bu araç, kimerik bir haploid düzeneği üretir, bu nedenle bunlar gerçekten doğru şekilde aşamalı haplotipler değildir. Falcon-unzip gerçekten işe yarayabilecek bir yazılımdır. O zamanlar denemek için çok gençti ama şimdi bir şans daha deneyebilirdim.
#2
+3
gringer
2017-05-22 13:12:38 UTC
view on stackexchange narkive permalink

Ayrıca Canu 'ya da gidebilirsiniz. Özellikle karmaşık popülasyon sıralaması için olmasa da uzun okunan montaj (hem PacBio hem de Nanopore) için tasarlanmıştır. Bir genomu kendi benzersiz bileşenlerine ayırmaya çalışır ve okumalardan iyi desteklenen bileşenlerden yollar oluşturur.

Parlatma ile ilgili olarak, cilalamanın işe yaramadığı görülüyor. yakınlaşır ve sadece iki olasılık arasında gidip gelen birçok değişken olacaktır. Ben ve bu yıl London Calling'den en az bir kişi için, üçüncü yinelemeden sonra parlatma doğruluğunda temelde hiçbir kazanç elde edilmedi. Kendi hata düzeltme algoritmamı kullandım, ancak Pilon ile daha "standart" cilalama kullandılar. Nanogözenekli WGS konsorsiyumu, değeri ne olursa olsun, Canu montajlarını cilalamak için Racon'u kullandı.

Aslında genomu Canu kullanarak bir araya getirdim, genomun ~ 2x haploid boyutuna sahip oldum, bunu [HaploMerger2] (http://www.ncbi.nlm.nih.gov/pubmed/22555592) kullanarak haplotiplere çöktürdüm. küresel olarak montajın iyi olduğunu bilin Sadece cilalanması gerekiyor.
Oh evet. Üzgünüm, ilk cevaba baktım ve bunun montajla ilgili olduğunu varsaydım. Şimdi sorunun montajdan çok * cilalamayı * tartışmak olduğunu anlıyorum.
@gringer Ayrıca Racon (Quiver haplotipleri çökertebilir) kullanarak oldukça heterozigot bir genom topluluğunu (canu tarafından oluşturulmuş) cilalamaya çalışıyordum, ancak tatmin edici bir çıktı elde edemedim (temelde, hiçbir istatistik değişmedi). herhangi bir tavsiye?
Şu anda genel tavsiyem, düzeltmek için metilasyon modunda nanopolish kullanmaktır, ardından Illumina ile Pilon * sadece * homopolimer parçalarını düzeltmek için okur (yani SNP düzeltmesi yok ve uzun menzilli yapı iskelesi yok). Buna dayanarak: https: //github.com/rrwick/Basecalling-comparison#methylation


Bu Soru-Cevap, otomatik olarak İngilizce dilinden çevrilmiştir.Orijinal içerik, dağıtıldığı cc by-sa 3.0 lisansı için teşekkür ettiğimiz stackexchange'ta mevcuttur.
Loading...