Soru:
RNA ONT okumalarını genoma hizalamak için STAR-uzun parametreler
aechchiki
2017-08-31 03:25:48 UTC
view on stackexchange narkive permalink

STAR-long kullanarak ONT okumalarını referans genoma hizalamak için önerilen herhangi bir parametre var mı? Şimdilik, burada önerilen parametreleri kullandım, ancak tuhaf bir davranış fark ettim.

R7 ve R9 akış hücrelerinden ayrı ayrı RNA okumaları ( D. melanogaster ) var. Ben sadece 2B okumalarını şifre kategorisinde analiz etmeyi seçtim.

Sırasıyla R7 için 113249 ve R9 için 40318 okuma yaptım. Bu okumaları hizaladım ve (sadece!) R7 verileri için 150 benzersiz şekilde eşlenmiş okuma ve R9 verileri için 8017 benzersiz şekilde eşlenmiş okuma elde ettim. Aynı komutu farklı bir sunucuda yeni derlemeyle tekrar çalıştırmayı denedim, ancak çıktı dosyası bu 150 okumayla tutarlı.

Ancak, aynı şeyi GMAP ile hizalarsam, R7 için 78016 benzersiz şekilde eşlenmiş okumalar ve R9 için 33523 benzersiz şekilde eşlenmiş okumalar elde ederim, bu yüzden şüpheliyim hizalama çalışmasında bir şeyler ters gitti.

İki haritacının çok farklı davrandıklarının farkındayım, STAR-uzun daha kesin ve daha az okumanın daha iyi konumdaki eşleştirmelerini rapor etmeyi tercih ediyor ve GMAP genel olarak daha az hassas, en çok haritayı çıkarmaya çalışıyor okur ama çok iyi olmayan lokuslarda.

Bazılarınızın bu konuda tecrübesi olup olmadığını merak ediyordum ve ONT'den RNA okumaları için bana en iyi parametreleri önerebilir miyiz?

Sanırım cevabım bir yorum olarak daha uygun olur - ama yapamam. SE'nin bu ayarının mantıklı olup olmadığından emin değilim, ama her neyse. Bu, gördüğünüz davranış için mutlaka bir çözüm değildir, ancak cDNA-seq hizalaması için https://github.com/lh3/minimap2'yi denemenizi öneririm.
Elimde, STAR-long gürültülü okumalarla iyi sonuç vermiyor. Çoğunlukla iso-seq için çalıştı çünkü iso-seq okumalarının hata oranı çok daha düşük.
Bir cevap:
gringer
2018-01-17 11:00:30 UTC
view on stackexchange narkive permalink

minimap2 kullanarak, özellikle hata düzeltme için Canu'nun bir ön işlemiyle birleştirildiğinde (okuma-okuma eşleme için minimap2 kullanarak) harika sonuçlar elde ettim ):

  # doğru okumalar ~ / install / canu / canu-1.6 / Linux-amd64 / bin / canu overlapper = minimap \ genomeSize = 100M minReadLength = 100 minOverlapLength = 30 -doğru \ -p 4T1_BC06 -d 4T1_BC06 \ -nanopore-raw workspace / pass / barcode06 / fastq_runid _ *. Fastq # align okur ~ / install / minimap2 / minimap2 -p 10 \ -a ~ / db / fasta / mmus / ucsc / mmus_ucsc_all_cdna.idx \ - x ekleme < (pv all / 4T1_BC06 / 4T1_BC06.correctedReads.fasta.gz) | \ samtools sort > 4T1_BC06_all_vs_mmusAll.bam  

Güncelleme: En yeni nano-gözenekli basecaller, en son minimap2 ile birleştiğinde artık haritalama ve okumaların ön düzeltmesi ile düzgün bir iş çıkarıyor gibi görünüyor daha uzun gerekli görünüyor. Daha yakın zamanlarda, transkriptomu haritalamak için LAST'ı ve genomu haritalamak için minimap2'yi kullanıyorum. Minimap2, homopolimer ile sıkıştırılmış bir genom indeksi kullanma yeteneğine sahiptir; bu, nanogözenek okumaları için en yaygın tutarlı hatanın (yani homopolimer uzunluğunun yanlış değerlendirilmesi), eşleme oranını etkilemeyeceği anlamına gelir.

Evet, minimap2'yi de kullandım, teşekkürler. Bu soru sorulduğunda, sadece STAR parametreleriyle ilgili saçma sapan bir şey yapıp yapmadığımı veya davranışının basitçe algoritmasından mı kaynaklandığını kontrol etmeye çalışıyordum. Okumaların düzeltilmesi için, Canu kullanıyorsanız, okumalarınızın indel kompozisyonunu değiştirmekten korkmuyor musunuz?
Hayır ... neden bu bir sorun olsun? Canu, çakışan okumaların fikir birliğine dayalı olarak hataları düzeltiyor; Bu düzeltmenin neden / nasıl çözdüğünden daha fazla soruna yol açacağını anlamıyorum.


Bu Soru-Cevap, otomatik olarak İngilizce dilinden çevrilmiştir.Orijinal içerik, dağıtıldığı cc by-sa 3.0 lisansı için teşekkür ettiğimiz stackexchange'ta mevcuttur.
Loading...