RNA ONT okumalarını genoma hizalamak için STAR-uzun parametreler

aechchiki

2017-08-31 03:25:48 UTC

view on stackexchange narkive permalink

STAR-long kullanarak ONT okumalarını referans genoma hizalamak için önerilen herhangi bir parametre var mı? Şimdilik, burada önerilen parametreleri kullandım, ancak tuhaf bir davranış fark ettim.

R7 ve R9 akış hücrelerinden ayrı ayrı RNA okumaları ( D. melanogaster ) var. Ben sadece 2B okumalarını şifre kategorisinde analiz etmeyi seçtim.

Sırasıyla R7 için 113249 ve R9 için 40318 okuma yaptım. Bu okumaları hizaladım ve (sadece!) R7 verileri için 150 benzersiz şekilde eşlenmiş okuma ve R9 verileri için 8017 benzersiz şekilde eşlenmiş okuma elde ettim. Aynı komutu farklı bir sunucuda yeni derlemeyle tekrar çalıştırmayı denedim, ancak çıktı dosyası bu 150 okumayla tutarlı.

Ancak, aynı şeyi GMAP ile hizalarsam, R7 için 78016 benzersiz şekilde eşlenmiş okumalar ve R9 için 33523 benzersiz şekilde eşlenmiş okumalar elde ederim, bu yüzden şüpheliyim hizalama çalışmasında bir şeyler ters gitti.

İki haritacının çok farklı davrandıklarının farkındayım, STAR-uzun daha kesin ve daha az okumanın daha iyi konumdaki eşleştirmelerini rapor etmeyi tercih ediyor ve GMAP genel olarak daha az hassas, en çok haritayı çıkarmaya çalışıyor okur ama çok iyi olmayan lokuslarda.

Bazılarınızın bu konuda tecrübesi olup olmadığını merak ediyordum ve ONT'den RNA okumaları için bana en iyi parametreleri önerebilir miyiz?

Sanırım cevabım bir yorum olarak daha uygun olur - ama yapamam. SE'nin bu ayarının mantıklı olup olmadığından emin değilim, ama her neyse. Bu, gördüğünüz davranış için mutlaka bir çözüm değildir, ancak cDNA-seq hizalaması için https://github.com/lh3/minimap2'yi denemenizi öneririm.

Elimde, STAR-long gürültülü okumalarla iyi sonuç vermiyor. Çoğunlukla iso-seq için çalıştı çünkü iso-seq okumalarının hata oranı çok daha düşük.

# doğru okumalar ~ / install / canu / canu-1.6 / Linux-amd64 / bin / canu overlapper = minimap \ genomeSize = 100M minReadLength = 100 minOverlapLength = 30 -doğru \ -p 4T1_BC06 -d 4T1_BC06 \ -nanopore-raw workspace / pass / barcode06 / fastq_runid _ *. Fastq # align okur ~ / install / minimap2 / minimap2 -p 10 \ -a ~ / db / fasta / mmus / ucsc / mmus_ucsc_all_cdna.idx \ - x ekleme < (pv all / 4T1_BC06 / 4T1_BC06.correctedReads.fasta.gz) | \ samtools sort > 4T1_BC06_all_vs_mmusAll.bam