Soru:
İşaretleyici gen ifadesine göre numunelerin sınıflandırılması
GWW
2017-05-24 20:41:28 UTC
view on stackexchange narkive permalink

Yarı denetimli kümeleme kullanarak RNA-seq örneklerini sınıflandırabileceğim birkaç işaretleyici gen setim var. Süreci otomatikleştirmek istiyorum, ancak, belirli bir örnekten işaretleyici gen kümesi için bir tür puan oluşturabilecek ideal algoritmayı bulmakta zorlanıyorum.

Bunun birçok grupta standart bir analiz olduğunu varsayıyorum ancak pratikte hangi yöntem (ler) in iyi sonuçlar verdiğinden emin değilim.

Son zamanlarda Biostars'ta cevap vermeyen benzer bir soru vardı: https://www.biostars.org/p/239228/
Ben şaşırdım. Çok önemli bir sorun gibi görünüyor. Özellikle scRNA-seq popülerlik kazanıyor.
ScRNA-seq verilerinden bahsettiğiniz için, [Buettner * ve diğerleri *] (https://www.nature.com/nbt/journal/v33/n2/full/nbt.3102.html) ilginizi çekebilir: " Tek hücreli RNA dizileme verilerinde hücreden hücreye heterojenliğin hesaplamalı analizi, hücrelerin gizli alt popülasyonlarını ortaya çıkarmaktadır ”. Sorununuza tam olarak hitap etmiyor, ancak özellikle scRNA-seq'te hücre popülasyonlarının tanımlanmasıyla ilgili bazı sorunları gösteriyor ve bunlar büyük ölçüde toplu RNA-sekansıyla düzeltiliyor.
Bir cevap:
#1
+7
Peter Humburg
2017-05-25 04:32:41 UTC
view on stackexchange narkive permalink

Biyoinformatiğin klasik sorunlarından biri olan örnekleri (özellikle kanser alt tiplerini ancak aynı ilkeler bu türdeki diğer problemler için de geçerlidir) sınıflandırmak için gen ifade imzalarını kullanmayı düşünürdüm. İyi sınıflandırma performansı sağlayan gen kümelerini türetme yöntemleri üzerinde oldukça fazla çalışma yapılmıştır. Zaten bir gen imzanız olduğu için bu, sorununuzdan biraz farklıdır, ancak yine de faydalı olabilir.

Bu yöntemler tipik olarak, genom genelindeki ifade verilerinden (az) sayıda gen seçen bir modele uyacaktır. söz konusu hücre tiplerini / koşullarını ayırt eden, yani bir gen imzası türeten. Ortaya çıkan model daha sonra yeni örneklerin sınıflandırılmasına izin verir. Bu amaçla GeneRave kullanarak başarılı oldum (ancak bunun mikrodizi verileri için tasarlandığına dikkat edin, onu RNA-seq verileriyle kullanmadım ve orada ne kadar iyi tuttuğunu bilmiyorum ). Bu konuyla ilgili daha yeni bir makale burada bulunabilir.

Peki bu size nasıl yardımcı olur? Bir seçenek, daha sonra otomatik olarak yeni örneklere uygulanabilecek bir model elde etmek için bu sınıflandırıcılardan birini zaten bildiğiniz genlerin gen ekspresyon verilerine sığdırmak olabilir.

Bu gerçekten yardımcı oldu, çok teşekkürler. Bunları deneyeceğim ya da en azından yöntemlerini nasıl uyarlayabileceğime bakacağım.
@Peter Humberg'in mikrodizi verileri için tasarlanmış GeneRave uyarısına değinerek, sayımlarınızı "limma" kullanarak "mikrodizi benzeri" hale getirmek için "voom" yapabilirsiniz.
CDNASeq ifadesini mikroarray ile karşılaştırmam gerektiğinde, DESeq'in VST dönüşümüne ('VSTPk' diyorum) uygulanan bir transkript uzunluğu normalizasyonu kullanıyorum. Th2 RNASeq makalemizin yöntemler bölümünde daha fazla ayrıntı bulunabilir: http: //dx.doi.org/10.1084/jem.20160470


Bu Soru-Cevap, otomatik olarak İngilizce dilinden çevrilmiştir.Orijinal içerik, dağıtıldığı cc by-sa 3.0 lisansı için teşekkür ettiğimiz stackexchange'ta mevcuttur.
Loading...