Soru:
Affymetrix dizileri arasındaki prob seti eşlemelerine prob seti
Prradep
2017-05-18 17:52:23 UTC
view on stackexchange narkive permalink

Farklı türde Affymetrix dizileri arasındaki eşleşmeleri tanımlamakla ilgileniyorum. Gen ve prob seti arasındaki eşlemelerin Ensembl'in Biomart veritabanı kullanılarak çıkarılabileceğinin farkındayım.

  Ensembe gen kimliği ENSG00000181019, 1. AFFY HG-U133_Plus_2'nin 210519_s_at2'siyle eşleşir. AFFY HuGene-1_0-st-v1'in 8002303'ü  

İki dizi arasında prob seti kimliklerinin eşlemelerini çıkarmanın herhangi bir yolu var mı (örneğin: HG-U133_Plus_2, HuGene-1_0-st-v1)?

  örneğin: 210519_s_at ve 8002303  
Sorunuz, diziler arasında örtüşen yoklama setlerini nasıl bulacağınız mı? Veya genel olarak prob setleri nasıl belirlenir? Açık değil.
Bir örnek ekledim. Bu şimdi mantıklı geliyor mu?
Yani temelde Ensembl's Biomart'tan iki gen kimliği eşlemesi alabilirsiniz. Doğru? Ensembl gen kimliğine göre bu iki tabloya katılmanızı engelleyen nedir? R'de "merge" işlevini veya SQL'de "JOIN" ifadesini kullanabilirsiniz.
@IakovDavydov veya Unix "birleştirme" de işe yarar
Sorun şudur: Tüm eşlemeler tam olarak bire bir değildir. HG-U133_Plus_2 veya HuGene-1_0-st-v1 eşlemesinin prob setleri ile bir topluluk gen kimliği.
@Prradep, çözmeye çalıştığınız sorunun altında yatan sorunun ne olduğunu açıklarsanız, daha iyi tavsiyeler sunabiliriz
Bire bir eşlemeler görmeyi beklememelisiniz, aşağıdaki cevabıma bakın.
üç yanıtlar:
#1
+9
neilfws
2017-05-19 06:18:14 UTC
view on stackexchange narkive permalink

Sorunuz şuysa: Farklı platformlardan gelen prob seti kimlikleri, prob setlerini genlerle eşleştirmeye benzer bir şekilde birbirleriyle eşleştirilebilir mi, o zaman cevap şudur: Evet. BioMart, kimliği olan hemen hemen her şeyi kimliği olan başka herhangi bir şeye eşlemenize izin verir.

BioMart'ı web arayüzü aracılığıyla veya programatik olarak kullanabilirsiniz. HG U133 Plus 2'yi HuGene 1.0 ile eşleştirmek için web arayüzünü kullanma hakkında kısa bir kılavuz:

  1. Başlangıç ​​sayfasına gidin
  2. H'yi seçin Veritabanınız için sapiens Ensembl genleri; Veri kümeniz için insan genleri (GRCh38.p10)
  3. Soldaki sütunda Filtreler'i tıklayın
  4. "BÖLGE" öğesini genişletin, GENE'ye gidin ve "Mikro dizi problarını / prob kümelerini girin kimliğini girin liste [Maks. 500 önerilir] "
  5. AFFY HG U133 PLUS 2 prob kimliğini seçin ve her satıra bir liste kopyalayıp yapıştırın veya yükleyin
  6. Soldaki Nitelikler'i tıklayın -hand sütunu
  7. Kaydırın, görmek istemediğiniz şeyin işaretini kaldırın ve ne yaptığınızı seçin, örneğin Gene Stable ID, AFFY HuGene 1 0 st v1 prob ve AFFY HG U133 Plus 2 prob
  8. Son olarak, sol taraftaki sütunun üstündeki menüde "Sonuçlar" ı tıklayın

Ve buna benzer bir sonuç görmelisiniz (siz "Sonuçlar" düğmesini tıklamanız gerekecek).

İki nedenden dolayı bire bir eşleştirme olmasını beklememelisiniz:

  • Genler her bir transkripte birden fazla transkript ve prob seti eşlenir
  • Bazı transkriptlerin birden fazla prob seti vardır: bu durumda, HuGene ID'ler 8002301 ve 8002303, transkriptlere eşlenir this gene

Son olarak: İşte R / BioMart kullanan programlı bir örnek:

  library (biomaRt) mart.hs <- useMart ("ensembl", "hsapiens_gene_ensembl") sonuçları <- getBM (öznitelikler = c ("ensembl_gene_id", "affy_hugene_1_0_st_v1", "affy_hg_u133_plus_2"), filtreler = "affy_hlus_u133_plus19" .hs) sonuçları ensembl_gene_id affy_hugene_1_0_st_v1 affy_hg_u133_plus_2
1 ENSG00000181019 8002301 210519_s_at2 ENSG00000181019 8002303 210519_s_at  
#2
+7
rmflight
2017-05-19 06:53:56 UTC
view on stackexchange narkive permalink

BiomaRt yerine, Bioconductor'ın kendisinde yerleşik olarak bulunan haritalama veritabanlarını kullanmak ve sondadan gene ve sonra da genden sondaya ikinci eşlemeyi yapmak da mümkündür. Bir başkasında sağlanan aynı yoklama kimliğini kullanarak hgu133 ve hgu95 arasında dönüştürmek için bazı R kodları:

  library (hgu133plus2.db) library (hgu95av2.db) query_probe <- "210519_s_at" hgu133_ensembl <- select (hgu133plus2.db, keys = query_probe, column = "ENSEMBL") ensembl_hgu95 <- select (hgu95av2.db, keys = hgu133_ensembl $ ENSEMBL, keytype = "ENSEMBLguens", sütunlar = "PROBh_join_join (ensemb3 :: iç") dplemb3 , by = "ENSEMBL", sonek = c (". 133", ".95"))  
#3
+2
rmflight
2017-05-19 06:57:32 UTC
view on stackexchange narkive permalink

Diğer yanıtlar, problar arasında neden bire bir eşleme olmayabileceğini açıklıyor.

AbsID veritabanı, prob dizilerini bir genom yapısına eşlemeye dayalı dönüştürme yapar ve daha sonra, örtüşen genom hizalama koordinatlarına göre eşlemeleri belirler. İki probun aynı transkripti ölçtüğünden gerçekten büyük olasılıkla emin olmak istiyorsanız bu gerçekten yararlıdır.

Bununla birlikte, her iki probun da genoma hizalanmasına bağlıdır.

Sorumluluk reddi: AbsID eşleme aracını sağlayan grupta çalıştım.



Bu Soru-Cevap, otomatik olarak İngilizce dilinden çevrilmiştir.Orijinal içerik, dağıtıldığı cc by-sa 3.0 lisansı için teşekkür ettiğimiz stackexchange'ta mevcuttur.
Loading...