גילוי RNA לא מקודד בכלי ביואינפורמטיקה

מתוך המכלול, האנציקלופדיה היהודית
קפיצה לניווט קפיצה לחיפוש

סוגי RNA לא מקודד (אנ'), (מעתה יקרא גם ncRNA) התגלו הן בשיטות ניסוי רטובות והן בשיטות ביואינפורמטיות. ניתן לחלק שיטות ביואינפורמטיות לשלוש קטגוריות עיקריות. הקטגוריה הראשונה כוללת טכניקות לחיפוש הומולוגי (אנ'), על אף שבהגדרתן, טכניקות אלו אינן מסוגלות למצוא מחלקות חדשות של ncRNAs. הקטגוריה השנייה כוללת אלגוריתמים שנועדו לגלות סוגים ספציפיים של ncRNA בעלי תכונות דומות. הקטגוריה השלישית כוללת מספר שיטות גילוי המבוססות על תכונות כלליות מאוד של RNA, ובכך הן מסוגלות לגלות סוגים חדשים לגמרי של ncRNAs.

גילוי על ידי חיפוש הומולוגי

חיפוש הומולוגי מתייחס לתהליך של חיפוש במסד נתונים של רצפים אחר RNAs הדומים לרצפי RNA ידועים כבר. ניתן להשתמש בכל אלגוריתם שמיועד לחיפוש הומולוגי של רצפי חומצות גרעין, למשל, BLAST[1]. עם זאת, אלגוריתמים כאלה בדרך כלל אינם רגישים או מדויקים כמו אלגוריתמים שתוכננו במיוחד עבור RNA.

למבנה השניוני של RNA יש חשיבות רבה, וניתן לבנות מודל למבנה השניוני שלו, ובכך להשיג דיוק נוסף בחיפושים. לדוגמה, ניתן לראות במודלים של שונות משותפת (Covariance)[2] הרחבה למודל מרקוב נסתר בפרופיל המשקף גם מבנה שניוני שמור. מודלים של שונות משותפת (Covariance) ממומשים בתוכנה Infernal[3].

גילוי סוגים ספציפיים של ncRNAs

לסוגי RNA מסוימים יש מאפיינים משותפים שאלגוריתמים יכולים לנצל. לדוגמה, tRNAscan-SE[4] מתמחה במציאת tRNAs. לב ליבה של תוכנית זו הוא חיפוש הומולוגי של tRNA המבוסס על covariance models, אך תוכניות חיפוש ספציפיות אחרות ל-tRNA משמשות להאצת חיפושים.

המאפיינים של snoRNAs אפשרו פיתוח תוכניות לזיהוי דוגמאות חדשות של snoRNAs, כולל כאלו העשויות להיות קשורות רק בקרבה רחוקה לדוגמאות המוכרות מהעבר. תוכנות מחשב המממשות גישות כאלה כוללות snoscan[5] ו- snoReport[6].

באופן דומה, פותחו מספר אלגוריתמים לזיהוי microRNAs. דוגמאות לכך כוללות miRNAFold[7] וכן miRNAminer[8].

גילוי לפי מאפיינים כלליים

מאפיינים מסוימים משותפים למספר מחלקות של ncRNA שאינן קשורות לא לזו, וכך ניתן להשתמש במאפיינים אלה, כדי לגלות מחלקות חדשות. המאפיין המרכזי מבין מאפיינים אלו הוא שימור מבנה שניוני של RNA. כדי למדוד שימור של מבנה שניוני, יש למצוא רצפים הומולוגיים שעשויים ליצור מבנה דומה. שיטות לעשות זאת כללו שימוש ב-BLAST בין שני רצפים[9] או מספר רצפים[10], ניצול סינטֶניה (synteny) - הימצאות גנים על גבי אותו כרומוזום - באמצעות גנים אורתולוגים[11][12] או שימוש ב-locality sensitive hashing בשילוב עם תכונות רצף ותכונות מבניות[13].

מוטציות המשנות את רצף הנוקלאוטידים, אך משמרות את המבנה השניוני, נקראות covariation, ויכולות לספק עדות לשימור. ניתן להשתמש בסטטיסטיקות אחרות ובמודלים הסתברותיים למדידת שימור כזה. שיטת גילוי ה-ncRNA הראשונה שהשתמשה בשימור מבני הייתה QRNA, אשר השוותה את ההסתברויות ל-alignment בין שני רצפים על סמך מודל RNA או על סמך מודל בו נשמר רק הרצף הראשוני. עבודה בגישה זו אפשרה עבודה שכללה יותר משני רצפים וכן כללה מודלים פילוגנטיים, למשל עם EvoFold[14]. גישה שננקטה ב-RNAz[15] כללה חישובים סטטיסטיים על alignment של מספר רב של רצפים. חלק מהחישובים הסטטיסטיים הללו מתייחסים לשימור מבני, בעוד שאחרים מודדים מאפיינים כלליים של ה-alignment שעלולים להשפיע על הטווח המנובא של הסטטיסטיקה המבנית. נתונים סטטיסטיים אלו שולבו באמצעות מכונת תמך וקטורי (אנ').

מאפיינים אחרים כוללים הופעת קדם (promoter) לשעתוק ה-RNA.

לרוב, Rho-independent transcription terminator נמצא לאחר ncRNAs.

על בסיס שילוב של גישות אלו, התקיימו מחקרים לחיזוי מבנים של RNA שטרם התגלו. למשל התבצעו מחקרים כדי לחזות באופן מדויק חיזוי מבני ותפקודי ל-RNA[16][17].

הערות שוליים

  1. ^ "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs". Nucleic Acids Res. 25 (17): 3389–3402. בספטמבר 1997. doi:10.1093/nar/25.17.3389. PMC 146917. PMID 9254694. {{cite journal}}: (עזרה)
  2. ^ "RNA sequence analysis using covariance models". Nucleic Acids Res. 22 (11): 2079–2088. ביוני 1994. doi:10.1093/nar/22.11.2079. PMC 308124. PMID 8029015. {{cite journal}}: (עזרה)
  3. ^ "Infernal 1.1: 100-fold faster RNA homology searches". Bioinformatics. 29 (22): 2933–2935. בנובמבר 2013. doi:10.1093/bioinformatics/btt509. PMC 3810854. PMID 24008419. {{cite journal}}: (עזרה)
  4. ^ "tRNAscan-SE: a program for improved detection of transfer RNA genes in genomic sequence". Nucleic Acids Res. 25 (5): 955–964. במרץ 1997. doi:10.1093/nar/25.5.955. PMC 146525. PMID 9023104. {{cite journal}}: (עזרה)
  5. ^ "A computational screen for methylation guide snoRNAs in yeast". Science. 283 (5405): 1168–1171. בפברואר 1999. Bibcode:1999Sci...283.1168L. doi:10.1126/science.283.5405.1168. PMID 10024243. {{cite journal}}: (עזרה)
  6. ^ "SnoReport: computational identification of snoRNAs with unknown targets". Bioinformatics. 24 (2): 158–164. בינואר 2008. doi:10.1093/bioinformatics/btm464. PMID 17895272free {{cite journal}}: (עזרה)תחזוקה - ציטוט: postscript (link)
  7. ^ "A fast ab-initio method for predicting miRNA precursors in genomes". Nucleic Acids Res. 40 (11): 955–964. 2012. doi:10.1093/nar/gks146. PMC 3367186. PMID 22362754.
  8. ^ "miRNAminer: a tool for homologous microRNA gene search". BMC Bioinformatics. 9 (1): 39. 2008. doi:10.1186/1471-2105-9-39. PMC 2258288. PMID 18215311.
  9. ^ "Noncoding RNA gene detection using comparative sequence analysis". BMC Bioinformatics. 2: 8. 2001. doi:10.1186/1471-2105-2-8. PMC 64605. PMID 11801179.
  10. ^ "Finding non-coding RNAs through genome-scale clustering". J Bioinform Comput Biol. 7 (2): 373–388. באפריל 2009. doi:10.1142/s0219720009004126. PMC 3417115. PMID 19340921. {{cite journal}}: (עזרה)
  11. ^ "Identification of 22 candidate structured RNAs in bacteria using the CMfinder comparative genomics pipeline". Nucleic Acids Res. 35 (14): 4809–4819. 2007. doi:10.1093/nar/gkm487. PMC 1950547. PMID 17621584.
  12. ^ "A plant 5S ribosomal RNA mimic regulates alternative splicing of transcription factor IIIA pre-mRNAs". Nat. Struct. Mol. Biol. 16 (5): 541–549. במאי 2009. doi:10.1038/nsmb.1588. PMC 2680232. PMID 19377483. {{cite journal}}: (עזרה)
  13. ^ "GraphClust: alignment-free structural clustering of local RNA secondary structures". Bioinformatics. 28 (12): i224–32. ביוני 2012. doi:10.1093/bioinformatics/bts224. PMC 3371856. PMID 22689765. {{cite journal}}: (עזרה)
  14. ^ "Identification and classification of conserved RNA secondary structures in the human genome". PLOS Comput. Biol. 2 (4): e33. באפריל 2006. Bibcode:2006PLSCB...2...33P. doi:10.1371/journal.pcbi.0020033. PMC 1440920. PMID 16628248. {{cite journal}}: (עזרה)
  15. ^ "Fast and reliable prediction of noncoding RNAs". Proc. Natl. Acad. Sci. U.S.A. 102 (7): 2454–2459. בפברואר 2005. doi:10.1073/pnas.0409169102. PMC 548974. PMID 15665081free {{cite journal}}: (עזרה)תחזוקה - ציטוט: postscript (link)
  16. ^ "Comparative genomics reveals 104 candidate structured RNAs from bacteria, archaea, and their metagenomes". Genome Biol. 11 (3): R31. 2010. doi:10.1186/gb-2010-11-3-r31. PMC 2864571. PMID 20230605.
  17. ^ "Detection of 224 candidate structured RNAs by comparative analysis of specific subsets of intergenic regions". Nucleic Acids Res. 45 (18): 10811–10823. באוקטובר 2017. doi:10.1093/nar/gkx699. PMC 5737381. PMID 28977401. {{cite journal}}: (עזרה)
הערך באדיבות ויקיפדיה העברית, קרדיט,
רשימת התורמים
רישיון cc-by-sa 3.0

גילוי RNA לא מקודד בכלי ביואינפורמטיקה33090008