פורמט העברת גנים
קפיצה לניווט
קפיצה לחיפוש
ערך שניתן לשפר את מקורותיו
| ||
ערך שניתן לשפר את מקורותיו |
פורמט העברת גנים (באנגלית: Gene transfer format; בראשי תיבות: GTF) הוא פורמט קובץ המשמש להחזקת מידע על מבנה הגן. זהו פורמט טקסט המופרד באמצעות TAB המבוסס על פורמט התכונות הכלליות (GFF), אך מכיל כמה מוסכמות נוספות הספציפיות למידע גנטי.
GTF זהה ל-GFF, בגרסה 2.[1]
מבנה
מבנה הפורמט נראה כדלהלן: שם הגן, מקור, מטרה, התחלת המקטע, סוף המקטע, ציון, גדיל, מסגרת, תכונות (אופציונלי), הערות (אופציונלי).
- שם הגן: שם הרצף. בדרך כלל, זהו מזהה הכרומוזום או מזהה הקונטיג (רצף רצפי קריאה חופפים בגנום המורכבים לרצף יחיד). שדה זה חייב להיות ייחודי בכל GTF עבור שדה ההערות הערות.
- מקור: עמודת המקור צריכה להיות תווית אינדיקטיבית המציינת מהיכן ההערות - בדרך כלל השם של תוכנית חיזוי או מסד נתונים ציבורי.
- מטרה: סוגי התכונות הבאים נדרשים: "CDS", "start_codon", "stop_codon". התכונות "5UTR", "3UTR", "inter", "inter_CNS", "intron_CNS" ו-"exon" הן אופציונליות. כל התכונות האחרות לא יחשבו. על הסוגים להיות בעלי אותיות גדולות וקטנות מדויקות כמצוין.
- התחלת וסוף מקטע: מיקומי התחלת וסוף המקטע המדובר. ערך ההתחלה חייב להיות קטן או שווה לערך הסוף.
- ציון: מידת הביטחון בקיומה של התכונה ובמיקומה. לערך של שדה זה אין קנה מידה עולמי, אך יכול להיות שהוא בעל משמעות יחסית כאשר השדה של המקור מציין את תוכנית החיזוי המשמשת ליצירת ביאור זה. זה יכול להיות מספר שלם או שבר.
- גדיל: כיוון הגדיל. מוגדר כ- + (קדימה) או - (לאחור).
- מסגרת: 0 מציין שהתכונה מתחילה בקודון שלם בבסיס 5 '. 1 פירושו שיש בסיס נוסף אחד (הבסיס השלישי של קודון) לפני הקודון השלם הראשון ו- 2 אומר שיש שני בסיסים נוספים (הבסיס השני והשלישי של הקודון) לפני הקודון הראשון.
- תכונות: רשימה המופרדת בנקודה-פסיק של זוגות ערך-תג, המספקת מידע נוסף על כל תכונה.
- הערות: מתחילה ב "#" ונגמרת בסוף אותה השורה.
קישורים חיצוניים
הערות שוליים
- ^ GFF/GTF info, from Ensembl
30059109פורמט העברת גנים