دنباله موتیف
From Wikipedia, the free encyclopedia
From Wikipedia, the free encyclopedia
در ژنتیک یک دنباله موتیف الگویی از توالی نوکلئوتید یا آمینو اسید است. برای پروتئینها توالی موتیف از طریق ساختار سهبعدی آمینو اسیدهای تشک.
مثال زیر یک موتیف N-گلیکوزیلاسیون است:
عبارتهای سهحرفی آمده در بالا نامهای اختصاری آمینواسیدها هستند.
زمانی که یک دنباله موتیف در اگزون یک ژن ظاهر میشود، ممکن است بهصورت رمز "ساختاری موتیف" از یک پروتئین تفسیر گردد; که یک کلیشه عنصر از ساختار کلی از پروتئین است. با این وجود الزاماً موتیف به یک ثانویه ساختار خاص وابسته نیست. توالیهای "Noncoding" به پروتئین ترجمه نمیشوند.
خارج از بخش اگزون ژنها، دنباله موتیفهای نظارتی وجود دارند. برخی از اینها بر شکل اسیدهای نوکلئیک (نگاه کنید به عنوان مثال RNA خود پیرایش) تاثیر میگدارند اما این تنها در مورد برخی از موارد صدق میکند. برای مثال بسیاری از پروتئینهای متصل شونده به DNA دارای شکل خاصی هستند که باعث میشود بتوانند موتیفها را در DNA تشخیص دهند و در آن نواحی به DNAمتصل شوند.
پژوهشگران برای یافتن موتیفها از اطلاعات از ابزارهای موجود در بیوانفورماتیک که برای تحلیل اطلاعات کاربرد دارند (مانند BLAST) استفاده میکنند.
مثال زیر را که یک موتیف N-گلیکوزیلاسیون است، در نظر بگیرید:
این الگو را میتوان به صورت
N{P}[ST]{P}
نمایش میدهند که در آن
N
= Asn, P
= Pro, S
= Ser, T
= Thr;
است.
عبارت {X}
به این معنی است که هر آمینواسیدی بجز X
میتواند در این مکان قرار بگیرد. همچنین عبارت [XY]
یعنی در این مکان یکی از آمینواسیدهای X
یا Y
میتواند قرار بگیرد. مشکل نشانگذاری [XY]
این است که در آن نمیتوان احتمال حضور هر کدام از آمینواسیدها را در این مکان نشان داد. بدین منظور میتوان از نمایش sequence logo استفاده کرد.
روشهای مختلفی برای نمایش دنباله موتیف وجود دارد، اما اکثر این روشها از روش استاندارد عبارت باقاعده با قراردادهای زیر استفاده میکنند:
[abc]
تنها آمینواسید متناظر با a
یا b
یا c
میتواند بیان شود.یک ماتریس عددی حاوی امتیازهای هر نوکلئوتید در هر موقعیت از یک موتیف با طول ثابت است. دو نوع ماتریس وزندهی وجود دارد.
نمونه ای از یک PFM از پایگاه داده TRANSFAC برای فاکتور رونویسی AP-1:
Pos | A | C | G | T | IUPAC |
---|---|---|---|---|---|
01 | 6 | 2 | 8 | 1 | R |
02 | 3 | 5 | 9 | 0 | S |
03 | 0 | 0 | 0 | 17 | T |
04 | 0 | 0 | 17 | 0 | G |
05 | 17 | 0 | 0 | 0 | A |
06 | 0 | 16 | 0 | 1 | C |
07 | 3 | 2 | 3 | 9 | T |
08 | 4 | 7 | 2 | 4 | N |
09 | 9 | 6 | 1 | 1 | M |
10 | 4 | 3 | 7 | 3 | N |
11 | 6 | 3 | 1 | 7 | W |
ستون اول موقعیت را مشخص میکند، ستون دوم شامل تعداد وقوع A در آن موقعیت است ، ستون سوم شامل تعداد تکرار C در آن موقعیت است، ستون چهارم شامل تعداد تکرار G در آن موقعیت است، ستون پنجم شامل تعداد تکرار T در آن موقعیت میباشد، و آخرین ستون شامل نماد IUPAC برای آن موقعیت. توجه داشته باشید که جمع تعداد وقوع A، C، G، T برای هر ردیف باید با ردیفهای دیگر یکسان باشد.
مثال زیر از مقالهای از ماتسودا و همکاران که در سال 1997 منتشر شده است [1]، گرفته شده است:
ماتسودا، و همکاران. یک کدگذاری به نام "کد های زنجیره ای سه بعدی" برای ارائه یک ساختار پروتئین به عنوان یک رشته از حروف نام پیشنهاد دادند. این طرح شباهت بین پروتئینها را بسیار واضحتر نسبت به توالی اسید آمینهها نشان می دهد:
3D زنجیرهی کد | توالی اسید آمینه | |
---|---|---|
1lccA | TWWWWWWWKCLKWWWWWWG | LYDVAEYAGVSYQTVSRVV |
3gapA | KWWWWWWGKCFKWWWWWWW | RQEIGQIVGCSRETVGRIL |
که در آن "W" مربوط به یک α-مارپیچ و "E" و "د" مربوط به یک β-رشته است.
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.