단백질 구조 예측
단백질 구조 예측(단백 해 붙자 증여 켤레)은, 단백질에 대해 그 아미노산 배열을 기초로 3 차원 구조(입체배좌)를 예측하는 것을 말해, 바이오 인포메틱스 및 계산 화학에 있어서의 연구 분야의 하나이다.전문적인 말로는 「단백질의 일차 구조를 기초로 삼차 구조를 예측하는 것」이라고 표현할 수 있다.단백질의 아미노산 배열은 일차 구조로 불린다.단백질의 아미노산 배열은, 그 유전자가 기록된 DNA의 염기 배열로부터, 유전 코드(코돈)의 대응표에 근거하고, 도출할 수 있다.생체내에 있고, 대부분의 단백질의 일차 구조는 일의적으로 3 차원 구조(삼차 구조, 콘포메이션)를 취한다(단백질이 꺾어 접어진다).단백질의 3 차원 구조를 아는 것은, 그 단백질의 기능을 이해하는데 있어서 유력한 단서가 된다. 창약등과 같이 공익성이 고있어 다양한 분야에 있어 응용되고 있다.
단백질의 3 차원 구조를 해명하는 수단으로서는, 실험에 의한 방법이라고 예측에 의한 방법이 있다.이 항목으로는 예측에 의한 방법을 설명한다.
단백질 구조 예측에 대해 많은 수법이 고안 되고 있다.각각의 수법의 유효성은, 2년마다 CASP(Critical Assessment of Techniques for Protein Structure Prediction)에 의해, 평가되고 있다.
목차
개요
현재는 단백질 구조 예측이 완수하는 역할은, 지금까지 이상으로 중요하게 되어 있다.근년, 인간 게놈 계획 등 DNA의 염기 배열을 해독하는 대규모 프로젝트가 활발히 행해지게 되고 있다. 이러한 프로젝트의 성과인 DNA 염기 배열의 데이터로부터, 유전 코드의 대응표에 근거하고, 매우 많은 단백질의 아미노산 배열의 데이터를 도출할 수 있다.공공의 배열 데이터 베이스(GenBank나 Swiss-Prot등)에 축적되는 아미노산 배열의 데이터는 급속히 증대하고 있지만, 현재로서는, 실험에 의한 방법으로 결정된 단백질 구조 데이터의 증가 페이스는 별로 높지 않다.실험에 의한 방법으로 단백질 구조를 결정하는 작업으로는, X선회절이나 핵자기 공명(NMR)과 같은 시간이 걸려 비용을 필요로 하는 수법을 사용하는 것이 많다.그 때문에, 이 항목으로 설명하는 예측에 의한 방법으로 단백질 구조를 해명하는 것이 많이 행해지고 있다.
그러나 단백질 구조의 예측은 매우 어렵다.그 배경에는, 다음에 말하는 많은 요인이 있다.
- 단백질이 취할 가능성이 있는 구조의 수는, 방대하다(Levinthal paradox).
- 단백질 구조의 안정성에 관한 물리학적인 기반이, 별로 이해되어 있지 않다.
- 일부의 단백질로는, 그 일차 구조만으로 삼차 구조를 결정할 수 없는 것이 있다.예를 들면, 샤프롱이라는 이름으로 알려진 한 무리의 단백질은, 다른 단백질이 올바르게 작게 접는(삼차 구조를 취한다) 것을 돕는다.
- 분자 동역학법(MD법)과 같은 수법으로 단백질의 때타타 봐를 직접 시뮬레이트 하는 것은, 실제적인 이유 및 이론적인 이유로부터, 일반적으로는 취급하기 어렵다.
이러한 곤란은 있지만, 단백질 구조 예측에 관심을 가지는 많은 연구 그룹에 의해, 수많은 진보가 이루어져 오고 있다. 작은 단백질의 구조 예측에 대해서는, 현재는 수법이 확립해 있다.다양한 수법으로 단백질의 구조 예측이 일상적에 행해지게 되어 있다.단백질 구조 예측의 수법은, de novo 모델링과 비교 모델링의 2개에 크게 분류할 수 있다.
de novo 모델링
de novo 모델링 혹은 ab initio 모델링으로 불리는 단백질 모델링으로는, 3 차원의 단백질 구조 모델을 「처음부터」만들어낸다.단백질의 때타타 봐를 재현하는 계산방법이나, 확률에 근거해 가능성의 높은 구조 모델을 탐색하는 계산방법은, 많이 고안 되고 있다(에너지 레벨을 작게 하는 에너지 함수의 포괄적 최적화).이러한 계산방법을 실시하려면 , 막대한 컴퓨터 자원이 필요하기 때문에, 작은 단백질 에 대해서만 실시되어 왔다.큰 단백질에 대해서 de novo 모델링을 실시하기 위해서는, 보다 뛰어난 계산방법(알고리즘), 및 보다 대규모 컴퓨터 자원이 필요하다.현재는 대규모 컴퓨터 자원으로서는, 고성능인 스파콘퓨타(IBM의 Blue Gene이나 NEC의 SX등)나, 분산 컴퓨팅(Folding@Home)이 있다.이와 같이 현시점에서는 컴퓨터 자원의 면에서의 제약은 크기는 하지만, 예측에 의한 방법 혹은 실험에 의한 방법으로 실시하는 구조 게노미크스의 잠재적인 유용성은 크고, 그 때문에 단백질의 de novo 모델링은 활발한 연구 분야가 되고 있다.
비교 모델링
단백질의 비교 모델링으로는, 최초로 구조 모델링의 출발점으로서 이미 해명되고 있는 단백질 구조 혹은 주형(template)을 사용한다.이 방법이 유효한 이유는, 단백질의 종류는 방대하지만, 단백질의 대부분이 가지는 삼차 구조의 구조 모티프의 종류는 적다고 보여지고 있기 때문이다.현재, 실제로 존재하는 단백질의 때타타 봐의 패턴은 2000 종류 정도라고 생각되고 있는[요점 출전].
비교 모델링의 수법은 다음 2 종류로 분류할 수 있다.
- 상동성 모델링
- 상동성의 높은 2개의 단백질은 매우 닮은 구조를 갖고 있다고 하는 전제에 근거하는 모델링.우선 구조를 해명하는 대상의 아미노산 배열과 그 단백질과의 상동성의 높은 기존의(구조가 해명된) 단백질을 준비한다.기존의 단백질의 아미노산을 컴퓨터상에서 변이시키고, 구조가 미지의 단백질의 아미노산에, 대응 짓는다.
- 탄파크렲스렛딘그
- 구조를 해명하는 대상의 아미노산 배열로, 구조가 해명된 단백질의 구조 데이터를 축적하고 있는 데이터 베이스를 검색하는 수법.구조를 해명하는 대상의 아미노산 배열과 기존의 구조와의 적합성(compatibility)을 평가하는 스코아링 함수를 사용해, 그 단백질이 취할 가능성이 높은 3 차원 구조 모델을 이끌어낸다.
단백질 복합체(4차 구조)의 구조 예측 편
This article is taken from the Japanese Wikipedia 단백질 구조 예측
This article is distributed by cc-by-sa or GFDL license in accordance with the provisions of Wikipedia.
In addition, Tranpedia is simply not responsible for any show is only by translating the writings of foreign licenses that are compatible with CC-BY-SA license information.
0 개의 댓글:
댓글 쓰기