구조-활성의 정량적 관계
화학 등에서 사용되는 회귀 또는 분류 모델 / From Wikipedia, the free encyclopedia
구조-활성의 정량적 관계(영어: quantitative structure–activity relationship, QSAR)모델은 화학, 생물학, 공학에서 사용되는 회귀 또는 분류모델로, 화학구조와 예측하고자 하는 활성 간의 정량적인 수학적 모델을 말한다. QSAR 회귀모델은 수치형태의 반응변수(Y), QSAR 분류모델은 범주형태의 반응변수와 예측변수(X)의 관계를 나타낸 것이다. QSAR 모델링에서 예측변수는 물리화학적 특성값이나, 이론적으로 계산하는 분자 표현자를 사용하며, 반응변수는 화합물의 생물학적 활성값이 사용될 수 있다. 먼저 QSAR모델을 통해서 화학구조와 생물학적 활성과의 관계를 나타내고, 그 다음에는 QSAR모델을 이용하여 새로운 화합물의 활성을 예측한다.
관련된 용어로 구조-물성의 정량적 관계(QSPR)이 있으며, 반응변수로 화학적 물성을 사용하는 것이며,[1][2] 다양한 화학분자의 물성이나 거동 등이 QSPR분야에서 연구되고 있다. 이러한 예로서 "구조-반응성의 정량적 관계(QSRRs), 구조-크로마토그래피의 정량적 관계(QSCRs), 구조-독성의 정량적 관계(QSTRs), 구조–전기화학의 정량적 관계(QSERs), 구조–생분해성의 정량적 관계(QSBRs)"등이 있다.[3]
예를 들어 생물학적 활성은 특정 생물학적 반응을 나타내는 물질의 농도를 통해서 정량적으로 나타낼 수 있므로, 물리 화학적 특성 및 화학구조를 수치화 하면, 수학적인 관계 또는 그들간에 구조-활성의 정량적 관계를 찾을 수 있다. 수학적 관계식이 신중하게 검증되었다면[4][5][6], 모델을 통해서 임의의 화학구조에 대한 반응값을 예측하는데 사용될 수 있다.[7]
QSAR은 수학적인 모델의 형태를 지니고 있다.
- 활성= f(물리화학적 물성 및 화학구조의 특성) + 오차
오차는 모델 오차(바이어스)과 관측치 내의 변이를 나타내는 관측치 변이를 포함한다.