안녕하세요. 한헌종입니다.
오늘은 지난번에 이어, ACMG pathogenicity class 의 수치적 표현에 대한 이야기를 하려 합니다.
글 맨 아래에는 ACMG evidence 조합에 따라 class 와 bayesian score를 구할 수 있는 계산기를 만들어 보았으니 한번 참고해보세요!

아래 내용은 다음 논문을 참조해서 작성했습니다:
Tavtigian, Sean V et al. “Modeling the ACMG/AMP variant classification guidelines as a Bayesian classification framework.” Genetics in medicine : official journal of the American College of Medical Genetics vol. 20,9 (2018): 1054-1060. doi:10.1038/gim.2017.210


ACMG class 가 뭐더라

지난번에 말씀드린 대로, ACMG/AMP guideline에 따라 각 유전변이의 pathogenicity를 판별할 수 있습니다.
규칙에 따라 여러 evidence를 할당하고, 그 결과를 조합해 5가지 class 중 하나를 규정하는 방식이죠.
5가지 class는 다음과 같습니다: Pathogenic, Likely pathogenic, vairiant of uncertain significance, Likely benign, Benign.
이를 줄여서 P, LP, VUS, LB, B 로 간단히 나타내기도 합니다.

ACMG guideline을 따르면 pathogenicity를 어느정도 가늠할 수 있게 됩니다.
그러나 연구자들은 이를 ‘수치적’으로 나타내기를 원했습니다.
이를 위해 연구자들은 Bayesian framework 를 사용해 수치화 하는 방법을 강구해냅니다.
바로 다음 식처럼 말이죠.

-

Bayesian framework에 따라서, 먼저 알고 있는 prior probability를 여러 조건부확률을 사용해 posterior probability를 계산하는 방식입니다.
이 식을 사용하면 특정 변이의 pathogenicity를 0~1 사이의 값으로 나타낼 수 있게 됩니다.

물론, 결국엔 ACMG guideline 조합에 따른 5가지 class를 사용해서 변이를 설명해야 합니다.

어떻게 계산하는 건가요?

그럼 식에 대해 좀더 알아보겠습니다.
위의 공식은 밑에 있는 일반적인 베이즈 규칙에 따라 만들어졌습니다:

-

여기서 P(A) 가 prior probability, 즉 the probability of pathogenicity 가 됩니다.
변이가 병원성을 가질 확률이죠.
P(B)는 the probability of the evidence for pathogenicity 입니다.
P(A|B) 가 여기서 posterior probability 가 되는데요,
그 의미는 the probability of pathogenicity given the evidence 즉 주어진 evidence들에 대해 이 변이가 병원성을 가질 확률입니다.
P(B|A) 는 the probability of the evidence, given that the variant is pathogenic, 즉 pathogenic 변이가 주어졌을 때 각 evidence를 가질 확률입니다.

여기서 prior는 0.1을 기본값으로 사용합니다.
이는 논문에서 제시한 값으로써, 유전자 패널 등에서 병원성 변이를 발견하게 될 확률을 경험적으로 나타낸 것이라고 하는군요.

Odds_Path 는 어떻게 구하는거죠?

Odds_Path 는 odds of pathogenicity 를 나타냅니다.
이는 evidence categories 들을 설명하는 방향으로 만들어졌습니다.
그래서 이 값이 1 보다 크면 pathogenic evidence가 많다는 것이고, 1보다 작으면 benign evidence 가 많다는 것을 의미입니다.
이 Odds_Path 는 다음 식으로 구해집니다:

-

설명드리자면, Odds_Path 는 PVS evidence 의 odds 값을 ‘특정 값’으로 제곱해서 계산합니다.
그 ‘특정 값’ 은 각 evidence 의 개수를 활용해 만들어집니다.
예를 들어, NPSu 는 pathogenic-supporting evidence의 개수를 말합니다.

이 evidence의 개수는 그 strength에 따라서 2배씩 줄어들도록 보정이 되는데요,
그 결과 very strong evidence 한개의 영향력은 strong evidence 두 개의 영향력과 같게 됩니다.
(여기서의 그 ‘두 배’ 라는 값도 역시 논문에서 정해준 값입니다.)

또한 pathogenic evidence 개수는 덧셈, benign evidence는 뺄셈으로 사용해서 결과값을 보정하고 있습니다.
Benign evidence 가 많으면 odds_path 가 1 이하로 떨어지겠죠?

여기서, O(PVSt) 즉 the odds of very strong pathogenicity 는 논문에서 350으로 제시하고 있습니다.
이렇게 해서 Odds_path 를 구하는 방식을 알아보았습니다.

그럼 이 값이 뭘 뜻하나요?

결국 Bayesian score를 구하기 위해서는 다음 두 단계를 거치면 됩니다.

  1. Odds_Path 를 evidence 개수를 사용해 구한다.
  2. Posterior probability를 bayesian framework에 따라 계산한다.

여기서 제시한 O(PVSt)=350, Prior=0.1 를 사용하면 다음과 같은 현상이 나타납니다:

  • Post_P >= 0.99 : Pathogenic
  • 0.99 > Post_P >= 0.90 : Likely pathogenic
  • 0.90 > Post_P > 0.1 : VUS
  • 0.1 >= Post_P > 0.001 : Likely benign
  • 0.001 >= Post_P : Benign

즉 Bayesian score 가 pathogenicity를 나타낼 수 있게 된 거죠.
높을 수록 Pathogenic 변이이며, 특정 값을 넘는지를 통해 class 도 알 수 있습니다.

그러나 이 공식으로 구해진 bayesian score는 완벽하지 않아서, 여러 예외상황이 발생하기도 합니다.
예를 들어 class 는 VUS 로 분류되지만 bayesian score 는 0.9를 넘는 경우가 발생하기도 하죠.
bayesian score는 설명을 돕기 위한 점수일 뿐이고, 결국 ACMG class 를 중점적으로 봐야한답니다.

ACMG class 계산기

js 를 사용해서 ACMG class 계산기를 만들어보았습니다.
해당하는 rule을 클릭해서 조합을 만들면, 밑부분의 결과에 ACMG class 와 bayesian score가 계산되어 나타납니다.
한번 직접 사용해보세요!

ACMG class calculator

made by HJHan

click rules below:
PVS1
PS1 PS2 PS3 PS4
PM1 PM2 PM3 PM4 PM5 PM6
PP1 PP2 PP3 PP4 PP5
BS1 BS2 BS3 BS4
BP1 BP2 BP3 BP4 BP5 BP6 BP7
Reset
Class Score


지금까지 ACMG class 를 수치화 하는 bayesian framework 를 살펴보았습니다.
더욱 자세한 내용은 맨 위에 말씀드린 논문에서 찾아볼 수 있습니다.
그럼 다음에 만나요!