본문 바로가기
Technology

인공지능은 신약개발의 효율성을 높일 수 있을까?

by HITS 2021. 9. 9.

안녕하세요. HITS에서 신약개발을 위한 인공지능(AI) 모델 개발을 맡고 있는 임재창입니다.

 

오늘은 LG화학과의 공동연구 사례를 바탕으로 HITS의 AI 기술을 소개해드리려 합니다.

최근 AI 신약개발이 큰 관심을 받으며 많은 논문이 발표되고 있습니다. 그러나 실제 산업에 성공적으로 적용된 예는 찾기 어려운데요. HITS의 AI 기술 적용사례를 통해 AI가 신약개발에 실제로 어떤 기여를 할 수 있는지 이해하시는 데 도움이 되었으면 좋겠습니다.

 

공동연구 동기

이 공동연구의 목적은 AI를 이용하여 ‘타깃 A’에 대해 특허성 있는 신규 골격을 찾는 것이었습니다. 이 타깃은 1,000개 이상의 물질에 대해서 특허가 광범위하게 걸려있어 신규성 있는 골격을 찾는 데에 어려움이 있었습니다. 동시에 시장성 확보를 위해 앞서있는 선발주자를 빠르게 따라잡아야 했습니다. LG화학은 AI를 이용하여 이러한 어려움을 극복하고자 HITS의 손을 잡았습니다.

 

HITS-LG화학 공동연구 동기

공동연구 방식

AI의 가장 큰 장점은 천문학적인 수의 분자를 빠른 속도로 탐색할 수 있다는 것입니다. 분자 하나하나를 상세히 검토하는 것은 전문가들이 더 잘할 수 있지만, 전문가들이 검토할 수 있는 분자의 수는 한정되어 있습니다. 이러한 AI의 장점을 최대한으로 활용하기 위해 공동연구팀은 AI로 방대한 수의 분자를 탐색하여 선별한 뒤 전문가들이 재선별하는 방식으로 프로젝트를 진행했습니다. 전문가 검토 후 제시된 분자구조 수정 방향을 반영하여 새롭게 분자를 탐색하기도 했습니다. 사실 이처럼 전문가의 의견을 반영하여 AI가 새롭게 분자구조 탐색을 수행하는 것은 기술적으로 간단하지 않습니다. 이를 가능하게 하고자 HITS는 human-AI interactive 하게 과제를 수행할 수 있는 AI 기술을 만들고 있습니다. AI는 만능이 아닙니다. AI가 잘할 수 있는 영역이 있고, 사람이 잘할 수 있는 영역이 있습니다. 둘의 장점을 취하고 단점을 보완하기 위해서는 human interactive AI가 필수적입니다. HITS에서 이러한 기술을 개발 할 수 있는 것은 HITS에는 단순히 AI 전문가들만 있는 것이 아니라, computational chemist, biologist, 신약개발전문가 등 다양한 전문성을 가진 최고의 인력이 함께 기술을 개발하고 있기 때문입니다.

 

HITS-LG화학 공동연구 방식

사용된 AI 기술

이 과제에 사용된 HITS의 AI 기술은 크게 두 가지입니다. 1. 약물-단백질 상호작용 예측모델2. 분자 디자인 모델.

이 두 가지 모델에는 AI 기술뿐 아니라 계산화학 기술도 상호보완적으로 사용됩니다. 이미 보고된 다른 타깃에 대해서는 사전에 여러 가지로 검증을 했지만, HITS의 기술을 실전과제에 처음으로 적용하였기 때문에 약물-단백질 상호작용 예측 모델의 성능을 타깃 A에 대해서 검증해보기로 하였습니다. 더욱이 타깃 A에 대해서 물질을 개발하는 방향이 단순한 경쟁저해제가 아니다 보니 모델 검증작업이 필요했습니다. 특허를 통해 보고된 타깃 A에 대한 활성분자들에 대해서 예측값과 실험값의 경향성을 비교하는 방식으로 모델의 성능을 검증하였습니다. 그 결과 R 값을 기준으로 0.6 이상의 correlation을 보였습니다. 타깃 A에 대한 실험 결과를 AI 모델에는 전혀 사용하지 않았다는 점을 고려하면, 높은 정확도라고 할 수 있습니다. 다음으로 분자 디자인 모델을 이용하여 타깃 A에 대한 후보물질을 디자인하였습니다. 디자인할 때는 random 하게 디자인하는 것이 아니라 분자골격기반 생성 모델을 이용한 conditional generation 방법을 이용하여 타깃 A에 대해서 활성을 보일 확률이 높은 후보물질을 디자인하였습니다. 그 후 위에서 검증된 약물-단백질 상호작용 예측 모델을 이용하여 상위 분자를 선별하였습니다. 다음으로 LG화학 의약합성팀에서 선별된 분자들을 검토 후 유도체를 생성한 뒤 분자를 합성하고 protein assay를 수행하여 % inhibition과 IC50을 측정하였습니다.

 

ref: Chem. Sci., 2020, 11, 1153-1164

결과

결과적으로 40개의 분자를 합성하여 15개의 유효물질(IC50<10 um)을 찾을 수 있었습니다. 15개의 분자들 중에는 IC50이 94 nM, 220 nM, 690 nM인 화합물들도 포함되어 있습니다. 이들 유효물질은 기존에 보고된 물질과는 다른 신규 골격을 가지고 있으며 구조 측면에서 특허성을 가지고 있습니다. 이러한 결과들은 HITS와 협업 전 1년 동안 2개의 유효물질을 찾은 것에 비하면 상당히 인상적인 결과입니다.

 

HITS-LG화학 공동연구 결과

성공 요인

1. HITS의 뛰어난 AI 및 계산화학 기술력: AI 신약개발 과제에서 가장 중요한 것 중 하나는 AI 기술력입니다. 뛰어난 AI 기술 덕분에 유망한 분자구조를 디자인 및 선별할 수 있었습니다. AI 기술에 더하여 HITS는 다양한 계산화학 기술을 사용합니다. 원리기반의 계산화학 기술을 이용하면 AI 모델이 가지고 있는 bias 문제를 보완할 수 있습니다. 이런 접근법이 가능했던 이유는 HITS엔 AI 전문가 뿐 아니라 최고의 계산화학 연구인력도 있기 때문입니다.

 

2. 실험팀(LG화학)과 AI팀(HITS)의 긴밀한 협력: AI를 효과적으로 적용하기 위해서는 풀고자 하는 문제를 AI가 풀 수 있는 문제로 바꿔야 합니다. 이를 위해서는 문제를 잘 알고 있는 실험팀과 기술을 잘 알고 있는 AI팀 간의 긴밀한 커뮤니케이션이 필요합니다. (이점에 대해서 LG화학 연구원들에 감사드립니다ㅎㅎ)

 

3. 최고의 연구인력: AI는 매우 효과적인 도구이며 큰 잠재력을 지니고 있습니다. 하지만 이 유용한 도구를 어떻게 사용할지는 ‘사람(연구자)’이 결정합니다. 따라서 AI 신약개발 과제의 성공 여부에는 어떤 연구자가 참여하느냐가 중요합니다. HITS에는 AI 기술을 이해하고 문제를 재정의할 수 있는 연구진이 있었기에 AI 기술을 효과적으로 적용하여 과제를 성공적으로 완수할 수 있었습니다.

 

과제에 사용된 세부 AI기술이 궁금하신 분들도 있으실 텐데요. 다음 편에서는 이 과제에 사용된 핵심기술인 분자골격기반 (scaffold-based molecular generative model, Chem. Sci., 2020, 11, 1153-1164) 생성 모델로 찾아뵙겠습니다!

 

댓글