현재 난리났다는 인간 유전자 발현 예측모델 근황

현재 난리났다는 인간 유전자 발현 예측모델 근황
댓글 0 조회   134

작성자 : 옷사마빚나데
 
 
 
 
 
 
 
전사조절 (유전자 발현) 은 우리 모든 생물학에서 중요함
 
근데 이 중요한게 너무 복잡해서 많이 밝히지 못함
 
또 기존 모델들은 특정 유형의 세포나 조건에 국한되어서 
 
범용적으로 사용하기엔 무리가 있음
 
 
 
 
 
 
 


 
 
 

 
 
그래서 만든게 GET  모델
 
일단 213개 인간 세포 유형의 scATAC-seq 데이터에서 추출한 염색질 접근성 및 TF 결합 부위 정보와
 
2Mbp 이상의 genomic locus 를 입력후
 
무작위로 마스킹 된 영역에서 motif 결합 점수 및 접근성 점수를 예측하도록 학습시켰음
 
 
 
 
 
 
 
 
 

 
이후 미세 조정은 scATAC-seq와 RNA-seq 데이터가 쌍으로 존재하는 153개 세포 유형 데이터를 사용하여, PolII가 염색질 환경을 읽어 유전자 발현을 조절하는 과정을 모방하도록 학습함
 
그랬더니 유전자 발현 예측을 잘함
 
 
 
 
 
 
 
 
 

 
학습에 사용되지 않은 세포 유형에서도 유전자 발현을 엄청난 정확도로 예측함
 
Pearson correlation 0.94, R2 0.88, unseen fetal astrocytes
 
대략 90%이상의 예측을 함
 
이는 다양한 세포유형에 대한 유전자 발현 예측을 할 수 있다는 소리
 
 
 
 
또한 태아 데이터로만 학습했음에도 성인 세포 유형의 유전자 발현을 정확하게 예측가능
 
다양한 시퀀싱 플랫폼과 분석법에 적용가능
 
제로샷(Zero-shot) 예측도 가능
학습없이 규제요소의 활성화를 예측했는데 기존 분석기 Enformer보다 정확함
 
 
 
 
 
 



 
 
 
 
 
 
결론
 
Transformer 기반의 범용 전사 조절 모델을 개발하고, 
self-supervised pretraining, fine-tuning, model interpretation, causal discovery, AlphaFold2 연계 
 
등 최신 기술을 융합하여, 
 
 
“전사 조절 연구의 새로운 지평”을 열었음
 
 
 
 
요약
 
여태 어려워했던 전사 조절의 기본 원리를 이해하고, 
 
질병 메커니즘을 규명하는 데 중요한 기여를 할 것으로 기대됨
 
또한 
 
이미 얘를 가지고
 
소아 백혈병의 새로운 발병기전 발견,
태아 헤모글로빈 조절기전 규명,
TF 상호작용 네트워크 구축에 성공했음
 
 
 


유머 게시판
제목
  • [네이트판] 한국은 ㅈㄴ모든 면에서 촌스러운거같음
    111 01.10
  • 엔비디아 젠슨 황이 말하는 양자컴퓨터의 현실
    144 01.10
  • 캘리포니아 화재 현장에서 포착된 장면 ㅎㄷㄷ
    116 01.10
  • SNS 없애면 출산율 올라갈거 같음
    112 01.10
  • 호랑이 vs 몽둥이 든 남자 40명
    136 01.10
  • 고용노동부 감독관을 울린 악덕기업
    208 01.10
  • 영재발굴단 수학영재 근황
    189 01.10
  • 트위터에서 화제 중인 귤을 대하는 N과 S의 차이
    117 01.10
  • 이상기후 때문에 난리난 태평양 섬나라
    177 01.10
  • 캘리포니아 화재현장 흑인들이 하고 있는 짓거리
    203 01.10
  • 쌍용건설이 8년만에 완공한 1조5천5백억 두바이 호텔
    171 01.10
  • 요새 한국이 너무 흉흉하네요
    207 01.10
  • 둔덕 있는 공항에 대한 한국식 해결책
    202 01.10
  • 하트시그널 출연자가 열엇다는 카페 겸 바
    149 01.10
  • 루머) 갤럭시25 시리즈 가격 유출 ㄷㄷ
    192 01.10

로그인 후 이용해주시기 바랍니다.