단백질 코드만 망가뜨리는 것이 아니다!

단백질 코드만 망가뜨리는 것이 아니다!

Pathogenic variants that alter protein code often disrupt splicing.

Nature genetics 에 온라인으로 먼저 publish 된 논문인데, 이것저것 끄적이다가 제목만 보고도 “오옷!”하는 땡기는 느낌이 있어서 읽기 시작하였다.논문 제목을 쉽고 명확하게 정하는 것도 능력인 듯. 내용도 제목만큼이나 흥미로웠는데, 이유는 나만 몰랐을 수도 있지만.. Missene 돌연변이가 단백질 코드를 바꿀 뿐만 아니라, RNA splicing 에도 영향을 줄 수 있다는 것을 보여주었기 때문.

William Fairbrother

책임 저자는 William G Fairbrother 라는 분으로, 현재 Brown University 에서 Assistant Professor 로 계시는 분이고 다음과 같은 테크를 타심. ‘Oberlin College 화학과 (학사) – Columbia University Biological Sciences (박사) – Phil Sharp Lab (포닥) 여기가 ㅎㄷㄷ...

Publish 한 논문을 보면 Sharp느님과 2002년 Science 에 논문을 썼는데, 딱 지금 논문에서 이야기하는 Exonic mutation 과 RNA splicing 에 관한 논문이다. 그 후로, Computation biology 와 Genomics 를 이용하여, Human genome 의 functional element 를 찾는 것이 주된 연구 관심사. 더 자세하게는 ‘Gene expression 과 RNA splicing associated mutations’ 와 ‘ES 에서의 TF 역할’ 정도인 듯.

논문 내용

  1. Exonic mutation 이 RNA splicing 에 영향을 줄 수 있다는 가설에서 시작.
  2. MaPSy (MAssively Parallel Splicing assaY) 라는 것을 셋팅하였고, 이것을 이용해 4,964개의 disease-causing exonic mutation 에 대해 splicing effect 를 테스트 하였음.
  3. Library 는 mutation 을 포함하고 있는 170 mer genomic fragments (최소 Upstream 으로 55 nt, Downstream으로 15 nt 커버).
  4. MaPSy 는 2개의 library 가 있는데, 하나는 in vivo level (여기서 in vivo 는 세포에 oligo를 Transfection 하는 정도..) splicing assay. 다른 하나는, in vitro level 로 Spliceosome complex assay (cell nuclear extract 를 뽑아서 incuation 시킨 다음, RNA 에 생기는 complex 를 측정함).
  5. 최종적으로 선별한 4,964개 mutation 중에서, 10% exonic mutation (약 496개) 이 splicing 에 문제를 주었다고 한다. 이러한 mutation 을 ESM (exonic splicing mutations) 이라고 말함.
  6. Common SNP 에 대해서도 동일한 방법으로 테스트 해봤는데, 3% (8/228개) 만 splicing 영향을 주었음.
  7. 전혀 예상하지 못한 cryptic 3’-splice-site usage 도 찾을 수 있었음. 이것은, exon 에 돌연변이가 생겨서 AG (splice acceptor) 가 만들어지는 돌연변이..이었음. 이런게 재미있네..
  8. ESM 이 생기는 gene 을 살펴보면, haploinsufficient gene 에 많이 생겼고, pLI score 가 높은 gene 에 더 enrichment 되어져 있었음. 결국 ESM도 loss of function 매커니즘을 보여준다고 결론. 쉽게 생각되는 결과 아닌가..?
  9. 추가로 Motif 분석도 해봤는데, mutation 이 생겨서 몇가지 gain 되거나 loss 되는 RNA binding protein 예상할 수 있었음.
  10. Spliceosome complex 가 형성되는 pre-splice, A, B/C, spliced transcript 를 실험을 통해서 확인해봤는데, ESM 돌연변이 별로 splicsome complex 형성이 다양하다는 것도 확인도 해보고, 더 예측도 해봄!

궁금한 점 및 의문

  1. Silent 돌연변이도 splicing 에 영향을 줄수 있을까 ?
  2. Cancer data 를 가지고 분석해도 재미있을 법하다. 당연히 여기서도 percentage 가 그렇게 높지는 않겠지만..
Advertisements

CIC 유전자에 대한 고찰 by Huda Y Zoghbi.

 CIC 유전자에 대한 고찰 by Huda Y Zoghbi.

Disruption of the ATXN1–CIC complex causes a spectrum of neurobehavioral phenotypes in mice and humans.

Nature genetics 역시 feed 를 받아보고 있는데, MECP2 유전자로 유명한 Zoghbi 가 보여서 논문을 읽기 시작하였다. Zoghbi 는 Baylor에 계신 분으로, 1999년 Rett syndrome 이 MECP2 유전자의 돌연변이에 의해 생긴다는 것을 처음으로 밝힌 분이라 익히 알고 있었고, 작년 말 Spinocerebellar ataxia 와 Rett syndrome 관련 연구 업적을 인정받아 Breakthrough Prize 를 수상하기도 하였다.

Huda Yahya Zoghbi, M.D.

읽기 시작한 논문은 CIC 유전자에 관련한 논문으로, 지금까지 Zoghbi 님이 보여주시던 전형적인 mouse KO-행동 실험-target 유전자 찾기 등의 패턴과 크게 다르지 않지만, 실제 CIC 유전자에 돌연변이가 있는 환자를 찾았다는 점이 의미가 있었던 것 같다. 오랜만에 자세하게 정주행 달린 논문.

소개 및 요약
  1. Ataxia 1 (ATXN1) 이라는 유전자는 1993년 처음 발견되었는데, ATXN1 단백질에서 poly-glutamine 길이가 증가하면 spinocerebellar ataxia type-1 라는 질병을 일으킨다고 알려져 있었다.
  2. 이후 같은 그룹에서 ATXN1 유전자에 mutation이 생기면 다양한 신경관련 유전자의 발현이 바뀌게 된다는 것을 발견하였고, ATXN1 이 CIC 이라는 Transcriptional repressor (발현 억제) 단백질과 서로 binding하여 ATXN1-CIC 라는 co-repressor complex 를 만들고, CIC 의 타겟유전자들의 발현을 억제한다 라는 것을 발견하였다.
  3. 이러한 연구들은 ATXN1-CIC complex 의 분자적 기능을 알려주는데 기여하였지만, ATXN-CIC 에 문제가 생기면 developing brain 에서 어떠한 결과를 만들어 내는지 알 수 없었다.
  4. 실제로 Atxn1/Atxn1l 혹은 CIC 유전자가 Knockout (KO) 된 mouse는 얼마 지나지 않아 죽게 된다고 한다. Atxn1-/-; Atxn1l-/- (Atxn1 혹은 Atxn1l 유전자가 없는 mouse) 들은 뇌수종 (hydrocephalus), 복벽결손 (abdominal wall defect), 폐결손 (lung defect) 등의 phenotype을 보였고, CIC KO mouse 역시 동일한 phenotype을 보여줌으로 Atxn1-CIC 가 in vivo 레벨에서도 complex 로 행동한다는 것을 증명해주었다.
  5. Human 에서는 ATXN1 을 포함한 염색체 6번 region이 deletion 이 된 Autism spectrum disorder (ASD), Developmental delay/Intellectual disability (DD/ID), seizure, ADHD 환자가 보고 되었다. 하지만 그 region 에는 다른 유전자들도 포함하고 있어 실제로 ATXN1 과의 연관성을 증명하기는 힘들었다.
  6. CIC 유전자 역시 2개의 missense 돌연변이를 가진 환자가 보고 되었지만, 돌연변이에 대한 Functional study 가 전혀 이루어지지 않은 상태에서 pathogenicity를 말하기는 어려웠다.
  7. 그래서 본 논문은, Atxn1-Atxn1l or CIC, 특히 CIC 가 KO 된 mouse 를 만들어 brain histology, mouse behavior 를 살펴보았고, DD/ID, ASD 와 같은 질병을 가진 환자들에게서 CIC 에 mutation 이 있는 것을 보고하였다.
결과 1. Conditional KO : Emx1-Cre CIC KO
  1. 앞서 이야기한대로, Atxn1/Atxn1l or CIC 유전자가 Knockout 된 mouse는 viable 하지 않기 때문에, conditional knockout 을 진행하였다. 구체적으로, Emx1-Cre를 이용해 developing forebrain 특이적으로, CIC 유전자를 deletion 시켜보았다.
  2. Emx1 은 telencephalon 이라고도 알려진 developing cerebrum에서 embryonic day 10.5 (E 10.5) 부터 발현되기 시작한다. Emx1 promoter 에 Cre 를 이용하면 E 10.5 day 부터 Cre 단백질이 발현되어 forebrain의 excitatory neurons and glia 특이적으로 CIC 를 deletion 시켜준다.
  3. 실제로 forebrain 쪽에서 CIC 단백질이 없어진 것을 Western blot, Immunofluorescent staining 을 이용하여 확인하였고, CIC 의 target 유전자인 Etv1, Etv4, Etv5 역시발현이 줄어든 것을 확인하였다. (CIC의 타겟로 알려짐)
결과 2. Behavior of Emx1-Cre CIC KO mouse
  1. CIC KO Mouse 의 open-filed test를 통해 control mouse에 비해 더 빠른 speed로, 더 많은 distance를 움직였음을 확인하였다.
  2. ADHD 모델에서 low-dose 로 Amphetamine 을 주면 모순적(?)인 calming 한 효과가 있다고 알려진 바가 있었는데, CIC KO mouse 에서도 동일한 효과를 보여주었다.
  3. Maze test를 통해 anxiety 가 줄어들었음을 확인하였고, Fear conditioning assay 를 통해 freezing 도 줄어들었음을 발견하였다. 또한 Spartial test를 통해 learning, mememory 에도 문제가 있음을 발견하였다. 마지막으로, Three-chamber test를 통해 social interaction에는 문제가 없음을 발견하였다.
  4. Conditional KO CIC mouse 에서 Atxn1/Atxn1l 단백질의 양은 줄어들지 않은 것을 보아, 주로 CIC 단백질이 없어짐으로 mouse의 표현형이 driven 된다는 결론을 내릴수 있었다.
결과 3. Brain sections of Emx1-Cre CIC KO mouse
  1. 5 weeks age mouse의 hippocampus와 amygdala는 control 에 비해 문제가 없는 것처럼 보였지만, cortical layer 2-4의 두께가 얇아져 있었다. cortical layer 5-6은 정상. (* cortical layer 2-4? 공부!)
  2. 20 weeks age mouse 역시 cortical layer 5-6 은 정상이었지만, layer 2-4 이 normal 에 비해 두께가 얇아져 있었다. 또한, CA1과 CA3는 정상으로 보이는 반면, Dentate gyrus의 두께가 얇아져 있었다.
  3. Dentate gyrus 는 CA3 region 으로 neuronal signal을 보내기 전에 input 을 받고 프로세싱하는데 중요한 역할을 하는 곳으로 알려져 있다.  Hippocampus의 synaptic plasticity 역시  presynaptic neurotransmitter release 가 많이 줄어들어 있음을 발견하였다.
  4. Neuronal marker 로 layer 별로 staining을 해보았다.
    • CUX1 는 layer 2-4
    • CTIP2 (BCL11B) 는 layer 5-6
    • SATB2 는 layer 2-6.
  5. CTIP2+ neuron 은 control 과 비슷하였지만, CUX1+ neuron이 layer 2-4 에서 많이 줄어들어 있었다. 이것은, CUX1+ neuron 이 layer 2-4의 layer의 두께 변화를 일으키는 주된 원인으로 생간된다고 판단.
  6. 그렇다면 무슨 이유로 layer 2-4 에서 neuron 의 숫자가 줄어들어 layer 두께의 변화를 유도할까?
    • 가정 1 – progenitor 세포들의 분열 (proliferation)에 문제가 생겼을것이다.
    • 가정 2 – progenitor 세포에 문제가 아니라, postnatal 문제, 즉 신경세포의 maturation or maintenance 에 문제가 있을 것이다.
    • 가정 1 증명: Layer 2-4 는 보통 E14.5 – E16.5 에 형성되는데, 이것을 이용하여 E14.5 와 E16.5의 mouse brain을 가지고 ethynyl-2 ́-deoxyuridine (EdU) 로 labeling 을 해보았다. EdU 와 함께 TBR2, PAX6 progenitor marker를 같이 labeling 해보았다. 그 결과, normal control 에 비해 전혀 영향을 받지 않았다.
    • 가정 2 증명-1: Layer 2-4 에서 CUX1+, SATB2+ neuron 들의 숫자는 태어난 직후 (P 0; Postnatal day 0) normal 과 CIC KO mouse가 비슷하다. 하지만, 10일이 지난후 보면 상당히 그 숫자가 줄어들어 있음을 확인할 수 있었다.
    • 가정 2 증명-2: Neurod6-Cre 를 KO도 test 해보았는데, Neurod6 는 postmitotoic excitatory neuron 에서 특이적으로 발현된다고 알려져 있다. Neurod6-Cre를 이용한 CIC KO mouse 역시 동일하게 postnatal maturation 에 문제가 있었다.또한 Apoptotic signal 이 P 5 에서 많이 올라가 있음을 보아 태어난 후 몇일 동안 apoptotic signal 이 올라감으로 neuron 들이 죽어나가는 것을 확인하였다.
결과 4. Opt-Cre CIC KO mouse and RNA-seq
  1. 추가로 Opt (orthopedia homeobox) promoter 이용하여 hypothalamic, medial amygdala neuron 에서 특이적으로 CIC를 KO 해보았다. 왜? 아직 이해를 못했..
  2. 행동실험에서는 특이적으로 social interaction 이 유의적으로 줄어들어 있었지만, Emxl1-Cre CIC KO와는 다르게 brain histological 하게 layer 두께가 줄어들거나 neuronal population 이 줄어 들어있지 않았다. 이상하군.
  3. Opt-Cre CIC KO 에서 좀더 분자적인 변화를 살펴보기 위해, RNA-seq 을 진행하였다.
  4. 여기서 가장 큰 문제는 CIC 가 Opt-Cre 에 없어진 hypothalamic, medial amygdala neuron 들만 sampling 해야한다. 그래서 TRAP 이라는 것을 이용하였는데, 이것은 Translating ribosome affinity purification 라는 것으로, 리보솜에 GFP 를 tagging 하는 기술이다.
  5. 그래서 TRAP을 Cre dependent 한 mouse line에 적용시키면, Cre 가 발현되는 Cell 만 특이적으로 GFP를 tagging 할 수 있고, 이러한 GFP 발현 되는 neuron 세포만 FACS 를 이용하여 쏙쏙 sorting 할 수 있다.
  6. RNA-seq 결과, Opt-Cre CIC KO mouse 의 neuron 들에서 123개 유전자가 control에 비해 발현이 올라갔고, 84개 유전자는 발현이 줄어들었다. 이 유전자들은 nervous system morphology, synaptic transmission 등에 관련된 유전자들이 었다. 그래서..?
결과 5. CIC mutations on patients with DD/ID, ADHD, ASD and seizures.
  1. ExAC DB 를 열어보면, CIC 유전자에 g.42796882G GC loss-of-function variant (frameshift) 가 높은 allele frequency (0.0002826; 34/120298) 를 보여준다.
  2. 즉, 건강한 60,149 사람들 중에서 European 30명, African 3명, Latino 1명이 CIC 유전자에 frame shift 돌연변이를 가지고 있다는 의미. 이 건강한 사람들은 어떻게 설명할 것인가? 논문에서는 sequencing, reporting error 혹은 low grade mosaicism 일 것으로 이야기한다.
  3. 실제로, 이 그룹에서는 총 5명의 CIC 유전자에서 de novo truncating mutation 을 가진 환자들을 찾았다. 5명 환자들 모두 DD/ID, ADHD, ASD, seizure 를 가지고 있었다.
  4. Family-2의 2명 proband는 genotyping 결과 germline mosaicism 으로 segregation 된것으로 발견되었다.
  5. Family-4 는 아빠가 mosaic (약 15%) 였는데, proband 만 het mutant allele를 가지고 있었고, 나머지 2명의 남동생들은 wild type allele 만 가지고 있었다.  개인적으로 Family-4 가 참 흥미롭다. 아빠의 sperm에 15% 정도가 CIC 돌연변이를 가지고 있는데, 우연히 15% 에 해당하는 sperm 을 첫째 아들이. 나머지 75% 정도 중에서 둘째, 셋째 아들이 우연히 받았다는 것. 불공평한 세상. 흑흑

궁금한 점 및 의문.
  1. 실제로 연구의 흐름이 이렇게 되었는지 궁금하다.
    • ASD 나 DD/ID를 가진 환자들의 WES 분석을 통해 CIC 돌연변이를 먼저 찾은 것인지.
    • 아니면, CIC KO mouse 표현형을 보고 환자를 후에 찾은 것인지.
  2. ExAC DB 를 열어보면, 논문에서 이야기한 돌연변이 말고도 추가로 7개 정도 Loss of function 돌연변이가 보고되어 있다 (5개 splicing, 1개 frameshift, 1개 stop gain). 이것은 정말 예외로 생각할 수 있는 것일까?
  3. gnomAD data를 열어보면… 헐!! 이게 왠일. 논문에서 말한 돌연변이를 포함하여 2개의 frameshift 돌연변이가 DB에서 사라졌다. 나머지 6개 돌연변이는 그대로 존재. 어떻게 해석해야 할까……?
  4. RNA-seq data가 주는 의미는? 단순히 DEG 몇개를 던져주었을 뿐, 더 이상의 정보를 제공해주지 않는다. 이러한 DEG  유전자들이 또 다른 candidate 라는 것?
  5. Mouse brain에 관련된 분자적인 실험 (IHC, IF 등) 이나 mouse behavior 실험은 정말 공부할 만한 논문이다.
  6. 하지만 분자적 매커니즘 스터디는 없는 것 같다. 예를 들어, 환자들은 de novo het mutation 이었다. 그렇다면 dominant negative mutation 으로 생각되는데, 나머지 allele 에서 만들어지는 CIC 단백질은 Atxn1 단백질과 complex를 이루어 행동하기에는 부족하다는 것인가? 등등. 궁금한게 많다ㅋㅋㅋ

Single cell 장인의 시리즈물 2탄: DroNc-Seq

Single cell 장인의 시리즈물 2탄: DroNc-Seq

DroNc-Seq: Deciphering cell types in human archived brain tissues by massively-parallel single nucleus RNA-seq.

이제서야 BioRxivFeedly에 추가하였다. 참 느리다 느려.. 추가하자 마자 보이는 논문에, CRISPR 장인 Feng Zhang님과 Single Cell 장인 Aviv Regev님이 보이시네. 바로 읽어봐야지 그럼. 이 두분에 대해서는 예전 Science 논문 리뷰하면서 올렸었으니 참고.

Aviv Regev, Ph.D.

Feng Zhang, Ph.D.

이 논문은, 지난 Science 논문의 sNuc-seq, Div-seq 을 한층 더 업그레이드 하여 ‘DroNc-Seq’ 이라는 것을 해봤다는 시리즈물. 진짜 대단하다 대단해.. 지난 sNuc-seq 에서는 FACs를 이용하여 mouse hippocampus에서 single nuclei를 sorting 하였었는데, 여기서는 Drop-seq 을 modify 하여 Single nuclei를 fresh, frozen tissue에서 sorting 하였음.. Drop-seq이 대세인듯? 지난 데이터에 비해서 Single nuclei의 갯수도 많이 늘어나긴 하였지만, 더 기쁜(?) 소식은 Adult human hippocampus 와 prefrontal cortex 데이터가 있다는점!

  • mouse cell line에서 4,442개 nuclei, adult mouse brain tissue에서 9,219개. Human frozen tissue에서 20,324 nuclei 를 뽑아서 RNA-seq 했으니까.. 약 30,000개 세포의 Transcriptome을 분석한 셈이네.. 대단하다 정말.
  • 이것 저것 DroNc-Seq의 sensitivity 분석도 하고. Clustering 분석도 하고. Marker 분석도 하고.. 이 논문은 어디에 나올까?

어쨌든, sNuc-seq 데이터 공개한 것 처럼, Single Cell Portal에 논문 publish 되면 data도 공개하겠지?

Novel 노다지: RNA modification.

Novel 노다지: RNA modification.

지난주 Nature (Volume 542, 23 February 2017) 에 RNA modification 관련 특집기사 2편과 m6A 관련 논문이 2편이나 실렸다. 특집 기사 제목의 Gold rush 라는 단어만 보아도 요즘 RNA modification 이 얼마나 주목을 받고 있는지 알 수 있다. 사실 RNA modification 은 지난 2016년 6월 Science에서 스페셜 이슈 (17 JUNE 2016, VOL 352, ISSUE 6292)로 다룬 적이 있어 대강 알고는 있었는데 최근에 정말 RNA modification 관련 (특히 m6A) 논문이 자주 보인다. 말 그대로 Gold rush 인 듯. 그래서 대강 m6a를 위주로 정리해 봄.

  1. 빅가이 of RNA modification (m6a) 아니 왜이렇게 중국인이 많아..다들 미국계인가..

    Chuan He (The University of Chicago)

    Tao Pan (The University of Chicago)

    Samie Jaffrey (Weill Medical College of Cornell University)

    • Gideon Rechavi (Tel Aviv University, Israel
    • Andrew Xiao (Yale University)
  2. N6-methyladenosine on RNA (m6A) 가 뭐임?
    • DNA의 cytosine에 methyaltion이 되는 것처럼, RNA의 adenosine에도 methylation이 된다.

      Structure of N6-Methyladenosine. (Wikipedia)

      Structure of N6-Methyladenosine. (Wikipedia)

    • 1974년. Fritz Rottman (organic chemist at Michigan State University in East Lansing)에 의해 처음 보고됨. 첫번째 저자인, Karen Friderici 는 현재 geneticist at Michigan State University. 1974년에 처음 밝혀진것이 30, 40년 지나서 주목을…받는다는건..정말..ㅠㅠ
  3. m6A mapping. m6a가 어디어디 생기나?
    • 약 12,000개 methylation site on mRNA (약 7,000개 gene): 중요한 논문들. PMID: 22608085,PMID: 22575960 (2012), PMID: 26121403 (2015)
    • 요 논문들 좀 읽어보면, 보통 3UTR 시작점, exon 마지막 termination codon에 m6a가 집중적으로 모여 있음.
  4. m6A machinery and function
    1. writer: WTAP, METTL3, METTL14
    2. eraser: FTO, ALKBH5
    3. reader: YTHDF2
    4. 아직까지 정확한 기능은 모르지만, RNA의 splicing, translation, stability에 영향.
    5. 확실한 것은, cell differentiation에 매우 중요. m6A writer KO mouse는 embryo 단계에서 죽음.
  5. m6A가 RNA만 되는 것은 아니다!
    1. DNA methylation 하면  모두가 알고 있는 5-methylcytosine (5mC). 이것은 이제 A,C,T,G 기본 염기 다음으로 5번째 염기 (base)라고도 불린다고 함.

      DNA methylation

      DNA methylation

    2. (하지만 이것 말고도!) 박테리아에서는 DNA에서도 6mA가 있다는 것을 오래전에 발견되었다고 함. (DNA의 adenosine에 methylation 되는 것은 6mA으로 표시)
    3. 2013년. Algal DNA에서도 6mA가 발견되었음 (PMID: 99431). 하지만 이들의 function은 아무도 모름.
    4. 2015년. Cell 에 시리즈로 발표된 것이 C.elegans, Chlamydomonas, Drosophila의 DNA에서도 6mA 가 있다는 보고가 나옴. (PMID: 25936839, PMID: 25936837, PMID: 25936838)
    5. 2016년. Nature에 mouse embryonic stem cell 에서도 6mA 가 있다는 논문이 나옴. (PMID: 27027282, Andrew Xiao lab, Yale)
  6. m6A이 아닌 다른 것들도 있나? 당연히 있지
    1. N1-methyladenosinem (m1A) 도 RNA의 adenosine에 된다고. (PMID: 27745969)
    2. m6Am 이라는 것도 mRNA의 5’ cap쪽에 나온다고. (PMID: 28002401)
  7. 결론 + 새롭게 알게 된 사실
    • 아직까지 m6A 자체의  기능은 많이 알려지지 않았음. 아직 할일이 많이 있다!
    • DNA에서도 m6A가 있다! 여기서 아이디어 얻어도 뭔가..
    • 다양한 species 에서 m6A 가 사용되고 있는 것을 보면 정말 중요한 factor 인것 같음ㅎ

m6a. 너 쭉쭉 계속 지켜보겠어.

lncRNA와 Pseudogene.

lncRNA와 Pseudogene.

이번주 Nanture online에 publish된 재미있는 논문 2개.

Peoples

2개중에서 하나는, Eric Lander 랩에서 나왔다. Eric Lander님은 현 Broad Institute of MIT and Harvard 의 director. 대학교때, MIT 에서 공짜로 오픈해준 “Introduction to Biology (open course)” 강의에서 genetics 파트를 강의해 주셨었는데.. 재미있게 해주셨던 기억이 있음. 덩치도 크고 콧수염도 나고… ㅋㅋ 그래서 그런지 그냥 동네 아저씨 같은 느낌이 있었는데.. 알고보니 엄청난 대가였음.

Eric Lander President and Director, Broad Institute of MIT and Harvard

Eric Lander President and Director, Broad Institute of MIT and Harvard

그것보다 논문의 1저자인 Jesse M. Engreitz 보고.. ㅎㄷㄷ. 현재 Eric. Lander 밑에 있는 포닥님이신데, Cell, Science, Nature  (CNS) 모두 달성하셨음. 심지어 2016년에 Eric. Lander 님과 책임저자로 Science에 논문도 내셨…어…헐..! 넓게는 gene regulation에 관련된 연구를 하고 있는 것을 보임. 당장 feedly에 추가해야겠다..근데 얼굴도 잘생겼어..으아.. 나중에 어디 교수님으로 가실랑가.

Jesse Engreitz

Jesse Engreitz

Papers

  • “Pseudogene 이 제대로 된 단백질을 만들어 낼수도 있어..”: Olfactory receptor pseudo-pseudogenes. Lucia L. Prieto-Godino, Raphael Rytz, Benoîte Bargeton, Liliane Abuin, J. Roman Arguello, Matteo Dal Peraro & Richard Benton. [Link]
    • Pseudo라는 말은 가짜라는 뜻. 그러므로 pseudogene은 짝퉁 유전자. 짝퉁 유전자는 우리가 기존에 가지고 있던 유전자에 nonsense 돌연변이 혹은 frameshift 돌연변이가 축적(?)이 되면서 제대로 된 기능을 가진 단백질을 만들어내지 못하는 유전자. 그냥 보통 junk라고 생각함.  Premature termination codon (PTC) 라고 해서, 이 돌연변이가 생기면 “단백질 그만 만들래?”라는 signal을 주게 되고,  결국 그 단백질은 … 중간에 다 안만들어지고.. 삐꾸가 나옴..
    • 하지만 초파리의 어떤 특정 신경세포 (olfactory sensory neuron)에서만! 기능적인 단백질이 만들어지고 특정 odour에 대한 기능을 가질수 있게 한다는 것을 발견함.. ㅎㄷㄷ.. 한마디로 특정 신경세포에서만 PTC signal 무시하고 올바른(?) 단백질을 만들어 냄. 그리고 기존과는 조금 다르게 특정 odour에 대한 기능을 부여한다고…
    • 감상: WES 분석을 통해 발견한 돌연변이는 보통 우리 몸 어디에나 존재하는 돌연변이인데, 왜 그 돌연변이들은 특정 phenotype만 만들어 낼까? 라는 질문이 있었다. 뭐 당연히.. “돌연변이가 있는 그 유전자가 만들어내는 단백질이 특정 tissue에서만 발현이 되겠지..” 라고 생각해 볼수도 있겠지만, 이 논문에 나온 것처럼 특정 tissue에서는 그 돌연변이를 무시하고 function 이 있는 단백질을 만든다는 것을 보면. 뭔가 우리가 모르는 매커니즘이 있는 것 같음. 신기방기한 재미있는 논문.

 

  • “Long non-coding RNA (lncRNA)가 가깝게 위치한 주변 유전자의 transcription에 주는 영향”: Local regulation of gene expression by lncRNA promoters, transcription and splicing. Jesse M. Engreitz, Jenna E. Haines, Elizabeth M. Perez, Glen Munson, Jenny Chen, Michael Kane, Patrick E. McDonel, Mitchell Guttman & Eric S. Lander. [Link]
    • 어떤 lncRNA promerter 를 지워봄 -> 이상하게도 가까이 있던 다른 유전자의 발현이 안돼.. (당연히 lncRNA 자체도 발현이 안됨) -> 그래서 promoter는 살려두고 lncRNA만 지워봄 -> 옆에 있던 다른 유전자의 발현이 잘됨. -> 이 Promoter는 기존에 알려진 enhancer 마커는 없었음. -> 아마도 이 promoter가 다른 유전자의 enhancer와 같은 역할을 할것으로 생각됨. 아니 기대됨. 아니 아직 몰라.
    • 감상: 읽을때는 짱잼. 꿀잼이었는데, 논문이 12개 loci lncRNA만 테스트 하고 있다. 부족해도 많이 부족하지 않나..? 그래도 Eric. Lander 님이니까.

 

Div-Seq?

Div-Seq? 이것보단 ‘biSNE’가 더 중요?

Facebook Broad Institute Page에 좋아요를 눌렀더니 Science에 논문 나왔다고 자랑. 누구인가 살펴봤더니 그동안 너무너무너무 자주 뵈었던 두분이 계시길래 바로 정독.  바로 Aviv Regev님과 Feng Zhang님! 논문 주제도 요즘 많이 보이는 Sing cell RNA-seq에 관한 것인데, 좀 더 specific하게 proliferation 되어지는 세포만 target한다는 것이 주된 내용. 그냥 한마디로 새로운 시퀀싱 기술. 하지만 더 관심이 가는건 biSNE라는 clustering  분석 방법…ㅋㅋ

Peoples

이 두분은 연구실에서 저널클럽을 하면서 높은 빈도로 논문에 이름이 보이거나 책임저자든 공동저자든  우리들의 입에서 자주 오르내리던 님들이 아닐까 생각된다. 그만큼 impact 있는 연구도 하시고.. 논문만 나오면 Nature나 Science니 ㄷㄷㄷ 저널클럽을 준비하는 대학원생에겐 자주 보일수 밖에.. 두분 다 Broad Institute에 계시고 Aviv Regev님은 HHMI에 라는 것과 CRISPR 장인 Feng Zhang라는 것만으로도.. ㅎㄷㄷ

https://www.broadinstitute.org/about/core-members/aviv-regev

Aviv Regev from Broad Institute

https://www.broadinstitute.org/history-leadership/scientific-leadership/core-members/feng-zhang

Feng Zhang from Broad Institute

정리.

  1. 한계
    • 현재 많이들 하시는 Singcell RNA-seq (scRNA-seq)은 Enzymatic Tissue dissociation을 해야 하기 때문에 neuron의 integrity 혹은 RNA content에 영향을 줄 수 있음. 그렇다네요..
    • 성인의 뇌에서 새롭게 만들어지는 neuron들은 잡아내기가 어려웠음. 왜? adult neuron은 cell-tagging이 부족하고, dynamic하게 진행되는 neurogenesis와 같은 과정에서 phase별로 새롭게 만들어지는 neuron 세포들만 특이적으로 isolation 하기가 어려웠어. 간단하게 말하면, 분석해야할 재료가 쉽게 망가지고 정말 희귀한 세포들은 잡기가 어렵다는것. 아아아 누가 몰라 다 알지. 못할뿐이지..
  2. 가설
    • Neuron의 integrity 혹은 RNA-content에 영향을 안주려면? sNuc-Seq을 이용하면 되잖아!
      •  sNuc-Seq은 Enzymatic tissue dissociation를 진행하지 않기 때문에 neuron 세포를 망가트리지 않고, Fixation과 원심분리를 이용해 세포의 핵!!!만 분리해 내는 기술. 그렇게 분리된 nuclei들 중에서 FACS를 이용해 딱 하나만 쏙!! 빼내서 RNA-seq 고고.
    • Adult에서 새롭게 만들어진 희귀하신 세포만 어떻게 뽑아내지? EdU labeling 하면 되잖아?
      • EdU (5-ethynyl-2′-deoxyuridine)는 Click이라는 화학물질을 이용해 새롭게 합성되는 DNA나 지금 막막막 분열하고 있는 세포에  쏙쏙 들어가서 labeling이 된다고 합니다. 결국 요렇게 표지가 된 세포는 Edu를 처리한 시점이후로 새롭게 만들어진 세포라는 것.
    • 그래서, sNuc-Seq + EdU labeling = Div-Seq 이라는 공식아닌 공식 말입니다. 사실 이것만 이해하면 이 논문 그냥 끝난 것 같습니다. 이후로는 “이거 이용하면 지금까지 할 수 없었던 일들을 할 수 있더라..”전형적인 method 논문ㅋㅋ
  3. 증명
    • Adult mouse hippocampus에서 1,367개정도의 세포를 위에 방법대로 일단은 sNuc-Seq 분리해서 분석해보니, 정말 깔끔하게 clustering되고, hippocampus의 subregion에 따라서도 데이터가 잘 나눠지는 것을 보여주었습니다.
    • 여기서 한가지 제가 궁금했던 분석은 biSNE라는 새로운 clustering 분석이었습니다. 논문 결과보다 이걸 지금 당장 해보고 싶은 마음뿐..ㅋㅋ 지금까지 많이 보여지던 PCA, MDS와 같은 clustering 분석을 사용하지 않고, ‘biSNE (biclustering on Stochastic Neighbor Embedding)‘라는 분석을 사용했는데.. 논문에서는 single cell 특이적으로 사용해야한다라는 언급이 없는 것을 보면, 일반적인 RNA-seq 데이터 분석에도 사용해도 될 것 같음. 구글신께 물어봐도 아직은.. 잘 안나옴..
    • 그리고 이제 EdU labeling 까지해서 그럼 이번엔 Div-Seq DG와 SC neuron에 적용을 해보았습니다. 당연히 이곳에는 ‘시간‘ 개념이 들어가겠죠. 신경 줄기세포인 stem-cell에 EdU labeling을 하고 각각 2일, 4일, 6일, 7일, 14일 후에 Div-Seq을 진행해서 어떻게 유전자들이 행동하는가를 살펴봤습니다.
    • 예상대로 새로운 세포가 생겨나는 초기에는 Proliferation, Differentiation 관련된 유전자들이 행동하다가 점점 Axonogenesis, neural development. 나중에는 Synaptic 관련 유전자들이 행동하는 것을  깔끔하게 보여주었습니다. 그리고 DG와 SC neuron에서 나온 데이터를 비교해 같이 행동하는 유전자 혹은 다르게 행동하는 유전자들이 무엇이 있는지 분석해 보았습니다. 사실 여기는 그냥 confirm 하는 정도 분위기라서 그렇게 자세히 나오진 않은듯..
  4. 결론
    • Div-Seq 이용하면 Singcell level로도 RNA-seq 데이터 아주 깔끔해!
    • Neurogenesis와 같은 다이나믹한 과정도 Div-Seq 이용하면 잡아낼 수 있어!
    • biSNE clustering이라는 분석방법을 새로 만들었어. 한번 써봐.

개인적으로 내가 neuron 세포 하나만 분리해서 RNA-seq을 해야할 때가 있을지 모르겠다..

하지만 여기서 사용된 biSNE clustering이라는 분석을 사용하게 될때가 훨씬훨씬훨씬 많을것 같다. 다른 것 모르겠고, 저거 빨리 R package로 나왔으면….ㅋㅋㅋㅋ

커지는 심장! 내가 막아주마.

커지는 심장! 내가 막아주마.

요몇일 잡생각에 연구도 집중이 안되었는데.. 오늘은 유난히 일이 손에 잡히질 않았습니다. 동기부여를 위해 2016년을 시작하면서 꼭 해내리라!!  다짐한 여러가지 목표를 생각해 보았습니다.  그중에서 가장 어려워 보이는.. 목표인 “진행중인 프로젝트와 전혀 관련 없는 최신 논문 읽기. (2-3 papers/week)” 라는 목표가 있더군요.. 역시나 2016년 한달이 지난 지금..흐엉..  더 분발해야겠다능..

그래서 오늘 논문을 살펴보았습니다. 읽다보니 진행하고 있는 프로젝트와 전혀 연관성이 없는 것은 아니었습니다. 접근법도 다르고 결과도 다르지만, 그래도 결국 비슷한 심장질환에 관련된 논문이었습니다.

Peoples

지난번에 Eric N. Olson 그룹에서 나온 science 논문을 review 했었는데, 오늘은 Harvard Medical School (Departments of Genetics)에 계시는 Christine E. Seidman 그룹에서 나온 science 논문입니다.

Christine Seidman, M.D. Professor/P.I. (cseidman@genetics.med.harvard.edu)

Seidman님은 Hypertrophic cardiomyopathy (HCM, 비후성 심근변증), Dilated cardiomyopathy (DCM, 확장성 심근병증)이라고 조금만 구글링만 하다보면 금방 찾을 수 있는 대가이십니다. 특히 TBX5, NKX2.5라는 Transcription factor 에서 돌연변이가 생기면 선천성 심장 결손 (congenital heart defects (CHD))이 생긴다는 것을 발견하신.. 정말 ㅎㄷㄷ하신 분이셨습니다. 연구실 홈페이지에 들어가보면 Jonathan Seidman 교수님도 같이 나오시는데.. 부부 이신 것 같음.

Jonathan Seidman, Ph.D. Professor/P.I. (seidman@genetics.med.harvard.edu)

Seidman Lab의 연구분야는,

  • 심장질환의 genetic etiologies를 찾고, myocyte의 생물학적 매커니즘을 파서!!!!! 새로운 치료법을 찾고자.. 노력하시는 대가이십니다. HCM와 DCM에 관련된 많은 논문들을 내셨더군요.

Diseases

이번주 science에 발표된 논문은 HCM에 관련된 내용인데, HCM는 고혈압이나 대동맥협착과 같은 factor 없이 심장의 좌심실벽이 두꺼워지는 유전질환으로, 보통 성인 500명당 1명에서 발견된다고 합니다. 정상보다 비대해진 심장은 결국 “hyperdynamic한 수축과 비정상적인 relaxation”을 주게 되고, 결국 stroke, heart failure 등으로 인해 사망에 이르게 하는.. 무서운 질병입니다.

Hypertrophic cardiomyopathy from Mayo Clinic

그리고 논문 서두에 보면 현재까지는, HCM을 치료하고자 하는 drug들은  beta-adrenergic receptor 나  calcium channel을 non-specific하게 target 한다고 합니다. 비록 비정상적으로 activation 되어있는 heart에 잠깐의 relief 효과를 줄수는 있지만, 전체적인 disease progression을 막을 수는 없다고 합니다. 이런말을 하는 것을 보면 자신들이 발견한 것은 가능하다는 것을…보여주기 위함?!

현재까지 HCM과 연관되어 가장 많이 알려진 유전자는 아래 2개로 알려져 있습니다.

  • MYH7 (beta-cardiac myosin heavy chain): 대부분의 missense 돌연변이가 MYH7 단백질의 globular motor domain, head-rod junction region, rod domain에 위치하고 있다고 합니다.
  • MYBPC3 (myosin-binding protein C): MYH7과는 다르게 MYBPC3의 돌연변이는 보통 truncated protein을 만드는 nonsense 돌연변이가 많다고 합니다.

Introduction: 마우스 모델과 중요한 단서들.

  1. HCM mouse 모델
    • mouse model에서는 alpha-cardiac myosin heavy chain gene 에 돌연변이가 있는 TG를 사용하였습니다. 앞서 말씀드린, Human에서 많이 발견되는 beta 형태와는 다르기는 하지만, 92% 정도 동일한 단백질이고 adult mouse의 좌심실에서 predominant하게 발현된다고 합니다.
    • 무엇보다 R403Q, R453C, R719W의 3가지 돌연변이를 가진 mouse는 사람의 HCM heart와 morphologic, functional feature가 동일하다고 합니다.
  2. 중요한 단서
    • 이전의 여러 연구에서 HCM mouse 모델 샘플, 사람의 HCM 샘플과 in vitro level에서 돌연변이를 발현시켜 보면,
      1. ATPase activity 증가.
      2. tension development 증가.
      3. unloaded actin-filament sliding velocities 증가.
    • 아마도 이것은 앞서 말씀드린 hyperdynamic하게 나타나는 HCM 환자의 심장 모습을 분자적으로 설명해주는 단서이겠죠.
    • 이외에도,
      1. profibrotic 유전자의 발현 증가.
      2. extracellular matrix 단백질 증가.
      3. 돌연변이 근절의 hyperdynamic biochemical properties 증가.
    • 전체적으로 hyperdynamic한 모습을 보이는데, 어떤 몇몇의 환자에게서는 아마 다른 돌연변이를 가진 위의 여러가지 분자적인 phenotype이 오히려 감소하기도 한다고 합니다. 결국 돌연변이별로 phenotype이 다르게 나타내는 것.
  3. 중요한 질문: ” HCM 환자에게서 발견되는 돌연변이가 분자적으로 sarcomere power output을 일으키는가?”
    • 이 질문에 답하기 위해 시도한 것이 “discovery small molecule” 이었습니다.
    • 즉, HCM이 발병하는 primary defect가 과도한 sacomere power에서 오는 것이라면, 그 power를 특이적으로 억제시켜줄 무언가 (small molecule)를 찾는다면 커져버리는 심장, 세포적인 불균형, myocardial fibrosis등을 회복시킬수 있지 않을까? 라는 가설을 세운 것입니다. 대단해..
  4. 이러한 sarcomere의 power output은 어디서 오는 것인가?
    • Myosin heads along with Actin filaments

    • sacomere의 전체적인 power output은 작은 myosin head (녹색)가 actin filament(보라색)를 따라 움직이는 속도에 따라 만들어지는 힘이 합쳐져서 나타나게 되는데, 어떤 “무언가”가 이러한 ensemble force의 생성을 억제하여 주기를 기대하였습니다. 그리고 여기서 중요한 역할을 하는 것이 그림에는 보이지 않지만, ATP >> ADP 작업을 수행해주는 “ATPase”입니다.
  5. Chemical screening과 그 “무엇”.
    • 앞서 말씀드린 myosin ATPase의 total cycle time이 늘어나면 전체적인 power가 줄어드는 현상을 이용하여 in vitro level에서 myosin ATPase의 maximal total cycle time을 늘려줄 그 “무언가”를 찾고자 하였습니다.
    • 바로 “무엇”은 MYK-461라는 chemical 이었습니다.
    • MYK-461을 구글링을 해보니, MyoKardia라는 심혈관 질환 전문 제약회사에서 만든 agent였습니다. 이미 2015년 3월에 clinical trial phase1을 시작한다고 발표했었네요 (관련기사).
    • MyoKardia 라는 제약회사의 founder를 찾아보니 역시나 Seidman 교수님을 비롯 네분이 계셨습니다. 그중에서 Seidman 교수님의 남편 교수님도..ㅎㅎ 어딜가나 항상 같이 나오심.

자, 이제 MYK-461 좀 써볼까?

여기서 부터는 아주 명확해 집니다. 결국 모든 내용이 hypertrophic한 심장을 MYK-461이 잘 고쳐주더라.. 라는 내용입니다.

  1. In vitro level test:
    • Mouse 심장 myofibrils를 떼어내어 MYK-461을 쳐봤더니 ATPase rate가 최고 90% 정도까지 떨어져서 ATPase의 cycle time을 조절할 수 있음을 확인하였고.
    • Adult rat 심장의 muscle fibers를 떼어내어 MYK-461을 쳐봤더니 근육의 tension level도 70%정도 까지 떨어졌습니다.
  2. In vivo level test:
    • mouse age 6-15 weeks :
      • 정상쥐와 각각의 R403Q, R453C, R719W 돌연변이를 가진 HCM 모델 쥐에 MYK-461을 하루에 2.5mg/kg 정도로 물에 타서 먹여보고, 2-4주 간격으로 심실 크기, 작아지는 크기 등을 살펴보았습니다.
      • 정상쥐와 HCM 모델 쥐 모두 심장 근육이 작아지는 모습을 보였습니다.
      • 논문을 읽으면서 들었던 생각이 “MYK-461이 skeletal 근육세포 말고 심장 근육에만 특이적으로 작용하는가?” 였습니다. 역시나 적은 affinity로 skeletal 근육세포에도 영향을 주긴 했지만,  grip strength, voluntary exercise capacity 에는 문제가 없었다고 하니 부작용도 그렇게 커보이진 않습니다.
    • mouse age 8-15 weeks :
      • 좀더 나이가 든 pre-hypertrophic HCM 모델 mouse를 사용하여 확인해 보니, LVWT (Left Ventricle Wall Thickness; 좌심실 두께)가 줄어든 것을 확인했습니다.
    • mouse age 30-35 weeks:
      • 이제 진짜 pathologic model 에서도 MYK-461이 회복을 시켜줄지.. 테스트하는 중요한 실험인데 심장이 확실히 예전 모습으로 돌아가는 것을 보여주었습니다. Figure를 보면 MYK-461을 친것은 방향성을 가지고 정렬된 모습을 보이지만, 약을 치지 않은 샘플에서는 어지럽게 깨져있는 모습을 보였습니다.
      • 이런 저런 실험중에 중요한 실험이 있었는데, ‘Hypertrophic한 증상이 나타난 후에 MYK-461을 주면 fibrosis가 그렇게 줄어들지 않았다는 것’입니다. 이건 아무래도 당연한 듯 하지만 hypertrophy 증상이 시작되기 전에 약을 투여한다는 것을 의미하는 것 같다고 논문에서 이야기합니다.

MYK-461, 누구랑 같이 움직임?

이제 MYK-461 어느정도 hypertrophic phenotype을 줄여주는 것을 이렇게 저렇게 확인을 했는데.. “어떤 유전자의 발현을 조절해서 이렇게 대단한거니? ” 이 질문에 답하기 위해 개인적인 생각으로 왜 RNA-seq을 안했을까..? 라는 생각이 들지만. R403Q, R453C 돌연변이를 가지고 있는 mouse와 WT에서 expression이 중요하게 차이가 나는 200개 유전자만 보았다고 합니다. 근데 뭐. 그렇게 꼭 집어서 뭐가 중요하다고 이야기 하지는 않는 것 같습니다. 사실 자세히 안읽어 봄.ㅎㅎ

Final summary

  1. 이미 우리는 clinical trial phaseI 을 진행하고 있는 MYC-461이라는 것을 개발했어.
  2. 그리고 돌연변이로 인해서 cardiac hypertrophy를 가진 mouse 모델에서 잘 적용되는 것을 확인했어.
  3. 좀만 기달려. 이제 금방 HCM을 정복할 수 있을거야.

최근에 Stanford에서 강연을 하신 Seidman 교수님의 영상이 Youtube에도 올라와 있습니다. 이번 science에 발표한 논문 내용도 마지막에 잘 정리해줍니다.ㅎ

A small-molecule inhibitor of sarcomere contractility suppresses hypertrophic cardiomyopathy in mice. Science  05 Feb 2016: Vol. 351, Issue 6273, pp. 617-621 DOI: 10.1126/science.aad3456 [link]