본문 바로가기 주메뉴 바로가기

바이오생물연구분야

국가과학기술 정보인프라의 중심, KREONET

GENOME/BIO

바이오분야는 전 세계적으로 분산된 정보를 빠르게 송수신하여 DB화하고 지식화 정보화하는 것이 매우 중요합니다. 또한 글로벌 유관기관과의 공동연구와 사이버 연구공간의 마련은 해당연구의 경쟁력 확보를 위해 매우 중요한 요소입니다.
초고속의 첨단연구망을 통한 데이터의 전송과 컴퓨팅 자원의 효율적인 활용 그리고 빠른 연구결과의 분석은 치열하게 경쟁하는 바이오분야의 국제 경쟁력이 될 것입니다

  • 350TB

    전송테이터(년간)

  • 20

    논문발표(SCI)

  • 30

    협력기관

  • 13

    연동기관 수

  • 연구내용

    강북삼성코호트 자료를 토대로 유전체 데이터 구축을 통해 연구 성과를 도출

    강북삼성코호트는 2009년 존스홉킨스와 국제협력체계를 바탕으로 100만건 이상의 건강 정보를 이용하여 세계적 연구 업적을 발표하고 있음
    강북삼성코호트를 통한 건강한 성인의 유전체 데이터 구축

    • 2,000명 GWAS용 250k SNP
    • 1,500명 gut metagenome
    • 1,500명 blood metagenome
    • 100명 whole genome

    유전체 관련 다양한 임상 연구를 위한 환경을 조성

    활용내용

    이대 김형래 연구팀에서 생산한 유전체 데이터 전송

    • 총 42TB 전송
    데이터중심
    • 첨단망 활용연구 효율성 효과

      50%이하
    • 전송량

      42TB
    • 참여연구원

      12명
    ICGC 유전체데이터분석 논문
  • 연구내용

    국제 컨소시엄 및 국내 유전체 유관 기관 협력을 통한 인간 범암 전장 유전체 데이터 분석

    • ICGC/TCGA 등 국제 공동 연구 컨소시움 데이터 분석
    • mitochondrial genome이 종양에서 변하는 양상 규명
    자세한 내용은 하단에 있습니다
    Figure2 (a → b → c → d → e)
    • a. Individual driver discovery methods
      • Mutational burden : Active Driver WGS, Composite Driver, DriverPower, dNdScv, ExInAtor, LARVAPlus, MutSig suite, NBR, ncdDetect, ncDriver, OncodriveFML, regDriver
      • Clustering
      • Functional impact: Distal TF binding site, Promoter
    • b. Correlation estimation

      DrivePower,MutSig, dNdScv, oncodriveFML_cadd, oncodriveFML_vest3, mcDriveConservation_snv, ncDriverConservation_indel, ncDriverCancerType_snv, ncDriverCancerType_indel, ncdDetect, ExInAtor, NBR, ActiveDriverWGS

      Burden, Clustering, Functional impact

      Correlation

    • c. Integration of methods

      CompositeDriver, ncdDetect, oncodriveFML_vest3, ExInAtor, ActiveDriverWGS, MutSig, LARVA, DriverPower, oncodriveFML)cadd, NBR, dNdScv, ncdDriverConservation_indel, ncDriverConservation_snv →

      Integration: TP53, EGFR, PTEN, IDH1, RB1, PIK3CA, ATRX, SLC30A3, EEF1A1, ERCC4

      -log10 p : 0, 5, 10, 15

    • d. Post-filltering of candidates

      TP53, EGFR, PTEN, IDH1, RB1, PIK3CA, ATRX, SLC30A3, EEF1A1, ERCC4 →

      #mutations, #patients, Sequence properties, Signatures →

      TP53, EGFR, PTEN, IDH1, RB1, PIK3CA, ATRX, ERCC4

    • e. False dicovery rate correction

      가로: Cohorts, 세로: Elements

      IncRNAs, Promoters, Coding genes

      Coding genes → Lists of significant elements (TP53, EGFR, PTEN, IDH1, RB1, PIK3CA, ATRX, SLC30A3, EEF1A1, ERCC4)

      *: Significant, -: Near-significant

    국제공동연구 자료

    활용내용

    국제 암 유전체 컨소시움(ICGC) 연구 활동 참여

    • 국제 암 유전체 컨소시움에 폐암 데이터 전송
    • 국제 암 유전체 컨소시움 전장 유전체 데이터 수신
    데이터중심
    • 첨단망 활용연구 효율성 효과

      100%이상
    • 참여연구원

      4명

    지원내용

    2,000여 명 이상의 인간 범암 유전체 자료의 mitochondrial genome 변이를 검출과 공동네트워킹 데이터 공유 지원
    30여개 종류 이상의 tissue sample에서 얻어진 전장 유전체 자료를 사용하여, 각 암종에서 mitochondrial genome의 숫자가 변화하는 양상과 인간의 다양한 정상 tissue 조직에서 mitochondrial genome 데이터의 공유

    자세한 내용은 아래에 있습니다.

    첨단망 연결현황(구성도)

    스위치 1G, 48P

    • KISTI 광망 1G
    • 서버 랙 1
    • 서버 랙 2
    • 센터 네트워크 1G
    첨단망 연결현황(구성도)
  • 연구내용

    국내 협력연구
    • WGS 기반의 공기관 협력을 통한 플랫폼 구축 및 분석 서비스(유전체 팜) 운영
    • 통합유전체자원 및 인적자원 컨소시엄을 통한 협력체계 구축
    만성질환 발병요인의 탐색협력연구
    • 만성질환 염증의 원인으로서 조직내 미생물의 존재를 WGS unmapped data로부터 추출 분석
    국제협력연구 지원
    • ICGC -TCGA 협력 프로그램인 PCAWG Data의 송수신을 통한 개방형 국제협력 연구
    • 장미생물 유전체 GWAS연구 MiQTL consortium협력연구
    대형 유전체 데이터 중심의 개방 협력연구
    • WGS 유전체자원, 글로벌 협력연구 운영체계 및 클라우드 플랫폼 경험을 국내 HPC 유전체 공공 연구기관에 정착시킴으로 연구자원의 활용과 확산

    활용내용

    국내 협력연구
    • 국내연구진 간 WES 기준 2만개 이상의 NGS가공 데이터 송수신
    • 국립보건연구원 CODA로 통합 데이터의 이전(WES 기준 2만개)
    • KISTI 첨단 연구망을 기반으로 한 유전체 데이터의 원격 분석 협업
    첨단망 연결현황(구성도)
    국외 협력연구
    • 비만·고지혈유전체국제컨서시엄(GLGC) 및 메타지놈·QTL컨서시엄의 데이터 전송을 통한 국제공동협력연구(각 25, 17개국협력)
    데이터중심
    • 첨단망 활용연구 효율성 효과

      100%이상
    • 전송량

      100TB
    • 참여연구원

      4명

    지원내용

    KREONET활용
    • 국내 국비에 의해 생산된 유전체자료의 공유협력연구를 위해, KISTI GSDC의 HTC에서의 가공 및 송수신 참여연구진의 확산(7개에서 9개 기관: 총 5천건의 유전체데이터 공유 분석 가능)
    • 국비로 생산된 유전체데이터의 분야 및 개방협력을 위한 국립보건연구원의CODA와 대용량 데이터 송수신(총 3천건)
    GLORIAD활용
    • 국제암컨서시엄 (I C G C )와 미국 암연구수TCGA와의 공동프로그램인 PCAWG 프로그램에서 국제적으로 공유되는 5,800개의 암유전체데이터의 공유
    • 비만·고지혈유전체국제컨서시엄(GLGC ) 및 메타지놈·QTL컨서시엄의 데이터 전송
  • 연구내용

    한국인 표준 게놈을 활용한 ICGC 유전체 데이터 분석

    가족 유전체 분석을 활용한 한국인 반배체 분석을 통해 한국인에 특이적인 유전 변이와 유전적 지표발굴
    한국인 표준 게놈 지도를 활용하여 ICGC 데이터를 분석함으로써 종양에 관련되어 한국인에 특이적인 유전 변이와 유전적 지표 발굴

    활용내용

    비암 가족 ICGC 시퀀싱 데이터 다운로드
    • 비암 가족 WGS 데이터
    • ICGC-TCGA 유전체 데이터
    데이터중심
    • 첨단망 활용연구 효율성 효과

      50%이하
    • 전송량

      69.5TB

    지원내용

    한국인 표준 게놈 지도를 활용하여 ICGC 데이터를 분석을 위해 유전체 공동연구그룹간 데이터 송수신 지원

    • 이화여대 37명 가족 데이터 bam, fastq 파일 다운로드(14.5TB)
    • kisti ICGC data 다운로드(55TB)
  • 연구내용

    연구 목적
    • 다양한 뇌질환 군에 대한 데이터 분석 시스템 운영
    • 국가 과학기술 연구망을 이용한 데이터 처리 및 전송 서비스 제공
    주요내용
    • 다양한 뇌질환 영상 데이터의 수집: 국내 각 병원에서 진행되고 있는 알츠하이머 치매, 파킨스 병, ADHD 등의 다양한 뇌질환 연구에 공동연구자로 참여
    • 대용량 다중 뇌 영상 데이터를 통한 복합적 연구수행: 다양한 뇌질환 영상 데이터 분석을 위해 structural MRI 영상을 활용한 대뇌 피질 두께의 분석, 뇌 하부 영역의 부피 분석, 확산 텐서 MRI 영상을 이용한 신경섬유 영상 분석, Functional MRI 영상을 이용한 뇌 기능 관련 신호의 분석 및 각 영상들의 조합을 통한 multimodal 분석 등 수행
    • 첨단망을 통해 획득 및 처리한 자료에 대한 국내외 연구자 공유 및 공동연구: 각 기관에서는 효과적으로 처리 및 분석 할 수 없는 대용량 다중 뇌영상 데이터를 첨단망을 통해 획득 및 분석 후, 결과 데이터 전송

    활용내용

    • 국내: 서울 삼성병원, 보라매병원, 서울대병원, 인하대병원, 한양대병원, 연세세브란스병원 등 국내 다양한 병원 및 연구단체들과 공동연구를 통해 협업
    • 국외: 캐나다 McGil University에서 개발하고 북미, 유럽이 참여하고 있는 GBRAIN 프로젝트에 참여하여 고속망인 KREONET을 통하여 세계 다른 지역 GBRAIN 프로젝트 그룹과의 데이터 관리 공조 및 데이터 전송 환경 이용
    KREONET 1Gb 망을 활용한 뇌영상 분석 연구 활동 - BigBrain(2)
    데이터중심
    • 첨단망 활용연구 효율성 효과

      50~100%
    • 전송량

      13.8TB
    • 참여연구원

      10명

    지원내용

    국내외의 다양한 연구기관과 글로벌 공동 연구 가운데 고해상도 MRI데이터의 고속 전산 처리를 위한 지속적인 데이터 전송 및 분석 처리

    국내 연구기관

    서울 삼성병원, 보라매병원, 서울대병원, 인하대병원, 한양대병원, 연세세브란스병원 등 국내 다양한 병원 및 연구단체들과 공동연구를 통해 협업

    국외 연구기관

    캐나다 McGil University에서 개발하고 북미, 유럽이 참여하고 있는 GBRAIN 프로젝트에 참여하여 고속망인 KREONET을 통하여 세계 다른 지역 GBRAIN 프로젝트 그룹과의 데이터 관리 공조 및 데이터 전송 환경 이용

    첨단연구망 활용을 통한 대용량 뇌 영상 데이터의 전송 및 수집

    국내외 공동연구기관과 한양대 간의 일반 네트워크망에서는 진행하기 어려운 대용량 뇌 영상 데이터전송을 KREONET 망을 이용한 효과적인 전송

  • 연구내용

    종양 유전체 데이터 분석
    • 종양 특이적 유전변이인 AIMP2- DX2의 특이적 발현 분석
    • 종양 유발 germline 돌연변이로써 lysosome storage disorder의 종양 발생 역할 규명
    자세한 내용은 하단에 있습니다

    A

    y축: Odds ratio (0,1,2,3,4) / x축 : Unadjusted Total,Adjusted Total, Singleton,Doubleton, Tripleton

    Unadjusted Total

    • Overall: 1~2(ratio),p<0.0001
    • Tier1: 1~2(ratio),p<0.0001
    • Tier2: 2~3(ratio),p<0.0001
    • Tier3: 1~2(ratio),p<0.05

    Adjusted Total

    • Overall: 1~2(ratio),p<0.05
    • Tier1: 1~2(ratio),p<0.0001
    • Tier2: 1~2(ratio),p<0.05
    • Tier3: 1~2(ratio),p<0.05

    Singleton

    • Overall: 1~2(ratio),p<0.0001
    • Tier1: 2~3(ratio),p<0.0001
    • Tier2: 2~3(ratio),p<0.001
    • Tier3: 1~2(ratio),p≥0.05

    Doubleton

    • Overall: 1~2(ratio),p<0.001
    • Tier1: 0~1(ratio),p≥0.05
    • Tier2: 2~3(ratio),p<0.05
    • Tier3: 3~4(ratio),p<0.001

    Tripleton

    • Overall: 3~4(ratio),p<0.05
    • Tier2: 0~1(ratio),p≥0.05
    • Tier3: 3~4(ratio),p≥0.05

    B

    y축: Odds ratio (1,2,3,4) / x축 : Unadjusted는, Adjusted는

    Adjusted (Total, Singleton, Doubleton, Tripleton) : 1

    Unadjusted (Total, Singleton, Doubleton, Tripleton) : 1 미만

    LSD carrier의 암 발병률 증가 현상 확인(Under review)
    연구 장비 사진

    활용내용

    유전체 데이터 전송
    • 서울대학교 암연구소- KISTI간 유전체 데이터 전송
    • 서울대학교 암연구소- KAIST간 유전체 데이터 전송
    데이터중심
    • 참여연구원

      5명
    자세한 내용은 하단에 있습니다.
    • A

      X축: Mean of normalized read counts(1e-02, 1e+00, 1e+02, 1e+04, 1e+06) / y축: Shrunken log2(FC)(-2,0,2,4)

    • B

      X축: Log2(FC) (-4,0,4,8) / Y축 : -In(P) (0,10,20)

    • C

      X축: P(0.00,0.25,0.50,0.75,1.00) / Y축 : Number of genes(0,1000,2000,3000)

    RNA profile differentiation between LSD carriers and non-carriers

    지원내용

    • 유전체 연구를 위해 생산되는 인간의 전장 유전체 정보의 양은 한 사람당 약 200GB 정도로 매우 방대한 양의 데이터가 생성
    • 유전체 데이터는 매우 작은 조각들의 서열 조각들로 기록되며 이를 분석하기 위해서는 기록된 조각들을 처리하는 과정이 필요하다. 이러한 과정들을 위해 고성능 컴퓨팅 리소스가 필수
    • 한사람의 분석을 위해 생산되어야 하는 유전체 데이터는 비교 컨트롤 데이터를 포함하여 한사람당 200GB 정도 이며 데이터 전송을 위해 필요한 시간은 대략 50시간 정도 소요된다. 이렇게 소모되는 전송시간 단축
    자세한 내용은 하단에 있습니다
    • A

      X축: PCAN, PACA, BRCA, CMBT, SKCM, PAEN, CMDI / Y축: Age of onset (0,20,40,60,80,100)

      범례: wild type,Mutant

      • PCAN(p=0.002): wild type - 0~85 / Mutant - 0~85
      • PACA(p<0.001): wild type - 35~85 / Mutant - 40~82
      • BRCA(p=0.488): wild type - 35~82 / Mutant - 38~82
      • CMBT(p=0.306): wild type - 0~ 42 / Mutant - 0~25
      • SKCM(p=0.257): wild type - 19~82 / Mutant - 40~79
      • PAEN(p=0.308): wild type - 20~80 / Mutant - 19~78
      • CMDI(p=0.044): wild type - 30~82 / Mutant - 38~70
    • B

      X축: Wile type, Overall, Tier1, Tier2, Tier3, GAA, SGSH, HEXA, GBA, HGSNAT, CLN3, NPC2 / Y축: Age of onset (0,20,40,60,80,100)

      범례: wild type,Mutant

      • Wile type : wild type 0~90
      • Overall(p=0.002) : Mutant 0~90
      • Tier1(p=0.017) : Mutant 0~90
      • Tier2(p=0.104) : Mutant 0~90
      • Tier3(p=0.004) : Mutant 5~85
      • GAA(p=0.092): Mutant 5~79
      • SGSH(p=0.052): Mutant 0~80
      • HEXA(p=0.126): Mutant 5~85
      • GBA(p=0.056) : Mutant 10~70
      • HGSNAT(p=0.01): Mutant 5~82
      • CLN3(p=0.036): Mutant 10~78
      • NPC2(p=0.03): Mutant 8~85
    • C

      X축: PACA, SKCM, CMDI / Y축: Age of onset (10,30,50,70,90)

      범례: wild type, MAN2B1, GALNS, GUSB, NPC2, SGSH

      • PACA(p=0.015, p=0.011, p=0.01) : wild type 35~90/ MAN2B1 48~69 / GALN3 49~60/ GUSB 40~60
      • SKCM(p=0.008): wild type 20~89/ NPC2 40~49
      • CMDI(p=0.016): wild type 29~80/ SGSH 35~50
    췌장암(PACA), 만성골수증식질환(CMDI)이 LSD 보인자에서 5년 이상 젊은 나이에 발병함을 증명한 본 연구자의 연구결과(교신저자, Under review)
  • 연구내용

    대형 게놈 해독데이터 생명정보 분석 인프라 구축
    • 게놈 데이터베이스 구축
    • 게놈 빅데이터 처리
    • 생명정보 분석 플랫폼 개발
    • 게놈 빅데이터 공유 및 교류
    다수의 인간 및 동식물 게놈 데이터를 생산, 분석, 제공
    자세한 내용은 하단에 있습니다.

    Scale-out

    • 10G Switch
      • Koref
        • CPU: 196core
        • Memory: 2TB
        • DAS:180TB*2ea
      • Hawk
        • CPU: 24core
        • Memory: 64GB
        • DAS:32TB*1ea, 180TB*1ea
      • Whale
        • CPU: 160core
        • Memory: 2TB
        • DAS: 180TB*2ea
      • Tiger
        • CPU: 128core
        • Memory: 1TB
        • DAS: 180TB*2ea
      • Lion
        • CPU: 128core
        • Memory: 1TB
        • DAS:180TB*2ea
        • GPU: K80*2ea
      • Eagle
        • CPU: 64core
        • Memory: 512GB
        • DAS: 144TB
      • Owl
        • CPU: 240core
        • Memory: 3TB
        • DAS: 264TB
      • NIPT
        • CPU: 40core
        • Memory: 256GB
        • DAS: 32TB, 180TB
      • Jellyfish
        • CPU: 288core
        • Memory: 2TB
        • DAS: 264TB
      • KPGP
        • CPU: 72core
        • Memory: 512GB
        • DAS: 540TB
    • Cluster Internal Switch(1G)
      • Whale
        • CPU: 160core
        • Memory: 2TB
        • DAS: 180TB*2ea
      • Tiger
        • CPU: 128core
        • Memory: 1TB
        • DAS: 180TB*2ea
      • Lion
        • CPU: 128core
        • Memory: 1TB
        • DAS:180TB*2ea
        • GPU: K80*2ea
      • Eagle
        • CPU: 64core
        • Memory: 512GB
        • DAS: 144TB
      • Owl
        • CPU: 240core
        • Memory: 3TB
        • DAS: 264TB
      • NIPT
        • CPU: 40core
        • Memory: 256GB
        • DAS: 32TB, 180TB
      • Jellyfish
        • CPU: 288core
        • Memory: 2TB
        • DAS: 264TB
      • KPGP
        • CPU: 72core
        • Memory: 512GB
        • DAS: 540TB
      • Koref
        • CPU: 196core
        • Memory: 2TB
        • DAS:180TB*2ea
      • Hawk
        • CPU: 24core
        • Memory: 64GB
        • DAS:32TB*1ea, 180TB*1ea
      • BioDB
        • CPU: 40core
        • Memory: 96GB
        • DAS:32TB
      • Web-Ccow
        • CPU: 8core
        • Memory: 32GB
        • DAS:32TB
      • FTP-Biodisk.org
        • CPU: 8core
        • Memory: 32GB
        • DAS:32TB
      • Oncomics
        • CPU: 40core
        • Memory: 256GB
        • DAS:32TB
      • BackupServer-Cat,Dog,Pig
        • CPU: 8core
        • Memory: 32GB
        • DAS:180TB*2ea, 114TB*1ea
    울산과학기술원 게놈연구소 서버자원 현황

    활용내용

    수십~수백 테라바이트의 대용량 게놈 데이터를 효율적으로 분석하고, 국내외 기관과 공유(만명 게놈 프로젝트, 한국인 개인 게놈 프로젝트 등)
    대전 국가참조표준센터, 대전 KISTI의 슈퍼컴퓨터센터, KAIST등과 협력을 통해서 생명정보 대량 데이터의 교류

    데이터중심
    • 일간

      50GB
    • 월간

      1TB
    • 년간(총량)

      10TB
    • 첨단망 활용연구 효율성 효과

      50~100%
    • 참여연구원

      50명

    지원내용

    데이터 분석 및 응용
    • 다부처 사업의 일환인 포스트게놈 과제에 참여
    • 다양한 게놈정보 분석 센터들과 협력
    • 게놈 분석 기술 이전 및 산업화 활용
    • 범용 게놈 분석 플랫폼 배포, 일반인의 관심 유도, 다양한 기관들과의 협력수행 활용
    대형 게놈 프로젝트 활용
    • 울산, 한국, 아시아 게놈 프로젝트 활용
    • 표준 게놈지도 구축 프로젝트 활용
    • 국제간 기업/기관들과 게놈 분석 프로젝트 활용
    KREONET연구망 연동스위치 장비사진
  • 연구내용

    interactive 신물질 발굴 platform 개발
    • 천연물 data collection 및 database 개발
    • web을 통한 database service
    • High - throughput 구조 identification methodology 개발
    네트워크 장비(스위치 허브)
    High-throughput 구조 결정법

    활용내용

    고속으로 DB Service
    • 제작된 DB의 고속 service
    국제 연구
    • 국제 공동 연구 수행중인 Roskilde University외 협력연구 진행중
    데이터중심
    • 일간

      10GB
    • 월간

      300GB
    • 년간(총량)

      3TB
    • 첨단망 활용연구 효율성 효과

      50~100%
    • 전송량

      1TB
    • 참여연구원

      4명
    숭실대 보유 고성능 GPU Cluster

    지원내용

    x - windows 의 원격접속

    interactive platform을 access하기 위해서는 x- windows를 이용, 효과적인 연구 수행 지원

    Web service

    KREONET을 이용해 빠른 web service를 할 수 있으며 사용자가 대용량의 data를 download 속도 지원

    국제 연결

    Roskilde University (Denmark )와 협력연구로 국제 연결 지원

    Database 분석 tool
  • 연구내용

    약 2,700 사례의 인간 암 유전체 데이터를 분석하는 국제 암유전체 컨소시엄 연구에 참여

    • International Cancer Genome Consortium Pan Cancer Analysis of Whole Genomes(ICGC - PCAWG study)
    • 암 유전체로부터 체성 유전체 돌연변이를 bioinformatics 기술을 이용해 발굴

    활용내용

    현재 국내에서 ICGC PCAWG study 데이터는 5개 기관 (KAIST, 이화여대, 서울대학교병원, 삼성서울병원 및 국립암센터)이 분산 보관

    • KAIST, 서울대학교 병원 및 삼성서울병원 사이에 데이터 전송에 활용
    데이터중심
    • 첨단망 활용연구 효율성 효과

      100%이상
    • 전송량

      10TB
    • 참여연구원

      4명

    지원내용

    데이터 전송의 편이성의 획기적 증대
    • 국가과학기술망 이전에는 데이터 전송을 외장하드에 복사 후 소포로 부치는 형식을 사용하였음
    • 복사/전송/재복사 과정에서 3~4일 간의 시간 차 발생
    • 국가과학기술망 사용으로 훨씬 효율적인 데이터전송 가능
  • 연구내용

    암유전체 빅데이터 분석
    • TCGA를 비롯한 대규모 국제 암 유전체 DB를 효율적으로 한국에서 다운로드하여 활용기반을 구축
    • 새로운 암 변이 시스너처 발굴연구
    • 한국인에서 특징적으로 발견된 암변이 검증

    대규모 단백질 -리간드 역가상 스크리닝(inversevirtual screening)을 통한 신약 재창출 유전체 빅데이터 인력양성 사업

    2017년 K-Genome 워크숍 사진

    활용내용

    미국 암유전체 데이터베이스 TCGA 데이터 다운로드
    공동연구기관인 KISTI, KAIST와의 대용량 데이터전송
    연구망을 활용하여 주요연구기관과 연구/교육용 고화질 화상회의 시스템 구축

    TCGA 데이터 이미지
    데이터중심
    • 일간

      35GB
    • 월간

      1TB
    • 년간(총량)

      81TB
    • 첨단망 활용연구 효율성 효과

      100%이상
    • 전송량

      81TB
    • 참여연구원

      10명

    지원내용

    TCGA 데이터 다운로드 활용
    • 본 기관은 TCGA low - level 데이터에 접근 할 수 있는 권한을 확보하였으나, 기관 자체 네트워크의 속도 문제로 인하여 접근 가능한 데이터를 모두 받는데 1년 이상의 시간이 소요되는 실정이었음
    • 첨단망 설치 이후 미국에 위치한 TCGA와 1Gbps 급으로 연결되어 현재는 다운로드 속도 문제가 모두 해결되어, 자체적으로 스토리지를 증설 중임
    TCGA 데이터 다운로드 화면
  • 연구내용

    연구목적

    국·내외 협력연구에서 생산된 대규모 전장유전체/엑솜 시퀀싱 데이터를 활용하여 암종 및 인종별 위험 유전변이 발굴
    국내 대학병원 및 국외 연구기관과의 협력체계 구축과 성과창출

    연구내용

    국내 차세대맞춤의료유전체 사업 (PGM2 1 : Personalized Genome Medicine21)등 통합 유전체 개방협력 연구에서 생산된 암질환, 비암, 대조군 시퀀싱 데이터를 첨단망을 활용하여 공유·분석하여 질환별 원인 유전변이 발굴
    국외 암유전체 국제협력 컨소시엄(ICGC )에서 생산한 수천 명의 유전체 데이터를 활용하여 암유형별 유전변이 발굴 및 인종별 유전변이 분포 차이를 비교분석(PCAWG: Pan - Cancer Analysis of Whole Genome )

    활용내용

    2017년 6월부터 연구망 연결 및 속도 테스트

    연구망 연결 이전에 한림대 서버에 내려 받은 국내외 데이터(ICGC/TCGA에서 생산된 시퀀싱 데이터, NCBI daGap control data, 국립보건원 400명 전장유전체 BAM 파일)들을 분석 중이므로 2017년 6월~12월까지 연구망을 활용한 성과 내역은 없음
    2018년 2월 질병관리본부 CODA에 기탁된 폐암관련 4개 과제의 유전체 데이터(40TB 상당)를 KREONET 망을 활용하여 전송받고 있음

    의학관 서버실 CISCO 스위치 장비
    의학관 서버실 주요 분석 서버
    데이터중심
    • 첨단망 활용연구 효율성 효과

      50%이하
    • 전송량

      10TB

    지원내용

    현재 본 연구실에서는 ICGC/TCGA의 데이터 사용 승인을 받은 후 자체 서버를 활용하여 2500쌍의 WGS gVCF를 분석중에 있으며 질병관리본부에서 생산한 400개의 WGS/WES 데이터를 제공받아 대조군으로 활용
    첨단망 도입 후 기존 대비 국내외 협력기관과의 직간접 연결이 가능하여졌고, 학내망 사용대비 두 배 이상의 속도 향상을 보여 데이터 전송 및 연구 분석진행에 있어 연구수행기간 단축 및 상당한 개선 효과
    2018년 2월부터 국내 CODA에서 생산된 BAM 파일(40TB)을 내려 받고 있으며 향후 약 200TB 이상의 국제 암 데이터 다운로드를 예정이므로 2017년도 보다는 2018년도에 KREONET 활용도가 제고될 것임

    자세한 내용은 하단에 있습니다

    KREONET

    • 의학관 3311호
    • INTERNET
      • 한림대
      • 의학관
    의학유전학교실 첨단연구망 연결 구성도
  • 연구내용

    연구 목적

    현재 축적되어 있는 한국인 유전체 데이터 분석 한국인 유전체 데이터에서 발견되는 한국인 특이적 somatic mutation 연구
    한국인의 주된 사망원인인 Cancer와 Alzheimer’s disease에 대한 marker 연구

    연구 내용

    Korean Reference 연구 cancer markers로 사용 할 mitochondria genome 연구
    임상정보와 ngs data를 통합 관리하는 UI 개발
    다양한 유전체 data를 통합적으로 분석 및 시각화하는 Tool 개발
    네트워크 분석을 통한 폐암 특이적인 marker 연구 Alzheimer ’s disease의 조기진단을 위한 marker 연구

    자세한 내용은 하단에 있습니다.
    • A
      • mtDNA-Server(55) = 17
      • mtDNA-Server(55) + Lofreq(19) + Varscan(48) = 2
      • mtDNA-Server(55) + muTECT(43) = 3
      • mtDNA-Server(55) + Varscan(48) +muTECT(43) = 7
      • mtDNA-Server(55) + Varscan(48) = 8
      • mtDNA-Server(55) + Sterellka(18) + Lofreq(19) = 2
      • mtDNA-Server(55) + Varscan(48) + Sterellka(18) = 1
      • muTECT(43) = 14
      • Varscan(48) = 12
      • Lofreq(19)
      • Sterellka(18)
      • mtDNA-Server(55) + Lofreq(19) + Varscan(48) + muTECT(43) + Sterellka(18) = 15
    • B
      • mtDNA-Server(94) = 2
      • mtDNA-Server(94) + Varscan(214) = 1
      • mtDNA-Server(94) + Varscan(214) +Lofreq(83) = 1
      • mtDNA-Server(94) + Varscan(214) +muTECT(101) = 8
      • mtDNA-Server(94) + muTECT(101) = 1
      • mtDNA-Server(94) + Lofreq(83) = 1
      • mtDNA-Server(94) + Lofreq(83) + Varscan(214) = 7
      • mtDNA-Server(94) + Lofreq(83) + Varscan(214) + Sterellka(73) = 2
      • Lofreq(83) = 1
      • Varscan(214) = 120
      • Varscan(214) + muTECT(101) = 4
      • Sterellka(73)
      • muTECT(101) = 9
      • mtDNA-Server(94) + Lofreq(83) + Varscan(214) + Sterellka(73) + muTECT(101) = 71
    폐암 및 혈액암 환자의 미토콘드리아 heteroplasmic 변이 검출 결과 비교(A.혈액암, B.폐암)

    활용내용

    Kisti GSDC 유전체시스템 협력 연구

    Korean Reference 연구
    cancer markers로 사용 할 mitochondria genome 연구(폐암, 혈액암)
    NGS data와 Clinical data를 사용하여 분석을 위한 Tool 개발(혈액암)

    다양한 국외 기관의 데이터를 이용한 연구

    The European Bioinformatics Institute(EMBL-EBI)의 다양한 유전체 data를 사용해서 시각화 Tool 개발
    UTSouthwestern Medical Center의 전사체 데이터로 폐암 marker 연구
    Alzheimer’s disease와 관련된 대용량 데이터를 분양받아 분석

    데이터중심
    • 일간

      60GB
    • 월간

      2TB
    • 년간(총량)

      25TB
    • 첨단망 활용연구 효율성 효과

      100%이상
    • 전송량

      25TB
    • 참여연구원

      15명

    지원내용

    국내기관과 개방형 유전체 분석
    • 축적되어 있는 유전체 빅데이터를 공유 되어있는 KISTI platform에서부터 GB/TB 단위의 빅데이터를 수신하고 분석하여 다시 공유할 수 있도록 활용함
    • 유전체 개방협력 연구 참여 기관인 서울대병원 혈액종양내과, 서울삼성병원 혈액종양내과, 이대목동병원 생화학연구실과 원활하게 데이터 공유
    • Alzheimer’s disease의 marker 연구를 같이 진행하는 서울대병원 신경과, ㈜피디젠과의 원활한 데이터 공유를 통한 협력 연구
    국외기관과 개방형 유전체 분석
    • Alzheimer’s disease와 관련된 다양한 종류의 데이터를 보유하고 있는 ADNI와 AIBL을 통해 유전체와 이미지 빅데이터를 분양받아 분석 진행
    • UTSouthwestern Medical Center에서 다양한 폐암 cell line의 전사체 데이터와 유전체 데이터를 KREONET을 통해 빠르게 공유하고, 폐암 타입 별 biomarker를 찾는 협력 연구 진행
  • 연구내용

    연구목적
    • 최첨단 생물전용 투과전자현미경(Bio -TEM)에서 생산되는 대용량 데이터의 효율적인 저장 및 전산처리 연계체계 구축
    • 대용량 데이터의 생산-저장-처리의 연계체계 구축을 통한 생체기작 영상분석 연구자들에 대한 연구지원 강화
    연구내용
    • Bio - EM연구동 (KBSI 오창센터)과 KISTI GSDC 간의 데이터 전송체계 구축
    • Bio- EM 데이터의 신속한 전산처리를 통한 생체시료의 고분해능 3차 구조분석 연구의 최적화된 환경 마련
    • 국내 Bio - EM 연구 활성화를 위한 인프라 구축 및 전문인력 양성
    KBSI-KISTI GSDC 데이터 생산-저장-처리 체계 모식도

    활용내용

    Bio - EM 영상분석 인프라 확립
    • KBSI의 HR Bio -TEM의 영상 조건 및 실험데이터 생산 최적화
    • GSDC로 원격 접속 및 데이터팜에서 전산처리소프트웨어 구동 테스트 수행
    Bio - EM 실험 데이터 전송체계 구축
    • KBSI 내부 DGN- DTN 데이터 전송 네트워크 최적화
    • KBSI 오창센터에서 첨단망을 통해 KISTI GSDC로 대용량 Bio- EM 실험데이터를 전송 할 수 있는 프로토콜 확립
    • KBSI - KISTI GSDC 대용량 데이터 전송 테스트 및 전송 속도 확인
    Bio - EM 인프라 구축
    • 국가 연구자들과의 공동연구를 통한 전산망 수요자 확보
    • 전산처리 및 데이터 접속 이용과 관련된 교육프로그램 실시
    데이터중심
    • 참여연구원

      3명

    지원내용

    대용량 실험데이터 전송 체계 구축
    • KBSI 오창센터 내부연구망을 통해 Bio - EM 연구동(DGN )에서 데이터전송 서버(DTN )까지의 데이터 전송 체계를 구축하고 전송속도 테스트를 수행한 결과 1TB 전송에 27시간이 소요에서 1TB 전송에 3시간이 소요
    • 현재 지속적으로 데이터의 전송이 정상적으로 진행되고 있으며 시간당 평균 0.3TB의 데이터가 KBSI DTN에서 GSDC 저장소로 전송
    자세한 내용은 하단에 있습니다

    RNA polymerase 단백질 고분해능 cryo-EM → 415,305 particles (Particle extraction and 3D refinement) → 4.04A @ 0.143FSC → Particle-based ment correction → 3.97A @ 0.143FSC

    RNA polymerase 단백질 고분해능 cryo-EM 전산처리 연구
    Cryo-EM 전산처리 워크샵 개최
Back to Top