<이미지를 클릭하시면 크게 보실 수 있습니다> |
카카오엔터프라이즈는 지난 22일부터 25일까지 경주화백컨벤션센터에서 열린 한국생명정보학회 정기학술대회 '바이오인포 2024'에서 카카오클라우드 기반의 유전체 빅데이터 분석 교육 워크숍을 진행했다고 30일 밝혔다.
이번 워크숍은 의료·바이오산업 분야에서 카카오클라우드 사용을 늘리고 연구 기술을 고도화하는 것을 목표로 한다. 병원 관계자와 연구원, 대학생 등 30여 명이 참여했다. 워크숍은 ▲카카오클라우드 소개 ▲유전체 분석 툴 키트(GATK) 파이프라인 구성과 개요 ▲빅데이터 분석 실습 등으로 구성됐다.
복잡한 유전체 데이터를 효과적으로 처리하기 위해선 클라우드 기반 분석 도구가 필수다. 의료 빅데이터의 핵심 자원으로 주목받고 있는 유전체 데이터가 염기 서열 분석이나 변이 식별 등 복잡한 계산을 필요로 하기 때문이다.
워크숍에서는 미국 국립표준기술연구소(NIST) 주도의 GIAB 컨소시엄이 제공하는 골드 스탠다드 유전체 'NA12878'를 활용해 유전체 변이 발생 빈도와 질병 간 관계 등을 분석 실습했다.
유전체 분석에는 GATK 파이프라인이 활용됐다. 카카오클라우드의 분산 데이터 처리 프레임워크인 '하둡 에코'를 기반으로 분산·병렬 연산 구조를 최적화했다.
최광묵 카카오엔터프라이즈 사업개발TF장은 "이번 워크숍을 통해 카카오클라우드 환경에서 유전체 변이 관련 발생 빈도, 임상 정보, 유해성 예측 등 다양한 데이터 분석 실습이 성공적으로 진행됐다"며 "카카오클라우드는 의료·바이오산업 분야에서 클라우드를 더욱 원활하게 사용할 수 있도록 적극 지원하고 있으며 업계 전문가들과 지속적인 기술 교류 및 협력을 이어갈 것"이라고 전했다.
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.