컨텐츠 바로가기

03.29 (금)

과학을 변화시킨 컴퓨터 코드 10가지

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다

2019년 국제 이벤트 호라이즌 망원경(Event Horizon Telescope,EHT) 팀은 블랙홀이 실제로 어떻게 생겼는지를 인류 역사상 처음으로 보여줬다. 공개된 사진은 일반 사진이 아니다. 하와이와 멕시코의 화산, 애리조나의 산과 스페인의 시에라 네바다, 칠레의 아타카마 사막 및 남극 등 전 세계 8개 기존 망원경으로 얻은 페타 바이트 크기 원데이터는 막스플랑크 연구소와 MIT헤이스텍 관측소 전문 슈퍼컴퓨터로 결합해 얻은 결과물이다.

이처럼 천문학에서 동물학에 이르기까지 현대 모든 위대한 과학 발견 뒤에는 컴퓨터가 있다. 현재 과학 연구는 근본적으로 소프트웨어와 연결되어 있다. 과학저널 네이처가 지난 1년 동안 연구원 수십 명을 대상으로 과학을 변화시킨 컴퓨터 기술 10가지를 발표했다.

IT NEWS

<이미지를 클릭하시면 크게 보실 수 있습니다>


1. 프로그래밍 언어 선구자 포트란(FORTRAN) (1957)
초창기 컴퓨터는 사용자 친화적인 것이 아니라 천공 카드를 사용해 코드를 수동으로 입력했다. 코드 작성은 복잡한 프로그래밍 언어에 대한 지식이 필요했지만, 1950년대에 IBM이 개발한 포트란(FORTRAN) 등장으로 프로그래밍 언어에 일대 혁신이 일어났다.

이를테면 x=3+5와 같이 사람이 읽을 수 있는 명령어를 사용해 컴퓨터를 프로그래밍하면 컴파일러는 이를 컴퓨터가 실제로 처리할 수 있는 기계 코드로 변환했다.

현재 80년이 된 포트란은 기후 모델링, 유체 역학, 계산 화학 등 복잡한 선형 대수를 포함한 숫자를 빠르게 처리하기 위해 강력한 컴퓨터가 필요한 모든 분야에서 여전히 널리 사용되고 있다.

IT NEWS

<이미지를 클릭하시면 크게 보실 수 있습니다>


2. 신호 프로세서 고속 푸리에변환(FFT, Fast Fourier Transform) (1965)
전파 천문학을 비롯한 과학 분야에서 디지털 신호 처리 및 이미지 분석 등 디지털 혁명을 가능케 한 고속 푸리에변환(FFT)은 함수 근삿값을 계산하는 알고리즘이다. 이 알고리즘은 복잡한 전자파 성질을 이해하기 위해 주파수를 함수로 대체 시각화한다.

1965년 미국의 수학자 제임스 쿨리(James Cooley)와 존 튜키(John Tukey)가 개발한 쿨리-튜키 알고리즘(Cooley-Tukey algorithm)이 널리 쓰이고 있다. 재미있는 것은 1805년 카를 프리드리히 가우스가 이미 같은 방법을 개발했다. 하지만 쿨리-튜키 알고리즘은 디지털 신호 처리, 이미지 분석, 구조 생물학 등 응용 프로그램 서막을 열었다.

실생활에서는 고속푸리에변환이나 역고속푸리에변환은 음악을 스트리밍하거나, 휴대폰 신호를 생성할 때, 인터넷을 검색하거나, 셀카를 찍을 때 항상 사용될 만큼 매우 중요하다.

IT NEWS

<이미지를 클릭하시면 크게 보실 수 있습니다>


3. 생물학 데이터베이스 (1965)
현재 대규모 게놈과 단백질의 데이터 분석에 사용되는 데이터 저장 시스템은 생물 정보학 선구자인 마거릿 데이호프(Margaret Dayhoff) 연구에 뿌리를 두고 있다. 1960년대에 생물학자들이 단백질의 아미노산 서열 분석에 착수했을 때, 데이호프 등이 데이터를 천공카드에 기록해 데이터베이스 검색을 쉽게 했다.

그와 3명의 공동저자는 서로 다른 종간의 진화 관계에 대한 단서를 찾기 위해 그 정보를 수집한 ‘단백질 서열 및 구조 지도’(Atlas of Protein Sequence and Structur)를 1965년 발표했다. 당시 65개 단백질 서열, 구조 및 유사성에 대해 관한 내용이다.

현재는 1971년에 가동을 시작한 17만개 이상 거대 분자구조를 자세히 설명한 단백질 정보은행과 1981년에 뉴앳(Newat)라는 또 다른 단백질 데이터베이스. 그리고 1982년에는 미국 국립 보건원에서 관리하는 DNA 아카이브인 젠뱅크(GenBank)가 될 데이터베이스 가동을 시작했다. 이후 다양한 분야에서 데이터 세트가 사용되고 있다.

4. 대기 순환 모형 (1969)
2차 세계대전 말 컴퓨터 선구자인 폰 노이만(von Neumann)은 탄도궤도 및 무기 설계에 사용된 컴퓨터를 사용해 일기예보 혁신에 도전했다. 당시에는 날씨를 경험과 직감으로 예측했다.

하지만 폰 노이만 연구팀은 물리 법칙에 기반한 수치 기상 예측을 시도했다. 1940년대 후반 폰 노이만은 프린스턴 고등 연구소에 날씨 예측팀을 만들었다. 1955년 두 번째 팀인 지구 물리 유체 역학 연구소는 ‘무한 예측’이라고 부르는 즉 기후 모델링에 대한 작업을 시작했다.

1958년에 기후 모델링 팀에 합류한 마나베(Manabe)는 대기모델 작업을 시작했다. 또 동료인 커크 브라이언(Kirk Bryan)은 바다에 대한 연구를 시작했다. 드디어 1969년 그들은 성공적으로 두 가지를 결합해 2006년 네이처가 과학 컴퓨팅에서 ‘이정표’라고 불렀던 모델을 만들었다

이후 날씨 데이터는 ‘대기 모델’ ‘해양 모델’ 등을 구축하고 컴퓨터로 분석해 예측 정확도를 높여갔다.

오늘날 모델은 행성의 표면을 25 × 25km 크기의 정사각형으로 나눌 수 있고 대기는 수십 개의 레벨로 나눌 수 있다.

5: BLAS (1979)
과학기술 문제 등을 해결하기 위한 기술 ‘BLAS’(Basic Linear Algebra Subprograms)는 주로 수학적 연산에 사용된다. 1979년에 BLAS6라는 기본 선형대수 기술로 표준 구성 요소가 마련됐다. 실제로 BLAS는 행렬과 벡터 연산을 덧셈과 뺄셈만큼 기본적인 계산 수준으로 쉬워졌다.

이 표준을 통해 컴퓨터 제조업체들은 하드웨어에서 빠르고 효율적인 작동을 위해 BLAS 구현을 최적화할 수 있었다. 40여 년이 지난 BLAS는 과학 소프트웨어를 만드는 과학 컴퓨팅 코드의 핵심을 대표한다

6. NIH 이미지 (1987)
1980년대에 미국 국립 보건원(NIH) 뇌 영상 연구소에서 근무하던 웨인 라스밴드(Wayne Rasband)는 X선 필름을 컴퓨터에서 표시·분석하는 프로그램을 고안했다. NIH 이미지라고 불린 이 프로그램은 당초 Mac OS에서만 작동했지만, 이후 NIH에 의해 고도 이미지 처리 시스템으로 발전을 거듭해 현재는 다른 OS에서도 사용되고 있다.

소프트웨어 제품군에는 라스밴드가 윈도 및 리눅스 사용자를 위해 작성한 자바(Java) 기반 버전인 이미지J와 독일 막스플랑크 분자세포생물유전학연구소(Max Planck Institute of Molecular Cell Biology and Genetics) 연구진이 개발한 이미지J 배포판 피지(Fiji)가 있다.

7. 시퀀스 검색 BLAST (1990)
1978년 생물 정보학 선구자인 마거릿 데이호프(Margaret Dayhoff)는 DNA와 단백질의 일차 구조의 유사성 및 관련성을 파악하기 위한 'PAM'(Point accepted mutation) 시스템을 고안했다.

1985년에 버지니아대학 윌리엄 피어슨(William Pearson)과 NCBI의 데이비드 립만(David Lipman)은 데이호프 매트릭스와 빠른 검색을 수행하는 기능을 결합한 알고리즘인 ‘FASTP’를 개발했다.

이후 1990년 립만과 NCBI 연구원, 파크대학, 펜실배니아대학, 애리조나대학과 함께 훨씬 더 강력한 기능인 ‘BLAST’(Basic Local Alignment Search Tool)로 진화해 당시 유전자 생물학 분야에 혁신을 가져왔다.

8. arXiv (1991)
1980년대 후반까지 과학계 연구 내용은 일반적으로 한정된 사회 내에서만 공유됐다. 하지만 1991년 뉴멕시코 로스알라모스국립연구소(Los Alamos National Laboratory)에서 근무하던 물리학자 폴 긴스파그(Paul Ginsparg)는 연구 내용을 널리 공유할 수 있는 새로운 시스템을 고안했다.

과학 관련 논문과 기사를 등록자들에게 전달하는 시스템으로, 물리학 커뮤니티에 한정된 정보가 전 학문을 대상으로 확대 공개되기에 이른다. 1998년 아카이브(arXiv)로 명칭을 바꾸고 발전을 거듭해 2021년 현재 약 180만 건 논문을 무료로 볼 수 있다. 매월 1만5천 건 이상 논문과 약 3천만 건 다운로드가 이뤄지고 있다.

이 사이트는 생물학, 의학, 사회학 및 기타 분야 논문 기록 보관소에서 붐을 일으켰다. 그 결과 오늘날 ‘SARS-CoV-2’ 바이러스에 대해 게시 된 수만 개 논문을 무료로 볼 수 있다.

9. IPython Notebook (2011)
콜롬비아 출신 입자 물리학자인 페르난도 페레즈(Fernando Pérez)는 2001년 미국 콜로라도대학 박사과정 중에 IPython(Interactive Python, 인터랙티브 파이썬) 프로젝트를 시작했다.

당시 페레즈는 프로그래밍 언어인 파이썬(Python)이 한 줄씩 실행되기 때문에 명령어 실행 결과만 나와 과학 연구에 필요한 모듈 탑재 및 데이터 시각화 등에 적합하지 않다고 생각, 보다 더 개선된 대화형 셀을 원했다.

그 결과 웹 브라우저에 터미널을 넣어 해결했다. 그 아이디어로 출발한 것이 IPython Notebook이다. 2011년에 공개한 IPython는 복수 프로그래밍 언어에서 상호작용적인 컴퓨팅을 하기 위한 명령 쉘로 파이썬 프로그래밍 언어용으로는 처음 개발됐다. 이후 IPython Notebook은 오픈소스로 공개돼, 데이터 과학 분야에 혁명을 일으켰다.

오픈소스 운동의 열렬한 지지자인 그는 파이썬 소프트웨어(Python Software) 재단의 펠로우(Fellow)이고,NumFOCUS의 창립멤버다. 현재 UC 버클리에서 통계학과 조교수로 근무하며, 로렌쯔 버클리 연구소 데이터과학기술분과 소속 과학자로, BIDS(Berkeley Institute for Data Science)에서 연구원으로 활동을 하고 있다.

10. AlexNet (2012)
인공지능(AI)은 '코드화된 규칙을 사용하는 것'과 ' 컴퓨터가 뇌의 신경 구조를 모방해 '학습'할 수 있는 머신러닝으로 정보처리 하는 것' 2가지로 구분된다.

2012년 캐나다 토론토대학 컴퓨터 과학자인 제프리 힌튼(Geoffrey Hinton) 교수 대학원생인 알렉스 크리제브스키(Alex Krizhevsky)와 일리야 서츠키버(Ilya Sutskever)는 연례 이미지넷(ImageNet) 경진 대회에서 그렇지 않다는 것을 증명했다,

당시 대회에서 대량 이미지를 프로그램으로 분류하는 ImageNet 알고리즘 오류는 약 25% 정도였ek. 반면 그들이 개발한 머신러닝 기반 화상 인식 프로그램 'AlexNet'은 오류를 16% 정도로 줄이는데 성공했다.

이러한 걀과로 딥러닝은 각종 실험과 연구에서 급부상하고 있다. 이미지 분석 도구가 현미경 사진에서 세포를 쉽게 찾을 수 있는 이유다. AlexNet이 과학계를 근본적으로 변화시킨 많은 도구 중에서 핵심 도구로 자리 잡았다.

김들풀 기자 itnews@


기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.