컨텐츠 바로가기

04.24 (수)

KBO 역사 데이터로 본다…38년 DB화 드디어 완료

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
스포티비뉴스

<이미지를 클릭하시면 크게 보실 수 있습니다>


[스포티비뉴스=신원철 기자] KBO가 38년 역사를 모두 데이터베이스화했다.

KBO는 2일 "숙원 사업 중 하나였던 KBO 리그 기록 데이터화 작업을 최종 완료했다"고 밝혔다. 데이터화 이전인 1982년부터 1996년까지의 기록 검증을 마치고, 2021년 한국 프로야구 출범 40년을 앞둔 올해 KBO 리그 38시즌 전 경기 기록의 데이터화 완성과 함께 잘못된 기록을 바로 잡았다.

올해 새롭게 발행된 KBO 연감, 레코드북은 데이터화 과정에서 바로 잡은 정정된 기록을 적용해 담았다. 또한 KBO 홈페이지 및 관련 기록 사이트를 통해서도 더욱 정확하고 깊이 있는 다양한 기록을 제공할 수 있게 됐다.

KBO는 경기 기록 데이터화를 통해 더욱 다양하고 흥미로운 KBO 리그 기록과 정보를 보다 정확하게 야구 팬들에게 제공하기 위해 지난 수년간 데이터베이스 완성에 노력을 기울여 왔다. ‘기록 스포츠’라 불릴 정도로 한 경기에 수많은 기록이 쏟아지는 야구의 특성상 여러 차례 검증과 확인 절차를 거쳤고, 정확한 검증을 위해 KBO 담당자와 공식기록원, 기록 업체의 전문 인력만으로 진행해 오랜 시간이 소요됐다.

KBO가 경기 기록을 온라인을 기반으로 데이터화 하기 시작한 것은 2001년부터다. 이전까지는 현장에서 작성된 수기 기록지를 팩시밀리로 받아 KBO 사무국에서 과거 전산 프로그램에 입력 후 일자 별 성적을 출력해 문서로 보관하는 방식이었다. 2001년부터는 경기장에서 온라인 경기 기록이 시작되고 경기 상황의 실시간 문자중계가 이루어지면서, 매 경기 기록이 곧바로 데이터베이스화 됐다. 수기 기록지와 온라인 기록지의 비교 작업까지 진행되면서 기록의 정확성도 확보됐다.

이후 KBO는 정확한 기록과 통계 정보 제공을 위해 기록위원회 및 스포츠투아이(현재 공식 기록 업체)와 협력해 과거 기록까지 데이터화 하기로 하고, 2000년부터 역순으로 수기 기록지를 데이터로 입력하는 작업에 들어갔다. 입력된 데이터는 다시 수기 기록지와 문서로 보관된 성적과 비교 검수한 뒤 오류에 대해 검증하는 과정으로 진행됐다.

1997년부터 2000년까지 4년간의 기록은 우선 작업을 진행해 데이터화가 완료된 상태에서, 2004년부터 본격적으로 1982년부터 1996년까지 총 6,168경기에 대한 기록 확인을 실시한 결과 약 1,600여건의 오류가 발견됐고, 수차례의 검증을 거쳐 발견된 오류를 정정했다.

수정 된 기록 중 투수는 투구이닝, 자책점 오기로 인한 평균자책점 조정이 가장 많았다. 타자는 경기수 집계 오류(대수비만 나온 경우 경기수에서 제외)가 가장 많았고, 홈런 기록에 대한 오류는 없었다.

기록원의 오기, 데이터 입력 오류, 단순 집계 실수 등의 여부를 검증해 정확한 기록으로 바로 잡았으며, 확인된 기록은 추가 검증을 통해 개인 및 팀의 통산 기록, 시즌 기록, 연속 기록 등 세부 항목에도 모두 반영했다. 검증 및 정정 완료된 기록들은 각 연도별로 투수, 타자를 구분해 정리했으며, 이후 선수 별로 정정된 내용을 구분하는 작업을 추가로 진행할 예정이다.

KBO는 앞으로도 매 시즌 종료 후 수기 기록지와 온라인 기록지, 데이터를 비교해 오류가 발견될 경우 즉시 바로잡아 미디어와 야구팬들에게 정확한 통계 자료가 제공될 수 있도록 노력할 방침이다.

스포티비뉴스=신원철 기자

<저작권자 ⓒ SPOTV NEWS 무단전재 및 재배포 금지>
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.