작성일 : 19-06-10 17:27
[대한민국 대표 연구실⑦] KISTI 콘텐츠큐레이션센터 , 1억개 데이터로 R&D지원 57년, 과학강국 '디딤돌'
 글쓴이 : happy
조회 : 6  

구글? 네이버? 비켜라! 정보검색 원조

                         데이터 생태계의 시작, KISTI 콘텐츠큐레이션센터.<영상= 대덕넷 뉴미디어팀>

35년전부터 한글 정보 검색이 가능했다고? 1980년대 초 컴퓨터도 제대로 보급되지 않은 시기, 국내에서 과학기술 정보를 한글로 검색할 수 있었다는 게 정말일까. 사실이다. 한국에서 과학기술정보 서비스를 시작하고 컴퓨터가 들어오며 한글 검색엔진 기술도 개발돼 접목됐다. 1984년 무렵 지금의 구글, 네이버처럼 필요한 키워드를 입력하면 관련 정보를 검색할 수 있었다. 이는 KISTI(한국과학기술정보연구원)의 주요 임무 중 하나인 과학기술정보 서비스의 시작으로, 과학기술 강국의 '디딤돌'이 됐다.

한국이 과학기술정보 서비스 활동을 시작한 것은 1962년 1월 1일. 유네스코한국위원회가 후진국 사업으로 한국과학문헌센터(이하 센터) 설립을 지원하면서다. 센터는 해외 학술지 1000종을 구입해 과학기술정보 제공 서비스를 시작했다.

서비스는 단순했다. 특허나 논문의 원문을 복사해 주는 정도. 이용자는 센터를 직접 방문해야 정보를 받을 정도로 더딘 전달이었다. 센터에서는 빠른 정보 전달을 위해 영문 저널 등을 번역해 과학기술문헌속보로 발간했다. 빠르게 해외 동향을 접할 수 있다는 사실만으로 과학계의 관심이 높았다.

과학기술이 발달하고 정보도 폭발적으로 늘었다. 1975년 센터에 컴퓨터가 도입됐다. 수작업으로 복사하는 대신 정보검색 서비스가 시작됐다. 국내 연구진의 노력으로 한글 입력과 출력 처리시스템이 가능해졌다. 1984년 온라인 정보 제공 서비스도 시작됐다. 오늘날 많이 활용되는 구글, 네이버 등 국내외 검색엔진과 같은 서비스가 35년전에 이미 가능했던 것. 

정부가 연구개발 예산을 늘리면서 국내에서 나오는 연구성과, 특허, 보고서의 양도 큰 폭으로 증가했다. 첨단기기들의 발달로 데이터의 유형도 변화했다. 데이터 서비스에 앞서 신뢰도 높은 데이터 구축의 필요성이 제기됐다.

KISTI 콘텐츠큐레이션센터(센터장 황혜경)는 국내외에서 생성되는 과학기술 정보, 데이터를 수집하고 가공해 이용자에게 가장 적합한 형태로 제공하는 역할을 한다. 겉으로 드러나지 않지만 본격 서비스가 이뤄지기전 신뢰도 높은 과학기술정보의 기틀을 만들어 가는 곳, 과학기술정보 서비스 발원지인 셈이다.

콘텐츠큐레이션센터의 초창기부터 오늘날까지 57년간의 여정과 역할, 앞으로 계획을 과거, 현재, 신진 연구자에게 들어보았다.

KISTI 콘텐트큐레이션센터는 우리나라 과학기술 정보 제공 서비스가 시작되는 곳이다. 신뢰도 높은 데이터를 수집, 가공해 이용자에게 가장 적합한 정보로 제공하겠다는 책임감, 사명감으로 일하고 있다. 1962년 1월 1월 처음 발족해 57년간 과학기술정보 서비스의 기틀을 마련해 왔다. 사진 왼쪽부터 예용희 박사, 황혜경 센터장, 설재욱 연구원.<사진= 대덕넷 >KISTI 콘텐트큐레이션센터는 우리나라 과학기술 정보 제공 서비스가 시작되는 곳이다. 신뢰도 높은 데이터를 수집, 가공해 이용자에게 가장 적합한 정보로 제공하겠다는 책임감, 사명감으로 일하고 있다. 1962년 1월 1월 처음 발족해 57년간 과학기술정보 서비스의 기틀을 마련해 왔다. 사진 왼쪽부터 예용희 박사, 황혜경 센터장, 설재욱 연구원.<사진= 대덕넷>

◆ "콘텐츠큐레이션, 한권 한권 수집하고 한건 한건 구축해 가는 과정"

"과학기술정보 수집과 데이터 구축은 한권 한권 수집하고 한건 한건 구축해 나가는 과정입니다. 주변 변화에 흔들리지 않고 협력하고 협업하며 책임감있게 도전하는 것이지요."

전자계산학을 전공하고 1981년부터 KISTI(당시 한국과학기술정보센터 전자계산부)에서 근무를 시작한 예용희 박사(은퇴 후 지금은 한국생명공학연구원 국가생명공학정책연구센터 전문위원으로 활동).

그는 KISTI에서 34년 8개월간 일하며 한국의 과학기술정보 구축과 서비스 변화 과정을 같이했다. 예 박사는 "신입사원 시기 시스템 운영과 해외 도입 DB를 구축하고 한글 온라인 검색서비스 기반을 만들었다"면서 "서울대와 국회도서관 장서목록을 데이터베이스로 구축하고 목록을 출판하며 지원했다. 현재와 같은 인터넷 검색서비스가 1984년부터 가능해 졌다"고 설명했다.

이 과정에서 웃지 못할 기억도 있다. 지금은 컴퓨터 활용이 PC에서 스마트폰으로 옮겨가며 다양한 환경변화를 이끌고 있다. 그러나 당시에는 이용자들의 온라인 검색 인식이 높지 않아 장비를 싣고 다니며 설명하는 '지역 순회공연(?)'도 불사해야 했다.

그는 "국가 연구개발 성과물을 잘 정리하고 분석해 유용한 서비스로 만들기까지 중요한 임무를 맡은 곳이 콘텐츠큐레이션센터"라면서 "과학기술정보와 컴퓨터는 뗄래야 뗄 수 없는 사이다. 초기 수작업에서 컴퓨터, 모바일로 검색 서비스 환경이 바뀌어 왔다"고 말했다.

예 박사는 퇴임을 앞두고 34년간 KISTI에서 쌓은 지식과 경험들을 정리해 책으로 남겼다. 지식과 경험이 이어지며 앞으로 닥칠 환경변화에도 후배들이 도전하며 지식과 경험을 이어갔으면 하는 마음에서다. 자비를 들여 발간한 책을 후배들에게 전달, 잔잔한 감동과 함께 귀감이 되고 있다.

센터를 이끌고 있는 황혜경 센터장은 선배와 동료, 후배의 역할로 데이터 생태계가 구축되고 있다고 밝혔다. 특히 국내 연구자들이 연구에 집중할 수 있도록 신뢰할 수 있는 정보를 제공하는 디딤돌로써 기반을 튼튼하게 다지고 있다.

"연구 성과들이 늘어나고 쌓이고 있고 데이터의 유형도 기술도 변화하고 있죠. 처음에는 관리 통제 저자 목록만 필요했다면 맞춤형 서비스 제공을 위해 논문 초록과 원문데이터까지 분석하고 가공하고 있습니다. 부담이 커졌다고 볼 수 있어요."(웃음)

데이터는 한번 구축되면 쉽게 바꾸기 어렵다. 때문에 이용자에게 가장 유용한 정보가 될 수 있도록 가공전 팀원간 논의를 통해 다양한 실험을 하게 된다. 황 센터장은 "정보 가공에 앞서 여러 기법을 적용해 보고 가장 효율적인 결과를 발표한다"면서 "이 과정에서 개인보다 이용자 중심의 데이터 가공과 서비스가 되어야 한다는 원칙과 기준으로 임하고 있다"고 강조했다.

컴퓨터가 도입되기전에는 원문을 복사해 서비스를 시작했다. 이후 마이크로필름에 담아 과학기술정보 서비스를 할 수 있도록 했다. 1975년 일본업체로부터 컴퓨터를 구입해 한글한자 처리시스템이 도입됐다. 온라인 서비스는 1984년부터 검색이 가능토록 했다. 사진은 당시 마이크로 필름과 컴퓨터, 발간 책자들.<사진= 길애경 기자 >컴퓨터가 도입되기전에는 원문을 복사해 서비스를 시작했다. 이후 마이크로필름에 담아 과학기술정보 서비스를 할 수 있도록 했다. 1975년 일본업체로부터 컴퓨터를 구입해 한글한자 처리시스템이 도입됐다. 온라인 서비스는 1984년부터 검색이 가능토록 했다. 사진은 당시 마이크로 필름과 컴퓨터, 발간 책자들.<사진= 길애경 기자>

◆ 1억개의 양질의 데이터, 과학기술 강국의 기반

과학기술정보가 아날로그 형태에서 디지털화 되며 데이터 유형도 인쇄본에서 마이크로 필름, PDF 등 다양하게 변화되는 추세다. 인터넷 서비스가 되는 지구촌 어디에서나 정보를 접할 수 있다. 그러나 검색된 정보의 신뢰도는 담보하기 어려운 게 사실이다.

콘텐츠큐레이션센터에서 그동안 구축해온 정보량은 올해 기준 1억개에 이른다. 한국학술지인용색인(KCI), 과학기술논문 인용색인(SCI), 네덜란드 엘스비어 출판사가 만든 전 세계 우수 학술논문 인용지수(SCOPUS) 등 주요 인용색인과 등재지 중심의 논문 DB 구축으로 신뢰성을 인정받는다.

또 기관 자체 구매와 국가 전자정보 컨소시엄(KESLI) 학술정보를 구축, 이용자에게 최적의 정보를 제공하기 위해 힘쓰고 있다. 특히 딥러닝 기반의 메타데이터 자동추출과 참고문헌 자동식별 기술 등 기술 고도화로 신속하고 정확한 데이터를 확보하고 구축했다는 평가를 받는다.

황혜경 센터장"올해부터 6억건의 참고문헌정보를 활용한 인용분석정보를 제공할 예정이다. 연구자들이 R&D에 필요한 정보와 데이터를 더 깊이있게 활용할 수 있을 것"이라면서 "신뢰도 높은 데이터 확보를 위해 센터는 이용자에게 유익한 정보로 제공해야 한다는 사명감으로 임하고 있다"며 센터의 역할을 강조했다.

그는 이어 "디지털화로 해외 관계 기관과의 네트워크도 더욱 중요해 지고 있다. 지속적인 협력을 통해 다양한 정보 확보에 집중하고 있다"고 덧붙였다.

KISTI 서가에 비치된 해외 주요 학회들의 1800년대 간행물 등 첫 호를 모아 정리한 책자(사진 위)와 국내외 학회지를 모은 자료(사진 아래). 어디에서도 볼 수 없는 중요한 자료들이다.<사진= 길애경 기자 > KISTI 서가에 비치된 해외 주요 학회들의 1800년대 간행물 등 첫 호를 모아 정리한 책자(사진 위)와 국내외 학회지를 모은 자료(사진 아래). 어디에서도 볼 수 없는 중요한 자료들이다.<사진= 길애경 기자>

◆ "책임감 갖고 이용자에게 유용한 정보"

1960년대 가장 못사는 나라였던 한국은 이젠 더 이상 후진국이 아니다. 과학기술 기반 산업 발전으로 과학기술 강국, 선진국 반열에 오르며 신흥국들의 모델이 되고 있다.

한국의 발전이 오늘에 이르기까지 많은 이들의 노력과 역할이 함께 했다. 콘텐츠큐레이션센터는 연구개발의 기반을 다지는 역할로 겉으로 드러나지 않는다. 누군가 기억하고 알아주지 않아도 연구개발에 필요한 양질의 정보 제공을 위해 노고를 아끼지 않은 그들의 활동은 여전히 진행형이다.

신진 연구자인 설재욱 연구원은 입사 후 가장 많이 들은 말로 '책임감' '사명감'을 들었다. 그리고 과거 히스토리를 알고 분야에서 최고가 되어야 한다는 말을 선배들로부터 많이 듣고 있다고 밝혔다. 그런 때문인지 그 역시 책임감을 강조했다.

그는 "우리 센터는 논문과 특허 등 과학기술정보를 이용자에게 유용하게 제공하기 위해 책임감있게 임하고 있다"면서 "이를 위해 과거의 히스토리부터 최신 트렌드까지 공부한다. 특히 선배들과 지속적인 관계를 유지하며 많은 것을 배우고 싶다"고 말했다.

인터뷰를 마무리하며 '내게 연구실이란' 의미를 과거, 현재, 신진 연구자에게 물었다.

"연구실은 지식이 잘 전달되며 내부 업무를 충실하게 지속적으로 할 수 있어야 하는 곳입니다. 선배의 지식이 후배에게 전달되며 활성화 되어야 합니다."(예용희 박사)

"장보고라고 하고 싶어요. 장인들이 정성을 들여서 만든 보물같은 정보를 구축하고 가공하는 곳, 고수들이 모인 곳이기 때문입니다."(황혜경 센터장)

"우리 연구실은 고객을 먼저 생각하는 곳입니다. 구축된 데이터가 활용되기 위해서는 이용자를 니즈를 파악하고 유용한 정보를 제공하기 위한 연구를 합니다. 아직 신입이라 어색하지만 운동과 문화 등 활력있는 활동으로 구성원간 더 친해지고 싶습니다."(설재욱 연구원) 
 
 ◆ 한국의 과학기술정보 서비스 역사
1962년 1월 유네스코한국위원회 지원으로 한국과학문헌센터 발족
1975년 일본전산시스템 업체로부터 TK-70컴퓨터 도입
1976년 한글한자 입력처리와 출력 처리시스템 S-5300 도입
1984년 온라인 DB 정보 서비스
1986년 대덕 지원 서비스
1988년 슈퍼컴퓨터 1호기 가동
1993년 슈퍼컴퓨터 2호기 가동
1999년 ETRI로부터 슈퍼컴퓨터센터 인수
2001년 슈퍼컴퓨터 3호기 구축과 KISTI 출범
2005년 국가과학기술지식정보서비스(NTIS) 구축
2010년 슈퍼컴퓨터 4호기 가동
2018년 슈퍼컴퓨터 5호기 가동.