메뉴바로가기본문바로가기

동아사이언스

전 세계 데이터의 90%가 ‘이것’…DGIST ‘암흑데이터 극한활용 연구센터’ 가보니

통합검색

전 세계 데이터의 90%가 ‘이것’…DGIST ‘암흑데이터 극한활용 연구센터’ 가보니

2021.03.08 07:00

90% 차지하는 암흑데이터 활용 기술 개발 

반도체 소자클린룸 갖추고 AI 연구 시너지

 

대구경북과학기술원(DGIST) ‘암흑데이터 극한활용 연구센터’ 전용 슈퍼컴퓨팅 시설에서 연구원들이 컴퓨터 성능을 확인하고 있다. DGIST 제공
대구경북과학기술원(DGIST) ‘암흑데이터 극한활용 연구센터’ 전용 슈퍼컴퓨팅 시설에서 연구원들이 컴퓨터 성능을 확인하고 있다. 빅데이터, 인공지능(AI) 등 4차 산업혁명을 이끌 기술 개발에는 슈퍼컴퓨터 등 첨단 연구 장비가 뒷받침돼야 한다. DGIST 제공

암흑데이터(dark data)는 사람이나 컴퓨터에 의해 생성돼 어딘가에 저장돼 있지만, 존재 여부를 알 수 없거나 찾지 못하는 데이터를 뜻하는 용어다. 데이터로 만들 수 없는 비정형 데이터, 사용자에게 필요한지 알 수 없어 활용하지 못하는 데이터를 이르는 말이다. 우주의 27%를 차지할 것으로 추정되지만 보이지도 않고 들리지도 않으며 느낄 수도 없는 존재인 암흑물질(dark matter)에서 이름을 따왔다. 

 

대구 달성군 현풍면 대구경북과학기술원(DGIST) 캠퍼스에는 이런 암흑 데이터를 연구하는 국내 유일의 슈퍼컴퓨터가 운영되고 있다. ‘암흑데이터 극한활용 연구센터’ 전용 슈퍼컴퓨팅 시설이다. 지난달 8일 찾은 센터의 문을 열고 들어가자 쉴새 없이 돌아가는 컴퓨터의 팬 소리가 사방을 가득 채웠다. 바로 옆에 있는 사람의 목소리가 들리지 않을 정도의 소음이었다. 

 

이성진 센터장(DGIST 정보통신융합전공 교수)은 “방대한 규모의 암흑데이터를 수집하고 저장하며 관리하고 처리하기 위한 모든 연구가 이곳에서 이뤄진다”며 “빅데이터, 인공지능(AI) 연구를 위해서는 복잡한 연산이 가능한 연구시설도 뒷받침돼야 한다”고 말했다. 


IBM에 따르면 전 세계에서 생성되는 데이터의 90%가 암흑데이터로 추산된다. 인간이 실제로 사용되는 데이터는 1%에 불과하다는 분석이다. 이런 이유로 최근 빅데이터 연구에서는 암흑데이터를 어떻게 처리하고 활용할지가 화두로 떠올랐다. 


이 센터장은 “쉬운 예로 e메일에 첨부됐지만 검색이 안 되는 파일이 암흑데이터에 해당한다”며 “심박수 기록, 자기공명영상(MRI) 이미지 등 의료 분야에서도 방대한 분량의 암흑데이터가 계속 생성되고 있다”고 말했다.  센터는 현재 서울대병원과는 암흑데이터에 해당하는 다량의 흉부 X선 사진에 AI를 적용해 자동으로 판독하는 진단 기술을 공동개발하고 있다.


최근에는 하드디스크, 플래시메모리 등 데이터 저장 매체가 발전해 데이터 저장용량이 TB(테라바이트) 수준으로 늘면서 암흑데이터도 많이 생성되고 있다. 이 센터장은 하드디스크에 데이터 저장뿐 아니라 연산 기능 등을 추가해 AI가 데이터를 찾을 때 처리 속도를 높이는 연구를 하고 있다. 


암흑데이터에서 의미 있는 데이터를 발굴하기 위한 검색 기술에는 딥러닝을 적용하고 있다. 이 센터장은 “페이스북이 머신러닝 기술을 도입해 자동으로 유해 콘텐츠를 가려내는 것처럼 암흑데이터가 검색에 걸리도록 인공신경망 등 AI 기술을 이용해 레이블을 달아줄 수 있을 것”이라며 “암흑데이터 발생을 원천적으로 차단할 수 있는 AI, 블록체인, 지능형 분산 검색 기술도 연구 중”이라고 말했다.

 

대구경북과학기술원(DGIST) 중앙기기센터에 구축된 소자클린룸. AI 반도체 설계부터 제작까지 전공정을 소화할 수 있다. DGIST 제공
대구경북과학기술원(DGIST) 중앙기기센터에 구축된 소자클린룸. AI 반도체 설계부터 제작까지 전공정을 소화할 수 있다. DGIST 제공

DGIST는 6인치 AI 반도체 웨이퍼를 생산할 수 있는 전 공정 장비에 0.5μm(마이크로미터·1μm는 100만 분의 1m)급 CMOS(상보형 금속산화반도체)를 제작할 수 있는 라인까지 최근 추가했다. 이봉호 DGIST 중앙기기센터장은 “CMOS 위에 지능형 반도체를 얹을 수 있다”며 “인간의 신경세포 작동 방식을 흉내 낸 뉴로모픽(신경모방) 반도체를 만들어 실험동물센터의 영장류에 직접 심어서 실험할 수도 있다”고 말했다. 

 

관련 태그 뉴스

이 기사가 괜찮으셨나요? 메일로 더 많은 기사를 받아보세요!

댓글 0

13 + 5 = 새로고침
###
    과학기술과 관련된 분야에서 소개할 만한 재미있는 이야기, 고발 소재 등이 있으면 주저하지 마시고, 알려주세요. 제보하기