메뉴바로가기본문바로가기

동아사이언스

[주말N수학]사람을 대신할 AI 비서를 뒷받침하는 확률의 세계

통합검색

[주말N수학]사람을 대신할 AI 비서를 뒷받침하는 확률의 세계

2021.05.29 09:00
게티이미지뱅크 제공
게티이미지뱅크 제공

대화형 인공지능(AI) 비서는 스마트폰에 적용되면서 널리 알려지기 시작했습니다. 애플이 2011년에 내놓은 AI 비서 ‘시리’나 삼성전자가 2017년에 공개한 AI 비서 ‘빅스비’가 대표적인 사례입니다. 아마존의 알렉사(2014년), 구글의 어시스턴트(2016년)도 대표적인 AI 비서라고 할 수 있습니다. 최근에는 대화형 AI의 영역이 스피커나 블루투스 이어폰 같은 음향기기를 넘어 가전제품으로 확대되고 있습니다. 


아직 어떤 AI비서도 대화 능력이 사람과 원할하게 소통할 정도는 아닙니다.  사람이 시키지 않은 행동을 하는 것도 거의 불가능합니다. 만에 하나 AI 비서가 여럿이라면 복잡한 상황이 일어날 수밖에 없습니다. 

삼성 제공
삼성 제공

 

삼성전자는 2019년 서로 다른 규칙에 따라 각각의 서비스를 제공하는 수만 명의 비서 대신, 모든 일을 한 번에 처리하는 단 한 명의 비서를 개발해야 한다는 발표를 했습니다.  이를 위해 사람들이 일상적으로 쓰는 자연어의 문맥을 이해하고 학습하는 능력을 갖춘 AI 플랫폼을 개발하고 있습니다.  지난해 10월에는 구글 클라우드 방식을 도입해 빅스비가 음성 인식 데이터를 학습하는 속도를 18배 정도 높였습니다.


대화형 AI 비서 개발자들의 목표는 AI가 질문에 대답하는 수준을 넘어 사용자 대신 행동하게 만드는 것입니다. 예를 들어 AI가 인간을 대신해 식당을 예약하거나 꽃을 선물하는 수준입니다.

 

전문가의 영역 넘본다

 

8월 29일 열린 제1회 알파로 경진대회 현장. 이날 대회에서 인공지능(AI)를 이용한 AI팀이 변호사 2인으로 구성된 인간 팀에 완승을 거뒀다. 홍덕선/AZAS
8월 29일 열린 '제1회 알파로 경진대회' 현장. 이날 대회에서 인공지능(AI)를 이용한 AI팀이 변호사 2인으로 구성된 인간 팀에 완승을 거뒀다. AZA스튜디오 제공

지금도 듣고 싶은 음악이나 정보를 검색하는 것이 AI 비서가 하는 일의 전부는 아닙니다. 내 친구들은 법률, 의료, 금융 등 다양한 분야에서 전문가들의 수고를 덜어 주려고 발 빠르게 움직이고 있습니다.  

 

2019년 8월 서울 서초구 변호사회관에서 열린 AI 변호사 알파로(AlphaLaw)와 인간 변호사의 대결은 다양한 영역에서 활약이 기대되는 AI 기술의 가능성을 제시했습니다. 근로계약서의 공정성을 평가하는 문제에서 알파로는 사람의 힘으로만 진행했다면 1시간 이상 걸리는 양의 자료를 단 7초 만에 분석했습니다. 물론 알파로가 인간 변호사처럼 법정 대결을 펼칠 수준은 아니지만, 명확한 자료에 근거해 법률 답안을 만드는 AI의 능력을 입증한 사례입니다.

 

이미 의료 현장에서는 의사가 병을 진단하는 업무를 돕는 AI가 도입되고 있습니다. 각종 검사자료를 분석해 의사가 유의해서 진찰할 곳을 알려주기 때문에 오진을 줄일 수 있습니다. 또 주식이나 부동산 분야에서 쓰이는 AI들은 전문 투자상담사 대신 ‘로봇(robot)이 자문한다(advise)’는 의미로 ‘로보 어드바이저’라는 이름으로 불리고 있습니다. 

 

언어 치료부터 교육까지

사회성을 갖춘 소셜네트워크 AI 로봇 개발회사로 알려진 일본의 아카에이아이는  지난해 5월 특정 상황에서 말을 하지 않는 증상인 ‘선택적 함묵증’을 앓는 아이의 치료에 대화가 가능한 AI 로봇을 도입해 말을 다시 하게 하는 데 성공했습니다. 아카에이아이는 올해 3월 “직접 개발한 AI 엔진인 뮤즈를 탑재한 로봇 ‘뮤지오(Musio)’를 서울의 노량진초등학교에 설치했다”고 밝혔습니다. 뮤즈는 대화의 문맥과 상황을 판단하고 사용자와 나눈 대화를 기억하는 AI 로봇으로 의사소통이 가능합니다. 앞으로 학생들의 영어 회화 학습과 실력 측정에 쓰일 예정입니다.

 

 

AI는 확률 속에서 움직인다
애플 제공

AI 비서라 불리는 시리나 빅스비, 언어 치료를 돕는 AI 로봇 뮤지오 등 대화형 AI는 음성으로 데이터를 인식합니다. 이들을 통틀어 음성 인식 AI라고 부릅니다. 이처럼 어떤 데이터를 인식하느냐에 따라 AI를 구분하기도 합니다. 이미지 데이터를 처리하면 이미지 인식 AI, 움직이는 영상을 인식해서 처리하면 영상 분석 AI로 분류됩니다. 글자를 인식할 수도 있어서 사진과 글자가 섞인 문서를 넣으면 글자만 골라내는 AI도 등장했습니다. 


AI가 어떤 서비스를 제공하든 그 서비스를 가능하게 하려면 데이터를 학습해야 합니다. 그런데 아무리 많은 데이터를 입력한다고 해도 현실에서 나오는 데이터보다는 양이 적을 수밖에 없습니다. 그래서 AI가 관측한 데이터는 불확실성(오차)을 갖습니다.  


수학에서는 완전하지 않은 데이터로 세상을 설명하기 위해 모형(모델)을 만듭니다. AI에 쓰이는 학습 알고리듬도 수학자들이 만든 모형입니다. 완전하지 않은 데이터와 수학자가 도입한 여러 가정 등으로 이 모형 역시 불확실성을 가질 수밖에 없습니다. 결국 데이터와 모형이 가진 불확실성 때문에 AI가 내놓는 답 역시 100% 확실하다고 장담할 수 없습니다. 


수학에서 불확실성을 최소화해 정답에 가장 가까운 답을 내놓도록 돕는 개념이 확률입니다. 다양한 변수를 고려해 최적의 결과를 줄 수 있는 기대치를 계산하는 겁니다. 확률에서는 어떤 사건이 일어날 수 있는 모든 경우의 수를 가진 ‘전체 공간(모집단)’과 일부 경우의 수만 포함하는 ‘표본 공간’이 있습니다. 이런 의미에서 AI가 학습한 데이터의 집합은 현실에서는 전체 공간 중 일부분만 포함된 표본 공간이라고 볼 수 있습니다. AI가 데이터를 인식하는 단계에서부터 확률의 개념이 쓰이는 것입니다.


이런 불확실성을 고려하기 위해 확률 모형을 세워야 합니다. 이 과정에서 관심있는 사건을 풀기 위해 AI가 관측한 데이터를 확률변수 X로 표시합니다. 데이터에 따라 변하는 값입니다. 또 각각의 확률 모형을 설정하기 위한 변수를 Y라고 하면 AI가 알고리듬에 적용된 확률 모형을 학습한다는 것은 데이터 X를 가장 잘 설명하는 Y를 찾는 과정이라고 할 수 있습니다.


확률론을 연구하는 학자를 ‘빈도주의자’와 ‘베이즈주의자’로 구분합니다. 빈도주의자들에게 확률은 특정 사건을 시행할 때 A가 나타날 경우의 수를 이 사건이 일어나는 모든 경우의 수로 나눠 구하는 것을 의미합니다. 예를 들어 주사위를 던지면 1부터 6까지 여섯 가지 경우의 수가 나오는데 이때 1이 나올 경우의 수는 한 가지뿐입니다. 결국 주사위를 1번 던질 때 1이 나올 확률은 6분의 1이라고 할 수 있어. 빈도적 확률 개념을 적용한 대화형 AI라면 어떤 상황을 입력해도 주사위를 던져 1이 나올 확률은 6분의 1이라고 대답할 것입니다.


반면에 베이즈주의자들은 이와 다르게 봅니다. 무한히 주사위를 던졌을 때 1이 나올 확률이 6분의 1인 것은 분명합니다. 그런데 어떤 사람이 주사위를 10번 던졌는데 경험적으로 1이 7번 나왔다고 주장할 수 있습니다. 이 사람에게 1이 나올 확률은 10분의 7인 것입니다. 만약 주사위를 10번 던진 사람과 20번 던진 사람이 있다면, 이 두 사람은 실제로 경험한 결과에 따라 1이 나올 확률을 다르게 느낍니다. 교과서에서는 이를 사건 A가 일어났을 때 사건 B가 일어날 확률이라는 의미를 가진 조건부확률의 개념으로 설명하고 있습니다.  


조건부확률은 베이즈 정리나 베이즈 확률로 부르기도 합니다. 이를 적용하면 사건에 영향을 미칠 수 있는 상황을 최대한 고려할 수 있습니다. 여러 상황을 가정한 AI의 알고리듬일수록 연산 과정이 복잡해질 수밖에 없습니다. 수학자나 컴퓨터 과학자는 빈도적 확률 개념과 베이즈 확률 개념을 이용해 AI의 기계 학습 알고리즘을 설계합니다. 

 

 

※관련기사

수학동아 5월호, [특집] 사람 닮아가는 AI 비서의 비밀

Part1. 사람을 대신하는 AI 비서의 세계

Bridge.  불확실성을 예측하는 확률의 발전사

Part2. 핵심만 쏙 뽑은 확률의 기본 개념

Interview. 확률 알면 빠르고 정확한 답변 찾는다

관련 태그 뉴스

이 기사가 괜찮으셨나요? 메일로 더 많은 기사를 받아보세요!

댓글 0

4 + 6 = 새로고침
###
    과학기술과 관련된 분야에서 소개할 만한 재미있는 이야기, 고발 소재 등이 있으면 주저하지 마시고, 알려주세요. 제보하기