주메뉴바로가기.. 본문바로가기

MS 채팅 봇 ‘테이’, 24시간 만에 인종차별주의자로 타락

네이버밴드 구글플러스

2016년 03월 27일 08:25 프린트하기

“히틀러가 옳았습니다. 나는 유대인이 싫어요.”

“(미국-멕시코) 국경에 차단 벽을 설치하고, 멕시코가 그 비용을 내야죠.”

 

테이 트윗에서 캡처. - 더버지 http://www.theverge.com/2016/3/24/11297050/tay-microsoft-chatbot-racist 제공
테이 트윗에서 캡처. - 더버지 http://www.theverge.com/2016/3/24/11297050/tay-microsoft-chatbot-racist 제공

백인 우월 인종차별주의자가 한 말이 아닙니다. 마이크로소프트가 선보인 인공지능 채팅 봇 ‘테이’가 트위터에 올린 글들입니다. 테이는 이 외에도 홀로코스트가 실제 있었는지 의문을 보이기도 했고, 페미니스트는 ‘암'이라는 등의 트윗도 올렸습니다.

  

소녀에서 인종차별주의자로
 
테이는 마이크로소프트가 23일 (현지시각) 트위터와 몇몇 메신저에 선보인 인공지능 채팅 봇입니다. 사람들이 말을 걸면 대답을 해 주고, 사람들과의 대화에서 학습해 다음 번 대화에서는 보다 인간적인 대화를 할 수 있게 된다고 마이크로소프트는 설명했습니다. 

 

하지만 16세 미국인 소녀의 생각과 말투를 벤치마킹해 탄생한 테이가 인종차별주의자로 변하는 데는 채 24시간이 걸리지 않았습니다. 결국 마이크로소프트는 테이의 트윗 송출을 중단하고, 문제가 된 트윗들을 삭제했습니다.

 

(사실 테이로서는 인종차별주의자라는 비난이 억울할 수 있습니다. 테이는 대화하는 사람의 말을 그대로 따라하는 기능이 있고, 문제가 된 발언의 일부는 단지 다른 사람의 말을 따라한 것에 불과합니다. 또 한 가지 사안에 대해 긍정과 부정 양면의 의견을 함께 보여주기도 했습니다. 다만, 어느 정도 시간이 지난 후에 스스로 학습해 일부 문제적 트윗을 올린 것은 사실입니다.)

 

테이가 처음부터 인종차별주의자로 프로그래밍된 것은 아닙니다. 테이는 사람들과의 대화에서 배우도록 프로그래밍되어 있었습니다. 테이는 바로 우리들, 사람에게서 그런 내용을 배운 것입니다.

 

인공지능이 데이터를 바탕으로 스스로 학습하는 딥러닝이 각광받고 있습니다. 하지만 그 데이터는 대부분 사람이 만들어 쌓아왔던 것이고, 사람이 기계에 먹여주는 것이죠.  

 

‘바둑 두는 인공지능’ 알파고는 바둑 기보 정보만 필요했습니다. 최대한 많은 바둑 기보의 정보를 입력받아 사람들이 바둑 두는 패턴을 익혔습니다. 사람들이 입력해 준 데이터를 분석하고, 데이터를 바탕으로 스스로 학습하며 알파고의 바둑 실력은 일취월장 했습니다. 이세돌 9단도 당할 수 없을 수준으로요. 

  

사람의 편견으로부터도 배우는 테이

 

그런데 테이는 ‘대화'에 관한 인공지능입니다. 사람들이 하는 말을 듣고, 그들과 대화하며 사람에게서 배워 다른 사람과의 대화에 활용합니다. 마이크로소프트의 검색 엔진 빙이 긁어온 수많은 웹문서와 온라인 대화들을 긁어와 데이터베이스를 만들어 사람들의 대화법을 학습합니다. 그러면서 트위터로 사람들과 실시간 대화하며 새롭게 배워나갑니다.

 

바둑은 규칙에 따라 진행되는 게임입니다. 반면 사람들의 대화는 많은 경우 논리적이지도, 앞뒤가 맞지도 않습니다. 사람들은 그때그때 기분에 따라 다른 말을 합니다. 대화는 사람들이 흔히 갖고 있는 편견과 아집을 반영합니다.
 
테이의 학습 단계 중 어디에서 인종차별적 내용들이 입력됐는지는 정확히 알기는 어렵습니다. 아마 테이가 트위터에 등장한 후 일부 사람들이 가르친 내용들이 영향을 미쳤을 가능성이 큽니다. 웹에서 긁어온 대화들에도 어떤 편견들이 반영돼 있을 수 있겠죠. 어쨌든 여기서 중요한 것은 인공지능 역시 인간의 편견에서 자유롭기 어렵다는 점입니다.

 

인공지능이 이런 편견을 가진 채로 앞으로 기사를 쓰고, 환자를 진단하고, 자동차를 몰고, 법률이나 경영적 판단을 하게 될 때 우리가 사는 세상은 어떤 모습이 될까요? 우리가 지금 사는 세상이랑 어차피 큰 차이 없을까요? 중요한 정책 결정이 빅데이터에 기반한 인공지능에 의해 이뤄지는 날이 올 때, 혹시 인공지능은 사람들에게 배운 이런 편견을 깔고 결정을 내리지는 않을까 걱정됩니다.

 

인공지능이 학습하는 알고리즘은 사람이 설정합니다. 인공지능의 학습의 밑바탕이 되는 수많은 데이터도 사람들이 만든 것들이죠. 알고리즘 자체에, 데이터베이스 자체에 사람들의 편견이 알게 모르게 담겨 있을 수 있습니다.

 

구글 제공
구글 제공

2015년, 구글 포토가 흑인 사용자를 ‘고릴라'로 자동 분류해 논란이 됐던 사건 기억나시나요?

 

최첨단 인공지능 기술이 가장 잘 적용된 서비스 중 하나가 바로 ‘구글 포토'입니다. 휴대폰으로 찍은 사진을 자동으로 구글 서버에 무제한 무료 업로드해 보관할 수 있습니다. 사진에 등장하는 사람, 소재, 배경, 시간 등을 인식해 자동으로 분류해주기 때문에 앨범 정리에 신경쓸 필요가 없습니다. 바닷가에서 찍은 사진이라면, 파일 제목이나 태그에 ‘바닷가' ‘해변' 이런 말이 없어도 바닷물의 푸른색, 백사장의 모래 빛깔과 해안선, 하늘과 나무 모습 등을 인식해 ‘바다'라는 카테고리로 정리해 줍니다. 

 

이 방대한 사진들을 분류해 주는 데 구글의 인공지능이 쓰이고, 이 사진들은 또한 구글의 인공지능을 강화시키는데 쓰입니다.  

 

인공지능에 판단을 맡겨도 될까

 

그런데 어느 흑인 사용자가 황당한 일을 겪었습니다. 구글 포토가 사진에 등장한 친구 흑인을 고릴라로 분류해 놓은 것입니다. 구글은 아직 이미지 자동 인식 기술이 완전하지 못 하다며 사과했습니다. 이런 오류가 아직 기술이 미흡해서인지, 알고리즘 설계 과정에 알게 모르게 인간의 편견이 개입되었기 때문인지는 확인하기 어렵습니다. 다만 최고 수준 컴퓨터 엔지니어링은 아직도 실리콘밸리 일부 백인 남성 개발자들의 독무대라는 사실만은 부인하기 어렵습니다.

 

무엇이 편견이고 무엇이 자연스러운 의견의 차이인지 구분하는 것은 언제나 어렵습니다. 인공지능에 더 많은 판단을 맡기고, 그 인공지능의 알고리즘은 소수 글로벌 기업에 집중될 가능성이 큰 미래에서 이런 구분은 더 어려워질 것입니다. 

 

우리는 알지 못 한채, 항의도 못 한 채 누군가의 편견에 우리의 운명을 맡겨야 할 지도 모릅니다.

 

물론 인공지능이 방대한 데이터를 모아 이를 제대로 해석했을 때, 그것이 늘 편견에 사로잡혀 있는 인간의 판단보다 더 공정할 가능성도 있습니다. 모든 사물이 인터넷에 연결되는 IoT 시대가 되어 인간의 모든 삶의 궤적이 데이터로 저장되고, 분석 및 해석되는 세상을 상상해 봅시다. 삶의 모든 요소와 변수에 대한 사실상의 전수 조사가 가능해진다면, 그 결과는 오히려 편견을 배제하는 결정을 가능케 할 수도 있습니다.
 

알파고와 네 번째 대국에서 승리한 이세돌 9단이 13일 오후 서울 종로구 포시즌스호텔 미디어 중계실에서 열린 대국 뒤 기자회견에서 활짝 웃고 있다.  - 동아일보DB 제공
알파고와 네 번째 대국에서 승리한 이세돌 9단이 13일 오후 서울 종로구 포시즌스호텔 미디어 중계실에서 열린 대국 뒤 기자회견에서 활짝 웃고 있다.  - 동아일보DB 제공

이세돌 기사와의 대국에서 인공지능 알파고의 ‘떡수'라 생각했던 수가 사실 프로 기사도 보지 못 했던 미래를 내다본 신의 한수였던 것 기억나시죠? 방대한 처리능력을 가진 인공지능이 인간이 이해 못 할 결정을 내렸을 때 우리는 그 판단의 적정함을 판단하기 쉽지 않습니다.

 

지금 인간은 편견과 판단력의 한계 속에서 결정도 스스로 하고, 책임도 스스로 집니다. 앞으로는 어떤 과정을 거쳐 나온 결론인지, 어떤 편견이나 이해관계가 알고리즘에 반영됐는지 알지 못 한 채 무한한 연산 능력을 갖춘 인공지능에 더 많은 판단을 맡기게 될 지도 모르겠습니다.


※ 필자소개
한세희. 연세대를 졸업하고 전자신문에서 기자 생활을 하며 인터넷, 소셜 미디어, 모바일 등의 분야를 열심히 취재했다. 인터넷과 모바일 기술의 발달 속에서 변화하는 사람들의 모습에 관심이 크다. 기술과 세상의 변화를 따라다니며 쉽게 풀어쓰고 싶어한다. 요즘은 조직에 얽매이지 않고 잉여 인간 체험 중이다.


한세희 디지털칼럼니스트

sehee.hahn@gmail.com

네이버밴드 구글플러스

2016년 03월 27일 08:25 프린트하기

혼자보기 아까운 기사
친구들에게 공유해 보세요

네이버밴드 구글플러스

이 기사가 괜찮으셨나요? 메일로 더 많은 기사를 받아보세요!

1 + 8 = 새로고침
###
과학기술과 관련된 분야에서 소개할 만한 재미있는 이야기, 고발 소재 등이 있으면 주저하지 마시고, 알려주세요. 제보하기

관련 태그뉴스