티스토리 뷰

반응형

chat gpt와 gpt-4의 출시, 그리고 튜링테스트

 

1.  Chat GPT란 무엇일까

Chat GPT는 OpenAI라는 회사에서 개발한 인공지능 채팅 서비스입니다. 사람이 컴퓨터에 궁금한 것을 입력하면 컴퓨터가 해답을 찾아주는 서비스입니다. 약 10년 전쯤 대한민국에도 심심할 때 대화상대가 되어주는 귀여운 이름의 '심심이'라는 채팅봇이 유행했습니다. 어느순간부터 심심이가 다양한 사람들의 말을 학습하여 나쁜말을 하기도 하던게 기억이 납니다. '심심이'를 알고있는 대한민국 사람들은 Chat GPT는 고학력 '심심이'같은 것이라고 생각하면 이해가 쉬울 것입니다. Chat GPT는 2018년에 처음 공개된 GPT-1를 시작으로 하였습니다. GPT-3.5가 대기업 자기소개서, 회사 보고서 작성, 논문 작성 등 다양한 분야에서 크게 도움을 주고 있다는 리뷰가 이곳저곳에서 올라오며 현재 대중의 큰 관심을 받고있는 버전입니다.

 챗봇에서 사용되는 핵심 기술 중 하나로 자연어처리 기술이 있습니다. 컴퓨터는 사람의 언어를 이해할 수 없습니다. 사람의 언어를 컴퓨터가 이해할 수 있도록 통역해주는 것이 자연어처리입니다. 단어와 문장을 직접 입력하는 것 이외에도 문장과 문장 사이의 행간의 의미와 대화 상황에 따른 뉘앙스를 컴퓨터가 이해하고 자연스럽게 재구성하도록 하기 위하여 고도의 기술과 막대한 저장용량이 필요합니다. 최근 자연어처리 기술과 클라우드, 대규모 대용량 데이터 처리 기술이 발달하며 한층 더 사람에 가까워진 인공지능컴퓨터의 시대가 오고 있습니다.  

2. Chat GPT-4

 OpenAI사는 샌프란시스코 현지 기준으로 2023년 3월 14일 오전 10시에 공식으로 Chat GPT-4를 발표하였습니다. 이전 버전인  GPT-3.5와 비교하여 보면, GPT-3.5는 미국 변호사 시험에서 하위 10%의 성적 받았다면 GPT-4는  상위 10% 점수를 받을 수 있을 정도로 능력이 좋아져 이전에 비해 획기적으로 전문가다워진 모습을 보입니다. 또 영어를 기준으로 한 번에 처리할 수 있는 단어량이 3000개에서 2만5000개로 8배 이상 늘어난 우수한 성능을 보입니다. 챗봇을 사용하다보면 컴퓨터가 사람의 말 중 나쁜 말까지 학습해버리는 현상을 종종 경험하게 됩니다. 이를 방지하고자 OpenAI는 다양한 전문가들과 함께 AI 모델이 위험한 답변을 하지 않도록 안전 장치를 만들어 GPT-4에 적용했습니다. 허용되지 않는 요청에 대한 답변에 응답하는 경향을 82% 줄이게 되었으며 이는 컴퓨터가 허용되지 않은 말을 하는 것을 막게 끔 교육을 한 것입니다.  또한 환각 오류라고 하는 컴퓨터가 사실과 다른 것을 마치 진실인 것처럼 강한 확신을 담아 답변하는 문제에 대하여 보강하여 이전 모델보다 40% 높은 점수를 받게 되었습니다. 

 

3. 튜링테스트

 

 IT업계 항간에는 GPT-4가 튜링테스트를 통과했다는 말이 돌고있다고 합니다. 튜링테스트는 컴퓨터가 인간과 얼마나 잘 대화할 수 있는지 판별하고자 하는 실험입니다. 이제부터 저는 벽 너머의 두 명과 대화를 시작합니다. 저와 대화하는 한 명은 컴퓨터이고 다른 한 명은 인간입니다. 그러나 벽에 가로막혀 누구와 대화하는지 볼 수는 없습니다. 만일 제가 두 명 중 누가 컴퓨터이고 누가 인간인지 분간할 수 없을 정도로 대화가 매끄럽게 진행된다면, 저와 대화했던 컴퓨터는 튜링테스트에 통과하게 됩니다.

 이 튜링테스트는 1950년 앨런 튜링이라는 맨체스터 대학교의 연구원이 고안한 테스트입니다. 초기에 인공지능을 연구하던 학자들은 인공지능이 무엇인지, 무엇이 인간다운 대화인지 개념을 명확히 정하지 못하고 있었습니다. 이 때 앨런 튜링은 지능이나 인간다움 등의 기준을 정하는 것은 잠시 나중으로 미루고, 우선 인간이 볼 때 인간같은 컴퓨터를 어떻게 만들 것인지에 집중하는 것이 훨씬 발전적일 것이라고 하였습니다. 그러면서 등장한 것이 인간이 볼 때 인간같은 컴퓨터를 판별하는 튜링테스트라는 실험이었습니다. 이후로 인공지능기계의 성능을 나타낼 때 튜링테스트를 많이 언급합니다. 하지만 엄밀히 살펴보면 튜링테스트는 대화지능 영역이 될 수 있을 뿐, 사람의 표정이나 감정을 살피는 능력까지 갖추었다고는 할 수 없습니다. 그렇기에, 우리는 튜링테스트를 컴퓨터의 성능이 얼마나 우수해졌는지 나타내는 비유적인 척도로 이해하면 좋을 것입니다. 

인공지능 교과서로 유명한 'Artificial Intelligence: A Modern Approach'라는 책에 다음과 같은 말이 나옵니다. 

튜링은 60년이 지난 지금도 여전히 유효한 테스트를 설계한 공로를 인정받을 만합니다. 하지만 AI 연구자들은 튜링 테스트를 통과하기 위한 노력을 거의 기울이지 않았습니다. 튜링 테스트를 통과하는 데 거의 노력을 기울이지 않았으며, 모범을 복제하는 것보다 지능의 기본 원리를 연구하는 것이 더 중요하다고 믿었습니다. 비행기를 만든 라이트 형제는 새를 모방하는 것을 그만두고 실험을 하며 공기 역학에 대해 배우기 시작했습니다. 항공 공학 교과서에서는 이 분야의 목표를 '정확하게 비행하는 기계'를 만드는 것으로 정의하였지 '다른 비둘기들고 속일 수 있을 정도로 비둘기와 똑같이 날아다니는 기계'를 만드는 것이라고 정의하지 않았습니다.

반응형