컨텐츠 바로가기

[Tech Talk] 챗GPT의 세계로 안내합니다


생성 AI의 진화와 발전


2023.02.14

현대카드·현대커머셜 뉴스룸의 모든 콘텐츠는
미디어에 활용하실 수 있습니다.
콘텐츠 활용 시에는 출처
(현대카드·현대커머셜 뉴스룸)표기를 부탁 드립니다.
ChatGPT

챗GPT가 화제다. 작년 한 해 생성 AI가 휩쓸고 간 기억이 사라지지도 않았는데, 하루가 멀다 하고 챗GPT에 관한 기사가 쏟아진다. 기사만 쏟아질까? SNS에서 챗GPT를 이렇게 쓰고 저렇게 써 본 후기가 매일 같이 올라온다. 기사나 학교 숙제, 소설을 쓰는 건 물론이고, 시험을 통과했다거나 프로그램을 짜는 일도 했다고 전해온다. 이번 Tech Talk에서는 요즘 화제의 챗GPT에 대해 알아보자.

챗GPT는 OpenAI에서 만든 챗봇(chatbot) 소프트웨어다. 챗봇이 처음도 아닌데 다들 왜 이렇게 챗GPT에 열광하는 걸까? 그림 만드는 AI에 들떴던 것처럼 챗GPT 역시 쉽고, 직접, 유용하게 쓸 수 있는 인공지능 서비스이다. 대형 언어 모델에 기반한 생성 AI 서비스는, 이제까지 쉽게 만들 수 없다고 생각했던 여러 콘텐츠를 간단히 그럴듯하게 만들어낸다. 원하면 누구나 써 볼 수 있고, 쓰는 방법도 간단하다.

다시 말해, 생성 AI 계열 서비스는 우리가 평범하게 처음 만나는 ‘직접 사용할 수 있는 인공지능’이다. 아직 한계가 분명하지만, 조금 더 다듬으면 쓸 곳이 많을 것 같다. 이런 특징이 사람들의 호기심을 크게 자극했다. 뒤처질세라 비슷한 기술을 가지고 있던 다른 빅테크 기업도 앞다퉈 기술 공개를 시작했다. 순식간에 거대한 트렌드가 생겼다.

다른 기업도 가지고 있던 챗GPT?

다른 빅테크 기업도 비슷한 기술을 이미 가지고 있었다고? 맞다. 기술은 순차적으로 발전한다. 알파고 같은 딥러닝으로 단련된 인공지능이 인기를 얻은 이후, AI를 번역, 이미지 인식, 음성 인식, 검색 기술 같은 다양한 곳에 다양한 형태로 쓰기 시작했다. 예전과 비교하면 정말 많이 발전했지만, 그걸 피부로 느끼건 어려웠다.

변화가 시작된 건 2017년이다. 구글에서 ‘트랜스포머’라고 불리는 딥러닝에 쓰이는 인공신경망 알고리즘을 발표했다. 기존 자연어 처리 기술보다 빠르고, 언어 이해 능력을 높인 기술이다. 원래는 언어 번역을 위해 태어났지만, 글이나 이미지, 소리, 영상 등 다양한 데이터를 학습하면 다른 곳에도 쓸 수 있기에 여러 분야에서 쓰고 있다.

강력하지만 공개된 AI 모델이기 때문에, 다른 회사들도 이에 기반한 새로운 연구나 서비스를 준비할 수 있었다. 스스로 주어진 데이터 조각의 관계를 파악하기에, 다른 AI 모델처럼 미리 사람이 분류한 대량의 데이터를 준비할 필요가 없다는 것도 장점이다. 덕분에 2018년 6월, 오픈AI에서는 GPT1란 자연어 처리 기술을 내놓을 수 있었다(이름부터가 Generative Pre-trained Transformer의 줄임말이다).

이후 줄줄이 대형 언어 데이터를 학습한 AI가 발표됐다. 구글에서 발표한 BERT(2018년 10월), 엔비디아의 Megatron(2019년 8월), 오픈AI의 GPT2(2019년 11월), MS의 Turing NLG(2020년 2월)등이다. 이 과정에서 더 많은 데이터 학습과 더 많은 매개 변수가 성능을 크게 끌어올릴 수 있다는 것을 알게 됐다.

그리고 2020년 6월, 1,750억 개의 매개 변수를 학습한 GPT3가 발표되며, 인공지능 판을 뒤흔들어 놨다. 너무 자연스러운 문장을 만들어내기 때문이다. 오죽하면 연구자들이 직접, 발표 논문 후반부 거의 절반에 걸쳐 GPT3의 영향력과 이에 따라 발생할 잠재적인 위험에 대해 경고했을 정도다.

챗GPT의 과감한 도전, 과감한 성공

이미 연구를 진행하고 있던 회사도 있었지만, GPT3가 놀라운 수준으로 문장을 만들어낸 충격이 많은 회사를 움직였다. 한국 네이버(하이퍼클로바)나 카카오 브레인(KoGPT) 같은 회사도 연구에 착수해서 GPT3 기반 인공지능을 발표했다. GPT3는 다른 회사의 응용 프로그램이나 웹 서비스에서도 사용할 수 있는 기능을 제공했기에, GPT3를 이용해 뭔가를 만들겠다는 회사도 속속 생겼다.

2021년 3월 기준으로도 GPT3를 채용한 기업은 300개 이상, 매일 도서 8만 권에 달하는 글을 쓰고 있었다. 쓰는 방법도 다양해서 설문 조사나 고객과의 채팅 기록 내용을 가져와 순식간에 요약하거나, 게임에서 가상 캐릭터가 말하게 하거나, 고객 개개인의 요구에 맞는 맞춤 문서를 생산하거나 하는 등 이미 많은 일을 하고 있었다. 지금 챗GPT 관련 회사라고 불리는 회사는, 대부분 GPT3를 기반으로 이런저런 일을 해오던 회사다.

다만 이때까지만 해도, GPT3는 인공지능 판이나 관련 회사에만 잘 알려진 수준이었다. 사람이 쓴 글과 구별하기 어려운 문장을 작성하는 만큼, 역풍을 불러올 가능성이 컸기 때문이다. MS는 AI 챗봇 Tay를 내놨다가 이미 호되게 신고식을 치른 적이 있었고, 한국에서도 AI 챗봇이 큰 결함을 보여줘 결국 서비스 중지된 적이 있다.

AI가 대중적으로 공개되면 거의 즉시 타락시키거나 농락하려는 사람이 달라붙는다. 어뷰징이 가능하면 어뷰징을 하는 게 본능인 사람이 있다. 어뷰징까지는 아니어도 윤리적으로 문제 되는 시도를 하기도 한다. GPT3 역시 이를 이용해 제공되는 ‘Project December’ 사이트에서, 사망한 약혼자를 챗봇화 시키려는 이용자가 발견됐다. 그만큼 AI 챗봇을 대중적으로 공개하는 것은 위험하기에, 일반적으론 비공개 베타 형식으로만 쓸 수 있게 제공된다.

하지만 이미지를 만드는 인공지능 DALL-E2를 누구나 쓸 수 있게 공개해서 큰 명성을 획득한 오픈AI는, 2022년 11월 챗GPT 역시 간단한 가입만 하면 누구나 쓸 수 있게 공개했다. 아니나 다를까 뜨거운 반응이 쏟아져 나왔다. 처음에는 간단한 질문을 하다가, 특정 주제에 대한 글을 작성해 달라고 하고, 간단한 프로그램을 짜거나 영어 문법 틀린 걸 교정하거나, 심지어 소설을 쓰거나 게임 배경 스토리도 만드는 등, 만능 글쟁이 역할도 맡기 시작했다. 물론 아직까지는 자주 멈추고, 그럴듯한 문장에 비해 내용은 평범하며, 오류가 있는 내용을 쓸 때가 생각보다 많지만 말이다.

인간은 챗GPT를 어떻게 쓰게 될까?

요즘은 자주 ‘기술이 사라지는 순간’에 대해 얘기한다. 우리가 그 기술이 어떻게 작동하는지 몰라도, 쓰기 쉽고, 필요하거나 재미있어서 계속 사용하게 되는 때다. 챗GPT는 그런, 기술이 사라지는 순간을 보여줬다. 대화하듯 문장을 입력하면, 그럴듯한 결과물을 만들어낸다.

앞으로는 어떻게 될까? 우선 기존에 사용하던 오피스나 웹브라우저 같은 프로그램, 검색 엔진 같은 웹 서비스에 인공지능이 ‘보이게’ 도입될 예정이다. MS는 검색 엔진 빙(Bing)과 엣지 브라우저에 오픈AI의 새 모델 프로메테우스를 적용하겠다고 발표했다. 이를 통해 더 정교하고 정리된 검색 결과를 제공하고, 브라우저에서 간단한 콘텐츠 초안을 작성하는 일이 가능해진다.

구글은 챗GPT와 비슷한 Bard를 선보였다. 2년 전에 출시한 LaMDA라는 대화 프로그램용 AI 모델에 기반한 제품으로, 역시 구글 검색에 통합될 가능성이 크다. 네이버에선 하이퍼클로바에 기반한 서치 GPT를 내놓을 예정이다. 메타는 챗GPT 같은 서비스 갤럭티카를 공개했다가 철수했지만, 동영상 생성 AI ‘Make-A-Video’ 같은 프로젝트를 계속 진행하고 있다. 중국 바이두 역시 ERNIE Bot(文心一言)이란 AI 챗봇을 개발하고 있다고 알렸다.

기존 GPT3 기반 제품을 개발하던 곳은 여전히 기대를 모을 것이다. 프로그램을 짜주거나, 마케팅용 카피나 글을 써주거나, 법률문서를 작성하는 일 등이다. 앞으로는 여행 계획을 짜거나 새로운 일을 배우는 방법, 운동 루틴을 알려줄지도 모른다. 가능성은 무궁무진하고, AI 역시 점점 더 좋아질 것이다. 생성 AI 전체로 놓고 보면 더 그렇다.

하지만 아직까지는 한계가 분명하다는 점은 잊지말자. 실제로 오픈AI CEO인 샘 알트먼은 사람들이 GPT4에 대한 기대가 너무 커서, 분명히 실망하게 될 거라고 말하기도 했다. 반복적인 성격이 큰 작업은 잘할 수 있지만, 사람 같기는 어렵다. 작동하기 위해 슈퍼컴퓨터급의 강력한 컴퓨터 성능을 요구하는 것도 문제다. 한마디로 실제 운영 비용이 너무 많이 든다. 본질적으로 확률에 기반해 문장을 짜깁기하는 거라서, 내용을 신뢰하기 어렵다. 기존 AI 챗봇이 보여준 편향이나 윤리적 문제에서도 자유롭지 않다. 앞으로 어떤 비즈니스 모델이 붙을지 모르겠지만, 그에 따라 정보통신업계 전체의 수익 구조가 요동칠 가능성도 있다.

한계는 있지만 분명 훌륭한 도구가 될 수 있다. 여기에 시청각 관련 다양한 형태의 정보를 습득하고, AI 음성 스피커와 같은 기기와 결합하면 IT 판 전체를 바꿀지도 모른다. 스마트폰이 ‘걸어 다니면서도 인터넷을 사용하고 싶어’라는 욕망을 반영한 기기란 걸 생각하면, 헛된 상상은 아닐 거다. 하지만 늘, 기술 발전은 사람이 더 어려운 일을 하도록 만들었다. 90년대 직장인과 2020년대 직장인만 비교해봐도, 해야 할 일이 훨씬 더 어렵고 복잡해졌다. ‘이런 시대에 적응하기 위해 인간은 무엇을 해야 할까’라는 고민을 우리에게 안겨준다.

이요훈 IT 칼럼니스트


이 콘텐츠를 평가해 주세요.

등록완료

맨 위로 가기