생성형 AI의 원리 : 글을 쓰고 그림을 그리는 AI의 비밀

ChatGPT가 세상에 나온 2022년 11월 30일 전만 해도, 컴퓨터가 시를 쓰거나 그림을 그리는 건 공상과학 영화에서나 가능한 이야기였습니다. 하지만 ChatGPT, DALL∙E 같은 AI는 글을 쓰고, 그림을 그리며 음악까지 만들어냅니다. 무척이나 신기하고 재미있습니다. 

그런데 이런 AI는 어떻게 작동해서 시를 쓰고, 그림을 그리게 되는 걸까요? 

그 비밀을 전문가가 아니어도 이해할 수 있도록 쉽게 작성해 보겠습니다. 


생성형 AI의 원리



'생성형 AI'란?

생성형 AI(Generative AI)는 단순히 데이터를 분석하거나 분류하는 것이 아닙니다. 새로운 것을 생성하도록 만들어진 특화된 AI입니다. 생성형 AI는 다음과 같은 콘텐츠를 만들 수 있습니다. 
  • 에세이, 대화, 코드 (예 : ChatGPT)
  • 그림, 일러스트, 이미지 (예 : DALL∙E, Midjourney)
  • 인간의 음성이나 음악
  • 짧은 영상이나 3D 모델 등의 시각/공간 콘텐츠
생성형 AI는 이러한 콘텐츠의 창작을 목적으로 만들어졌습니다.


AI가 인간처럼 글을 쓸 수 있는 이유

ChatGPT와 같은 생성형 AI의 핵심은 예측 능력입니다. AI는 '다음에 어떤 단어가 나올지'를 끊임없이 예측하며 문장을 만들어냅니다.
예를 들면, "오늘은 날씨가 너무..."라는 문장이 있으면, 그 다음으로 나올 단어는 "좋다"의 확률이 높습니다. AI는 이런 방식으로 문장을 이어가는 방법을 수십억 개의 문장을 통해 배웁니다. 
이 기술의 기반이 바로 GPT(Generative Pre-trained Transformer)라는 구조입니다. 이것은 매우 빠르고 똑똑한 자동완성 기능이라고 할 수 있습니다. 인간이 이해하고 사고하는 방식은 아니지만, 우리가 느끼기에 매우 자연스러운 문장을 흉내내고 있는 것입니다. 

그림을 생성하는 AI의 작동 방법

그림 AI는 텍스트를 생성하는 AI와는 조금 다른 방식으로 작동합니다. 대표적인 그림 생성 AI DALL∙E, Midjourney 등의 AI는 먼저 '무작위 점'으로 시작해서 점점 형태를 잡아갑니다. 
예를 들어, '선글라스를 낀 여우가 타임스퀘어에 있는 모습'이라는 프롬프트를 입력하면 AI는 문장을 분석하고 관련된 요소를 하나하나씩 조합해 나갑니다. 
이 과정을 "디퓨전(diffusion)"이라 하며, 안갯속에서 점점 조각상이 드러나는 것과 같이 이미지가 점차 선명해지게 됩니다. 
이것은 이미 존재하는 이미지를 복사하는 것이 아니며, 학습한 수많은 이미지를 조합함으로써 완전히 새로운 이미지를 생성하는 것입니다. 


AI를 창의적이라고 할 수 있을까?

AI는 창의적인 걸까요? AI는 영감을 받은 것이 아니고, 감정도 없으며, 과거의 추억에서 아이디어가 나오지도 않습니다. 대신, AI는 이미 본 것들을 재조합하여 새로운 결과물을 만들어내는 것입니다. 
그러니 "창의성" 하고는 거리가 있을 수 있습니다. 하지만 인간의 창의력에 도움을 주는 도구로써는 확실히 그 역할을 할 수 있습니다. 

예를 들면, 
  • 작가가 글을 쓰려고 할 때 아이디어를 주고
  • 디자이너의 콘셉트를 시작화해주고
  • 개발자에게 코드의 뼈대를 빠르게 만들어 내는데 도움을 줄 수 있습니다. 

AI는 사람을 창의력을 대체할 수 있는 것이 아니라, 돕고 가속화시켜주는 역할을 하는 것입니다. 


미래에는 어떻게 될까?

생성형 AI는 하루가 다르게 발전하고 있습니다. 이미 영상 생성, 목소리 복제, 3D 콘텐츠 제작 등 더 넓은 영역으로 뻗어나가고 있으며, 어떤 스타트업은 단 몇 줄의 텍스트로 게임이나 가상 공간을 만들어내는 기술을 연구 중이라고 합니다. 
그러나 분명한 한계와 위험 요소는 존재합니다.
  • 환각(hallucination) : 사실이 아닌 내용을 그럴듯하게 만들어 냄
  • 편향 : 학습한 데이터에 차별적 요소가 반영될 가능성 있음
  • 윤리적 문제 : 표절, 딥페이크, 저작권 등 여러 가지 논란 존재
이러한 이유로, AI는 만능 도구가 아니며 신중하게 사용되어야 할 것입니다. 


마치며

생성형 AI는 창작의 벽을 낮춰주는 놀라운 도구입니다. 그림을 못 그리고, 글을 쓰지 못해도 이제는 누구나 아이디어와 생성형 AI만 있으면 고품질의 콘텐츠 제작이 가능합니다. 

그러나 AI는 어쩌면 사용자의 역량을 이끌어 낼 수는 있지만, 그 이상의 결과를 주지는 못할 것입니다. 
사용자는 아는 만큼 질문할 수 있고, 결과를 해석할 수 있으며, 더 많은 질문을 할 수 있기 때문입니다. 

댓글 쓰기

다음 이전