
미국 OpenAI라는 회사가 내놓은 서비스 챗GPT의 열기가 전 세계적으로 선풍적이다. OpenAI는 유대인으로 창업지원회사인 와이콤비네이터 대표 출신인 샘알트만이 창업한 회사다. 특히 테슬라를 창업한 일론 머스크가 초기에 투자했고, 현재 마이크로소프트 빌게이츠가 100억달러(약 13조원)를 수 년에 걸쳐 투자키로 했다.
서비스 오픈 후 전 세계에서 매력적인 사용 사례들이나 오답에 관한 에피소드들이 소개되면서 명암이 교차되는 모습이다. 검색 링크를 알려주던 기존에서 질문을 정리해주는 모습으로 검색에 대한 패러다임을 바꿔놓은 것은 챗GPT의 큰 기여다. 이처럼 열병같이 밀려온 새로운 도전을 우리가 실질적으로 어떻게 사용할지, 그 미래는 어떻게 될지 살펴보고자 한다.
챗GPT의 사용방법은 간단하다. 챗GPT의 홈페이지에 접속, 간단한 가입과 로긴으로 원하는 질문을 타이핑해(프롬프트) 답변을 살펴볼 수 있다.
“챗GPT가 어떻게 학습했는지 알아야”
단, 질문에 앞서 챗GPT의 학습한 분야나 학습 시기등을 알고 있는 것이 필수다. 즉 인공지능이란 것이 기존에 학습된 것에 대한 요약정리의 답변이라 학습한 시기가 2021년 9월까지 임을 인지하고 있어야 한다(이 답변도 챗GPT에게 물어봐서 얻은 답변임). 공부한 분야나 언어권도 알고 있어야 한다. 이것도 챗GPT에 물어보았다. 주로 영어권 데이터 위주로 학습했고, 한국어 데이터는 1~2%수준이라고 답한다. 학습한 분량도 알고 있으면 검색에 큰 도움이 된다. 검색이란 단어가 좀 어색한데 검색보단 자문(컨설팅)를 받는다는 표현이 좋을 수도 있다.
챗GPT가 학습한 데이터셋은 대부분 인터넷에서 수집한 대규모 텍스트 데이터(약 45TB), 이미지 데이터, 오디오 데이터 등으로 구성돼 있으며 이러한 데이터셋은 수십억, 수백억 개의 단어와 수백만, 수천만 개의 이미지, 오디오 클립 등으로 이뤄져 있으며, 이들 데이터를 처리하고 모델을 학습하는 데엔 막대한 계산량과 시간이 필요하다. 따라서 챗GPT가 학습한 분량은 상당히 방대하며, 이러한 학습은 대규모 클라우드 컴퓨팅 자원과 강력한 하드웨어를 사용해 수행되기에 근래의 학습, 실시간 학습은 매우 어려운 실정이다.
“잘 아는 다양한 질문으로 챗GPT의 실력을 사전 검토해야”
이 정도로 챗GPT의 태생을 인지하고, 간단한 질의 응답을 통해 챗GPT의 역량을 살펴 보기로 하자.
▲ 대한민국 조선시대 이율곡 선생님의 어머니는 누구인가? 챗GPT는 엉뚱한 답변은 제시해 한국 역사를 공부하려는 외국인들에겐 오해를 일으키기에 위험스런 수준이다. 심지언 이율곡 선생의 아버지로 이황 선생을 제시키도 한다.
▲ x²+9x+18=0 2차방정식의 해를 구해보자. x=-3,-6를 정확히 구해준다. 좀 더 어려운 수학 문제를 제시해 본다.
▲ x⁶+x⁴+27x-132=0 를 만족하는 x를 구하라. 6차 방정식이다. 수치해석적으로 풀어준다. x≈-2.084, 1.893에 근접하는 숫자이며 나머지 4개는 복소수라고 하며 구해 준다(x≈-1.267 +/- 0.791i, 0.507 +/- 1.416i). 이 정도면 매우 만족스럽다. 그러다 매우 틀렸다. 오답이다. 모르는 사람들은 빠져들기 쉽다.
“챗GPT가 잘하는 분야, 좋은 질문으로 유도해야”
챗GPT는 잘하는 분야가 있고 미흡한 분야가 있다. 간단한 수학도 못할 때도 있으나 영어 문법을 고쳐준다든지, 기사 작성, 에세이를 작성커나, 미국 역사 등에 대해선 좋은 답변을 받을 수 있다. 책을 저술할 때도 나 하고 다른 창의적인 콘텐츠를 제공해 줄 수 있으며 법적인 판례나 의학 지식도 참고용으로 찾아 볼 수 있다.
공학적 프로그래밍에도 매우 좋은 가이드가 될 수 있다. 챗GPT 스스로가 깃허브란 오스소스의 저장소를 공부했기에 내가 원하는 소프트웨어 프로그래밍을 도와 줄 수 있다. 챗GPT가 제공하는 코드들을 수정해 사용하면 업무 효율이 매우 빠를 수 있다.
필자도 공대 출신이라 ◯◯ 프로젝트의 제안서 작성에 시간을 줄이려 챗GPT에게 아주 큰 도움을 받을 수 있었다. 해외 시장 동향이나 해외 정부에 제안할 아이디어를 구함에 흡족한 결과를 볼 수 있었다. 물론 아주 깊은 전문가들이 볼 땐 일반적인 평범한 표현들이겠지만 초안을 수정 보완해 사용하기에 큰 불편함을 없었다.
“챗GPT는 진화중, 한국에도 자체기술의 이런 서비스 출현 기대”
필자의 생각으로 챗GPT는 아직 발전 중이다. 기술에서 어느 것이든지 ‘만능(Perfect)’은 없으며 챗GPT 또한 그러하다. 챗GPT는 지속적으로 공부 학습하여 좋은 답변을 주려고 노력할 수 있으나 학습하지 않은 분야나 질문엔 엉뚱한 답변을 하는 사례가 매우 많다. 참고용으로 중요한 곳에 사용할 땐 반드시 cross check가 필요하다. 문학적이나 일반적 문서등에 사용할 때에 보조자로서는 충분하다고 본다.
게임체인저가 되기엔 아직 이르지만 몇년 전 알파고가 인공지능(AI)을 친 시민적으로 만들었듯, 또 다시 AI로 많은 반향을 일으킨 것엔 큰 점수를 주고 싶다. 이제 우리나라 빅테크 기업들도 챗GPT 같은 서비스를 내놓고 API(다른 기업들에게 본 서비스를 활용토록 열어주는 인터페이스) 공개하고, 우위의 생태계를 만들어야 한다.
엄청난 클라우드 컴퓨팅 계산 능력이나 대량의 학습량, 수 많은 연구진이 매달리는 챗GPT와의 정면 대결보다는 챗GPT가 못하는 약한 분야에 우리의 경쟁력을 키웠으면 한다. 예를 들어 최신 논문, 데이터까지 학습한 의학전문 GPT, 우리나라 법원 판례들을 망라한 최신 법률전문 GPT 및 수학이나, 물리에 특화된 과학전문 GPT등 좁은 분야 깊게 전문적으로 제공하길 제안한다. 한글 특화 플랫폼, 해외 수출로 현지 국가 언어 지원 및 그 나라에 특화된 GPT의 개발 및 수출 등은 General 한 챗GPT가 하기 어려운 영역이다.
우리가 매번 미국의 혁신 기술에 API로 붙어 살 수 없기 때문이다.