챗GPT AI 신뢰성에 대해 생각해 본 적이 있습니까? 단순히 지금 주어지는 정보가 맞고 틀림을 의미하는 것은 아닙니다.
23년의 화두는 AI입니다. 특히 MS의 챗GPT (Chat Gpt) 와 구글의 바드가 경쟁을 하면서 과연 어떤 프로그램이 더 정확성 있는 정보를 주는지 관심이 모아지고 있습니다.
AI 채팅 외에도 AI 그림 그리기나 AI 동영상 제작, 음성 제작 등 이미 시중에는 콘텐츠를 자동화하여 생성 시킬 수 있는 프로그램이 많이 있습니다.
그중에서 유독 대화형 인공지능이 주목받는 것은 자연어를 이해한다는 것과 개인이 직접 찾아봐야 할 많은 정보를 즉각적으로 취합하여 전달해 주는 기능 때문일 것입니다.
장기적으로 본다면 기업 입장에서는 내부 기밀 유출과 같은 보안 사고만 발생하지 않도록 잘 대처한다면 업무 효율을 극대화하면서 인건비 절감을 달성할 수 있지 않을까 생각해 봅니다.
대화형 AI와 문서 신뢰성
1. 챗GPT AI 신뢰성의 근원
물리적으로 움직일 수 없는 챗GPT나 바드는 결국 웹 사이트 상에 존재하는 수많은 문서들 중에서 가장 적합하다고 판단되는 자료를 취합하여 이용자에게 전달할 것입니다.
적합한 문서의 기준은 대화형 인공지능 프로그램에 따라 조금씩 다를 것입니다. 하지만 기본적으로 답변 시 노출되는 조건은 분명 존재할 것입니다.
그리고 그것이 바로 ‘챗GPT AI 신뢰도’ 임을 부인하는 이는 아무도 없을 것이라 생각합니다.
신뢰도를 측정하는 기준 역시 다를 수 있습니다.
그러나 원칙적으로 ‘권위가 인정되고’, ‘많은 이들이 찾고 공유되는’ 사이트가 바로 신뢰성 있는 사이트라고 볼 수 있습니다.
뉴스를 기준으로 본다면 국내 유명 언론 사이트가 신뢰도 높은 뉴스 사이트가 될 것입니다.
건강이나 의학 정보를 찾는다면 유명 대학병원이나 국가 정부 기관의 사이트가 신뢰성 있는 정보의 출처라고 판단할 수 있습니다.
향후 챗GPT나 바드와 같은 인공지능 프로그램이 더 다듬어진다면 어떻게 될까요?
사용자들은 지금까지 누군가 편집한 정보 혹은 출처와 근거를 알 수 없는 정보 대신 공식적이고 믿을 수 있는 정보를 빠르고 간편하게 얻을 수 있을 것입니다.
2. 웹 문서 조작 가능성
챗GPT의 답과 행동 유도
정부나 공공 기관에서 얻을 수 있는 정보는 조작될 가능성이 낮습니다. 하지만 모든 정보가 유명 기관에만 있는 것은 아닙니다.
우리는 각종 커뮤니티 사이트의 정보를 참고하고 있으며 제품을 구매함에 있어서 판매자 사이트의 리뷰를 참고하고 있습니다.
만약 어떠한 제품을 추천받기를 원한다면 챗GPT와 바드는 어떠한 기준으로 답을 할 것인지 궁금합니다.
물론 현재까지는 중립적인 입장에서 여러 제품을 찾아보라고 답을 하기도 합니다,
그리고 개인에 따라 다를 수 있다고 답을 하고 있습니다. 앞으로도 상업성 질문에 대해서는 중립적인 입장을 고수할 수도 있습니다.
그러나 많은 사람들은 대부분 첫 번째 답에 나오는 제품을 믿을 수 있구나라고 받아들입니다.
대표적인 예로 많은 사람들이 인스타 등의 SNS에서 활약하고 있는 유명 인플루언서의 추천을 받아 제품을 구매하고 있습니다. (물론 지금은 믿지 않는 사람도 많이 생겨났습니다.)
같은 이치로 모든 사람들이 주관성 없이 객관적인 데이터로 평가하는 AI가 추천하는 제품이 있다면 어떨까요?
비록 답변의 하단에 다른 제품을 더 찾아보거나, AI가 개인에 따라 다를 수 있다고 평가를 한들 결국 챗GPT 가 제시한 몇몇 제품에 먼저 손이 갈 수밖에 없을 것입니다.
챗GPT AI의 추천 근거
다시 돌아와서 그렇다면 대화형 AI는 어떠한 기준으로 제품을 추천하겠습니까?
일개 평범한 사람인 제가 감히 말할 수는 없겠지만 앞에서 말한 것처럼 신뢰성 있는 사이트에서 언급되거나 높은 판매와 유입이 있는 제품일 것입니다.
이는 충분히 상식적인 이야기입니다.
많은 사람들이 이야기하고 추천하는 제품, 많은 사람들이 검색해서 눈으로 보고 구매하는 제품은 특별한 사정이 있지 않는 이상 좋은 제품일 가능성이 높습니다.
(물론 가성비가 떨어질 수도 있고 각종 매체 광고를 통해 일시적으로 유명해질 수도 있습니다.)
만약 AI라는 제품을 추천해 달라고 했을 시 Chat Gpt나 바드가 아마존 사이트에서 가장 인기 있는 제품을 추천할 수도 있고 국내 유명 오픈 마켓이나 네이버 쇼핑 등에서 인기 있는 제품을 추천할 수 있습니다.
그렇다면 판매하는 입장에서 자신의 제품이 언급되기를 원한다면 어떠한 방법을 취할 수 있을까요? 가짜 구매, 가짜 리뷰, 가짜 추천, 가짜 트래픽을 활용하는 방법이 있습니다.
실제로 최근 언론에서 다룬 네이버 쇼핑의 경우 상위 검색 노출을 위해 가짜 트래픽을 넣어 인기도를 얻는 방법이 있다는 것을 다룬 적이 있습니다.
그리고 빈 박스 마케팅이라고 불리는 가짜 구매와 리뷰 역시 종종 뉴스에 나오기도 합니다.
신뢰할 수 있는 웹 사이트 영역에서 거짓된 추천과 구매 점수, 리뷰, 트래픽 유입과 배포가 지속적으로 이루어질 경우 인공지능은 어떻게 이를 ‘참’과 ‘거짓’으로 나누어 볼 수 있을지 궁금해지는 부분입니다.
특히 많은 사람들이 즐겨 보는 ‘가짜 뉴스’ 사이트가 있다면 AI는 그것이 가짜라는 것을 어떻게 구별해 낼 수 있을까요?
수많은 사람들이 각종 커뮤니티에 남긴 가짜 뉴스라는 글과 댓글을 분석하여 판별할 것인지 혹은 다른 신뢰도 높은 뉴스 사이트의 내용과 비교하여 판단할까요?
기술적인 부분은 실력 있는 엔지니어들이 잘 해결할 것입니다.
하지만 현재 사람들도 가짜에 속는다는 것을 감안한다면, 그리고 누군가 거짓된 정보를 지속적으로 생성하고 있고 앞으로 이를 적극적으로 활용하게 된다면 우리는 매일 같은 거짓에 속을 지도 모릅니다.
3. 챗GPT AI 정보의 한계
앞으로 국내 유명 포털인 네이버와 카카오에서도 대화형 AI 서비스를 출시할 예정입니다.
국내 토종 포털사이트 대표주자로서 해외 AI 서비스에 비해 한글 분석 능력이 상대적으로 뛰어날 것으로 예측되고 있습니다.
네이버와 카카오 역시 자사 서비스인 블로그나 카페, 쇼핑 플랫폼을 포함하여 다양한 웹 문서를 수집하여 이용자가 원하는 정확도 높은 답을 제시할 수 있도록 노력할 것입니다.
하지만 챗GPT, 바드, 네이버와 카카오 모두 외부에 공개된 정보를 기준으로 답변을 만들 수밖에 없을 것입니다.
예를 들어서 우리는 일상생활 속에서 건강과 관련된 다양한 정보를 찾으려고 노력합니다.
건강 관련 정보는 유명 병원의 홈페이지, 국가 기관인 보건 복지부, 건강 전문 뉴스 사이트를 통해 누구나 무료로 접할 수 있습니다.
그러나 정말로 검증된 정보라고 한다면 결국 논문, 학회 등 외부에 공개되지 않은 정보 혹은 유료로 이용할 수밖에 없는 정보가 될 수 있습니다.
그러나 현재 기준으로 무료로 외부에 공개되지 않은 정보는 대화형 AI가 정보를 취득할 수 없는 상태입니다.
이는 정보 취합에 있어서 한계가 있음을 의미합니다.
챗GPT AI가 틀릴 수 있다는 가정
아직까지는 정형화된 데이터, 예를 들어 HTML 분석이나 계산 등을 제외하고는 많은 오류가 발견되고 있는 것이 사실입니다.
특히 역사나 과거 사건 사고의 경우 잘못된 내용을 전달하는 경우가 많으며 간혹 커뮤니티 등에서 조롱의 대상으로 사람들의 입에 오르내리고 있습니다.
그러나 언젠가 시간이 지나게 되면 정확도는 더욱 올라가게 될 것입니다.
그리고 AI의 기술력이 정점에 다다르게 될 시 어릴 적부터 대화형 AI 프로그램을 접한 사람들은 그것이 정답이라고 믿게 될 것입니다.
사람은 항상 생각하고 오류의 가능성을 열어두고 검토를 합니다. 이러한 학습을 통해 사고의 확장이 이루어지게 됩니다.
AI의 등장과 함께 AI의 답이 ‘진실’이라고 확신하는 순간 우리는 더 이상 검증을 하지 않을 것입니다.
먼 미래에 사람들은 두 가지 분류로 나누어지게 될지도 모르겠습니다. AI에 의존하며 학습하는 사람과 AI가 잘못되었음을 검증하는 분류로 말입니다.
특히 후자의 경우 AI가 물리적으로 이용하지 못하는 정보를 생산하고 활용할지도 모를 일입니다.
또한 누군가는 그 정보를 훔쳐서 AI에게 학습을 시킬지도 모릅니다.
오히려 사람의 역할이 AI가 발전할 수 있도록 인공지능이 도달하지 못하는 정보를 취합하여 제공하는 것이 될지도 모릅니다.
이는 다소 황당하면서도 과장된 상상에 불과할 수 있으나 그것이 현실이 될지 확답할 수 있습니까?
챗GPT AI 신뢰성 조작될 수 있다.
사실 트래픽 유입이나 백링크를 활용하여 웹 문서나 웹 사이트의 순위를 올리는 것은 굉장히 고전적인 방식에 불과하고 현재는 통하지 않는 방법으로 알려져 있습니다.
그러나 일부라고 하여도 영향도가 전혀 없다고 볼 수는 없으며 앞에서 이야기했듯이 네이버의 일부 서비스는 트래픽 어뷰징에 노출되고 있습니다.
이야기하고자 하는 것은 어뷰징에 대한 방식이 아니라 사람이 개발한 AI를 사람이 지배하기 위해 얼마든지 다른 공격의 수단을 가지고 조작된 결과를 도출할 수 있다는 것입니다.
이를 방지하기 위해서는 챗GPT나 바드, 각종 AI 를 활용하여 정보를 제공하는 업체들이 사회적인 책임감을 가져야 한다고 생각합니다.
이 이야기가 망상에 불과할 수 있습니다.
오히려 망상에 불과하고 대화형 AI 서비스가 메타버스처럼 유행에 지나지 않을 수 있습니다.
단순하게 제한된 서비스로 인해 간편한 도구로서 활용되는 정도에 그친다면 더 좋지 않을까라는 짧은 생각과 함께 글을 마칩니다.