개발자들이 AI 콘텐츠와 코드를 신뢰하지 않는 이유

AI 혐오 현상: 개발자들이 AI 생성 콘텐츠를 불신하는 이유

생성형 인공지능(AI)이 일상 업무에 적극적으로 통합되면서, 열광적인 반응과 더불어 특히 숙련된 IT 전문가들 사이에서는 상당한 반발을 불러일으키고 있습니다. 이른바 'AI 찌꺼기(AI sludge)'라고 불리는 것에 대한 이러한 혐오감은 LLM 모델이 생성한 텍스트와 코드를 다룰 때 두드러지게 나타납니다. 이 글에서는 생물학, 심리학, 정보 이론, 그리고 실제 개발 경험의 원칙들을 바탕으로 이러한 현상의 근본적인 이유를 깊이 있게 탐구할 것입니다. 우리의 목표는 AI 생성 콘텐츠가 왜 종종 공허하고 신뢰할 수 없다고 인식되는지, 그리고 이것이 전문가 커뮤니티 내의 신뢰와 책임에 어떻게 영향을 미치는지 이해하는 것입니다.

신뢰의 근원: 커뮤니케이션의 생물학적 및 경제적 측면

인간 상호작용의 핵심에는 불문율의 계약이 존재합니다. 모든 커뮤니케이션은 발신자로부터 인지적 자원(시간, 구성, 구조화, 설득에 드는 노력)의 투자를 요구합니다. 이러한 투자는 저자의 명성을 걸고 메시지의 가치를 알리는 역할을 합니다. 수신자는 그 대가로 오늘날 가장 희소한 자원 중 하나인 자신의 주의를 투자합니다. 만약 받은 정보가 투자한 주의를 정당화하지 못한다면, 신뢰는 무너지고 짜증과 흥미 상실로 이어집니다. 신경망은 콘텐츠 생성 비용을 사실상 0으로 만듦으로써 이러한 역학 관계를 근본적으로 변화시킵니다. 저자는 읽는 데 상당한 시간이 걸리는 텍스트를 몇 분 만에 생성할 수 있습니다. 이는 암묵적인 계약을 위반하여 창작자와 소비자 간의 노력 불균형을 초래합니다. 만약 텍스트에 진정한 지적 노력이 결여되어 있다면, 독자에게 그 가치는 0에 수렴합니다. 동일한 논리가 코드에도 적용됩니다. 명백히 AI가 생성한 코드(상당한 인간의 노력이 투입되지 않은)를 검토하는 것은 부당한 책임 전가이자 숙련된 전문가의 시간 낭비로 인식됩니다.

진화 심리학과 텍스트의 '불쾌한 골짜기'

수백만 년의 진화는 우리의 뇌가 다른 생물학적 주체를 효율적으로 평가하도록 형성했습니다. 우리는 얼굴 표정, 억양, 움직임과 같은 비언어적 단서를 통해 본능적으로 신뢰성과 의도를 측정합니다. AI는 그러한 신호를 제공하지 않으며, 우리의 위협 감지 시스템은 입력 없이 이를 잠재적 위험으로 해석합니다. 이 메커니즘은 시각적 인식의 '불쾌한 골짜기' 효과와 유사합니다. 인간과 거의 같지만 완전히 같지는 않은 대상은 명백히 비인간적인 것보다 더 강한 혐오감을 불러일으킵니다. 텍스트의 맥락에서 신경망은 문법적으로 정확하고, 표면적으로는 논리적이며, 문체적으로 중립적인 콘텐츠를 생성합니다. 이는 인간의 언어와 충분히 유사하여 우리의 인식 메커니즘을 활성화시키지만, 개성의 독특하고 유기적인 표식이 없기 때문에 충분히 달라 불안감을 유발합니다. 뇌는 거짓을 감지하고, 이를 인간인 척하는 에이전트로부터의 위협으로 해석합니다.

사회 심리학과 책임의 문제

사회에서의 신뢰는 상호 취약성과 책임을 전제로 하는 사회 계약 위에 구축됩니다. 그러나 AI는 책임을 질 수 없습니다. AI에게는 잃을 명성이 없기 때문입니다. 이것이 바로 '책임 공백(accountability gap)'이라고 알려진 것을 만듭니다. 책임이 사람들 사이에 분산되는 책임 분산(방관자 효과)과는 달리, 여기서는 책임이 인간과 '결정을 내리는' 기계 사이에 분산됩니다. 역설은 다음과 같습니다. 한편으로는 '알고리즘 혐오'가 있습니다. 즉, 단 한 번의 AI 오류가 인간의 열 번의 오류보다 신뢰를 더 심각하게 훼손합니다. 다른 한편으로는 '자동화 편향'이 존재합니다. 이는 기계의 권고를 맹목적으로 따르는 경향입니다. 우리는 AI의 책임감 부족 때문에 불신하면서도, 명백한 자신감과 속도 때문에 AI에 의존합니다. 이러한 공백은 우리가 비판적으로 사고하고 우리 결정에 대한 책임을 지는 것을 방해하며, 대신 공정하지만 책임지지 않는 시스템에 이를 위임하게 만듭니다.

주관적 인식: 사고로 위장한 공허함

제 관점에서 핵심 문제는 신경망 그 자체가 아니라, 신경망이 사고인 척 가장하려는 공허함입니다. 독창적인 의견이 없는 사람들은 AI를 방패 삼아 평범한 콘텐츠를 생성하며, 개인적인 입장의 부재를 가립니다. 입장은 항상 위험, 선택, 그리고 설령 틀렸을지라도 자신의 의견을 옹호하려는 의지를 수반합니다. 수십억 개의 텍스트로 훈련되고 RLHF를 통해 보정된 LLM의 콘텐츠는 '가중 평균' 결과물입니다. 그것은 좋지도 나쁘지도 않으며, 그저 '특징 없는' 것입니다. 그러나 진정으로 가치 있는 텍스트는 항상 중간값에서 벗어나며, 독특한 경험, 깊은 성찰, 그리고 저자의 개인적인 관점의 결과물입니다. 텍스트에 깊이와 가치를 부여하는 것은 평균성이 아니라 독창성입니다. 이러한 개인적인 각인의 부재는 텍스트를 무미건조하게 만들며, 기차역 확성기에서 나오는 안내 방송처럼 감정적인 반응을 이끌어내거나 사고를 자극할 수 없게 만듭니다.

인간 텍스트와 AI 텍스트 비교

| 특징 | 인간 텍스트 | AI 텍스트 |

| :---------------------- | :-------------------------------------------------- | :-------------------------------------------------------- |

| 리듬과 구조 | 다양한 리듬, 다채로운 문장 길이. | 획일적인 구조, 단조로운 문장. |

| 은유 | 예상치 못하고, 때로는 과감함. | 안전하고, 진부하거나, 부재함. |

| 세부 수준 | 독자의 지성을 믿고 공백을 둘 수 있음. | 모든 단계를 '다섯 살 아이에게 설명하듯' 설명함. |

| 입장 | 확고하고 주관적이며, 논거를 제시함. | 중립적이며, '한편으로는... 다른 한편으로는...' 식. |

| 예시 | 생생하고, 개인적인 경험에서 우러나오며, 예상치 못함. | 추상적이고, 일반적이며, 보편적임. |

정보 이론: 불확실성 감소와 지루함

정보 이론적 관점에서 LLM은 본질적으로 문맥에 기반하여 다음 토큰을 예측하는 '강화된 T9'와 같습니다. 정보는 불확실성 감소로 정의됩니다. 메시지가 덜 예측 가능할수록 더 많은 정보를 담고 있습니다. 신경망에 의한 텍스트 생성은 통계적으로 평균적인 시퀀스를 만드는 과정입니다. 이들은 사실상 섀넌 엔트로피가 결여되어 있으며, 이는 최소한의 새로운 정보와 최대한의 예측 가능성을 의미합니다. 반대로 인간의 뇌는 가치를 지니고 지루함을 덜어주는 참신함, 즉 새로운 패턴을 추구합니다. 신경망은 이미 알려지고 예측 가능한 것을 조직하여, 정확하긴 하지만 정보적으로는 공허한 콘텐츠를 생성합니다. 이로 인해 AI 텍스트는 새롭거나 독특한 것을 제공하지 않으므로 종종 지루하고 흥미롭지 않게 느껴집니다.

AI 생성 콘텐츠(및 코드)를 인식하는 방법

숙련된 사용자들과 개발자들은 종종 다음과 같은 특징적인 표식들을 통해 AI 생성 콘텐츠를 직관적으로 인식합니다.

구조적 패턴:

* 목록병(Listitis): 단락 형식이 더 적절할 때도 글머리 기호나 번호 매기기 목록을 과도하게 사용합니다. AI는 일관된 서사를 구성하는 데 어려움을 겪을 때 종종 이러한 방식을 사용합니다.

* 대칭적 구성: "첫째로... 둘째로... 셋째로..."와 같이 의심스러울 정도로 항목 길이가 균일한 반복적인 구절을 사용하여 인위적인 대칭을 만듭니다.

* 프랙탈 반복: 텍스트의 각 섹션이 동일한 엄격한 구성(주제, 설명, 예시, 결론)을 따르며, 이는 단조로움과 예측 가능성으로 이어집니다.

어휘 및 의미론적 표식:

* 채움 문구: "이에 대해 자세히 살펴보겠습니다," "주목할 점은," "따라서," "강조할 가치가 있습니다," "결론적으로"와 같은 서두 문구를 과도하게 사용하여 깊은 사고의 부재를 가립니다.

* 과도한 정확성: 구어체, 속어, 줄임말이 없습니다. 텍스트는 공식 문서의 번역처럼 지나치게 격식적이며, 자연스러운 언어가 결여되어 있습니다.

* 거짓된 매끄러움: 전환어와 양보 접속사가 풍부하여 매끄러운 서사의 환상을 만들지만, 논리적 공백이나 피상적인 논증을 숨깁니다.

* 공허한 형용사: "효과적인," "편리한," "강력한," "유연한"과 같이 의미를 구체화하지 않는 일반적이고 정보 없는 형용사를 사용합니다.

* 모순의 부재: 선형적이고 절대적으로 일관된 서술. 인간은 생각을 바꾸고, 아이디어를 병치하며, 복잡성을 인정할 수 있지만, AI는 '이상적으로' 일관된 텍스트를 생성합니다.

* 거짓된 깊이: 주의 깊게 읽어보면 같은 아이디어를 여러 번 재구성한 것에 불과한 긴 단락들.

* 과도한 역량: 인간 전문가는 달성할 수 없는, 매우 다른 지식 분야를 동등한 자신감과 미묘한 차이 없이 설명하는 텍스트.

코드의 맥락에서는 과도한 주석 외에도 생성되었음을 나타내는 '아티팩트'가 종종 나타납니다. 예를 들어, 코드는 구문적으로 정확하고 간단한 경우에는 작동할 수도 있지만, 예외 처리 부족, 대규모 데이터셋에 대한 비효율적인 알고리즘, 보안 취약점, 또는 엣지 케이스에 대한 완전한 무시와 같은 중요한 측면을 간과할 수 있습니다. 이러한 코드는 작동할 수는 있지만, 프로덕션 환경에서는 최적화되거나 유지보수 가능하거나 안전한 경우가 거의 없으며, 상당한 인간의 정제와 리팩토링을 필요로 합니다.

주요 요점:

커뮤니케이션 계약 위반: AI는 콘텐츠 생성 비용을 0으로 만들어, 독자가 주의를 기울이는 동안 저자는 최소한의 노력만 들이므로 신뢰를 약화시킵니다.
텍스트의 '불쾌한 골짜기': AI 텍스트는 인간의 것과 유사하지만, 독특한 개인적 표식의 부재는 인간과 거의 동일한 로봇을 인식할 때와 유사하게 혐오감을 유발합니다.
책임 공백: AI는 자신의 말이나 코드에 대해 책임을 지지 않으므로, 신뢰 공백을 만들고 AI 결정에 대한 적절한 평가를 방해합니다.
정보 엔트로피: AI는 예측 가능하고 평균적인, 정보 가치가 낮은 콘텐츠를 생성하는 반면, 인간은 참신함과 독창성을 추구합니다.
AI 콘텐츠의 표식: 과도한 목록, 대칭적 구성, 채움 문구, 과도한 정확성, 거짓된 깊이, 과도한 역량 — 이 모든 것은 텍스트와 코드에서 'AI 찌꺼기'의 징후입니다.

— Editorial Team