AI 시대의 학문적 무결성 유지: 과제와 해결책

이나고 아카데미, "AI 시대의 학문적 무결성 유지: 과제와 해결책." 이나고 아카데미. 3월 26, 2024. https://www.enago.com/academy/kr/ai-content-detection-tools/.

Copy

Reading time

11 minutes

published on

3월 26, 2024

오늘날의 학술 환경에서 가장 시급한 과제 중 하나는 학문적 무결성을 보장하는 것입니다. 온라인에서 사용할 수 있는 정보가 넘쳐나면서 표절(plagiarism)과 조작된 콘텐츠(fabricated content)가 큰 우려의 대상이 되었습니다. 최근 한 연구 논문이 Physica Scripta 저널에 게재되었다가 ChatGPT의 “응답 재생성” 명령이 포함된 것으로 밝혀져 철회되는 사건이 있었습니다. 이처럼 공개되지 않은 생성형 도구를 사용하는 것은 과학계에 불신이 만연한 분위기를 조장하고 학문적 무결성을 손상시킵니다.

생성 AI 도구의 발전으로 큰 노력 없이도 정보를 얻을 수 있게 되었습니다. 그 결과, 기존의 데이터 수집 방법보다 이러한 AI 모델을 선호하는 사람들이 점차 많아지고 있습니다. 그러나 생성형 AI가 만들어내는 합성 데이터(synthetic data)를 무분별하게 사용할 경우 어떤 결과가 초래될 수 있는지를 인식하는 것이 중요합니다. 조작 및 표절 연구가 보고되는 건수가 점점 늘어나고 있는 현재의 환경에서, 인간의 감독이 없다면 학문적 무결성에 심각한 위험이 초래됩니다.

AI 도구의 사용을 아예 피할 수는 없지만, 학문적 표준을 손상하지 않는 윤리적 사용을 보장하려면 이들 도구에 접근할 때 책임감 있는 태도를 갖춰야 합니다. AI를 두려워하는 대신 개인과 기관 차원에서 신뢰할 수 있는 모니터링을 구현하고 윤리적 가이드라인을 준수하면 학문적 무결성을 보호할 수 있습니다. 그렇게 하지 않으면 표절과 합성으로 생성된 데이터의 통합으로 이어질 수 있으며, 이는 진본 데이터(authentic data)로 독창적인 연구를 수행한다는 핵심 원칙을 훼손하는 결과를 초래할 수 있습니다. 그러나 자동으로 표절 콘텐츠를 감지하거나 합성 데이터 콘텐츠를 감지하도록 설계된 새로운 AI 도구들이 이러한 문제를 해결하는 데 도움이 될 수 있습니다.

부정직한 관행이 연구의 신뢰성에 미치는 영향

연구자의 학술적 부정행위는 연구자 개인의 평판은 물론 소속 기관의 위상을 심각하게 훼손할 수 있습니다. 데이터 조작, 표절, 선택적 보고와 같은 관행은 연구 과정의 무결성을 손상시킵니다. 이는 또한 창의성을 억압하고, 과학 연구의 핵심인 비판적 사고를 위태롭게 합니다. 이러한 행위가 드러나 밝혀지면 과학계에 대한 신뢰가 손상됩니다. 학술 연구의 신뢰성을 유지하는 작업에는 경계와 투명성이 요구됩니다.

정보 접근과 AI 활용으로 인한 과제

인터넷은 귀중한 정보 접근을 제공해 주지만 새로운 형태의 부정행위를 가능하게 했으며, 이는 신입 연구자들이 직면하는 게재를 못하면 끝장이라는 압박으로 인해 더욱 악화되고 있습니다. 한편, AI는 연구와 출판에 통합되어 이점을 제공하고 있지만 동시에 이러한 현상에 대한 우려의 목소리도 커지고 있습니다. 연구자들이 AI 글쓰기 도구에 과도하게 의존하면 표절과 부정직한 관행이 새로운 차원으로 발전할 수 있습니다. 윤리를 훼손하지 않으면서 이러한 환경을 탐색하려면 다음과 같은 복잡한 과제가 제기됩니다.

1. 온라인 소스가 널리 보급되어 이용 가능하기 때문에 표절에 대한 유혹이 커짐

2. 약탈적 온라인 저널이 수준 이하의 연구나 위조된 연구를 게재하여 연구 품질 기준을 훼손함

3. ‘원본’ 텍스트를 생성할 때 인간의 감독이나 저작자 표시 없이 AI 생성 모델에만 의존함

4. 연구 및 게재 시 AI 사용에 대한 공개 및 감독 정책이 부재함

AI 생성 콘텐츠를 식별하는 방법

AI가 생성한 콘텐츠를 식별하는 것은 학술 저술의 무결성과 신뢰성을 유지하는 데 매우 중요합니다. 기계 생성 텍스트를 감지하는 몇 가지 방법은 다음과 같습니다.

1. 천편일률적인 글쓰기 스타일

AI는 인간의 글쓰기 스타일을 모방할 수 있지만, AI가 생성한 텍스트를 자세히 살펴보면 뉘앙스가 부족하고 인간이 쓴 글에서 흔히 찾아보기 어려운 반복성을 보이는 경우가 많습니다. 인간 편집자(에디터)는 지나치게 정형화되고 반복적인 단어 패턴을 찾아냄으로써 AI 생성 텍스트를 식별할 수 있습니다.

2. AI 감지 도구 활용

이것은 AI가 생성한 콘텐츠를 감지하기 위해 가장 많이 사용되는 방법 중 하나입니다. AI 감지 도구는 인간이 작성한 콘텐츠와 AI가 생성한 콘텐츠를 구분하도록 도와서 쉽고 간단한 솔루션을 제공해 줍니다. 그러나 이러한 도구의 등급을 나누어 검증하려면 여전히 인간의 감독이 필요합니다.

3. 인용 검증

AI 도구는 겉으로는 정당하고 합리적으로 보이지만 사실은 허구인 출처와 인용을 생성할 수 있습니다. 인용이 실제적이고 적용 가능한 출처를 참조했는지는 인간 연구자만이 확실하게 검증할 수 있습니다. 이러한 검증을 하지 않으면 학문적 무결성이 손상될 수 있습니다.

4. 문맥 분석

인간은 AI가 생성한 텍스트를 식별하는 데 필요한 맥락을 더 깊이 이해하고 있습니다. AI가 생성한 테스트는 문법적으로는 정확하지만, 인간 작가가 제공하는 독창성과 문맥적 관련성이 부족합니다. AI는 실제 지식이 부족하며, AI가 생성한 콘텐츠는 두루뭉술하니 일반적으로 보일 수 있습니다.

AI 콘텐츠 감지 도구란 무엇이며 어떻게 작동할까

AI 콘텐츠 감지 도구는 콘텐츠가 인간에 의해 작성되었는지 아니면 AI 도구에 의해 작성되었는지를 인공지능을 활용하여 판단합니다. 머신러닝(ML)과 자연어 처리(NLP)를 사용하여 텍스트의 단어 구조와 사용법을 분석합니다. 또한 새로운 콘텐츠를 인간이 작성한 방대한 텍스트 데이터 세트와 비교하여 AI 생성 텍스트를 나타내는 미묘한 차이를 식별합니다.

이는 학술 저작물의 신뢰성을 조사하는 편리하고 포괄적인 방법 역할을 하기에, AI 콘텐츠를 감지하는 가장 효과적인 전략 중 하나입니다.

AI 콘텐츠 감지 도구는 주로 난해성(perplexity)과 균일성(burstiness)라는 두 가지 요소의 존재 유무를 고려하여 AI 생성 콘텐츠를 식별합니다. 이 두 가지 요소의 값이 낮을수록 해당 텍스트가 AI에 의해 생성되었을 가능성이 큽니다. 이들 요소에 대해 함께 알아보도록 합시다.

1. 난해성

난해성은 예측 가능성과 일관성을 측정합니다. 예측 가능성과 일관성을 측정합니다. AI 텍스트는 논리적으로 의미가 통하는 것을 목표로 하기 때문에 난해성 점수가 낮습니다. 사람이 쓴 글은 창의성과 실수가 존재하기에 난해성 점수가 더 높습니다.

2. 균일성

균일성은 문장 구조와 길이 변화를 평가합니다. AI 텍스트는 일관된 구문과 평균적인 문장 길이를 사용합니다. 이러한 획일성은 사람이 쓴 글에서 찾아볼 수 있는 과장이나 꾸밈과는 다릅니다.

최고의 AI 콘텐츠 감지 도구 3가지

학계가 직면한 과제에 전략적으로 대응할 수 있는 최고의 AI 콘텐츠 감지 도구 3가지를 종합적으로 분석해 보면 다음과 같습니다.

1. 트링카 AI 콘텐츠 감지기(Trinka AI Content Detector)

ChatGPT, Bing Chat, Claude과 같은 광범위한 대규모 언어 모델(LLM)에서 Ai가 생성한 텍스트를 감지하는 종합 도구 역할

고급 머신러닝 알고리즘을 활용하여 AI가 생성한 콘텐츠를 식별하고 통찰력을 문장 및 구문 수준까지 제공

AI가 생성한 텍스트에 대해 점수가 포함된 빠른 개요 제공

패러프레이즈(의역)된 경우에도 AI가 생성한 텍스트를 식별하는 민감도 보유

2. Originality.AI

ChatGPT, Bing Chat, Claude와 같은 LLM에서 생성된 콘텐츠 대상

콘텐츠 진위 여부에 대한 통찰력 제공

스캔한 콘텐츠에 대해 이해하기 쉬운 피드백 제공

3. 크로스플래그 AI 콘텐츠 감지기(Crossplag AI Content Detector)

고급 머신러닝 알고리즘을 활용한 텍스트 분석 및 식별

전체 점수를 제공하지만 표절 검사 및 개별 섹션 강조 표시가 부족함

긴 텍스트에서는 더 나은 성능을 발휘하지만 짧은 샘플에서는 정확도가 떨어질 수 있음

학문적 무결성 유지와 처벌 시행

연구에서 윤리와 무결성을 유지하려면 학술 기관의 역할이 중요합니다. 그러나 부정행위에 대한 처벌을 시행하려면 공정성과 적법한 절차에 대한 우려가 균형을 이루어야 합니다. AI 도구는 문제가 있는 콘텐츠를 감지하는 데 도움을 줄 수 있지만, 위반 가능성에 대한 처벌을 부과할 때는 여전히 인간의 판단이 필요합니다. 기관은 위반 가능성을 조사하면서 동시에 윤리적 관행을 장려하기 위해 다차원적 접근 방식을 취할 수 있습니다.

신중한 가이드라인, 절차, 문화적 강화와 더불어, 기관은 건전한 연구 윤리와 부결성을 통해 부정행위를 억제하고 신뢰성을 유지할 수 있습니다.

새로이 떠오르는 기술이 학문적 부정행위에 새로운 길을 제공하기는 하지만, 연구의 무결성은 근본적으로 투명성을 유지하고 책임을 다하려는 개인과 기관의 노력에 달려 있습니다. 윤리 표준과 시행 정책의 공동 개발을 통해 연구 커뮤니티는 신뢰성을 보호하는 가운데 AI를 책임감 있게 활용할 수 있습니다.

연구의 무결성을 유지하기 위해 AI 도구를 사용해 본 적이 있나요? Enago Academy 오픈 플랫폼에 여러분의 관점을 자유롭게 공유해 보세요.