[ Article ]

Journal of Digital Contents Society - Vol. 26, No. 12, pp.3399-3408

ISSN: 1598-2009 (Print) 2287-738X (Online)

Print publication date 31 Dec 2025

Received 20 Oct 2025 Revised 17 Nov 2025 Accepted 24 Nov 2025

DOI: https://doi.org/10.9728/dcs.2025.26.12.3399

MOD 게임 중심의 워터마킹 기술 연구 동향 분석

최효림¹ ; 김혜영²^{, *}

1홍익대학교 게임학과 석사과정
2홍익대학교 게임학부 게임소프트웨어전공 교수

A Survey of Watermarking Techniques in Modification-Centric Game Environments

Hyorim Choi¹ ; Hye-Young Kim²^{, *}

1Master’s Course, Department of Games(Engineering), Hongik University, Sejong 30016, Korea , Korea
2Professor, School of Game(Major in Game Software), Hongik University, Sejong 30016, Korea

Correspondence to: ^*Hye-Young Kim Tel: +82-44-860-2683 E-mail: hykim@hongik.ac.kr

Copyright ⓒ 2025 The Digital Contents Society
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-CommercialLicense(http://creativecommons.org/licenses/by-nc/3.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

초록

현대 게임에서 사용자 제작 콘텐츠(MOD)의 활용이 증가함에 따라 설정 파일, 스크립트, 메타데이터 등 텍스트 기반 자산의 사용도 급증하고 있다. JSON, YAML, XML 등으로 구성된 이러한 자산은 모딩 커뮤니티 내에서 활발히 공유되고 편집되며, 이에 따라 콘텐츠의 진위성, 무단 재사용, 저작권 귀속에 대한 우려가 제기되고 있다. 본 논문은 MOD 환경에서 사용되는 반정형 및 비정형 텍스트에 적용 가능한 워터마킹 기법을 조사하며, 보이지 않는 문자 인코딩, 메타데이터 삽입, 구문 보존 변형 등의 방법을 다룬다. 또한 규칙 기반부터 AI 기반까지 다양한 검출 기법을 소개하고, 파서 민감성, 형식 정규화, 플랫폼 간 호환성과 같은 주요 기술적 과제를 논의한다. 기존 기법의 분류 및 비교 분석을 통해, 본 연구는 게임 모딩 생태계의 변화에 대응하는 경량·보안 중심의 워터마킹 솔루션 개발을 위한 기초적 관점을 제시한다.

Abstract

As user-generated modifications (MODs) have become integral to modern games, the use of textual assets such as configuration files, scripts, and metadata has surged. These assets, often formatted in JSON, YAML, or XML, are widely shared and edited across modding communities, raising concerns over authenticity, unauthorized reuse, and copyright attribution. This paper surveys watermarking techniques applicable to semi-structured and unstructured text in MOD environments, including invisible character encoding, metadata embedding, and syntax-preserving transformations. It also reviews detection methods ranging from rule-based to AI-driven approaches, and discusses key challenges such as parser sensitivity, format normalization, and cross-platform compatibility. By classifying and comparing existing techniques, the study provides a foundation for developing lightweight and secure watermarking solutions tailored to the dynamic needs of game-modding ecosystems.

Keywords:

Digital Watermarking, Semi-Structured Text Files, Unstructured Text Files, Game MODs, Copyright Detection

키워드:

디지털 워터마킹, 반정형 텍스트 파일, 비정형 텍스트 파일, 게임 MOD, 저작권 탐지

Ⅰ. 서 론

1-1 연구의 배경 및 필요성

현대 디지털 게임에서 사용자 생성 콘텐츠(User-Generated Content, UGC)의 한 형태인 MOD(Modification)는 게임의 기능, 외관, 규칙을 확장하거나 변경하는 핵심 요소로 자리 잡았다. 이러한 MOD들은 대부분 JSON, YAML, XML, TXT와 같은 텍스트 파일을 기반으로 제작되며, 이 파일들은 게임 엔진이 실시간으로 해석하고 실행하여 게임 플레이와 서사에 직접적인 영향을 미친다[1]. 모딩 커뮤니티에서 이 파일들은 자유롭게 공유, 재사용, 편집되고 있다.

그러나 이러한 개방적인 생태계는 콘텐츠의 무단 복제, 위변조, 지적 재산권 귀속 문제와 같은 심각한 기술적, 윤리적 문제를 야기한다. 특히, 텍스트 기반의 MOD 파일은 누구나 쉽게 복사하거나 수정할 수 있어 원작자의 저작권이 침해되기 쉽다. 따라서 MOD 환경에서 텍스트 파일의 진위성(authenticity)과 출처(attribution)를 보장할 수 있는 기술적 해결책이 필수적으로 요구된다.

이러한 문제를 해결하기 위한 방안으로 디지털 워터마킹(Digital Watermarking) 기술이 유망한 대안으로 부상하고 있다. 워터마킹은 콘텐츠 내에 식별 정보를 은밀하게 삽입하여 저작권 증명 및 위변조 방지를 가능하게 하는 기술이다. 하지만 텍스트 워터마킹은 이미지나 오디오 등 멀티미디어 워터마킹과는 다른 고유한 기술적 과제에 직면한다. 텍스트는 문법 구조가 엄격하고 파서(parser)에 민감하여, 워터마크 삽입 시 구문 오류가 발생하거나 파일 기능이 손상될 위험이 있다. 또한, MOD 파일은 자동 포맷팅(Auto-Formatting)이나 최적화(Minification)와 같은 과정에 노출될 경우, 워터마크가 쉽게 소실될 위험이 있다.

1-2 연구의 목적 및 범위

본 연구는 게임 MOD 환경에서 활용될 수 있는 텍스트 워터마킹 기술의 연구 동향을 종합적으로 분석하는 것을 목적으로 한다. 이 과정에서 우리는 기존 연구의 한계를 파악하고, 게임 MOD 생태계의 특수성을 고려한 워터마킹 기술의 적용 방안을 모색하고자 한다.

본 연구의 구체적인 범위는 다음과 같다. 첫째, 게임 MOD에서 주로 사용되는 반정형 텍스트(JSON, YAML, XML) 및 비정형 텍스트(TXT)에 초점을 맞추어 각 파일 형식의 특성과 워터마킹의 제약사항을 분석한다[2]. 둘째, 워터마크 삽입 방법(무형 문자 삽입, 키 순서 변경, 의미 보존 단어 치환 등)과 워터마크 탐지 방법(규칙 기반, 통계/패턴 기반, AI 기반 등)을 체계적으로 분류하고 비교한다. 셋째, 게임 MOD 환경의 고유한 특성(파서 호환성, 자동 포맷팅 등)이 워터마킹 기술의 적용에 미치는 영향을 고찰하고, 실질적인 기술적 한계와 미래 연구 방향을 제시한다. 이러한 연구를 통해, 게임 MOD 창작자의 권리를 보호하고 신뢰할 수 있는 콘텐츠 공유 환경을 구축하는 데 기여하고자 한다.

Ⅱ. 관련 연구

2-1 디지털 워터마킹 개요

디지털 워터마킹은 문서의 위조 방지나 소유권 증명을 위해 디지털 콘텐츠에 식별 정보를 은닉하는 기술이다. 이 기술은 1990년대 중반부터 이미지, 오디오, 비디오 등 멀티미디어 콘텐츠를 중심으로 발전해 왔으며, 주로 주파수 영역(Frequency Domain)을 활용하는 방법들이 연구되었다. 이러한 전통적인 기술들은 물리적 신호의 중복성과 연속성을 이용하기 때문에, 엄격한 문법 구조를 가진 텍스트 파일에 직접 적용하기 어렵다는 한계를 가지고 있다.

최근에는 워터마크가 콘텐츠 변형에 얼마나 강인하게 버티는지에 따라 강인 워터마킹(Robust Watermarking)과 취약 워터마킹(Fragile Watermarking)으로 구분된다. 강인 워터마킹은 불법 복제물 추적이나 소유권 증명 등 장기적인 보호를 목적으로 하며, 콘텐츠가 여러 차례 변형되어도 워터마크가 유지되도록 설계된다. 반면, 취약 워터마킹은 콘텐츠의 작은 변형에도 워터마크가 손상되도록 설계되어 문서의 무결성 검증 및 위변조 탐지에 주로 사용된다. 게임 MOD 환경에서는 콘텐츠가 자주 수정되고 최적화되기 때문에, 용도에 따라 두 가지 워터마킹 방식 중 하나를 선택해야 한다.

2-2 텍스트 워터마킹 기술

멀티미디어 워터마킹에 비해 상대적으로 주목을 덜 받았던 텍스트 워터마킹은 주로 자연어 기반 문서에 초점을 맞춰 발전해 왔다. 문법이나 의미를 미묘하게 변경하여 워터마크를 삽입하는 언어학적 기법이 제안되었으며[3], 문서 포맷팅을 조작하여 식별 정보를 숨기는 방법도 제시되었다[4]. 또한, 동의어 치환이나 문장 재배열과 같은 형태통사적 변형을 통해 데이터를 은닉하는 기술이 연구되었고[5], 문장 구조를 조작하여 의미는 보존하면서 워터마크를 삽입하는 방법도 제시되었다[6]. 이러한 연구들은 주로 자연어 텍스트나 문단 중심의 문서에 적합하며, JSON, XML과 같은 기계 판독 가능한 구조화된 형식에는 적용하기 어렵다는 한계를 가진다.

최근에는 구조화된 텍스트 형식에 대한 워터마킹 연구도 활발하게 진행되고 있다. XML 문서의 트리 구조 내에 워터마크를 삽입하는 방법이 제안되었고[7], XML, 관계형 데이터베이스 등 다양한 구조에 적용 가능한 강인 워터마킹 프레임워크가 개발되었다[8]. 또한 소프트웨어 코드의 계층적 구조를 워터마크 운반체로 활용한 연구도 제안되었다[9]. 그러나 이들 연구 역시 게임 MOD 환경의 동적인 로딩 구조, 잦은 사용자 수정, 플랫폼별 형식 불일치와 같은 고유한 제약 조건들을 완전히 포괄하지는 못한다.

2-3 게임 MOD 환경의 콘텐츠 보호 및 관련 기술 연구

MOD 환경의 콘텐츠 보호를 위한 다양한 시도가 이루어져 왔다. 디지털 서명된 데이터 내에서 부분적인 수정 사항을 탐지하는 기술이 제안되었으며[10], 해시 기반 서명 방식의 취약점을 분석하며 위조 가능성을 제시한 연구도 있다[11]. 이와 더불어 플래그 표절 탐지(Plagiarism Detection) 및 출처 귀속(Content Attribution) 연구도 진행되어 왔다. 특히, 스타일 측정(Stylometry) 기법을 활용하여 여러 저자가 기여한 텍스트에서 저자를 식별하는 방법이 제시되기도 하였다[12].

이러한 기술들은 MOD 콘텐츠의 무결성 검증에 기여하지만, 워터마킹처럼 콘텐츠에 직접적인 식별 정보를 삽입하거나 위변조 방지 기능을 제공하지는 못한다. 이로 인해 워터마킹과 스타일 측정 기술을 상호 보완적으로 결합하는 하이브리드 접근 방식이 게임 MOD 환경의 콘텐츠 보호를 위한 효과적인 전략이 될 수 있다.

Ⅲ. 본 론

기존 워터마킹 연구는 데이터이자 실행 로직이 결합될 수 있는 MOD 파일의 이중적 특성과 파서 민감성을 고려하지 못했기 때문에 MOD 파일에 대한 분석이 필요하다.

3-1 게임 MOD와 텍스트 파일 구조

게임 MOD에는 복잡한 콘텐츠와 기능이 포함되는 경우가 많으며, 그 핵심은 대부분 텍스트 기반 파일로 구성된다. 이러한 텍스트 파일은 게임 엔진이 해석하고 실행하여 MOD의 동작 방식, 설정, 이야기, 심지어 게임 플레이 메커니즘까지 정의한다. 이 섹션에서는 MOD에서 사용되는 일반적인 텍스트 파일 형식과 게임 엔진 내에서의 역할 및 제약 사항을 분석한다.

MOD에서 가장 일반적으로 사용되는 텍스트 파일 형식은 JSON (JavaScript Object Notation), YAML (YAML Ain't Markup Language), XML (eXtensible Markup Language)이며, 그 외에 INI와 스크립트 파일이 사용된다. 각 형식은 고유한 구문과 구조적 특성을 가지며, MOD 제작자는 구현하려는 특정 기능에 따라 형식을 선택한다.

JSON은 가독성이 뛰어나고 기계가 쉽게 분석할 수 있어 MOD 개발에 널리 사용된다. 게임 내 아이템 속성, 캐릭터 통계, 퀘스트 설정 등을 정의하는 데 주로 활용된다. 그러나 JSON은 구문 규칙이 엄격하여 파서(parser)가 구문 오류를 발견하면 MOD의 작동이 중단될 수 있다는 단점이 있다[13].

YAML은 들여쓰기 기반의 구문을 사용해 JSON보다 가독성이 더 뛰어나며, 구성 파일이나 레벨 디자인에 적합하다. 하지만 YAML은 공백이나 들여쓰기 오류에 매우 민감하여 런타임에 파싱 오류를 유발할 수 있다[14].

XML은 태그 기반의 계층적 구조를 통해 복잡한 데이터 관계를 표현할 수 있어 게임 설정, 객체 속성 등에 유용하다[15]. 하지만 XML 또한 구문 정확성이 중요하며, 사소한 오류도 파싱 실패로 이어질 수 있다.

스크립트 파일은 Lua, Python과 같은 특정 프로그래밍 언어로 작성된 실행 가능한 로직을 포함하는 반정형 텍스트의 독특한 범주이다. 스크립트 파일은 게임 엔진 내에서 게임플레이 메커니즘을 제어하며, 런타임에 파싱 및 실행된다. 따라서 구문 규칙을 매우 엄격하게 준수해야 하며, 작은 수정만으로도 런타임 오류나 예상치 못한 동작을 일으킬 수 있다.

INI 파일은 초기 설정 및 사용자 정의 설정을 저장하는 데 사용되는 가볍고 간단한 형식이다. 구조가 단순하여 워터마킹에 적합하지 않고, 많은 게임 엔진이 주석을 무시하여 워터마크가 쉽게 손실될 수 있다.

이러한 텍스트 파일들은 단순히 데이터를 저장하는 것을 넘어, 게임의 동작을 직접 제어하는 데이터와 코드의 이중적 특성을 가진다. 따라서 워터마크를 삽입할 때 파일의 데이터 무결성뿐만 아니라 코드 무결성도 동시에 고려해야 하는 복잡성이 존재한다.

3-2 실질적인 워터마크 삽입 기술

게임 MOD 환경에 적용 가능한 워터마크 삽입 기술은 파일의 구조, 콘텐츠, 그리고 게임 엔진의 파싱 방식에 따라 다양하게 적용될 수 있다.

무형 문자 삽입 기법은 사람의 눈에는 보이지 않거나 파서가 무시하는 문자를 삽입하여 워터마크를 인코딩한다. 유니코드의 제로 폭 문자(Zero-Width Space)나 다른 유니코드 공백 문자를 활용하는 방식이 대표적이다. 이 방법은 가독성이나 시각적 품질에 영향을 주지 않아 높은 비가시성을 제공한다. 그러나 자동 포맷팅이나 파일 압축 도구에 의해 무형 문자가 쉽게 제거될 수 있어 견고성이 매우 낮다.

Fig. 1.

Original JSON MOD file

예를 들어, 원본 JSON MOD 파일을 기준으로 description 필드의 문자열 끝에 제로 폭 문자(\u200B)를 삽입하면 워터마크 비트 패턴을 인코딩할 수 있다.

Fig. 2.

JSON MOD file with zero-width characters inserted

구조화된 파일의 키 순서 변경은 JSON이나 YAML과 같이 키 순서가 데이터 의미에 영향을 미치지 않는 파일 형식을 활용하는 기법이다. 특정 키 쌍의 순서를 오름차순/내림차순으로 정렬하거나, 특정 비트 패턴에 따라 키 순서를 변경하여 워터마크를 삽입한다. 이 방법은 파일 포맷터에 의한 단순한 공백 제거에는 강하지만, 강제로 키를 정렬하는 도구에는 취약하다.

의미 보존 단어 치환은 주로 대화 스크립트나 설명문과 같은 비정형 텍스트 파일에 적용되는 기법이다. 워터마크 비트에 따라 특정 단어를 동의어로 바꾸거나, 문장 구조를 변경하는 방식으로 워터마크를 삽입한다. 이 방법은 사람에게는 거의 인지되지 않지만, 자동 번역이나 요약 도구에 의해 워터마크가 손상될 위험이 크다.

많은 파일 형식은 파일 콘텐츠 외에 추가 정보를 저장할 수 있는 메타데이터 영역을 제공하거나, 미사용 필드를 포함하고 있다. 메타데이터 또는 미사용 필드 삽입 기법은 이러한 영역에 워터마크를 삽입하는 방식이다. 구현이 비교적 쉽고 파일의 핵심 콘텐츠에 영향을 주지 않지만, 메타데이터는 쉽게 접근하고 수정할 수 있어 보안이 취약하다.

다음은 JSON 파일에 워터마크 해시 값을 저장하는 미사용 필드 _wm_hash를 추가하는 예시이다. 게임 설계 시 이 필드가 무시되도록 한다.

Fig. 3.

JSON MOD file with unused fields added

JSON, YAML, XML과 같은 구조화된 텍스트 파일은 가독성을 위해 들여쓰기, 줄 바꿈, 공백 등을 사용하며, 파서는 이를 무시하는 경우가 많다. 워터마크 비트에 따라 들여쓰기나 공백의 양을 조절하는 방식으로 워터마크를 삽입할 수 있다. 이를 들여쓰기 및 포맷팅 인코딩 기법이라 한다. 이 방법은 비가시성이 높지만, 코드 포맷터나 압축 도구에 의해 쉽게 제거된다. 앞서 설명한 무형 문자 삽입 기법과는 파서가 무시하는 영역을 활용한다는 공통점이 있으나 혼동해서는 안 된다. 무형 문자 삽입 기법은 유니코드 제로 폭 문자(U+200B)와 같은 비가시 문자를 데이터(문자열)의 내용 자체에 삽입하는 반면, 들여쓰기 및 포맷팅 인코딩 기법은 탭 개수나 공백 길이 등 파일의 구조적 서식을 변형하여 워터마크를 인코딩한다.

스크립트 내 스테가노그래피 기법은 스크립트 파일의 문법적 특성이나 실행 로직을 이용하여 워터마크를 숨기는 방법이다. 변수나 함수 이름을 조작하거나, 실행 로직에 영향을 미치지 않는 더미 조건문이나 불필요한 연산을 삽입하는 방식이 있다. 이는 코드 실행에 영향을 주지 않지만, 코드 최적화 도구에 의해 제거되거나 변경될 수 있다.

LLM 기반 변형 기법은 대규모 언어 모델(LLM)을 활용하여 워터마크를 삽입하는 새로운 방법이다. LLM이 워터마크 비트에 따라 의미는 동일하지만 다르게 표현된 문장을 생성하거나, 문법적으로 유효한 더미 코드 스니펫을 삽입하도록 한다. 이 기법은 자연스럽고 견고한 워터마크를 삽입할 수 있는 잠재력이 높지만, 높은 계산 비용과 파서 유효성 보장이라는 과제가 있다.

제로 워터마킹(Zero-Watermarking)은 원본 파일을 직접 수정하지 않고 외부에서 워터마크 서명을 생성하는 비침습적 기법이다. 원본 콘텐츠의 구조적 특징을 추출하여 워터마크를 만들며, 이는 파일의 무결성을 완벽하게 보존하여 포맷 정규화나 파서 수준의 변형에 매우 강하다.

삽입 워터마킹 기법에서 비가시성은 워터마크 삽입 후 원본 텍스트와 비교하여 사용자가 그 변화를 인지할 수 있는 정도를 나타내는 주요 성능 기준이다. 게임 MOD 환경에 적용되는 워터마킹은 워터마크 삽입이 게임플레이 스크립트나 대화의 의미적 및 문법적 특성을 손상시키거나 MOD 작동을 방해해서는 안 되기 때문에 이 비가시성을 극대화하도록 설계된다. 본 논문에서 제시한 삽입 워터마킹 기법 중 텍스트의 내용(의미) 변화를 통해 인지 가능성이 있는 기법은 의미 보존 단어 치환과 LLM 기반 변형 기법을 꼽을 수 있다. 반면, 무형 문자 삽입, 들여쓰기 및 포맷팅 인코딩, 키 순서 변경, 메타데이터 또는 미사용 필드 삽입, 스크립트 내 스테가노그래피 기법은 주로 파서 무시 영역이나 구조를 활용하여 실제 콘텐츠의 내용적 변화를 인지할 수 없도록 높은 비가시성을 제공한다. 한편, 제로 워터마킹은 원본을 직접 수정하지 않고 외부에서 서명을 생성하는 비침습적 기법으로, 완벽한 비가시성을 달성한다.

지금까지 살펴본 개별 워터마킹 삽입 기법들은 각각의 장점에도 불구하고 게임 MOD 환경의 고유한 공격 벡터에 취약하다는 공통적인 한계를 가진다. 특히 MOD 파일은 자동 포맷팅이나 최적화와 같은 프로세스에 의해 들여쓰기나 공백 기반 워터마크가 쉽게 소실되며, 키 순서 재배열 공격에 취약하다. 이러한 문제를 근본적으로 해결하기 위해 여러 기술을 상호 보완적으로 결합한 하이브리드 워터마킹 접근 방식이 필수적이다. 이는 스크립트 내 스테가노그래피 기법과 같이 실행 로직에 숨겨진 워터마크를 키 순서 변경 기법과 같은 구조 기반 워터마크와 병행하여 삽입하는 것을 포함한다. 더 나아가 제로 워터마킹 기법을 하이브리드 전략의 핵심 방어 계층으로 활용할 수 있다. 제로 워터마킹은 원본 파일을 수정하지 않고 구조적 특징을 기반으로 서명을 생성하여 완벽한 비가시성을 달성하며, 포맷 정규화나 파서 수준의 변형에 매우 강력한 견고성을 제공하기 때문이다. 따라서 삽입 기반 워터마크가 공격에 손상되더라도, 제로 워터마크가 파일의 무결성 및 출처를 보장하는 최종 방어선 역할을 수행하여 게임 MOD 창작자의 권리를 보호하는 가장 효과적이고 실질적인 방안이 될 수 있다.

3-3 보안 위협 모델 및 공격 방법

텍스트 워터마킹 기술은 게임 MOD 환경의 동적인 특성으로 인해 다양한 보안 위협에 취약하다. 워터마크의 효과를 보장하기 위해서는 잠재적인 위협 모델과 공격자의 행동을 명확히 이해해야 한다.

MOD 환경의 공격자는 무단 재배포자, 기능 조작자, 리버스 엔지니어 등으로 분류할 수 있다. 이들은 저작권 침해, 무단 수익 창출, 원본 출처 숨기기, 기능 변경 등 다양한 동기를 가지고 워터마크를 제거하거나 변조하려 한다. 공격자는 워터마크를 직접 제거하거나 탐지 알고리즘을 우회한다. 구조화된 텍스트 파일의 경우, 키 순서 재배열, 공백 제거, 포맷 정규화, 메타데이터 제거 등의 기법을 사용한다. 비정형 텍스트의 경우, 의미적 재작성, 동의어 치환, 구문적 변경을 통해 탐지를 방해한다. 워터마크 제거 외에, 공격자는 위조된 워터마크를 삽입하거나 반복적인 수정을 통해 탐지 신호를 약화시킬 수 있다. 이러한 공격은 탐지 알고리즘의 신뢰성을 떨어뜨려 워터마크의 진위 판단에 혼란을 초래한다. 파일을 다른 형식으로 변환하는 것도 중요한 공격 벡터이다. 예를 들어, JSON 파일을 XML로 변환하거나, YAML을 CSV로 재구성하면 워터마크를 포함한 구조적 요소가 변경되거나 제거될 수 있다.

이러한 공격에 대응하기 위해, 워터마크는 비가시성과 견고성을 모두 확보해야 한다. 중복 삽입, 암호화 해시 기반 무결성 검증, 파서 인식 삽입 방법, 하이브리드 워터마킹 등의 방어 전략을 사용할 수 있다. 또한, 적대적 학습 기반의 탐지 모델을 개발하여 공격자의 조작 패턴에 선제적으로 대응하는 것도 효과적인 방안이다.

3-4 워터마크 탐지 및 식별

워터마크를 삽입하는 것만큼 효율적이고 정확하게 탐지하고 식별하는 것도 중요하다. 게임 MOD 환경과 같이 콘텐츠가 자주 훼손, 위변조, 무단 재배포되는 환경에서는 다양한 조건에서 워터마크를 안정적으로 추출할 수 있는 탐지 메커니즘이 필수적이다.

규칙 기반 탐지 기법은 미리 정의된 패턴이나 특정 서명을 통해 워터마크의 존재를 확인하는 가장 직접적인 방법이다. 특정 문자열 패턴 검색, 구조적 요소 검사, 주석 및 메타데이터 분석 등이 포함된다. 구현이 간단하고 계산 비용이 낮지만, 공격자가 메커니즘을 이해하면 쉽게 우회할 수 있어 보안이 취약하다.

통계 또는 패턴 분석 기반 탐지 기법은 워터마크 삽입으로 인해 발생한 미묘한 통계적 변화나 패턴을 분석하여 워터마크를 식별한다. 공백, 줄 바꿈, 특정 문자 빈도 등을 통계적으로 분석하거나 , N-gram 분석을 통해 원본 텍스트와의 통계적 차이를 감지하는 방식이다. 규칙 기반 방법보다 정교하고 공격에 강하지만, 원본 파일이 없으면 탐지가 어렵고 계산 비용이 복잡하다는 한계가 있다.

파일의 해시 값을 비교하여 무결성을 검증하는 기법은 단순하지만 강력한 방법이다. 워터마크 삽입 후 파일의 해시 값을 미리 저장해두고, 추후 검증 시 현재 파일의 해시 값과 비교하여 위변조 여부를 판단한다. 파일 내용이 단 한 비트라도 변경되면 해시 값이 완전히 달라지므로 위변조 탐지에 매우 효과적이다. 그러나 파일이 변경되는 즉시 워터마크가 손상된 것으로 간주되므로, 강인 워터마킹에는 적합하지 않다.

기계 학습 또는 딥러닝 기반 탐지 기법의 경우 복잡하고 미묘한 패턴을 가진 워터마크를 탐지하는 데 강점을 가진다. 워터마크가 삽입된 텍스트와 그렇지 않은 텍스트를 훈련 데이터로 사용하여 분류 모델을 학습시키거나 , 텍스트의 미세한 이상 현상을 감지하여 워터마크의 존재를 식별한다. 이 방법은 복잡한 공격에도 높은 견고성을 보이지만, 대량의 훈련 데이터와 막대한 계산 자원이 필요하다는 단점이 있다.

3-5 게임 MOD 환경에서의 활용 사례 및 도전 과제

게임 MOD 환경에서 텍스트 워터마킹의 활용은 주로 JSON 기반 MOD 파일 보호와 게임플레이 스크립트 보호에 집중된다. 텍스트 워터마킹의 실질적인 적용에는 여러 고유한 도전 과제가 존재한다. JSON, YAML과 같은 구조화된 형식은 엄격한 구문 규칙을 따른다. 워터마크 삽입 과정에서 이러한 규칙이 위반될 경우, 파일이 파싱되지 않아 MOD가 오작동할 수 있다. 워터마크의 비가시성과 파일의 구문 유효성을 동시에 보장하는 것이 핵심적인 기술적 과제이다. MOD 파일은 개발 도구, IDE, 웹 기반 배포 플랫폼 등에 의해 자동으로 포맷이 변경되거나 최적화되는 경우도 빈번하다. 이러한 과정에서 들여쓰기, 공백, 줄 바꿈, 심지어 특정 필드의 순서까지 변경될 수 있으며, 이 정보에 의존하는 워터마크는 쉽게 소실된다. 따라서 자동 포맷팅 또는 정규화로 인한 워터마크 손실도 고려해야 한다.

또한, Roblox나 Minecraft와 같은 MOD를 지원하는 게임마다 파일 처리 방식, 지원 형식, 엔진의 파싱 로직에 고유한 특성이 있어 맞춤형 접근이 필요하다. 예를 들어 Lua 스크립트를 주로 사용하는 Roblox의 경우 엔진 로딩 과정에서 주석이나 유니코드 기반의 무형 문자가 제거되는 경우가 빈번하다. 따라서 단순한 들여쓰기 및 포맷팅 인코딩 기법은 효과가 매우 낮기 때문에 스크립트 내 스테가노그래피 기법을 사용하여 실행 로직에 영향을 주지 않으면서도 엔진에 의해 쉽게 제거되지 않는 변수 이름 조작이나 더미 조건문에 숨기는 등의 방법이 권장된다. JSON이나 YAML 등으로 구성된 데이터 팩이나 리소스 팩을 사용하는 Minecraft의 경우 MOD 제작 도구나 웹 기반 배포 플랫폼을 거치면서 자동으로 최적화되거나 강제 정렬된다. 이 과정에서 공백, 들여쓰기, 줄 바꿈 기반 워터마크는 즉시 소실되며, 키-값 쌍의 순서 또한 재배열될 수 있다. 따라서 들여쓰기/공백 기반 기법을 지양하고, 키 순서 변경 기법이나 미사용 필드 삽입 기법을 사용하되 키 정렬 공격에 대비하여 강인 워터마킹 프레임워크를 적용하는 것이 바람직하다.

3-6 기존 연구들에 대한 성능 평가 및 비교

기존 텍스트 워터마킹 연구들은 주로 일반 문서, XML 데이터베이스, 또는 자연어 생성(LLM) 환경의 보호에 중점을 두었으며, 게임 MOD 환경의 고유한 특성인 ① 자동 포맷팅 및 최적화 프로세스, ② 잦은 사용자 수정 및 재배포 주기의 짧음, 그리고 ③ 플랫폼별로 상이한 구조적 요구사항을 충분히 고려하지 못했다는 한계가 있다. 본 연구는 이러한 MOD 환경의 제약 조건을 평가 기준으로 삼아 기존 연구들의 성능을 재해석하는 데 중점을 둔다.

텍스트 워터마킹 기술의 성능을 평가하기 위한 주요 기준은 비가시성(Imperceptibility), 견고성(Robustness), 페이로드 용량(Payload Capacity), 보안성(Security), 계산 효율성(Computational Efficiency)이다.

비가시성은 워터마크 삽입 후 원본 텍스트와 워터마크가 삽입된 텍스트 간의 의미적 및 문법적 유사성을 측정하는 기준이다. 텍스트 워터마킹에서의 비가시성은 단순히 눈에 보이는 것을 넘어 삽입된 워터마크가 원본 텍스트의 의미적(semantic) 및 문법적(syntactic) 특성을 얼마나 손상시키지 않는가를 의미한다. 게임 MOD 파일의 경우, 워터마크 삽입으로 인해 게임 스크립트나 대화가 변경되면 게임 플레이에 직접적인 영향을 미치므로 이 기준이 중요하다고 할 수 있다.

견고성은 워터마크가 다양한 공격이나 변형에 얼마나 잘 견디는지를 나타낸다. 텍스트 워터마킹의 경우 단어 삽입, 삭제, 치환, 재배열 등의 공격에 대한 저항성을 평가한다. MOD 파일은 사용자에 의해 자주 수정되므로 견고성은 워터마킹 기술의 실용성을 결정하는 핵심 요소이다.

보안성은 워터마크가 허가되지 않은 사용자에게 탐지, 제거 또는 위조되는 것을 얼마나 효과적으로 방지하는지를 나타낸다.

계산 효율성은 워터마크 삽입 및 탐지에 소요되는 시간과 자원을 의미한다. 게임 MOD 파일은 실시간으로 로딩되거나 수정될 수 있기 때문에, 효율성은 실질적인 적용에 있어 중요하게 고려되어야 한다.

XML, JSON과 같은 반정형 텍스트 파일을 위한 워터마킹 기술은 주로 태그, 속성, 계층적 구조와 같은 구조적 요소를 활용한다. Martinez 등 은 모델의 추상 구문 트리(AST)에 메타데이터를 삽입하여 공동 작업 환경에서의 견고성을 높이는 방법을 제안했다[16]. Wen 등 은 원본 문서를 수정하지 않는 제로 워터마킹을 통해 완벽한 비가시성을 달성했다[17]. He 등 은 보조 파일을 사용하여 노드 삭제 및 삽입 공격에 강인한 기법을 개발했고[18], Zhuang 등 은 연결 그래프 개념을 활용해 구조적 재조직에 강한 방법을 제시했다[19]. 이 기술들은 높은 견고성과 비가시성을 제공하지만, 복잡한 처리 과정으로 인해 계산 효율성이 낮을 수 있다. Constantin 등 은 머신러닝을 통해 워터마크 탐지 효율성을 높이는 연구를 진행했다[20].

일반 텍스트나 게임 대화 스크립트와 같은 비정형 텍스트 워터마킹은 언어적 특성이나 통계적 속성에 기반을 둔다. Saeed와 Dixit 은 원본 텍스트를 변경하지 않는 하이브리드 통계적 제로 워터마킹(HSW)을 통해 높은 비가시성과 견고성을 달성했다[21]. Hou 등 은 LLM의 문장 생성 과정에서 의미론적 속성을 조작하여 패러프레이징 공격에 강인한 기법을 제시했고[22], Lu 등 은 엔트로피 기반 탐지 기법을 통해 워터마크를 삽입하지 않고도 위변조를 탐지하는 효율적인 방법을 제안했다[23]. 이러한 LLM 기반 워터마킹은 매우 높은 비가시성과 견고성을 보이지만, 여전히 높은 계산 비용을 가진다는 한계가 있다.

무형 문자 삽입이나 주석 기반 워터마킹은 비가시성이 우수하지만, MOD 환경에서는 Roblox Lua 스크립트 로더나 Minecraft의 데이터 팩 Minifier와 같은 플랫폼 고유의 자동 정리 프로세스에 의해 워터마크가 쉽게 제거될 수 있다는 근본적인 취약점을 가진다. 이는 일반적인 문서 환경에서는 중요하지 않았던 요소이나, MOD 생태계에서는 견고성(Robustness)이 매우 낮음으로 평가되는 핵심 이유이다.

키 순서 변경 및 들여쓰기 기반 기술은 XML, JSON 파일의 구조적 특징을 이용하나, 대다수 개발 툴이 제공하는 강제 정렬 기능이나 자동 최적화 기능을 사용한 공격에 직접적으로 노출된다. 기존 연구들은 단순 구조 보호에 집중했지만 MOD 환경에서는 공격자가 구조를 쉽게 파괴할 수 있다는 점 때문에 견고성에 대한 기대치를 낮추어 재평가해야 한다.

동의어 치환과 같은 의미 기반 워터마킹은 자연어 텍스트에 강력하나, 게임 MOD의 설정 파일이나 스크립트 코드가 가지는 고정된 전문 용어나 구문적 제약 때문에 적용 가능한 단어의 폭이 극히 제한적이다. 이는 일반적인 보호 관련 연구에서와 달리 MOD 환경에서는 페이로드 용량과 비가시성이 모두 저하되는 결과로 이어진다.

이러한 기술들은 각각의 장단점을 가지며, 특히 게임 MOD 환경의 특성을 고려한 맞춤형 설계가 필수적이다.

Table 1.

Performance evaluation criteria

Table 2.

Performance evaluation by technique

Ⅳ. 결 론

본 연구는 게임 MOD 환경에서 활용될 수 있는 텍스트 워터마킹 기술의 연구 동향을 종합적으로 분석했다. 현대 게임에서 텍스트 기반 MOD 콘텐츠의 중요성이 커짐에 따라, 이 콘텐츠의 진위성, 출처, 소유권을 보호하기 위한 기술적 필요성이 증대되고 있다. 본 논문에서는 무형 문자 삽입, 키 순서 조작, 의미 보존 단어 치환 등 다양한 워터마킹 기술의 장단점 및 한계를 비교 분석했다. 또한, 규칙 기반, 통계적, 머신러닝 기반의 워터마크 탐지 및 식별 방법론도 검토했다. 특히, 파서의 견고성, 플랫폼 간 호환성, 자동 포맷팅과 같은 게임 MOD 환경의 고유한 제약 조건이 워터마킹 기술 적용에 미치는 영향을 논의했다.

결론적으로, 텍스트 워터마킹은 게임 MOD 환경에서 콘텐츠 보호를 위한 유망한 방법이다. 그러나 기존 멀티미디어 워터마킹 기술의 한계를 극복하고 텍스트 파일의 문법적 유효성과 의미론적 일관성을 유지하는 것이 핵심 과제이다. 파일에 대한 최적화(minification), 재포맷팅(reformatting)과 다양한 게임 엔진 및 플랫폼의 특성은 워터마크의 견고성과 비가시성을 보장하기 위한 정교한 설계의 필요성을 강조한다.

이러한 특성으로 인해, 무형 문자 삽입이나 포맷 인코딩과 같은 삽입 기반 워터마킹 기법은 자동화된 최적화 프로세스에 의해 견고성에 본질적인 한계를 가진다는 점이 본 연구를 통해 도출된 핵심 통찰이다. 따라서 원본 파일 변형 없이 구조적 특징에 기반하여 서명을 생성하는 제로 워터마킹 기법을 핵심 방어 계층으로 활용해야 한다. 이는 삽입형 워터마크가 공격에 손상되더라도, 파일의 출처와 무결성을 보장하는 최종 방어선 역할을 수행하여 창작자의 권리를 효과적으로 보호하는 실질적인 방안이 될 수 있다.

이러한 워터마킹 기술은 게임 MOD 생태계의 다양한 주체들에게 구체적으로 활용될 수 있다. MOD 창작자는 자신의 텍스트 기반 자산에 고유 식별자를 워터마킹하여 무단 재배포 시 저작권 귀속을 명확히 보장받을 수 있다. 플랫폼 차원에서는 무결성 검증이 가능하다. Steam Workshop이나 Nexus Mods와 같은 MOD 배포 플랫폼이 파일 업로드 시 워터마크를 탐지하여 위변조 여부 및 원본 출처를 확인하는 자동화된 위변조 탐지 시스템을 구축할 수 있다. 유료 콘텐츠 보호 강화도 가능하다. 유료 MOD 파일에 구매자 정보를 인코딩하는 핑거프린팅(Fingerprinting) 기술을 적용하여 불법 유출을 방지하고 상업적 가치를 보호할 수 있다.

향후 연구는 다음과 같은 방향으로 진행될 수 있다. 첫째, 단일 기술의 한계를 극복하기 위해 여러 텍스트 워터마킹 기술을 결합하거나, 이미지 및 오디오 워터마킹과 통합하는 하이브리드 접근 방식에 대한 연구가 필요하다. 이를 통해 다양한 공격에 대한 워터마크의 견고성을 높일 수 있다. 둘째, 대규모 언어 모델(LLM)의 발전과 함께 더 자연스럽고 견고하게 많은 양의 정보를 삽입할 수 있는 LLM 기반 텍스트 워터마킹 기술에 대한 심층적인 연구가 필요하다. 또한, LLM이 삽입한 워터마크를 효과적으로 탐지하고 제거 공격에 대비하기 위한 적대적 학습 기반의 탐지 모델 개발도 중요하다. 셋째, 이론적 연구를 넘어 실제 상용 게임 엔진과 MOD 플랫폼에서 텍스트 워터마킹 기술을 구현하고 실험적으로 검증하는 연구가 필요하다. 마지막으로, MOD 창작자들이 워터마크를 쉽게 삽입하고 검증할 수 있도록 오픈소스 도구와 라이브러리를 개발하여 자발적인 콘텐츠 보호 생태계를 구축하는 노력이 필요하다. 궁극적으로 텍스트 워터마킹 기술은 게임 MOD 생태계 내에서 창작자의 권리를 보호하고 안전하며 신뢰할 수 있는 콘텐츠 공유 환경을 조성하는 데 중요한 역할을 할 것으로 기대된다.

Acknowledgments

이 논문은 2025학년도 홍익대학교 학술연구진흥비에 의하여 지원되었음.

References

M. Alvarez, R. E. Amaya, K. A. Benko, J. T. Martin, R. Knauf, K. P. Jantke, and A. J. Gonzalez, “Hello, Narratives: Character Development in Automated Narrative Generation,” in Proceedings of the 32nd International Florida Artificial Intelligence Research Society Conference (FLAIRS-32), Sarasota: FL, pp. 264-269, 2019. https://aaai.org/papers/257-flairs-2019-18221/
P. Buneman, “Semistructured Data,” in Proceedings of the Sixteenth ACM SIGACT-SIGMOD-SIGART Symposium on Principles of Database Systems (PODS ’97), Tucson: AZ, pp. 117-121, 1997. [https://doi.org/10.1145/263661.263675]
M. J. Atallah, V. Raskin, M. Crogan, C. Hempelmann, F. Kerschbaum, D. Mohamed, and S. Naik, “Natural Language Watermarking: Design, Analysis, and a Proof-of-Concept Implementation,” in Proceedings of the 4th International Workshop on Information Hiding (IH 2001), Pittsburgh: PA, pp. 185-200, 2001. [https://doi.org/10.1007/3-540-45496-9_14]
J. T. Brassil, S. Low, N. F. Maxemchuk, and L. O’Gorman, “Electronic Marking and Identification Techniques to Discourage Document Copying,” IEEE Journal on Selected Areas in Communications, Vol. 13, No. 8, pp. 1495-1504, October 1995. [https://doi.org/10.1109/49.464718]
H. M. Meral, B. Sankur, A. S. Özsoy, T. Güngör, and E. Sevinç, “Natural Language Watermarking via Morphosyntactic Alterations,” Computer Speech & Language, Vol. 23, No. 1, pp. 107-125, January 2009. [https://doi.org/10.1016/j.csl.2008.04.001]
M. Topkara, U. Topkara, and M. J. Atallah, “Words are Not Enough: Sentence Level Natural Language Watermarking,” in Proceedings of the 4th ACM International Workshop on Contents Protection and Security (CPS 2006), Santa Barbara: CA, pp. 37-46, 2006. [https://doi.org/10.1145/1178766.1178777]
W. Ng and H.-L. Lau, “Effective Approaches for Watermarking XML Data,” in Proceedings of the 10th International Conference on Database Systems for Advanced Applications (DASFAA 2005), Beijing: China, pp. 68-80, 2005. [https://doi.org/10.1007/11408079_9]
M. A. Nematollahi, C. Vorakulpipat, and H. G. Rosales, Relational Database, XML, and Ontology Watermarking, in Digital Watermarking: Techniques and Trends, Princeton, NJ: Springer Publishing Company, pp. 145-161, 2016. [https://doi.org/10.1007/978-981-10-2095-7_10]
L. M. S. Bento, D. R. Boccardo, R. C. S. Machado, V. G. Pereira de Sá, and J. L. Szwarcfiter, “Structured Watermarks for Structured Software,” SN Computer Science, Vol. 5, No. 5, 568, 2024. [https://doi.org/10.1007/s42979-024-02934-x]
T. B. Idalino, L. Moura, R. F. Custódio, and D. Panario, “Locating Modifications in Signed Data for Partial Data Integrity,” Information Processing Letters, Vol. 115, No. 10, pp. 731-737, October 2015. [https://doi.org/10.1016/j.ipl.2015.02.014]
E. Kiktenko, M. Kudinov, A. Bulychev, and A. Fedorov, “Proof-of-Forgery for Hash-Based Signatures,” in Proceedings of the 18th International Conference on Security and Cryptography (SECRYPT 2021), Lieusaint: France, pp. 333-342, 2021. [https://doi.org/10.5220/0010579603330342]
M. Škorić, R. Stanković, M. Ikonić Nešić, J. Byszuk, and M. Eder, “Parallel Stylometric Document Embeddings with Deep Learning Based Language Models in Literary Authorship Attribution,” Mathematics, Vol. 10, No. 5, 838, 2022. [https://doi.org/10.3390/math10050838]
T. Bray, The JavaScript Object Notation (JSON) Data Interchange Format, Internet Engineering Task Force (IETF), RFC 8259, December 2017. [https://doi.org/10.17487/rfc8259]
O. Ben-Kiki, C. Evans, and I. döt Net, YAML Ain’t Markup Language (YAML™) Version 1.2 Revision 1.2.2, YAML.org, Technical Report, July 2021. https://yaml.org/spec/1.2.2
T. Bray, J. Paoli, and C. M. Sperberg-McQueen, Extensible Markup Language (XML) 1.0, World Wide Web Consortium (W3C), Technical Report, October 2000. [https://doi.org/10.1036/1097-8542.yb150636]
S. Martinez, S. Gérard, and J. Cabot, “On Watermarking for Collaborative Model-Driven Engineering,” IEEE Access, Vol. 6, pp. 29715-29728, 2018. [https://doi.org/10.1109/ACCESS.2018.2841020]
Q. Wen, Y. Wang, and P. Li, “Two Zero-Watermark Methods for XML Documents,” Journal of Real-Time Image Processing, Vol. 14, No. 1, pp. 183-192, 2018. [https://doi.org/10.1007/s11554-016-0647-2]
J. He, Q. Ying, Z. Qian, G. Feng, and X. Zhang, “Semi-Structured Data Protection Scheme Based on Robust Watermarking,” EURASIP Journal on Image and Video Processing, Vol. 2020, No. 1, 12, 2020. [https://doi.org/10.1186/s13640-020-00500-y]
X. Zhuang, X. Luo, and L. He, “Document Database Watermark Algorithm Based on Connected Graph,” in Proceedings of the 2022 International Conference on Computing, Communication, Perception and Quantum Technology (CCPQT), Xiamen: China, pp. 212-218, 2022. [https://doi.org/10.1109/CCPQT56151.2022.00044]
I. M. Constantin, C. Dobre, R. I. Ciobanu, O. C. Dochia, and A. Barbu, “Watermark Decoding Solution for Semi-Structured Data,” in Proceedings of the 17th annual International Conference of Education, Research and Innovation (ICERI 2024), Seville: Spain, pp. 6927-6935, 2024. [https://doi.org/10.21125/iceri.2024.1671]
F. Saeed and A. Dixit, “Hybrid HSW Based Zero Watermarking for Tampering Detection of Text Contents,” in Proceedings of the International Conference on Computer Networks, Big Data and IoT (ICCBI 2018), Madurai: India, pp. 820-826, 2018. [https://doi.org/10.1007/978-3-030-24643-3_96]
A. Hou, J. Zhang, T. He, Y. Wang, Y.-S. Chuang, H. Wang, ... and Y. Tsvetkov, “SemStamp: A Semantic Watermark with Paraphrastic Robustness for Text Generation,” in Proceedings of the 2024 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (NAACL 2024), Mexico City: Mexico, pp. 4067-4082, 2024. [https://doi.org/10.18653/v1/2024.naacl-long.226]
Y. Lu, A. Liu, D. Yu, J. Li, and I. King, “An Entropy-Based Text Watermarking Detection Method,” in Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics (ACL 2024), Bangkok: Thailand, pp. 11724-11735, 2024. [https://doi.org/10.18653/v1/2024.acl-long.630]
Z. Chen, C. Jia, and D. Xu, “Hidden Path: Dynamic Software Watermarking Based on Control Flow Obfuscation,” in Proceedings of the 2017 IEEE International Conference on Computational Science and Engineering (CSE) and IEEE International Conference on Embedded and Ubiquitous Computing (EUC), Guangzhou: China, pp. 443-450, 2017. [https://doi.org/10.1109/CSE-EUC.2017.280]
L. Zhao, Y. Zou, C. Xu, Y. Ma, W. Shen, Q. Shan, ... and Y. Jiang, “Robust Soliton Distribution-Based Zero-Watermarking for Semi-Structured Power Data,” Electronics, Vol. 13, No. 3, 655, 2024. [https://doi.org/10.3390/electronics13030655]

최효림(Hyorim Choi)

2024년：성결대학교 미디어소프트웨어학과 (공학사)

2025년～현 재: 홍익대학교 게임학과 석사과정

※관심분야：정보보호(Personal Information), 워터마킹(Watermarking) 등

김혜영(Hye-Young Kim)

1989년～1998년: (주) 현대전자 S/W연구소 책임연구원

2001년～2004년: 청강문화산업대학 컴퓨터 게임학과 전임교수

2005년～2006년: Wright State University PostDoctoral Fellow

2007년～현 재: 홍익대학교 게임학부 게임소프트웨어전공 교수

Criterion	'Very High' / 'High' Criteria	'Moderate' Criteria	'Very Low' / 'Low' Criteria
Imperceptibility	Watermark insertion almost perfectly preserves the semantic and syntactic properties of the original text and is virtually undetectable by users or parsers	Minor changes occur but they do not affect game functionality or the meaning of the content	Watermark is easily exposed or causes visually apparent changes in structural elements during auto-formatting or optimization
Robustness	Watermark stably persists against various attacks or can be extracted without modifying the original file	Withstands simple modifications but is vulnerable to robust attacks	Watermark is easily lost or damaged and cannot be recovered by minor changes
Payload Capacity	The capacity allows for the embedding of a large amount of information to encode extensive data such as detailed copyright records, licensing information, and distribution history	The capacity is limited, sufficient for encoding core identification data but not extensive metadata	The capacity is extremely restrictive, utilizing only minimal structural features or single-bit modifications, primarily for simple integrity verification or binary owner identification
Security	Watermark is encrypted or covertly embedded within parser-ignored areas/execution logic, making it difficult for attackers to detect and remove	The watermark mechanism is inferable but difficult to modify directly, requiring complex analysis for circumvention	Embedded in areas that are easily accessed and modified or uses predefined patterns that can be easily bypassed
Computational Efficiency	Insertion/detection process is very fast (within milliseconds), suitable for real-time loading or frequent modification environments	Takes a reasonable amount of time (tens to hundreds of milliseconds), usable for offline or distribution-stage application	Requires massive computational resources due to the use of Large Language Models (LLMs) or complex statistical analysis, making real-time application difficult

Technique Type	Imperceptibility	Robustness	Payload Capacity	Security	Computational Efficiency	References
Invisible Character Embedding	High	Low	Low	Low	Very High	[3],[4]
Key Order Rearrangement	High	Moderate	Low	Moderate	High	[7]
Semantics-Preserving Word Substitution	High	Moderate	Moderate	Moderate	Moderate	[5],[6]
Metadata/Unused Field Insertion	High	Low	High	Low	Very High	[8]
Indentation/Formatting Encoding	High	Very Low	Low	Very Low	High	[7]
In-Script Steganography	High	Moderate	Low	Moderate	Moderate	[24]
LLM-Based Transformation	Very High	Very High	Moderate	High	Low	[22]
Zero Watermarking	Very High	High	Very Low	High	High	[17],[25]