두 문서 중복 검사기
두 문서를 비교하고 동일한 단락이나 문장을 찾으세요. 사이드 패널을 사용하여 분석 설정을 구성하세요.
🔍 고급 문서 분석
정교한 알고리즘이 단락·문장 수준에서 두 문서를 비교하여 정확한 일치, 유사한 콘텐츠, 텍스트 재사용을 높은 정확도로 식별합니다. 중복 검사기와 문서 유사도 측정 프로그램 용도에 최적이며, 학술 연구·콘텐츠 검증·표절 감지에 완벽합니다.
📊 상세한 유사성 보고서
문서 유사도(%) 점수, 하이라이트된 중복 구간, 나란히 비교로 종합적인 분석을 제공합니다. 중복 검사기 결과를 문서화하고 추가 분석을 위해 결과를 내보낼 수 있습니다.
🌐 다중 형식 지원
PDF, Word(DOCX), 일반 텍스트 등 다양한 형식에서 두 문서를 비교하여 중복 검사 및 문서 유사도 측정을 수행하세요. 파일을 업로드하거나 콘텐츠를 붙여넣으면 즉시 분석합니다.
자주 묻는 질문
문서 유사성 검사기의 정확도는 어느 정도인가요?
우리 도구는 코사인 유사성과 자카드 지수를 포함한 고급 알고리즘을 사용하여 매우 정확한 결과를 제공하며, 일반적으로 유사한 콘텐츠 감지에서 95% 이상의 정확도를 달성합니다.
어떤 파일 형식이 지원되나요?
PDF 파일, Microsoft Word 문서 (.docx) 및 일반 텍스트 파일을 업로드하고 비교할 수 있습니다. 도구는 편집기를 통한 직접 텍스트 입력도 지원합니다.
이 도구는 무료로 사용할 수 있나요?
네, 우리 문서 유사성 검사기는 완전히 무료로 사용할 수 있습니다. 숨겨진 요금이나 등록 요구 사항이 없습니다.
유사도 백분율은 어떻게 계산되나요?
사실 아주 간단합니다. 두 개의 쇼핑 목록을 비교해서 같은 항목이 몇 개인지 보는 것과 같습니다:
- 단어로 분할: 문장을 개별 단어로 분할합니다. 예를 들어 "나는 오늘 공원에 갔다"는 [나는, 오늘, 공원에, 갔다]가 됩니다. 중국어, 영어, 일본어, 한국어 등을 지원합니다.
- 사전 만들기: 각 단어가 어디에 나타나는지 기록하여 빠르게 찾을 수 있도록 합니다. "은", "는", "the" 같은 매우 일반적인 단어는 유사도 판단에 도움이 되지 않으므로 필터링됩니다.
- 비율 계산: 같은 단어가 몇 개인지 세고 총 단어 수로 나눕니다. 예를 들어, 두 텍스트에 총 100개의 고유 단어가 있고 40개가 같다면 유사도는 40%입니다.
📊 실제 예시:
문장 A: "나는 오늘 공원에 갔다" (5개 단어). 문장 B: "공원에 갔다" (3개 단어). 공통 단어: "공원에", "갔다" (2개 단어). 총 고유 단어: 5개 (나는, 오늘, 공원에, 갔다). 유사도 = 2÷5 = 40%