구글 서치 콘솔을 열었습니다. "색인 생성됨 - 중복 페이지" 경고가 수백 개 떠있습니다. 콘텐츠 품질엔 문제없는데 검색 순위는 계속 떨어지고, ChatGPT는 내 사이트를 인용하지 않습니다.
원인을 분석해보니 캐노니컬 태그 설정이 문제였습니다.
테크니컬 SEO 컨설팅 현장에서 만나는 검색 노출 문제 중 상당수가 캐노니컬 이슈입니다. 쇼핑몰, 언론사, 대형 콘텐츠 사이트처럼 구조적으로 중복 URL이 많이 생기는 곳일수록 캐노니컬 설정이 잘못되면 사이트 전체의 검색 성과가 무너집니다.
GEO 시대에는 더 심각합니다. AI는 원본이 불명확한 콘텐츠를 신뢰하지 않습니다. 캐노니컬 태그가 없거나 잘못 설정되면 AI 검색 결과에서 배제될 가능성이 큽니다.
지난 글에서 캐노니컬 태그의 개념과 301 리디렉션과의 비교를 위주로 설명했습니다. 이 글에서는 캐노니컬 이슈가 왜 SEO와 GEO 문제의 주범인지, 어떻게 해결할 수 있는지 정리했습니다.
캐노니컬 태그(Canonical Tag)란?
캐노니컬 태그(Canonical Tag)는 동일한 콘텐츠를 가리키는 여러 URL 중 어떤 URL이 원본인지 검색엔진에게 알려주는 HTML 요소입니다.
<link rel="canonical" href="<https://www.example.com/original-page>" />
예를 들어 쇼핑몰에서 상품 정렬 옵션을 바꾸면 URL이 달라집니다. shop.com/shoes, shop.com/shoes?sort=price, shop.com/shoes?sort=popular 모두 같은 상품 목록을 보여주지만 검색엔진은 서로 다른 페이지로 인식합니다.
이때 캐노니컬 태그로 shop.com/shoes가 원본이라고 명시하면 검색엔진은 나머지를 중복으로 처리하고 원본만 평가합니다.
캐노니컬 태그에 대한 자세한 개념과 설정 방법은 이전 글을 참고하세요.
SEO 관점에서의 캐노니컬 태그
구글은 공식 문서에서 캐노니컬 태그를 중복 URL 통합의 권장 방법으로 제시합니다. 없으면 어떤 문제가 생길까요?
비효율적인 크롤링
검색엔진은 사이트를 크롤링할 때 시스템 리소스를 사용합니다. 중복 페이지가 많으면 크롤러는 같은 콘텐츠를 반복해서 수집합니다. 이 과정에서 정작 중요한 신규 페이지나 업데이트된 페이지는 누락될 수 있습니다.
특히 수만 개 페이지를 가진 대형 사이트에서는 크롤 버짓(Crawl Budget) 관리가 중요합니다.
SEO 평가 분산
동일한 콘텐츠가 5개 URL에 분산되어 있다고 가정해봅시다.
외부 사이트에서 백링크를 걸 때 어떤 URL로 걸지 제각각입니다. SNS 공유도 URL이 다릅니다. 사용자 행동 신호(클릭률, 체류 시간)도 5개로 나뉩니다.
결과적으로 하나의 콘텐츠가 받아야 할 평가가 5개로 분산되어 각 URL의 검색 순위 경쟁력이 약해집니다. 캐노니컬 태그로 통합하면 모든 평가가 원본 하나에 집중되어 순위가 올라갑니다.
검색 결과에 의도와 다른 페이지 노출
캐노니컬이 없으면 구글이 임의로 원본을 선택합니다. 문제는 구글이 선택한 URL이 마케터가 원하는 URL과 다를 수 있다는 점입니다.
예를 들어 shop.com/shoes?utm_source=email같은 추적 코드가 붙은 URL을 구글이 원본으로 선택하면 검색 결과에 지저분한 URL이 노출됩니다.
GEO 관점에서의 캐노니컬 태그 – AI 검색 실패의 주범
대표 페이지 식별에 엄격한 AI
ChatGPT, Perplexity 같은 생성형 AI는 전통적인 검색엔진보다 대표 페이지 식별에 엄격합니다. 구글은 캐노니컬이 없어도 알아서 원본을 선택해주지만, AI는 불명확한 출처를 아예 인용하지 않는 경향이 있습니다.
실제 GEO 컨설팅 현장에서 만나는 문제의 70% 이상이 캐노니컬 이슈에서 발생합니다. 콘텐츠 품질은 좋은데 AI가 인용하지 않는다면 가장 먼저 확인해야 할 것이 캐노니컬 설정입니다.
AI가 원본을 판단하는 4단계
AI는 동일한 콘텐츠를 여러 URL에서 발견하면 다음 순서로 원본을 판단합니다.
캐노니컬 태그 확인 (명시적 신호)
도메인 권위 비교
발행 날짜 확인
백링크 수 비교
만약 캐노니컬 태그가 있으면 1번에서 즉시 원본이 결정됩니다. 하지만 태그가 없으면 AI는 2-4번 과정을 거쳐야 하는데, 이 과정에서 잘못된 판단이 발생하기도 합니다.
예를 들어, 언론사가 자사 사이트와 네이버뉴스에 동시 게재했는데 캐노니컬 설정이 없으면, AI는 도메인 권위가 높은 네이버를 원본으로 인식합니다. 결과적으로 AI 답변의 출처는 네이버가 되고 자사 사이트는 배제됩니다.
AI 검색 노출 구조의 차이
구글 같은 전통 검색엔진은 중복 콘텐츠가 있어도 둘 다 색인하고 사용자가 선택하게 합니다. 하지만 AI는 하나의 출처만 선택해야 합니다. 답변 생성 시 제한된 수의 출처만 인용하기 때문입니다.
캐노니컬이 불명확할 경우 AI는 “이 콘텐츠의 원본이 불확실하다.” 또는 “신뢰도가 낮다.”라고 판단하며 다른 신뢰도 있는 콘텐츠를 찾습니다.
결과적으로 콘텐츠 품질이 좋아도 AI 검색 결과에서 배제됩니다. 구글 SEO는 순위만 떨어지지만, GEO는 아예 노출 기회조차 없어지는 것입니다.
캐노니컬 이슈로 GEO 실패하는 3가지 케이스
1. 쇼핑몰의 파라미터 URL
쇼핑몰의 '?sort=price', '?filter=color' 같은 파라미터 URL은 AI가 가장 혼란스러워하는 케이스입니다.
예를 들어 신발 카테고리 페이지가 아래와 같이 존재한다고 가정해봅시다.
https://shop.com/shoes
https://shop.com/shoes?sort=price
https://shop.com/shoes?sort=popular
https://shop.com/shoes?color=black
AI는 4개 URL을 모두 크롤링해 동일한 콘텐츠임을 인식하지만, 어느 것이 대표 URL인지 알 수 없습니다. 캐노니컬 태그로 파라미터 없는 기본 URL을 명시하지 않으면 AI는 4개 URL을 모두 낮은 신뢰도로 평가하거나 아예 인용하지 않습니다.
💡특히 쇼핑몰은 정렬, 필터, 페이지네이션, 추적 코드 등으로 수천 개의 파라미터 URL이 자동 생성됩니다. 이 모든 URL에 캐노니컬 태그가 없다면 해당 사이트는 AI에서 인용되기 어렵습니다.
2. 외부 매체에 동일한 콘텐츠를 게재
뉴스 기사를 여러 플랫폼에 배포하는 언론사는 캐노니컬 관리가 생존 문제입니다.
AI는 동일 기사가 자사 사이트, 네이버뉴스, 다음뉴스에 있을 때 캐노니컬이 없으면 이렇게 판단합니다:
네이버뉴스 도메인 권위 높음 → 원본으로 추정
AI 답변 출처에 네이버뉴스 표시
자사 사이트는 복사본으로 간주되어 배제
이렇게 되면 언론사는 자체 콘텐츠로 AI 검색 트래픽을 전혀 얻지 못합니다. 캐노니컬 태그로 자사 사이트를 원본으로 명시해야 AI가 자사 사이트를 출처로 인용합니다.
3. 모바일 별도 URL – m. 도메인
m.example.com 형태의 모바일 사이트는 GEO에서 특히 위험합니다.
AI 검색은 주로 모바일에서 이루어지는데, 모바일 사이트와 데스크톱 사이트의 관계가 불명확하면 AI는 둘을 완전히 다른 웹사이트로 인식합니다.
캐노니컬과 alternate를 통해 데스크톱과 모바일 간의 관계를 명확히 정의하지 않으면, 생성형 AI는 m.example.com을 데스크톱 사이트와 별개의 출처로 인식할 수 있습니다.
이 경우 데스크톱 사이트에 축적된 권위와 신뢰 신호가 모바일 URL로 제대로 전달되지 않으며, 모바일 페이지는 AI 인용 구조에서 불리한 위치에 놓이게 됩니다.
이 문제를 방지하려면 데스크톱과 모바일 페이지 간의 양방향 관계를 명확히 선언해야 합니다.
올바른 설정 방식
데스크톱 페이지에는 모바일 페이지를 alternate로 지정합니다.
<link rel="alternate" media="only screen and (max-width: 640px)" href="<https://m.example.com/article>" />
모바일 페이지에는 데스크톱 페이지를 canonical로 지정합니다.
<link rel="canonical" href="<https://www.example.com/article>" />
이처럼 양방향으로 관계를 명시하면, 검색엔진과 AI는 두 URL을 서로 다른 페이지가 아닌 하나의 콘텐츠를 표현하는 동일한 사이트 구조로 인식하게 됩니다.
그 결과 데스크톱과 모바일 간의 신뢰 신호가 일관되게 전달되고, AI 검색 환경에서도 대표 출처로 판단될 가능성이 높아집니다.
캐노니컬 태그 설정시 자주 하는 실수 3가지
1. 상대 경로로 캐노니컬 태그 작성하기
구글은 공식 가이드를 통해 상대 경로가 아닌 절대 경로 사용을 권장합니다. 상대 경로는 base 태그 설정에 따라 다르게 해석될 수 있어 오류 가능성이 있습니다.
❌ 잘못된 예시
<link rel="canonical" href="/products/shoes" />
✅ 올바른 예시
<link rel="canonical" href="<https://www.example.com/products/shoes>" />
2. 캐노니컬 태그 순환 참조 만들기
페이지 A가 페이지 B를 캐노니컬로 지정하고, 페이지 B가 다시 페이지 A를 캐노니컬로 지정하는 경우입니다.
페이지 A → 캐노니컬: 페이지 B
페이지 B → 캐노니컬: 페이지 A이런 순환 참조가 발생하면 검색엔진은 어느 것이 원본인지 판단할 수 없어 캐노니컬 태그를 무시합니다. 페이지 A → B → C 같은 체인 형태도 피해야 합니다.
3. 전혀 다른 콘텐츠에 캐노니컬 설정하기
판매 종료된 제품 페이지를 새 제품 페이지로 캐노니컬 설정하는 경우가 있습니다. 기존 페이지의 검색 순위를 활용하려는 의도지만, 콘텐츠가 완전히 다르면 검색엔진이 이를 무시합니다.
캐노니컬 태그는 동일하거나 매우 유사한 콘텐츠 간에만 사용해야 합니다. 콘텐츠가 다르다면 301 리디렉션이 더 적절합니다.
캐노니컬 태그, 지금 확인하세요
캐노니컬 태그는 단 한 줄의 코드이지만 SEO와 GEO 모두에서 치명적인 영향을 줍니다. 설정이 잘못되면 검색 순위가 하락하고, AI 검색에서 완전히 배제될 수 있습니다.
쇼핑몰, 언론사, 대형 콘텐츠 사이트처럼 중복 URL이 발생하기 쉬운 환경이라면 캐노니컬 태그 설정이 필수입니다. 지금 구글 서치 콘솔에서 "중복 페이지" 경고를 확인해보세요.
리드젠랩은 GEO/AEO 전문 에이전시로서 캐노니컬 태그 진단부터 중복 콘텐츠 전략, AI 검색 최적화까지 포괄적인 테크니컬 SEO 컨설팅을 제공합니다.
👉 검색최적화 전문가에게 전략 문의하러 가기
🔗같이 읽으면 좋은 글
메타 타이틀이란? GEO SEO 최적화 Meta Title 작성법
메타 디스크립션 작성법: 구글·네이버 SEO 최적화 실무 가이드
FAQ- 캐노니컬 태그 관련 자주 묻는 질문
Q1. 캐노니컬 태그 하나로 검색 순위가 정말 떨어질 수 있나요?
네. 캐노니컬 태그가 없거나 잘못 설정되면 동일한 콘텐츠의 평가가 여러 URL로 분산됩니다. 그 결과 하나의 페이지가 받아야 할 SEO 신호가 나뉘어 검색 순위 경쟁력이 약해질 수 있습니다.
Q2. 캐노니컬 태그가 GEO와 AI 검색에도 영향을 주나요?
네, 영향을 줍니다.
생성형 AI는 대표 페이지 식별에 훨씬 엄격하며, 캐노니컬이 불명확한 콘텐츠는 신뢰하기 어려운 출처로 판단해 인용을 회피하는 경향이 있습니다.
Q3. SEO에서는 순위만 떨어지는데 GEO에서는 왜 더 치명적인가요?
전통적인 검색엔진은 중복 콘텐츠가 있어도 여러 페이지를 색인하고 사용자가 선택하게 합니다.
반면 AI 검색은 제한된 수의 출처만 인용하기 때문에, 원본이 불명확한 콘텐츠는 인용 후보에서 제외될 가능성이 높아집니다.
Q4. 캐노니컬 태그를 설정했는데도 AI가 인용하지 않는 이유는 뭔가요?
캐노니컬은 중요한 신호이지만 단독으로 작동하지는 않습니다.
콘텐츠 일관성, 내부 링크 구조, 도메인 신뢰도, 발행 정보 등이 함께 맞지 않으면 AI는 다른 출처를 선택할 수 있습니다.