PDF 문서의 검색엔진 최적화

PDF 문서의 검색엔진 최적화에 관한 8가지 조언

PDF_SEO

기본적으로 HTML문서에 적용되는 최적화 지침이 PDF 문서 검색엔진 최적화에도 적용됩니다.

 

1. PDF 문서에 검색엔진 인덱싱할 수 있는 텍스트를 반드시 포함시켜야 합니다.

예를들어, 검색엔진은 현재 PDF 문서의 이미지속에 있는 텍스트를 인덱싱할 수 없습니다. 그러므로 평판형 스캐너를 이용해 PDF 문서를 만든다면 이미지만 있는 PDF문서로 검색엔진은 텍스트를 추출, 인덱싱할 수 없습니다. 이런 경우, 이미지와 별도로 텍스트를 반드시 포함시켜야 합니다.

2,. PDF 문서에 키워드가 풍부한 텍스트를 사용해야 합니다.

3. 페이지가 여러 개인 PDF 문서에서 가장 중요한 텍스트가 PDF 문서의 첫페이지에 있도록 하십시요

4. 다운로드 시간을 최소화시키세요.

: 다운로드 시간의 최소화는 검색엔진 최적화 요소입니다. 일반적으로 검색엔진에서는 주로 사용성의 이유로 문서 파일 크기를 100K 이하로 권장하지만 이미지가 포함된 PDF 문서의 경우 크기가 커질 수 밖에 없습니다. PDF 문서의 다운로드 시간을 최소화하는 두가지 방법은 사용된 폰트 수를 제한하거나  웹 전용 PDF 문서로 만들어 더 낮은(작은) 해상도의 이미지를 사용하는 방법이 있습니다.

5. 적절한 경우, PDF 문서의 요약문이 있는 최적화된 HTML 페이지를 만드세요.

    가능한한 PDF 문서로 유도하는 앵커 텍스트와 앵커 텍스트 근처의 단어도 키워드를 포함하는 것을 잊지 말아주세요.

6. 반드시 웹사이트의 여러 페이지에 PDF문서에 걸리는 링크를 두도록 하세요.

7. 로봇은 중복 컨텐츠를 차단합니다. 상업적인 웹 검색엔진은 PDF 문서와 여러 텍스트 기반의 문서를 오래전부터 인덱싱할 수 있었기 때문에 같은 컨텐츠를 여러 서식으로 포맷하면 중복 컨텐츠 로 분류되어 더 적은 인덱스만 유발 할 뿐이므로 중복한 켄텐츠를 PDF로 만드는 것은 피하시는 것이 좋습니다.

저의 경우, 저의 웹사이트상의 HTML을 합처서 통합된 PDF로 만들었는데, 5일이 지나도 노출이 되지 안되고 있습니다. 이것은 중복된 컨텐츠로 간주되어 발생한 것으로 판단됩니다.

8. 삼단으로 접히는 마케팅 브로슈어와 연간 보고서 같은 PDF 문서는 키워드가 집중된 텍스트를 사용할 수 없는 경우가 많습니다. 그러므로 상기 7가지 요소를 고려하여 최적화될 수 있는 PDF 문서에 최적화 노력을 집중하는 것이 현실적입니다.

 

추가적인 조언

추가로 언급하고 싶은 것은 HTML 에도 제목와 메타 디스크립션이 있듯이 PDF 문서에도 있는데, 이 작업을 안해주시면 아래의 이미지와 같이 깨진 제목과 설명문(메타 디스크립션)이 나오며 제목이 깨졌다는 것은 검색엔진이 인덱싱하는데 실패하게 되므로

 

PDF 문서 검색엔진최적화_1.jpg

 

반드시, PDF 문서를 만들때, 파일 > 문서 속성 에서

 

PDF 문서 검색엔진 최적화_2

 

제목, 작성자, 주제, 키워드, 설명 등을 넣어주시기 바랍니다.

 

PDF 문서 검색엔진 최적화_3

 

 

위에 기술한 PDF 문서를 검색엔진최적화 방법에도 불구하고 PDF 문서는 검색엔진보다 사이트 방문자를 위해 디자인해야 한다는 점을 유의해 주시기 바랍니다. 검색엔진 크롤러는 제품과 서비스 구매에 수십억원을 쓰지 않겠지만, 타깃 사용자는 그럴 수 있기 때문입니다. 그러므로 노출도 중요하지만 항상 타깃 사용자를 염두에 두고 PDF 문서를 디자인하시길 바랍니다.

 

HTML 을 PDF로 만드는 방법

상기 “7. 로봇은 중복 컨텐츠를 차단합니다.”에서 언급했던 실험을 진행했던 방법은 아래와 같습니다.

파이어폭스 부가기능 중 Print pages to PDF 를 설치한 후 “Print active Tab”을 이용하여  저희 회사 사이트를 열어 동일카테고리에 해당하는 웹페이지들을 PDF 문서로 전화하였습니다.

 

성공적인 PDF 문서 검색엔진 최적화_10

 

Adobe Arobat 7.0 Professional 에서 [PDF작성] -> [여러파일에서]를 선택하여 Print pages to PDF로 만들어 놓은 동일 카테고리의 상품에 해당하는 file들을 합쳐서 통합 PDF문서를 만들었습니다.

 

성공적인 PDF 문서 검색엔진 최적화_11

 

구글내 pdf file 순위확인하는 방법 : 구글 검색 명령어 filetype

pdf file이 최적화가 잘 되었는지 구글에서 검색하게 되면 구글은 html file를 포함한 전체 검색결과를 보여주게 되어 PDF file 중에서 순위가 올라갔는지 확인하기 어려운 경우가 있습니다.

PDF_SEO_1

 

이런 경우에는 구글 검색 명령어중 filetype 명령어를 이용하세요. 아래와 같이 검색창에 “검색어 + filetype:pdf”로 입력해주시면 pdf file 중에서 자신의 pdf file 의 순위를 쉽게 확인하실 수 있습니다.

 

PDF_SEO_2