Индексирует ли Google PDF файлы и контент?

  1. FAQ по индексированию файлов PDF
  2. Как искать файлы PDF в Google
  3. PDF-файлы могут даже отображаться в избранных фрагментах
  4. Другие типы файлов, индексируемые Google

В недавнем видеовстрече Google Джон Мюллер подтвердил, что они индексируют файлы PDF точно так же, как и на любой другой веб-странице . Джон Мюллер также дал понять, почему такой файл PDF не может быть проиндексирован, несмотря на это.

В Google Hangout был задан следующий вопрос 18:48 :

Вопрос: Я не могу получить много своих PDF-файлов, проиндексированных на страницах моего продукта. Должен ли я просто добавить контент на вкладку своего продукта, чтобы он был в обоих местах? Приведет ли это к проблемам с дублированием и есть ли идея, почему они не будут индексироваться?

Джон Мюллер : В общем, мы индексируем PDF-файлы так же, как и другие обычные страницы на сайте. Что, вероятно, произойдет с PDF-файлами, так это то, что мы не так часто их обновляем, как обычные HTML-страницы, поскольку предполагаем, что PDF-файлы остаются стабильными. Но это не похоже на твою проблему. Что касается индексации файлов PDF, если мы увидим ссылки на эти страницы, мы попытаемся проиндексировать эти страницы, чтобы включить их в результаты поиска.

Джон Мюллер : Итак, если мы не можем проиндексировать эти страницы, то либо у нас возникают проблемы с поиском ссылок на эти файлы PDF, возможно, из-за того, что их трудно найти на веб-сайте, либо, возможно, они не находятся в статическом HTML, либо у них есть ссылка nofollow или что-то в этом роде. Или, может быть, мы говорим, что у нас уже достаточно контента, проиндексированного с вашего сайта. Мы еще не готовы добавить значительную партию контента. Таким образом, мы не можем гарантировать, что будем индексировать весь контент на веб-сайте, что означает, что для некоторых веб-сайтов в некоторых ситуациях у нас может быть отсечение, и мы говорим, что уже проиндексировали много контента с этого веб-сайта. Мы будем продолжать сканировать больше контента с этого веб-сайта, и если мы найдем что-то действительно интересное, мы также включим это в индекс. Возможно, эти PDF-файлы - это контент, который мы просмотрели, или контент, на который у нас не было времени посмотреть с веб-сайта.

Джон Мюллер : Если в тех PDF-файлах есть важный контент, который вам нужно проиндексировать, возможно, стоит включить его на страницу продукта. Таким образом, людям не нужно скачивать PDF-файл, чтобы увидеть этот контент. Так что, если это важно, возможно, разместите это прямо на странице. Если это более вспомогательный контент, например, справочный материал, на который люди могут захотеть посмотреть, но не нужно оценивать его отдельно, тогда, возможно, будет хорошо просто ссылаться на страницы вашего продукта.

Вы можете просмотреть соответствующую часть обсуждения ниже:

FAQ по индексированию файлов PDF

Это не первый раз, когда возникает проблема индексации PDF-файлов. В Центральная запись блога для веб-мастеров Еще в сентябре 2011 года Гари Иллис из Google ответил на несколько вопросов об индексации PDF, которые мы кратко изложим ниже:

В общем, да, Google сканирует PDF-файлы, если они не защищены паролем или не зашифрованы. Если текст встроен в виде изображений, Google может обрабатывать эти изображения для извлечения текста. Общее правило заключается в том, что если вы можете копировать \ вставлять текст из документа PDF, Google должен иметь возможность выполнять поиск содержимого PDF и индексировать его.

Изображения в файлах PDF не индексируются (по состоянию на 2011 год).

Ссылки обрабатываются так же, как ссылки на веб-страницах. Они передают PageRank и другие сигналы индексации и будут отслеживаться при сканировании. Невозможно «nofollow» ссылки в файле PDF.

Вы должны добавить «X-Robots-Tag: noindex» в заголовок HTTP, используемый для обслуживания файла. Если они уже проиндексированы, то реализованный заголовок заставит их выпадать со временем. Кроме того, вы можете использовать Инструмент для удаления URL ,

Файлы PDF могут ранжироваться аналогично веб-страницам.

Google использует метаданные заголовка в файле и якорный текст ссылок, указывающих на файл PDF. Google рекомендует установить оба.

Как искать файлы PDF в Google

Как искать файлы PDF в Google

  1. Используйте оператор filetype для поиска файлов PDF

    Если вы хотите искать PDF-файлы в Google, вы можете использовать оператор «filetype:».

    Для поиска файлов PDF по поисковому запросу «SEO PDF» введите следующее:

    • Тип файла: pdf SEO PDF
    • Затем нажмите «Поиск Google».
  2. Страница результатов SERP показывает PDF в верхнем индексе слева от каждого результата

    Вы можете увидеть скриншот результатов на скриншоте.

PDF-файлы могут даже отображаться в избранных фрагментах

17 января 2019 г. Кевин Индиг сообщил в Твиттере что Google теперь извлекает избранные фрагменты из файлов PDF.

Я попробовал приведенный пример, и он работал до 26 января. Вы можете увидеть скриншот ниже:

В недавнем видеовстрече Google Джон Мюллер подтвердил, что они индексируют файлы PDF точно так же, как и на любой другой веб-странице

Показанный фрагмент из PDF, отображаемый в Google. © Вебмастер

Вы можете поспорить, что многие специалисты по SEO теперь будут оптимизировать свои PDF для поисковых систем.

Другие типы файлов, индексируемые Google

PDF - это лишь один из большого количества типов файлов, которые могут быть проиндексированы Google.

Google может индексировать содержимое большинства типов страниц и файлов, включая Adobe Flash, документы Microsoft, такие как Excel и Docs, Rich Text Format, документы OpenOffice, PowerPoint и различные языки программирования.

Вы можете найти полный список индексируемые файлы здесь ,

Должен ли я просто добавить контент на вкладку своего продукта, чтобы он был в обоих местах?
Приведет ли это к проблемам с дублированием и есть ли идея, почему они не будут индексироваться?