ФорумСообществоФлейм → Почему гугл не берет в индекс все ссылки из sitemap.xml?

Почему гугл не берет в индекс все ссылки из sitemap.xml?

  • adw0rd

    Сообщения: 22905 Репутация: N Группа: в ухо

    Spritz 4 августа 2010 г. 0:22

    подробнее в картинке
    Спустя 50 сек.
    4083 урла передал ему, а в индексе всего 31
    Спустя 16 сек.
    http://kinsburg.ru/sitemap.xml
    adw/0
  • phpdude

    Сообщения: 26624 Репутация: N Группа: в ухо

    Spritz 4 августа 2010 г. 0:26, спустя 4 минуты 16 секунд

    4083 урла передал ему, а в индексе всего 31

    а он и не обязан в индекс ничего брать :)

    все эти сайтмапы - всего лишь помощь ему, не более
    Спустя 21 сек.
    возможно он еще не просканиварол их
    Спустя 21 сек.
    ну да, 3 августа загрузил 4го чудо хочешь))) дня 2 еще подожди
    Сапожник без сапог
  • artoodetoo

    Сообщения: 5139 Репутация: N Группа: в ухо

    Spritz 4 августа 2010 г. 0:28, спустя 2 минуты 13 секунд

    может посчитал их нерелевантными?



    ιιlllιlllι унц-унц
  • adw0rd

    Сообщения: 22905 Репутация: N Группа: в ухо

    Spritz 4 августа 2010 г. 0:40, спустя 11 минут 35 секунд

    ну да, 3 августа загрузил 4го чудо хочешь))) дня 2 еще подожди

    я его загружаю каждый день, нафиг тогда он, если он все равно сканирует долго )
    Спустя 49 сек.
    artoodetoo,
    Спустя 52 сек.
    надо побольше слова "торрент" впихнуть ))
    1. keys.png (42)
    adw/0
  • Professor

    Сообщения: 2089 Репутация: N Группа: Адекваты

    Spritz 4 августа 2010 г. 0:47, спустя 7 минут 37 секунд

    Он для того чтобы гугл смог добраться до всех твоих страниц, до которых самостоятельно возможно не доберется никогда.
    Возможно он уже добрался больше чем до 31 страницы, но по каким то причинам не включил их в индекс. Может быть не уникальный контент, может быть мало информации и так далее.

    2 дня это как то очень мало. Не знаю как сейчас, но раньше (года 1,5 назад) я неделю ждал.
  • Padaboo

    Сообщения: 477 Репутация: N Группа: Адекваты

    Spritz 4 августа 2010 г. 1:51, спустя 1 час 3 минуты 40 секунд

    adw0rd, вроде как нельзя сразу 4тыс передавать (Где то читал) надо разделять их как то по файлам шт по 100 что ли
  • adw0rd

    Сообщения: 22905 Репутация: N Группа: в ухо

    Spritz 4 августа 2010 г. 1:53, спустя 1 минуту 56 секунд


    adw0rd, вроде как нельзя сразу 4тыс передавать (Где то читал) надо разделять их как то по файлам шт по 100 что ли
    о, если дашь ссылку, то будет вообще супер )
    Спустя 70 сек.
    Можно предоставить несколько файлов Sitemap, однако в каждом из этих файлов должно быть не более 50000 URL, а размер каждого из этих файлов не должен превышать 10 МБ.

    http://ru.wikipedia.org/wiki/Sitemaps
    adw/0
  • Givi

    Сообщения: 2284 Репутация: N Группа: Адекваты

    Spritz 4 августа 2010 г. 1:56, спустя 3 минуты 15 секунд

    Padaboo, именно так. Точное кол-во не скажу, но в целом знаю рекомендацию Гугля разбивать сайт-меп на страницы, то есть отдавать туда по 50 ссылок, и последнюю ссылку делать на вторую страницу сайт-мепа. Тогда все будет значительно лучше и веселее будет индексация :)
  • adw0rd

    Сообщения: 22905 Репутация: N Группа: в ухо

    Spritz 4 августа 2010 г. 1:57, спустя 39 секунд

    В заключение хочется отметить, что карты сайта в формате xml — это своего рода подсказки для поисковых систем о том, где расположены доступные для инексации страницы и документы. Наличие карты не гарантирует, что всё её содержимое будет проиндексировано и никак не влияет на ранжирование результатов поиска.
    http://shift-web.ru/sitemap-xml-for-crawlers

    зы. это я и так знал, но не 30 же из 4000
    adw/0
  • Givi

    Сообщения: 2284 Репутация: N Группа: Адекваты

    Spritz 4 августа 2010 г. 1:58, спустя 1 минуту 4 секунды

    adw0rd, по твоей ссылке, то не Гугловские требования, а просто требования стандарта, по которому создана карта. А в реале все немного не так уже (раньше было проще, а потом пришли Дуды разные со своими дорвеями).
  • adw0rd

    Сообщения: 22905 Репутация: N Группа: в ухо

    Spritz 4 августа 2010 г. 2:00, спустя 1 минуту 56 секунд

    Яндекс:
    Размер файла Sitemap больше 10 Мб.

    Файл индекса Sitemap может содержать не более 1000 URL файлов Sitemap.

    http://help.yandex.ru/webmaster/?id=1007067

    уже интереснее )
    adw/0
  • Givi

    Сообщения: 2284 Репутация: N Группа: Адекваты

    Spritz 4 августа 2010 г. 2:00, спустя 21 секунду

    adw0rd, суть в том, что Гугля вообще фильтрует страницы. на которых очень много ссылок. По сути он вообще их может "послать" нахер. А карта сайта есть для него не что иное как страница, пусть и с "подсказкой" что это карта-сайта. Они таким хером борются с чрезмерными злоупотреблениями. Да и заодно не хотят они создавать лишнюю нагрузку на сайты как то делает Яху.
  • adw0rd

    Сообщения: 22905 Репутация: N Группа: в ухо

    Spritz 4 августа 2010 г. 2:02, спустя 1 минуту 37 секунд

    Файл Sitemap может содержать не более 50 000 URL-адресов, а его размер в несжатом виде не должен превышать 10 МБ. Если ваш файл Sitemap больше, разбейте его на несколько файлов Sitemap меньшего размера и перечислите их в файле индекса Sitemap.

    http://www.google.com/support/webmasters/bin/answer.py?hl=ru&answer=35738

    гугл говорит что он действует именно по стандарту
    Спустя 52 сек.
    Givi, можешь привести факты и пруфлинки, а не догадки?
    adw/0
  • Givi

    Сообщения: 2284 Репутация: N Группа: Адекваты

    Spritz 4 августа 2010 г. 2:06, спустя 3 минуты 49 секунд


    Яндекс:
    Файл индекса Sitemap может содержать не более 1000 URL файлов Sitemap.



    Ну вот, просто свои 4к страниц засовывай в сайт-меп по 50-100 ссылок на страницу, и в итоге получишь не более 1000 страниц-сайтмепов. А вообще у тебя получится всего лишь 800-400 страниц =)


    Givi, можешь привести факты и пруфлинки, а не догадки?

    Нет ссылок на оф. источники. Инфа была взята из обсуждения проблем индексации то ли на СЕ, то ли на форуме ВордПресса, так как именно с ним у меня возник вопрос, и я искал ответ почему плагин-картостроитель создает по-умолчанию карту только с 50 последними ссылками.
  • adw0rd

    Сообщения: 22905 Репутация: N Группа: в ухо

    Spritz 4 августа 2010 г. 2:08, спустя 2 минуты 50 секунд

    Givi, ну так дай ссылку на СЕ/ВордПресс
    Спустя 56 сек.
    А можно сделать так:
    sitemap.xml - там ссылки на остальные sitemap*.xml
    sitemap1.xml sitemap2.xml sitemap3.xml … sitemap100.xml

    ?
    Спустя 70 сек.
    То есть ссылки на сайтмапы только в sitemap.xml, в остальных ссылки на мой контент.
    Или обязательно в каждом sitemap*.xml указывать сссылку на следующий?
    adw/0

Пожалуйста, авторизуйтесь, чтобы написать комментарий!