Февраль
1

Что нам не показывает Гугл? Несовпадение количества результов..

17.11.2005 17:34 vlad677

Начал парсить выдачу скриптами и заметил интересную вещь:

По некоторому запросу имеем 437 результатов, начинаем их вычитывать и получаем реально 243, а об остальных нам говорят, что это похожие страницы и больше результатов не дают.

На этот же запрос с filter=0 Гугл говорит нам уже о 317 результатах, но при этом выдает все до единого.

Вопрос в следующем, а почему нам не дают остальные (437-317) результатов?

Что это:

1. Супер похожий контент?
2. Забаненые или запенализированные сайты?
3. Что-то другое?


17.11.2005 21:15 harvik

Обычно это страницы с доменов, которые (домены) уже показаны. если ты проведешь вручную поиск "Повторить поиск включая полученные результаты" тебе обычно выдадут всё. Поскольку ты парсишь гостевые или блоги, то разные страницы этих ресурсов считаются похожим контентом (совпадение в адресе)
Mas vale morir de pie, que vivir de rodillas – Девиз для моих рефов.
Испанская пословица, ставшая девизом Долорес Ибаррури


17.11.2005 22:44 Buckster

Так это и есть то что отсеивается по filter=0.
А фиг знает вообще – умом гуглю не понять, аршином общим не измерить.
Скока дает – стока и нормально, а остальное уж мсн с яхой дополнят.


18.11.2005 02:33 bufo

А ты попробуй вручную попарить и поймешь


18.11.2005 06:04 vlad677

Если мы изучаем выдачу по кейзам, может ли этот показатель служить признаком заспамленности темы?


19.11.2005 12:28 [b

Сообщение от [b
Цитата[/b] (vlad677 @ Ноя 18 2005,09:04)]Если мы изучаем выдачу по кейзам, может ли этот показатель служить признаком заспамленности темы?на мой взгляд нет,если проанилизоровать выдачу по некомерческим запросам,то можно увидеть такую же картину
МНОГОФУНКЦИОНАЛЬНАЯ СЕРВЕРНАЯ СПАМИЛКА-250$.СЕРЬЕЗНЫЙ ПРОДУКТ ДЛЯ СЕРЬЕЗНЫХ ЛЮДЕЙ.ТЕПЕРЬ С БАЗАМИ. ICQ :237169824 .


0