Февраль
1

контейнер поиска

09.07.2006 11:31 KimeZ

Суть вопроса проста.

Скажем, есть запрос

Исходный код
+(”гостевая”|”гостевуха”|”guest book”|”guestbook”) site:fastbb.ru[/QUOTE]
по которому Гугля находит 13000 результатов (гостевух на фастбб). Чтобы загнать всех в базу данных, надо расщепить 13000 результатов на 13 кусков по 1000 (а ведь больше Гугл отказывается выдавать).

Например, запрос

Исходный код
+mp3 +(”гостевая”|”гостевуха”|”guest book”|”guestbook”) site:fastbb.ru[/QUOTE]
обязывает Гостевуху содержать лексемму mp3, отсеивая остальное и выдавая примерно 1000 ответов. Отпарсил. Занес в базу. Далее по запросу, например,

Исходный код
+авто -mp3 +(”гостевая”|”гостевуха”|”guest book”|”guestbook”) site:fastbb.ru[/QUOTE]
получаем следующую 1000 сайтов (примерно), в которой уже точно отсутствует mp3 (мы же уже его занесли в базу), и присутствует авто.

И так далее…

НО ЭТО В ТЕОРИИ!!!

НА ПРАКТИКЕ ХРЕН ТАМ!!!!

Вот что происходит.
Запрос

Исходный код
+(”гостевая”|”гостевуха”|”guest book”|”guestbook”) site:fastbb.ru[/QUOTE]
действительно выдает 13000 сайтов. Далее берем

Исходный код
+mp3 +(”гостевая”|”гостевуха”|”guest book”|”guestbook”) site:fastbb.ru[/QUOTE] и получаем….
ага, хрен там, 1000… получаем всего 12 сайтов???!!! :-О почему????? ведь на других ПОЛНО фраз mp3. почему он их не включил?

Более того. Усугубим эксперимент. Возьмем вместо пресловутого mp3 слово "каждый", которое имеет гораздо большее число вхождений в речь, нежели mp3, и встречается практически на каждой странице…
И опять

Исходный код
+”каждый” +(”гостевая”|”гостевуха”|”guest book”|”guestbook”) site:fastbb.ru[/QUOTE] ХРЕН ТАМ! 2 результата!!! :-О :-О :-О :-О !!!!!!!!!! Я в шоке!!!! Шо за хрень???
главное – мозги


09.07.2006 11:42 harvik

1. Разное распределение частот для одних и тех же слов для разных сфер употребления. То есть например слово "двигатель" в разговоре водителей будет вcтречаться чаще, нежели в речи художников.
2. Разные страницы одной и той же гостевой входят в общее число найденных страниц, но в выдачу попадает только одна-две страницы одной и той же гостевой (при поиске с фильтром).
Mas vale morir de pie, que vivir de rodillas – Девиз для моих рефов.
Испанская пословица, ставшая девизом Долорес Ибаррури


09.07.2006 15:32 KimeZ

Эх, как бы полечге по 1000 результатов Гугл доить?
главное – мозги


09.07.2006 15:35 [b

Сообщение от [b
Цитата[/b] (KimeZ @ Июл 09 2006,11:32)]Эх, как бы полечге по 1000 результатов Гугл доить? Стать модератором
Купить парсилку


09.07.2006 15:37 KimeZ

парсилку я написал свою , на сипипи …

а вот модером стать – это надо…
главное – мозги


10.07.2006 08:06 Lis

www.umaxforum.com/topic/5/13862/
прожка миксит запросы.
выташишь из 10к гдето 5-6 если не больше.
seo-posting.com – комплексный прогон вашего сайта.
Проверенный временем серверный генератор дорвеев.


0