Февраль
1

Генерация текста для дора пишу доргенератор, нужны советы

16.03.2006 20:14 DaSharm

Доргенератор пишу. Вот и столкнулся с неопределением…

Итак, допустим надо создать 2 дора:

phentermine
buy phentermine

контент дор генератора качает прямо из гугла по поиску (описание сайтов). Я решил, что нецелесообразно запрашивать в гугла phentermine, после этого buy phentermine и генерить доры разные. Я пришел к выводу, что достаточно будет запросить по phentermine текст, и использовать его сразу для всех доров будь-то buy phentermine или phentermine online, не забывая вставлять киворды с плотностью 5-10%…

Итак, чего я не знаю и ищу подсказки:

Так как контент для доров один и тот-же, я должен делать его уникальным, тоесть, смешивать…хотя, сделает ли случайное смешивание контент уникальным? И вообще, я бы хотел услышать ответ кого-то опытного о том, как следует генерить текст для доров из одного и того-же контента.

П.С. Всеми почему-то возлюбленный, а на мой взгял страшно кривой DPW тягает киворды с овертюры, а затем ИЗ НИХ (!!!) генерит доры!!! Я просто был поражен, когда открыл первый созданный используя DPW дор…Он просто вставляет между кивордами слова из простого английского, типа of, must, not…Как-то формирует что-то… Хотелось бы услышать мнения…

И ещё, маркова не предлагайте, пожалуйста, так как для маркова нужно иметь много текста очень высокого качества, чего в гугле на странице результатов не найти

Спасибо всем, кто ответит


16.03.2006 20:35 Creator

Лол, а что ты тогда хочешь для создания уникального контента из одного и того же текста, не используя цепи Маркова?
Они и будут самым верным решением. А контента в Гугле полно, "качественность" его можешь сортировать скриптами как посчитаешь нужным.


16.03.2006 20:50 DaSharm

Creator видно ты в теме даже и не работал. Как это скрипт качественность определит??? Откуда ты это взял? Просьба тех, кто не знает что сказать, не отвечать вообще. Если бы ты хоть раз бы генерил цепями маркова текст, ты бы понял все минусы этой темы.


16.03.2006 20:58 GreenWood

слухай сюда :
берешь dpw и генеришь примено 10 доров на разные темы (никуда их закачивать не надо)
Затем берешь программу Site Content Analyzer указываешь дор и запускаешь анализ а затем внимательно изучаешь плотность распределение плотности по странице (важная штука – особенно визуальная .. там увидишь ) ну и по кейвудам все смотришь. Вот на этом и делаешь выводы как dpw генерит .
Особенно обрати внимание на визуализацию … насколько я знаю это может делать только эта прога.
Приходи и зарабатывай достойно
Всякие новости и по SE тоже.


16.03.2006 21:08 Creator

DaSharm,
писец полный, удивляюсь я таким людям как ты…
Доргены пишу давно, тексты генерировал самыми разнообразными способами. Больше ничем свою компетентность доказывать тебе не собираюсь, ибо не мне это нужно.
*Как это скрипт качественность определит???*
Хочу напомнить, что у тебя есть мозги (хотя уверенности в этом все меньше), попробуй ими поработать. Если ты не способен придумать как отсеить мусорный текст, то лучше не берись за это дело вообще…

p.s. смотри последнюю строчку своего первого поста


16.03.2006 21:29 Giber

У меня так и генерит. Хоть тыщу раз запусти – контент уникальный.
На входе шаблоны + частотный спектр ВСЕХ слов со страниц из топа ключевику. Марков и рядом не валялся…
Но если ты начинающий программер советую сходу не бросаться на такую задачу – тут сотней строк не отделаешься..
Надоело спамить?


16.03.2006 21:34 seiko

"частотный спектр ВСЕХ слов со страниц из топа ключевику."

Это что? )
Умный блог


16.03.2006 21:45 Giber

Частотный спектр в данном контексте, это набор вероятностей появления того или иного слова в тексте.
Надоело спамить?


16.03.2006 21:52 GreenWood

Giber, а почему не использовать рефератный принцип ?
Приходи и зарабатывай достойно
Всякие новости и по SE тоже.


17.03.2006 08:21 Giber

Если я правильно понимаю, то рефератный принцип – это дергать готовые предложения и перемешивать? Мне кажется, что в этом есть существенный минус. Когда юзер наберет нужный поисковый запрос, сработает не только наш контент, но и тот который мы дергали, и здесь мы скорее всего улетим под duplicated фильтр.
Надоело спамить?


0