Категория: Работа с каталогами | Автор: admin | (Июл 10, 2009)

Как искать белые каталоги?Все знают о пользе белых каталогов, но появляется вопрос «Где достать белые каталоги?». Скачивать базы других легко, но их чистка занимает много времени. Так что мы займёмся созданием своей базы.

Для начала работы нам нужен парсер. В этом примере воспользуемся программой «AGGRESS Parser», которая специально создана для наших нужд.

Заострять внимание на таких мелочах как «скачать и установить», не будем. Сразу перейдём к действиям.

Для  начало нам нужно зайти в папку с нашей программой и там найти папку с названием «search». В ней будет файл Google.txt, в нём записан запрос к ПС, он стандартный и нам подходит. Открываем этот файл на редактирование. Находим примерно такую строчку:
AbsoluteUrl-http://www.google.com/search?client=opera&rls=ru&q={REQUEST}&sourceid=opera&ie=utf-8&oe=utf-8&num=500&start=0&hl=ru&lr=lang_ru&hs=o6a&filter=0

и заменяем её на

AbsoluteUrl-http://www.google.com/search?client=opera&rls=ru&q=allinurl:{REQUEST}&sourceid=opera&ie=utf-8&oe=utf-8&num=500&start=0&hl=ru&lr=lang_ru&hs=o6a&filter=0

Сохраняем и закрываем.

Теперь наши запросы отсылаются с добавкой «allinurl:» и поиск ограничивается всеми введенными словами в соответствующем URL.

Далее мы ищем CMS для каталога, в котором страницы практически одинаковы.
Напримера возьмём «Flashcat». Для добавления сайта, на этом движке, мы стандартно переходим на страницу «?act=s_add». Теперь у нас стоит задача, нам нужны все сайты, которые оканчиваются на «?act=s_add». Для этого мы:

1. Запускаем «AGGRESS Parser»

2. В разделе «поисковики» выбираем «Google.txt»

3. Вводим запрос: ?act=s_add и нажимаем «Добавить»

4. Теперь наш запрос добавился в список. Нажимаем кнопку «Запуск» и ждём как слева пополняется список с сайтами.

5. После завершения парсинга мы нажимаем слева внизу кнопочку «Сохранить» при этом стандартно файл для сохранения стоит «base.txt»

Вот практически и всё. Наш файлик со списком каталогов находится в папке AGGRESS\Parser\date\base.txt. Его можно без труда импортировать в AllSubmitter, где в процессе регистрации (или просто просмотра каталогов) мы отсеем не «белые» каталоги. Теперь можете искать другие движки каталогов и парсить их.

Поэкспериментируйте с Яндексом. Разница от Google в том, что нужно выбрать в программе yandex.txt и вводить в запрос не страницу добавления, а часть текста находящегося на странице. Например, для того же Flashcat мы будем вводить запрос: “URL кнопки 88×31 (если есть):”. Все остальные действия полностью повторяют пример с ПС Google.

Комментарии: 1 | Просмотров: 2,780 | Подробнее