Сапа: черная книжечка, версия 1.1
— Фемистоклюс, скажи мне, какой лучший город во Франции? Манилов.
Моя черная книжечка распухла: список неблагонадежных сайтов увеличился вдвое.
Причем распухла она за последние семь дней, в которые я перетряхнул все купленные ранее сайты и перешел на полуавтоматический режим покупки ссылок с ручным (визуальным) отбором.
Как показала ручная ревизия, плагин Winka помогает в 70-80 случаях из 100. Некоторые особо противные вебмастера умудряются замаскировать не только свои каталожики и доски объявлений, но даже отдельные сообщения форумов и профили. Впрочем, некоторые убогие сайты, созданные исключительно для заработка на контексте и продаже ссылок, можно обнаружить только визуально.
При определенной сноровке времени на ручной отбор уходит не так уж много: просев 1000-1500 заявок и отбор в итоге 50-100 гожих страниц занимает, самое большее, час — полтора. Если бы не нестабильная работа API Сапы и обвинения Гугла моей персоны в киборгизме, всё было бы ещё быстрее.
Естественно, 80-90% заявок отсекается с помощью фильтров плагина и программы Sapemaster. Методика простая:
1. С помощью плагина выявляются неблагонадежные сайты (фильтры G10 и LF; можно побаловаться с TF — фильтром контента — отсеять порносайты и сайты, ссылающиеся на порно и проституток; варезники и т. п.). «Нехорошие» сайты заносятся в черную книжечку.
2. С помощью сырой и недоделанной программы Sapemaster удаляются заявки с чужим регионом (на всякий случай) и заявки, цена которых превышает среднюю в 2 раза и больше. По идее, на этом же этапе следует отсеять страницы с малым количеством текста (меньше 1,5 кб — это примерно 1500 знаков). Но пока, чаще всего, не получается.
3. Возвращаемся в Сапу и отсеиваем страницы, отсутствующие в Яндексе или в Гугле. Покупать ссылки только под одну из систем — это неоправданное расточительство. После проверки в Яндексе, лучше запустить проверку внешних ссылок и отсеять неподходящие, а уже потом проверить в Гугле. Если повезет, то получится с первого раза: Гугль не менее капризный, чем Яндекс и не любит большого количества запросов с одного ip в короткий промежуток времени. Можно, конечно, побаловаться сторонними программами или анонимными проксями, хотя я предпочитаю чуть-чуть подождать.
4. После чистки приступаем к визуальном проверке: однако смотрим не все сайты, а только те, у которых количество текста не менее 2,5-3 тысяч символов и примерно одинаковое количество страниц в Яндексе и Гугле. Последний момент немного спорный, но лучше перестраховаться.
Вероятно, работа с белым списком будет эффективнее. Но белый список надо ещё составить, а отобрать 5 тысяч сайтов не так просто. Тем более качественный отбор подразумевает анализ структуры сайта, выявление технических проблем, анализ входящих и исходящих ссылок и т.п. Т. е. составить действительно качественный список — нереально, в лучшем случае, это будет список сайтов, ссылки, с которых неплохо индексируются.
Можно, конечно, просто позаимствовать белый список у кого-нибудь ещё. Например, у Сеопульта. Правда, я сомневаюсь, в его качестве.
Известно, что представители первобытных племен работают 4 часа в сутки. Чем я хуже?
P. S. Статья устарела.
Работа с черным списком детально разобрана в материале «
Как работать в Сапе».
Актуальный черный список для Сапы.
Петр Алексеевич Кропоткин, простой русский социалист, по его расчетам при коммунизме люди будут работать не более 5.
Опубликовано: 6 января 2009
Рубрика(и): Вынос мусора
Метки: Сапа, ссылки
Комментарии посетителей
Читать все комментарии (22) »»