|
Данная статья из серии делюсь навыком. Цель какая - многие системы купли продажи ссылок требуют чтобы страница была проиндексирована поисковой системой яндекс и для проверки этого факта предлагают разные варианты - самый легкой это кликать на ссылки проверить на присутствие в Яндекс (для примера у системы купли продажи ссылок SApe эта вероятность есть ), также есть ряд программ которые это разрешают делать - самая из них распостранённая это YCCY. Программа довольно стремительная , бесплатная. Но есть 1 недочет - если поставить слишком маленькое время задержки между проверкой ссылок - поисковая система может забанить на некоторое время. (Есть такое предположение что могут вывалиться страницы с индекса - так как был такой случай, я проверял 1 ГС на 2к страниц - с дальнейшего АПа страниц не было в индексе).
Идея в следующем: заходим в панель вебмастера (по адресу webmaster.yandex.ru) и там дозволено взглянуть число страниц которые проиндексированны поисковой системой. Сберегаем все такие страницы в одном файле, потом с той либо другой системы купли продажи ссылок получаем число ссылок которые обнаружила система купли продажи ссылок у вас на сайте , ваяем простенький скрипт тот, что ищет в одном файле строки со 2-го и вуала всё готово. Плюс такого подхода - НИКАКОЙ лишней нагрузки на интернет-сайт нашего великого яндекса. Минус (а как же без них) - если у интернет-сайта много страниц неудобно копировать с панели вебмастера.
Ниже скриптец
$f = file_get_contents('index.txt');
$url = 'http://yoursite.ru';
$urls = file('urls.txt');
for($i = 0; $i < count($urls); ++$i)
{
$fullUrl = $url.trim($urls[$i]);
if(stristr($f, $fullUrl)=== false)
continue;
echo $fullUrl."\n";}
?>
тут
http://yoursite.ru - урл вашего интернет-сайта
urls.txt - файл с урлами тот, что нужно проверить (его дозволено получить у системы купли продажи ссылок)
index.txt - то что получили с панели вебмастера
|