Jak wiadomo nie zawsze podstrony z formularzem rejestracyjnym są zaindeksowane. Często tworzy się footprinty do wyszukiwania adresów tak, aby pobrane adresy url z wyników wyszukiwania prowadziły od razu do podstrony rejestracyjnej. Jednak wtedy ucieka nam sporo innych adresów. Z kolei jak tworzymy footprinty do różnych podstron, to często trzeba znaleźć link do rejestracji. Sprawa jest na tyle prosta w przypadku np. Xrumera, że takich zabiegów nie trzeba robić, bo mod sam szuka podstrony rejestracyjnej. Jednak nie zawsze jest to dobre rozwiązanie!
Poniżej podaję gotowy skrypt w php do wyciągania linków, które posiadają w sobie określony ciąg znaków.
set_time_limit(3600);
$linki = file('linki.txt');
$slowa = array(
'register',
'signup',
);
foreach ($linki as $link)
{
$link = trim($link);
if ( ! empty($link))
{
$tresc = file_get_contents($link);
preg_match_all('/href="(.*?)"/s', $tresc, $dopasowania);
foreach ($dopasowania[1] as $anchor)
{
foreach ($slowa as $slowo)
if (strstr($anchor, $slowo))
{
if (strstr($anchor, 'https'))
echo $anchor."<br>\r\n";
else
{
$link = parse_url($link);
echo $link['scheme'].'://'.$link['host'].$anchor."<br>\r\n";
}
}
}
}
}
W zmiennej $slowa podajemy ciągi znaków pod wyciąganie linków.
W pliku linki.txt podajemy adresy url, z których będą wyciągane linki.
Takie zabiegi łatwo robi się w programie UltraSeoMaster. Możemy ustawić wielowątkowość. Mój skrypt ma ograniczenia, ale dla osób, które nie posiadają tego programu może się przydać. Druga sprawa łatwiej się uczy PHP na gotowych skryptach :)
![[Gotowiec: PHP] Wyciąganie linków do rejestracji Wyciąganie linków do rejestracji php](https://pawelmacur.com/wp-content/uploads/2013/06/wyciaganie-linkow-do-rejestracji-php.jpg)
6 komentarzy
Dzięki za skrypt na pewno się przyda :)
UltraSeoMaster bez niego to już nie potrafię pracować. Skrypt bardzo przydatny. Dzięki
+ dla was. Bardzo dobry skrypt.
Bardzo dobry skrypt.
Bardzo przydatny skrypt! Wielkie dzięki.
Również dziękuje :)