Jak wiadomo nie zawsze podstrony z formularzem rejestracyjnym są zaindeksowane. Często tworzy się footprinty do wyszukiwania adresów tak, aby pobrane adresy url z wyników wyszukiwania prowadziły od razu do podstrony rejestracyjnej. Jednak wtedy ucieka nam sporo innych adresów. Z kolei jak tworzymy footprinty do różnych podstron, to często trzeba znaleźć link do rejestracji. Sprawa jest na tyle prosta w przypadku np. Xrumera, że takich zabiegów nie trzeba robić, bo mod sam szuka podstrony rejestracyjnej. Jednak nie zawsze jest to dobre rozwiązanie!
Poniżej podaję gotowy skrypt w php do wyciągania linków, które posiadają w sobie określony ciąg znaków.
set_time_limit(3600); $linki = file('linki.txt'); $slowa = array( 'register', 'signup', ); foreach ($linki as $link) { $link = trim($link); if ( ! empty($link)) { $tresc = file_get_contents($link); preg_match_all('/href="(.*?)"/s', $tresc, $dopasowania); foreach ($dopasowania[1] as $anchor) { foreach ($slowa as $slowo) if (strstr($anchor, $slowo)) { if (strstr($anchor, 'https')) echo $anchor."<br>\r\n"; else { $link = parse_url($link); echo $link['scheme'].'://'.$link['host'].$anchor."<br>\r\n"; } } } } }
W zmiennej $slowa podajemy ciągi znaków pod wyciąganie linków.
W pliku linki.txt podajemy adresy url, z których będą wyciągane linki.
Takie zabiegi łatwo robi się w programie UltraSeoMaster. Możemy ustawić wielowątkowość. Mój skrypt ma ograniczenia, ale dla osób, które nie posiadają tego programu może się przydać. Druga sprawa łatwiej się uczy PHP na gotowych skryptach :)
6 komentarzy
Dzięki za skrypt na pewno się przyda :)
UltraSeoMaster bez niego to już nie potrafię pracować. Skrypt bardzo przydatny. Dzięki
+ dla was. Bardzo dobry skrypt.
Bardzo dobry skrypt.
Bardzo przydatny skrypt! Wielkie dzięki.
Również dziękuje :)