Internetový robot

Z Wikipedie, otevřené encyklopedie
Skočit na: Navigace, Hledání

Internetový robot nebo častěji jenom bot je počítačový program, který pro svého majitele opakovaně vykonává nějakou rutinní činnost na internetu - obvykle sbírá data, odesílá a zpracovává požadavky na služby vzdálených serverů.

Příklady botů[editovat | editovat zdroj]

Vyhledávací roboty[editovat | editovat zdroj]

Častým příkladem robota jsou vyhledávací roboty internetových vyhledávačů, v angličtině crawler, spider, gatherer (doslova „prolízač“, pavouk, „shomažďovač“ - český ekvivalent se nepoužívá). Tento typ robotů prochází jednotlivé webové stránky, hledá na nich odkazy na nové stránky, indexuje obsah zpracovávaných stránek a umožňuje jejich následné prohledávání. Podobným příkladem může být robot na kontrolu odkazů (linkchecker). Prochází zadanou množinu stránek (opět následuje odkazy) a hledá na nich odkazy na již neexistující stránky.

Spamboty[editovat | editovat zdroj]

Robot může informace do stránek i vkládat (odesíláním dat přes HTTP), existují např. roboty vkládající komentářový spam. Takový robot vyhledává formuláře na webu a vkládá do nich reklamní text nebo komerční sdělení.

Existují rovněž roboty, které získávají e-mailové adresy, jež vkládají do databází příjemců pro rozesílání nevyžádané pošty (spamu). Odtud se jim říká spamboti, řidčeji harvester. Jeden ze způsobů je prohledávání internetových stránek - e-mailovou adresu obvykle poznají podle přítomnosti zavináče@.[1] Protože objem takového spamu přesáhl míru únosnosti, bývá naléhavě doporučováno e-mailové adresy na internetu nezveřejňovat přímo, ale nějakým pro člověka snadno pochopitelným způsobem je opsat, např. jmeno (zavinac) domena.cz. Některé servery jdou v tomto uživatelům vstříc a e-mailové adresy takto rozloží automaticky nebo je vloží ve formě obrázku[2] (či obrázkem nahradí jednotlivá písmena nebo alespoň znak zavináče[3]). Existuje i způsob přes kaskádové styly[4][5], ten však zužuje skupinu uživatelů na ty s prohlížeči s podporou CSS(2).

Spamovací roboty však e-mailové adresy můžou získat rovněž sledováním odpovědí vzdálených SMTP serverů. Provádějí na vzdálený poštovní server tzv. slovníkový útok, kdy se pokouší doručit e-mail na adresy složené z obvyklých jmen a příjmení, oblíbených názvů a přezdívek (svoboda, novak, cerny, atd.). Tyto adresy jsou proto ohroženější, jako protiopatření se doporučuje např. rozšíření adresy o další znaky (xsvoboda, novak69, …).

Některé weby místo kontaktního mailu rovnou zobrazí formulář (třeba na připomínky k správě či obsahu jejich stránek), který je po vyplnění uživatelem zpracován na serveru, přičemž se teprve pošle na adresu administrátora nebo jiné zodpovědné osoby.[6] Při nedůsledném zpracování tohoto formuláře vzniká bezpečnostní díra, kterou může robot využít a pomocí ní rozeslat spam nejen správci ale libovolnému příjemci.[7]

Zajímavostí je ring serverů, které na spamboty políčily past - zobrazují stránky s desítkami mailových adres a odkazy vedoucí na obdobné takové stránky spřátelených serverů. Tyto stránky jsou vygenerované a odkazy lze procházet donekonečna, aniž by spamboty jediný z nich vyvedl mimo ring (obtěžovat běžné uživatele). Zmíněné e-mailové adresy pak patří největším prokázaným spamerům, takže tito v podstatě „sklízejí co zaseli“.[8]

Roboty pro správu a údržbu[editovat | editovat zdroj]

Wikipedie používá roboty k různým údržbářským pracím, např. údržbě mezijazykových odkazů, odstraňování nefunkčních externích odkazů, vytváření nových přesměrování či odstraňování dvojitých přesměrování.

IRC bot, Chatterbot[editovat | editovat zdroj]

Robot nemusí pracovat pouze s webovými stránkami, IRC bot může poslouchat na IRC kanálu a reagovat na zaslané příkazy, či do IRC kanálu nějakou konverzaci odesílat.

Úkolem dalšího z botů, tzv. chatterbota, není sbírat nebo zasílat spam, ale bavit uživatele předstíráním (simulací) inteligentní konverzace. Zpravidla jeho algoritmus není tak dokonalý, aby obstál srovnání s živým protějškem (více viz Turingův test), většinou se jen snaží analyzovat z vět klíčová slova a na ně odpovědět podle připravených vzorů.

Botnet[editovat | editovat zdroj]

Dnešní počítačové viry a červi často staví botnety, což jsou sítě propojených botů na zavirovaných počítačích (zotročená síť počítačů), kteří čekají na příkazy majitele a poté používají napadené počítače k jejich splnění. Tímto způsobem jsou často vytvářeny DDoS útoky nebo rozesílány spamy.

Odkazy[editovat | editovat zdroj]

Reference[editovat | editovat zdroj]

  1. Teoreticky by se zavináč mohl uvést jako element @; specifikaci HTML to neodporuje, prohlížeče by to měly podporovat a většinu spambotů by to mělo zmást.
  2. http://www.who.is/whois-org/ip-address/wikipedia.org/ Příklad e-mailu ve formě obrázku (na stránce uveden ve spodní části)
  3. http://kmf.troja.mff.cuni.cz/pracovnici/index.php?id=votocek
  4. http://css.interval.cz/clanky/skryti-e-mailu-pred-harvestery-e-mailovych-adres-antispam/
  5. http://css.interval.cz/priklady/priklad-50-1.htm
  6. http://www.256b.com/contact.php
  7. http://php.vrana.cz/e-mailovy-formular.php - příklad pro PHP
  8. http://www1173640515703.reporterweb.com/

Související články[editovat | editovat zdroj]

Externí odkazy[editovat | editovat zdroj]