Internetový robot

Z Wikipedie, otevřené encyklopedie
Skočit na: Navigace, Hledání

Internetový robot nebo častěji jenom bot je počítačový program, který pro svého majitele opakovaně vykonává nějakou rutinní činnost na internetu - obvykle sbírá data, odesílá a zpracovává požadavky na služby vzdálených serverů.

Obsah

[editovat] Příklady botů

[editovat] Vyhledávací roboti

Častým příkladem robota jsou vyhledávací roboti internetových vyhledávačů, v angličtině crawler, spider, gatherer (doslova „prolízač“, pavouk, „shomažďovač“ - český ekvivalent se nepoužívá). Tento typ robotů prochází jednotlivé webové stránky, hledá na nich odkazy na nové stránky, indexuje obsah zpracovávaných stránek a umožňuje jejich následné prohledávání. Podobným příkladem může být robot na kontrolu odkazů (linkchecker). Prochází zadanou množinu stránek (opět následuje odkazy) a hledá na nich odkazy na již neexistující stránky.

[editovat] Spamboti

Ambox warning pn.svg

Tato část zřejmě obsahuje výsledky vlastního výzkumu nebo neověřená tvrzení.
Prosím pomozte Wikipedii tím, že přidáte reference. Podívejte se na diskusní stránku, kde mohou být uvedeny další detaily.

Robot může informace do stránek i vkládat (odesíláním dat přes HTTP), existují např. roboti vkládající komentářový spam. Takový robot vyhledává formuláře na webu a vkládá do nich reklamní text nebo komerční sdělení.

Existují rovněž roboti, kteří získávají e-mailové adresy, jež vkládají do databází příjemců pro rozesílání nevyžádané pošty (spamu). Odtud se jim říká spamboti, řidčeji harvester. Jeden ze způsobů je prohledávání internetových stránek - e-mailovou adresu obvykle poznají podle přítomnosti zavináče@.[1] Protože objem takového spamu přesáhl míru únosnosti, bývá naléhavě doporučováno e-mailové adresy na internetu nezveřejňovat přímo, ale nějakým pro člověka snadno pochopitelným způsobem je opsat, např. jmeno (zavinac) domena.cz. Některé servery jdou v tomto uživatelům vstříc a e-mailové adresy takto rozloží automaticky nebo je vloží ve formě obrázku[2] (či obrázkem nahradí jednotlivá písmena nebo alespoň znak zavináče[3]). Existuje i způsob přes kaskádové styly[4][5], ten však zužuje skupinu uživatelů na ty s prohlížeči s podporou CSS(2).

Spamovací roboti však e-mailové adresy můžou získat rovněž sledováním odpovědí vzdálených SMTP serverů. Provádějí na vzdálený poštovní server tzv. slovníkový útok, kdy se pokouší doručit e-mail na adresy složené z obvyklých jmen a příjmení, oblíbených názvů a přezdívek (svoboda, novak, cerny, atd.). Tyto adresy jsou proto ohroženější, jako protiopatření se doporučuje např. rozšíření adresy o další znaky (xsvoboda, novak69, …).

Některé weby místo kontaktního mailu rovnou zobrazí formulář (třeba na připomínky k správě či obsahu jejich stránek), který je po vyplnění uživatelem zpracován na serveru, přičemž se teprve pošle na adresu administrátora nebo jiné zodpovědné osoby.[6] Při nedůsledném zpracování tohoto formuláře vzniká bezpečnostní díra, kterou může robot využít a pomocí ní rozeslat spam nejen správci ale libovolnému příjemci.[7]

Zajímavostí je ring serverů, které na spamboty políčily past - zobrazují stránky s desítkami mailových adres a odkazy vedoucí na obdobné takové stránky spřátelených serverů. Tyto stránky jsou vygenerované a odkazy lze procházet donekonečna, aniž by spamboty jediný z nich vyvedl mimo ring (obtěžovat běžné uživatele). Zmíněné e-mailové adresy pak patří největším prokázaným spamerům, takže tito v podstatě „sklízejí co zaseli“.[8]

[editovat] Roboti pro správu a údržbu

Wikipedie používá roboty k různým údržbářským pracím, např. údržbě mezijazykových odkazů, odstraňování nefunkčních externích odkazů, vytváření nových přesměrování či odstraňování dvojitých přesměrování.

[editovat] IRC bot, Chatterbot

Robot nemusí pracovat pouze s webovými stránkami, IRC bot může poslouchat na IRC kanálu a reagovat na zaslané příkazy, či do IRC kanálu nějakou konverzaci odesílat.

Úkolem dalšího z botů, tzv. chatterbota, není sbírat nebo zasílat spam, ale bavit uživatele předstíráním (simulací) inteligentní konverzace. Zpravidla jeho algoritmus není tak dokonalý, aby obstál srovnání s živým protějškem (více viz Turingův test), většinou se jen snaží analyzovat z vět klíčová slova a na ně odpovědět podle připravených vzorů.

[editovat] Botnet

Dnešní počítačové viry a červi často staví botnety, což jsou sítě propojených botů na zavirovaných počítačích (zotročená síť počítačů), kteří čekají na příkazy majitele a poté používají napadené počítače k jejich splnění. Tímto způsobem jsou často vytvářeny DDoS útoky nebo rozesílány spamy.

[editovat] Odkazy

[editovat] Reference

  1. Teoreticky by se zavináč mohl uvést jako element @; specifikaci HTML to neodporuje, prohlížeče by to měly podporovat a většinu spambotů by to mělo zmást.
  2. http://www.who.is/whois-org/ip-address/wikipedia.org/ Příklad e-mailu ve formě obrázku (na stránce uveden ve spodní části)
  3. http://kmf.troja.mff.cuni.cz/pracovnici/index.php?id=votocek
  4. http://css.interval.cz/clanky/skryti-e-mailu-pred-harvestery-e-mailovych-adres-antispam/
  5. http://css.interval.cz/priklady/priklad-50-1.htm
  6. http://www.256b.com/contact.php
  7. http://php.vrana.cz/e-mailovy-formular.php - příklad pro PHP
  8. http://www1173640515703.reporterweb.com/

[editovat] Související články

[editovat] Externí odkazy

Osobní nástroje
Jmenné prostory

Varianty
Akce
Navigace
Tisk/export
Nástroje
V jiných jazycích