Internetový bot: Porovnání verzí
m Kohelet přesunul stránku Internetový robot na Internetový bot s výměnou přesměrování: "robot" se nikde nepoužívá |
opr |
||
Řádek 1: | Řádek 1: | ||
'''Internetový |
'''Internetový bot''' (zkrácenina slova ''[[robot]]'') je [[počítačový program]], který pro svého majitele opakovaně vykonává nějakou rutinní činnost na [[internet]]u - obvykle sbírá data, odesílá a zpracovává požadavky na služby vzdálených [[server]]ů. |
||
== Příklady botů == |
== Příklady botů == |
||
===Vyhledávací |
===Vyhledávací boti=== |
||
Častým příkladem |
Častým příkladem bota jsou ''vyhledávací boti'' [[Internetový vyhledávač|internetových vyhledávačů]], v [[angličtina|angličtině]] crawler, spider, gatherer (doslova „prolízač“, pavouk, „shomažďovač“ - český ekvivalent se nepoužívá). Tento typ botů prochází jednotlivé [[World Wide Web|webové]] stránky, hledá na nich odkazy na nové stránky, [[index]]uje obsah zpracovávaných stránek a umožňuje jejich následné prohledávání. Podobným příkladem může být ''bot na kontrolu odkazů'' (linkchecker). Prochází zadanou množinu stránek (opět následuje odkazy) a hledá na nich odkazy na již neexistující stránky. |
||
===Spamboty=== |
===Spamboty=== |
||
{{Vlastní výzkum|část}} |
{{Vlastní výzkum|část}} |
||
Bot může informace do stránek i vkládat (odesíláním dat přes [[HTTP]]), existují např. boti vkládající [[komentářový spam]]. Takový bot vyhledává formuláře na webu a vkládá do nich reklamní text nebo komerční sdělení. |
|||
Existují rovněž |
Existují rovněž boti, kteří získávají [[e-mail|e-mailové adresy]], jež vkládají do databází příjemců pro rozesílání nevyžádané pošty ([[spam]]u). Odtud se jim říká '''spambot'''i, řidčeji harvester. Jeden ze způsobů je prohledávání internetových stránek - e-mailovou adresu obvykle poznají podle přítomnosti [[zavináč]]e – '''@'''.<ref>Teoreticky by se zavináč mohl uvést jako element '''&#64;'''; specifikaci [[HyperText Markup Language|HTML]] to neodporuje, prohlížeče by to měly podporovat a většinu spambotů by to mělo zmást.</ref> Protože objem takového spamu přesáhl míru únosnosti, bývá naléhavě doporučováno e-mailové adresy na internetu nezveřejňovat přímo, ale nějakým pro člověka snadno pochopitelným způsobem je opsat, např. '''jmeno (zavinac) domena.cz'''. Některé servery jdou v tomto uživatelům vstříc a e-mailové adresy takto rozloží automaticky nebo je vloží ve formě obrázku<ref>http://www.who.is/whois-org/ip-address/wikipedia.org/ Příklad e-mailu ve formě obrázku (na stránce uveden ve spodní části)</ref> (či obrázkem nahradí jednotlivá písmena nebo alespoň znak zavináče<ref>http://kmf.troja.mff.cuni.cz/pracovnici/index.php?id=votocek</ref>). Existuje i způsob přes [[kaskádové styly]]<ref>http://css.interval.cz/clanky/skryti-e-mailu-pred-harvestery-e-mailovych-adres-antispam/</ref><ref>http://css.interval.cz/priklady/priklad-50-1.htm</ref>, ten však zužuje skupinu uživatelů na ty s prohlížeči s podporou CSS(2). |
||
Spamovací |
Spamovací boti však e-mailové adresy můžou získat rovněž sledováním odpovědí vzdálených [[Simple Mail Transfer Protocol|SMTP]] [[server]]ů. Provádějí na vzdálený [[SMTP#Poštovní server|poštovní server]] tzv. [[slovníkový útok]], kdy se pokouší doručit e-mail na adresy složené z obvyklých jmen a příjmení, oblíbených názvů a přezdívek (svoboda, novak, cerny, atd.). Tyto adresy jsou proto ohroženější, jako protiopatření se doporučuje např. rozšíření adresy o další znaky (xsvoboda, novak69, …). |
||
Některé weby místo kontaktního mailu rovnou zobrazí formulář (třeba na připomínky k správě či obsahu jejich stránek), který je po vyplnění uživatelem zpracován na serveru, přičemž se teprve pošle na adresu administrátora nebo jiné zodpovědné osoby.<ref>http://www.256b.com/contact.php</ref> Při nedůsledném zpracování tohoto formuláře vzniká bezpečnostní díra, kterou může |
Některé weby místo kontaktního mailu rovnou zobrazí formulář (třeba na připomínky k správě či obsahu jejich stránek), který je po vyplnění uživatelem zpracován na serveru, přičemž se teprve pošle na adresu administrátora nebo jiné zodpovědné osoby.<ref>http://www.256b.com/contact.php</ref> Při nedůsledném zpracování tohoto formuláře vzniká bezpečnostní díra, kterou může bot využít a pomocí ní rozeslat spam nejen správci ale libovolnému příjemci.<ref>http://php.vrana.cz/e-mailovy-formular.php - příklad pro [[PHP]]</ref> |
||
Zajímavostí je ring serverů, které na spamboty políčily past - zobrazují stránky s desítkami mailových adres a odkazy vedoucí na obdobné takové stránky spřátelených serverů. Tyto stránky jsou vygenerované a odkazy lze procházet donekonečna, aniž by spamboty jediný z nich vyvedl mimo ring (obtěžovat běžné uživatele). Zmíněné e-mailové adresy pak patří největším prokázaným spamerům, takže tito v podstatě „sklízejí co zaseli“.<ref>http://www1173640515703.reporterweb.com/</ref> |
Zajímavostí je ring serverů, které na spamboty políčily past - zobrazují stránky s desítkami mailových adres a odkazy vedoucí na obdobné takové stránky spřátelených serverů. Tyto stránky jsou vygenerované a odkazy lze procházet donekonečna, aniž by spamboty jediný z nich vyvedl mimo ring (obtěžovat běžné uživatele). Zmíněné e-mailové adresy pak patří největším prokázaným spamerům, takže tito v podstatě „sklízejí co zaseli“.<ref>http://www1173640515703.reporterweb.com/</ref> |
||
=== |
===Boti pro správu a údržbu=== |
||
[[Wikipedie]] používá [[Wikipedie:Bot| |
[[Wikipedie]] používá [[Wikipedie:Bot|boty]] k různým údržbářským pracím, např. údržbě [[Wikipedie:Interwiki|mezijazykových odkazů]], odstraňování nefunkčních [[Wikipedie:Externí odkazy|externích odkazů]], vytváření nových [[Wikipedie:Přesměrování|přesměrování]] či odstraňování [[Wikipedie:Přesměrování#Dvojité přesměrování|dvojitých přesměrování]]. |
||
===IRC bot, Chatterbot=== |
===IRC bot, Chatterbot=== |
||
Bot nemusí pracovat pouze s webovými stránkami, [[IRC bot]] může poslouchat na [[IRC]] kanálu a reagovat na zaslané příkazy, či do IRC kanálu nějakou konverzaci odesílat. |
|||
Úkolem dalšího z botů, tzv. chatterbota, není sbírat nebo zasílat spam, ale bavit uživatele předstíráním (simulací) inteligentní konverzace. Zpravidla jeho algoritmus není tak dokonalý, aby obstál srovnání s živým protějškem (více viz [[Turingův test]]), většinou se jen snaží analyzovat z vět klíčová slova a na ně odpovědět podle připravených vzorů. |
Úkolem dalšího z botů, tzv. chatterbota, není sbírat nebo zasílat spam, ale bavit uživatele předstíráním (simulací) inteligentní konverzace. Zpravidla jeho algoritmus není tak dokonalý, aby obstál srovnání s živým protějškem (více viz [[Turingův test]]), většinou se jen snaží analyzovat z vět klíčová slova a na ně odpovědět podle připravených vzorů. |
||
Řádek 33: | Řádek 33: | ||
<references/> |
<references/> |
||
=== Související články === |
=== Související články === |
||
* [[Wikipedie:Bot| |
* [[Wikipedie:Bot|Internetoví boti na české Wikipedii]] |
||
* [[Spam]] |
* [[Spam]] |
||
Verze z 5. 2. 2015, 07:11
Internetový bot (zkrácenina slova robot) je počítačový program, který pro svého majitele opakovaně vykonává nějakou rutinní činnost na internetu - obvykle sbírá data, odesílá a zpracovává požadavky na služby vzdálených serverů.
Příklady botů
Vyhledávací boti
Častým příkladem bota jsou vyhledávací boti internetových vyhledávačů, v angličtině crawler, spider, gatherer (doslova „prolízač“, pavouk, „shomažďovač“ - český ekvivalent se nepoužívá). Tento typ botů prochází jednotlivé webové stránky, hledá na nich odkazy na nové stránky, indexuje obsah zpracovávaných stránek a umožňuje jejich následné prohledávání. Podobným příkladem může být bot na kontrolu odkazů (linkchecker). Prochází zadanou množinu stránek (opět následuje odkazy) a hledá na nich odkazy na již neexistující stránky.
Spamboty
Bot může informace do stránek i vkládat (odesíláním dat přes HTTP), existují např. boti vkládající komentářový spam. Takový bot vyhledává formuláře na webu a vkládá do nich reklamní text nebo komerční sdělení.
Existují rovněž boti, kteří získávají e-mailové adresy, jež vkládají do databází příjemců pro rozesílání nevyžádané pošty (spamu). Odtud se jim říká spamboti, řidčeji harvester. Jeden ze způsobů je prohledávání internetových stránek - e-mailovou adresu obvykle poznají podle přítomnosti zavináče – @.[1] Protože objem takového spamu přesáhl míru únosnosti, bývá naléhavě doporučováno e-mailové adresy na internetu nezveřejňovat přímo, ale nějakým pro člověka snadno pochopitelným způsobem je opsat, např. jmeno (zavinac) domena.cz. Některé servery jdou v tomto uživatelům vstříc a e-mailové adresy takto rozloží automaticky nebo je vloží ve formě obrázku[2] (či obrázkem nahradí jednotlivá písmena nebo alespoň znak zavináče[3]). Existuje i způsob přes kaskádové styly[4][5], ten však zužuje skupinu uživatelů na ty s prohlížeči s podporou CSS(2).
Spamovací boti však e-mailové adresy můžou získat rovněž sledováním odpovědí vzdálených SMTP serverů. Provádějí na vzdálený poštovní server tzv. slovníkový útok, kdy se pokouší doručit e-mail na adresy složené z obvyklých jmen a příjmení, oblíbených názvů a přezdívek (svoboda, novak, cerny, atd.). Tyto adresy jsou proto ohroženější, jako protiopatření se doporučuje např. rozšíření adresy o další znaky (xsvoboda, novak69, …).
Některé weby místo kontaktního mailu rovnou zobrazí formulář (třeba na připomínky k správě či obsahu jejich stránek), který je po vyplnění uživatelem zpracován na serveru, přičemž se teprve pošle na adresu administrátora nebo jiné zodpovědné osoby.[6] Při nedůsledném zpracování tohoto formuláře vzniká bezpečnostní díra, kterou může bot využít a pomocí ní rozeslat spam nejen správci ale libovolnému příjemci.[7]
Zajímavostí je ring serverů, které na spamboty políčily past - zobrazují stránky s desítkami mailových adres a odkazy vedoucí na obdobné takové stránky spřátelených serverů. Tyto stránky jsou vygenerované a odkazy lze procházet donekonečna, aniž by spamboty jediný z nich vyvedl mimo ring (obtěžovat běžné uživatele). Zmíněné e-mailové adresy pak patří největším prokázaným spamerům, takže tito v podstatě „sklízejí co zaseli“.[8]
Boti pro správu a údržbu
Wikipedie používá boty k různým údržbářským pracím, např. údržbě mezijazykových odkazů, odstraňování nefunkčních externích odkazů, vytváření nových přesměrování či odstraňování dvojitých přesměrování.
IRC bot, Chatterbot
Bot nemusí pracovat pouze s webovými stránkami, IRC bot může poslouchat na IRC kanálu a reagovat na zaslané příkazy, či do IRC kanálu nějakou konverzaci odesílat.
Úkolem dalšího z botů, tzv. chatterbota, není sbírat nebo zasílat spam, ale bavit uživatele předstíráním (simulací) inteligentní konverzace. Zpravidla jeho algoritmus není tak dokonalý, aby obstál srovnání s živým protějškem (více viz Turingův test), většinou se jen snaží analyzovat z vět klíčová slova a na ně odpovědět podle připravených vzorů.
Botnet
Dnešní počítačové viry a červi často staví botnety, což jsou sítě propojených botů na zavirovaných počítačích (zotročená síť počítačů), kteří čekají na příkazy majitele a poté používají napadené počítače k jejich splnění. Tímto způsobem jsou často vytvářeny DDoS útoky nebo rozesílány spamy.
Odkazy
Reference
- ↑ Teoreticky by se zavináč mohl uvést jako element @; specifikaci HTML to neodporuje, prohlížeče by to měly podporovat a většinu spambotů by to mělo zmást.
- ↑ http://www.who.is/whois-org/ip-address/wikipedia.org/ Příklad e-mailu ve formě obrázku (na stránce uveden ve spodní části)
- ↑ http://kmf.troja.mff.cuni.cz/pracovnici/index.php?id=votocek
- ↑ http://css.interval.cz/clanky/skryti-e-mailu-pred-harvestery-e-mailovych-adres-antispam/
- ↑ http://css.interval.cz/priklady/priklad-50-1.htm
- ↑ http://www.256b.com/contact.php
- ↑ http://php.vrana.cz/e-mailovy-formular.php - příklad pro PHP
- ↑ http://www1173640515703.reporterweb.com/
Související články
Externí odkazy
- Spammers getting smacked down - Past na spamboty
- Botnety: nová internetová hrozba Helena Nykodýmová, lupa.cz, 31. 5. 2006