Přeskočit na obsah

Wikipedista:BotCS

Z Wikipedie, otevřené encyklopedie
Tento uživatelský účet je bot, kterého ovládá uživatel Michal Jurosz (diskuse).

Nejedná se o žádný loutkový účet, ale o technický účet, který slouží k automatické nebo poloautomatické editaci Wikipedie. Dřina patří strojům.
Správci, pokud bot nepracuje správně nebo způsobuje potíže, zablokujte jej.

BotCS je skript (webový robot) pro automatické udržování české Wikipedie. Robot již není několik let používán. Nepravidelně a interaktivně jej spouštěl Wikipedista:Michal Jurosz pro udržování mezijazykových odkazů.

Historie používání robota, rok 2004

[editovat | editovat zdroj]
  • hodně dávno - Česká Wikipedie potřebuje robota, který pomůže alespoň s interwifikací. Začínám si tedy hrát s usilovně vyvíjeným balíkem Python Wikipedia Robot Framework. Chyba způsobující problémy s českými znaky ve shrnutí editace byla vývojaři rychle odstraněna. Vypadá to tedy, že robot bude použitelný.
  • 22.červenec (10:14) - Spouštím první větší test. Je vidět, že robot dosti zaneřádil poslední změny. Zastavuji tedy jeho činnost a prosím o pomoc při nastavení flag bot (viz. následující odstavec).
  • 23. červenec
    • 14:40 - BotCS obdržel status robota. Spouštím jej na 122 článků (1231 oprav + opravy formátování) získaných z warnfile robota na sl wikipedii.
    • 18:20 - Spuštěn interwiki robot na prvních 100 stránek (od stránky 0). Robot má mezi aktualizacemi (uploadem) asi 50 sekund pauzu a také pauzy mezi načítáním stránek, takže příliš nezatěžuje server.
    • 18:55 - Robot zastaven. Warnfile, který generuje není v utf-8, ale obsahuje spoustu otazníků, takže není použitelný pro roboty na ostatních wikipediích. Myslím, že je zbytečné stahovat ostatní jazykové verze a zatěžovat tak server, pokud těmto verzím nemůžeme rovněž s interwiki pomoci.
  • 31. červenec
    • 10:50 - Spuštěno s JA warnfile (173 článků, 3592 změn).
    • 13:49 - Hotovo.
  • 31.srpen
    • 9:53 - Přidány interwiki odkazy pro články 19502004. Vypadá to, že vygenerovaný výstup (treelagn.log) je stále nepoužitelný.
  • 10. září
    • 19:30 - Spuštěn s JA warnfile 2004-09-04 (533 článků, 6582 změn).
    • 22:52 - Pozastaveno, zbytek snad zítra. Dobrou noc.
  • 11.září - 8:55 až 9:38 - Dokončeno.
  • 28. listopad - 9:03 až 12:52 - Spuštěn s JA warnfile 2004-11-15 (387 článků, 1545 změn). Dvakrát to spadlo a robot procházel články znovu.

Odkazy na cizojazyčné stránky (interwiki)

[editovat | editovat zdroj]
  1. Skript načte českou stránku (verzi pro editaci).
  2. Pomocí interwiki odkazů na této stránce (nebo vstupu od uživatele) najde cizojazyčné názvy stránek. Pracuje rekurzivně, tj. prochází (načítá) všechny cizojazyčné stránky.
  3. Rozumí a opravuje přesměrování a při nalezení dvou různých odkazů na jednu jazykovou verzi se poradí s uživatelem.
  4. Pokud vše proběhne vpořádku, tak opraví českou verzi stránky (s uživatelským jménem BotCS) a vypíše seznam nesrovnalostí u ostatních jazykových verzí (warnfile).

Obdobou robota BotCS je na anglické Wikipedii en:User:Robbot.

Doplnění interwiki do všech článků

[editovat | editovat zdroj]

Programuji Perl Wikipedia Toolkit a používám offline verzi databáze (SQL dump).

  • dostupné výsledky pro interwiki jsou na stránce Wikipedie:Interwiki
  • dále se chystám vytvořit seznam českých stránek bez interwiki odkazů. Do seznamu ke každému článku doplníme jeden interwiki odkaz a robot vše další provede automaticky. Pak bude možné spustit robota na celou českou Wikipedii a zveřejnit vygenerovaný warnfile, aby správci příslušných robotů na cizojazyčných Wikipediích mohli doplnit interwiki na české články.

--Michal Jurosz 12:16, 29. 11. 2004 (UTC)

Podívejte se též na:

[editovat | editovat zdroj]