Přeskočit na obsah

Wikipedie:Pod lípou/Archiv 2024/02

Z Wikipedie, otevřené encyklopedie

Umělá inteligence na české Wikipedii

Na naší wiki máme (možná první?) nástroj současné umělé inteligence. Wikipedie:Generátor alternativních textů k obrázkům si projde článek a navrhne k jeho obrázkům alternativní popisky určené hlavně nevidomým uživatelům. Jde tedy o převod obrazové informace na textovou, využívá se model GPT 4 Turbo od firmy OpenAI. Např. po spuštění na článku Fafertin a vyžádání si dvou návrhů pro každý obrázek jsem dostal tento výstup:

|alt=Fotografie zachycuje starobylou kamennou architekturu, pravděpodobně vstup či bránu, s velkým klenutým otvorem uprostřed. Kolem jsou roztroušené kameny a vegetace, na pozadí je vidět několik kamenných zdí či hradby. Celkově scéna evokuje historické a archeologické místo.
|alt=Barevná fotografie ukazuje starověkou kamennou stavbu, která vypadá jako brána nebo vchod. Velký klenutý otvor obklopený robustními kamennými bloky dominuje kompozici a je pozadím pro surovou, kamenitou krajinu. Na přední straně jsou rozesety kameny a drobná vegetace. Celkový vzhled obrázku evokuje historickou a archeologickou lokalitu.
|alt=Fotografie zobrazuje kamennou ruinu s obloukovým prvkem v aridní krajině. Oblouk je postaven z velkých kamenů a je částečně obalen vegetací. V pozadí je vidět suchá, skalnatá krajina s nízkou vegetací. Na pravé straně obrázku sedí osoba na kamenech v blízkosti ruin.
|alt=Fotografie zobrazuje ruinu staré kamenné stavby s obloukovým vchodem v suché krajině s kamenitou půdou.
|alt=Fotografie starověkého kamenného oblouku, zobrazeného zdola nahoru. Oblouk je vyroben z řad růžových a bílých kamenů. Ve středu horní části oblouku je vytesaný symbol.
|alt=Fotografie části kamenného oblouku. Snímek je pořízen zespodu, ukazuje klenbu zbudovanou z masivních kamenů uspořádaných do tvaru oblouku. Na klenbě je vidět rytina s geometrickým vzorem.

Model je nastaven tak, že při každém spuštění přijde s jinými návrhy. Jeho kvalita je taková, že zhruba dvě třetiny návrhů jsou více méně použitelné, ale málokdy se stane, že by popisek vůbec nepotřeboval určitou úpravu. Samozřejmě také záleží na tom, jak snadné pro něj obrázky jsou - některé druhy obrazového obsahu rozezná snadno, v jiných případech se trápí. Je potřeba dávat pozor i na občasné halucinace, kdy model vidí na obrázku něco, co tam není. Ale celkově mi to hodně ulehčilo práci s generováním popisků pro moje dva kandidáty na Nejlepší článek.

Kdyby vás napadlo, jak ještě umělou inteligenci nového typu na Wikipedii použít, tak budu rád, když se podělíte se svými myšlenkami. Bylo by fajn tuto oblast rozvíjet, abychom nezůstali v době kamenné.

Kromě toho jsou dva obecné problémy:

  • Program si každý uživatel musí spustit u sebe na počítači (nebo poprosit mě). Je to uživatelsky mnohem méně přívětivé, než jiná udělátka, a prakticky to vylučuje wikipedisty, kteří neprogramují v Pythonu.
  • Předpokladem spuštění programu je předplatit si API u firmy OpenAI, což sice není až tak drahé (jeden potenciální Nejlepší článek se dvěma návrhy na obrázek přijde řádově na desetikorunu), ale i tak je to výdaj a otrava a riziko.

Takže kdybyste někdo věděl o způsobu, jak tato omezení překonat (jinými slovy kdyby nadace zaplatila používání modelu a zajistila infrastrukturu), tak by to bylo dobré.--Jan Spousta (diskuse) 11. 5. 2024, 10:05 (CEST)

@Jan Spousta: Opět skvělý nápad, díky za jeho provedení. Mohu-li se zeptat, na jaké kandidáty mezi nejlepší články jste nástroj použil? Těchto šest altů, které jsou zde uvedeny, jsou ty dobré, nebo patří mezi horší? Žádné halucinace v popiscích nevidím, tak buď jsem špatně koukal, nebo jsou dobré. Osobně bych to sám lépe nepopsal. --Marek Genius (diskuse) 11. 5. 2024, 18:36 (CEST)
@Marek Genius: Dobrý den, Marku, děkuji za uznání. Použil jsem své udělátko na články Červencová krize a Dvorní dámy (ale jak píšu, ty alty tam jsou více či méně zeditované, v původním znění jich zůstalo jen málo). Halucinace se vyskytují jen zřídka a tady náhodou možná zrovna žádná není; jen jsem chtěl upozornit, že to může nastat, aby někdo slepě nepřevzal návrh, aniž by se podíval na obrázek.--Jan Spousta (diskuse) 11. 5. 2024, 18:53 (CEST)
@Matěj Suchánek, Jan Spousta, Tchoř: Jinak ještě upozorňuji na jedno úskalí současných AI modelů, a to je jejich viditelná cenzurovanost, kterou na Wiki netrpíme. Osobně si dost často hraju s en:Microsoft Copilot (založte pahýl! :-)) a zjistil jsem, že na "kontroverzní" věci odmítá odpovídat a nalhává, že mu došly nápady, resp. začne odpovídat a pak tu odpověď smaže, že mu došly nápady (to je ještě lepší :-)). Bavíme se zde o pro encyklopedii relevantních otázkách, například co to je vibrátor? a je masturbace zdravotně škodlivá? (srandičky, že chci zabít souseda, vynechávám > na to se raději ani neptám, aby mi tu policajti nevykopli dveře :-)). Takže AI rozhodně nemusí být nezaujatá. --OJJ, Diskuse 13. 5. 2024, 09:06 (CEST)
Zaujatost AI považuji za obrovský problém, daleko větší než halucinace nebo deepfake videa. --Marek Genius (diskuse) 13. 5. 2024, 15:47 (CEST)
@Marek Genius: V tomhle kontextu by to mohlo být na překážku leda kdyby někdo chtěl protlačit do NČ článek Vibrátor a chtěl k němu pomocí toho udělátka vyrobit alty k obrázkům. Tak by si to možná chudák musel nakonec udělat sám ručně. ;) Ale to bych za tak obrovský problém nepovažoval. Jinými slovy prostě budeme citlivý obsah editovat pořád postaru.--Jan Spousta (diskuse) 13. 5. 2024, 16:17 (CEST)
Asi se to některým nebude líbit, protože to budou považovat za další zbytečné otravování. Ale přikláněl bych se k tomu, aby se využití tohoto nástroje psalo do shrnutí editace. Případně by mohla vzniknout i nějaká šablona, něco na způsob Šablona:Překlad nebo Šablona:Svolení autora, která by se dávala alespoň na diskusní stránky článků. Až se potom nástroj nějak začlení přímo do softwaru, tak potom budou stačit značky typu HotCat, Cat-a-lot nebo contenttranslation. Mimo jiné jde o to, že z obsahu Wikipedie se tyto neuronky pak zase učí a takto se vlastně budou učit z vlastních výstupů. Tak aby dokázaly nějak odlišit obsah vytvořený lidmi a obsah vytvořený AI. Tak, jako se v dávné minulosti použitá a kopírovaná díla necitovala, ale později se přišlo na výhody tohoto citování, měla by si nyní odborná komunita zvyknout i na citování použitého softwaru a jeho konkrétní verze, minimálně na citování LLM a překladačů. --Marek Genius (diskuse) 13. 5. 2024, 15:46 (CEST)
@Marek Genius: Pokud by nám autoři modelů platili, že jim ulehčujeme práci, tak by ten návrh snad dával smysl. Ale obávám se, že i kdybychom nakrásně nějaké shrnutí editace dávali, tak ty neuronové sítě se o tom nemají šanci dozvědět, jelikož je obvykle učí na základě aktuálního textu Wikipedie, bez přihlédnutí k její historii a natož k různých skrytým šablonám a editačním shrnutím. Další aspekt je, že podobné rozhodnutí pak uposlechne jen menšina maximálně ukázněných a znalých editorů, pokud se to nějak nezajistí automaticky, zatímco divocí wikipedisté se s formalitami neobtěžují. Takže je to možná dobrý nápad, ale připadá mi obtížně realizovatelný a prakticky bez vlivu na trénování modelů.--Jan Spousta (diskuse) 13. 5. 2024, 16:17 (CEST)
@Jan Spousta: To první (tedy využívání shrnutí editace neuronkami) je jenom záležitost technického pokroku. Wikipedie má obrovský vliv. Tak jako se Google naučil rozpoznávat jednotlivé informace z článků a například při ukázkách z Wikipedie vynechává datum a místo narození a úmrtí osob v závorkách, když někdo googlí konkrétní osobu, naučí se neuronky časem pracovat se shrnutími editací, diskusemi, zdrojovým kódem, historickými verzemi a dalšími. Pochopitelně, že když půjde o praxi jedné malé (rozuměj české) wikipedie, a nadto ještě v deseti článcích za rok, tak to nikdo svou neuronku učit nebude. Ale pokud by se to dělalo ve velkém, na více wikipediích nebo dokonce na Commons (jak tu Matěj navrhoval zapisovat alty rovnou do metadat), potom už by stálo za to, aby to někdo neuronku naučil. To druhé (tedy divocí wikipedisté), to bude samozřejmě problém. --Marek Genius (diskuse) 13. 5. 2024, 17:13 (CEST)
@Marek Genius: Psát tímto způsobem je a priori špatně. Pokud něco řekne AI, tak to může být správné, ale je to neověřitelné, zároveň každému vygeneruje jiný výstup. Lidi musím slušně odmítat, i když mi třeba posílají dokumenty z rodinných archivů právě pro neověřitelnost, i když jsou 100% správně. Nedovedu si představit využívat tímto způsobem AI. --OJJ, Diskuse 13. 5. 2024, 16:33 (CEST)
@OJJ: Už teď lze umělé inteligenci předhodit nějaké podklady jako kontext a požádat ji, aby psala na základě těch podkladů. Pokud jí nabídneš věrohodné zdroje, zkontroluješ, že nehalucinuje, opravíš po ní jazykové chyby a zdroje ocituješ, tak nevím, proč by to mělo být špatně.--Jan Spousta (diskuse) 13. 5. 2024, 16:50 (CEST)
@Jan Spousta: Však to ať si lidi dělají dle svého vkusu. Kolega se ale bavil o citování AI, nikoli užívání AI. To je rozdíl. Pak je tedy samozřejmě otázka, jestli chceme třeba hromadný import AI hesel, jak by to přijala veřejnost a jak budeme konkurenceschopní >> třeba ta robotická hesla se před časem myslím zavrhla, protože odporují filosofii projektu, ačkoli po vzoru cebuánské Wikipedie se dala založit už před mnoha lety (X je druh Y z čeledi Z. Jeho areál výskytu zahrnuje oblast A, přirozeným stanovištěm jsou B. Podle Mezinárodního svazu ochrany přírody patří mezi ohrožené/neohrožené druhy. >> vše se to dá vytahat třeba z IUCN databáze, kde na to mají kolonky >> mohli jsme tu mít všechny druhy hodnocené IUCN a bylo by to 100% správně). OJJ, Diskuse 13. 5. 2024, 17:00 (CEST)
@OJJ: Byl jsem špatně pochopen. Nemyslel jsem přebírání celých článků z neuronek, spíš jenom nějak označit, že pro tuto editaci byla použita ta a ta neuronka, tak jako se označuje např. HotCat. --Marek Genius (diskuse) 13. 5. 2024, 17:15 (CEST) Nemyslel jsem citovat ve významu „doslovně převzít“, ale citovat ve významu „oznámit použití“, prostě ve významu našich referencí: Alty v editaci č. 123456 byly vygenerovány nástrojem Generátor alternativních textů verze 2 a převzaty bez úprav / a následně upraveny lidským zásahem. Ideálně v nějaké standardizované podobě (dané šablonou, jako je Šablona:Překlad: „V tomto článku byl použit překlad textu…“), aby si tu formulaci každý uživatel nepsal podle sebe, aby to bylo později pro stroj snáze zpracovatelné. --Marek Genius (diskuse) 13. 5. 2024, 18:46 (CEST) Upraveno: --Marek Genius (diskuse) 13. 5. 2024, 18:59 (CEST)
@OJJ: S tím souhlasím, je to tak. Ale pokud už tyto nástroje někdo použije (jako třeba u zde zmíněných altů), je podle mě vhodné to uvést. Může to pak taky sloužit ke statistice (naší interní, nebo třetího subjektu, až někdo bude psát o Wikipedii diplomku) atd. Částečně bych to přirovnal i k metadatům u fotografií, kde přístroj automaticky zaznamenává značku přístroje, konkrétní model, název aplikace (softwaru), nastavení clony. Když se to napíše, maximálně to bude napsané zbytečně, když se to nenapíše, už se to zpětně nedohledá. --Marek Genius (diskuse) 13. 5. 2024, 16:55 (CEST)
  1. Nevím, jestli bychom měli zrovna oficiálně podporovat komerční GPT. Kolega Tchoř měl ke spojování komerčních aplikací a Wikipedie dost výhrady už třeba u Discordu, odkaz na placený program v oficiální nápovědě mohou mnozí nést ještě neliběji (když nám v něm navíc roste konkurence, co ještě vyžírá naše texty).
  2. Alty považuji za nesmyslnou buzeraci a pochybuji, že je vůbec někdo někdy použil. Pokud budou recenzenti požadovat podobné slohové cvičení u obrázků, pak se nelze divit, že NNČ jsou jednotky za rok. Navíc u dlouhých hesel je to jen další kB zátěž, v tomto případě balast.
  3. Za nápad přesto díky, ale s Pythonem neumím prakticky nic, takže nevyužiji. :-)
  4. I díky současnému boomu AI a neprediktabilitě jejího vlivu do budoucna zhnuseně hledím vstříc další dekádě (což sem nepatří, ale za těch 100 tisíc editací plus mi to odpustíte).

OJJ, Diskuse 11. 5. 2024, 19:28 (CEST)

Je pravda, že se mi to nelíbí. Principiálně. Wikipedii by měli tvořit editoři, nikoliv AI. Zabránit tomu, aby editoři tajně používali takové pomůcky, jistě nelze, ale nepodporoval bych je v tom. Do budoucna tam mohou vzniknout i legislativní problémy, protože legislativa se jistě v této oblasti ještě bude bouřlivě vyvíjet. A je otázka, zda právní analýza za deset let s nějakými novými zákony bude považovat licenci CC-BY-SA kompatibilní s takto vygenerovanými texty.
Ale osobně by mne tam spíš mrzelo zanikání "českosti" Wikipedie. Tyhle modely jsou obvykle trénované na angličtině a na těch textech je to v různých drobných aspektech i vidět (a jistě jsou i jiné aspekty, na kterých to vidět není, ale jsou tam). Já považuji kulturní rozmanitost za v principu užitečnou věc a že Čech přemýšlí jinak než Američan (a jinak než americká umělá inteligence), to mi přijde jako dobré.--Tchoř (diskuse) 11. 5. 2024, 20:39 (CEST)
@Tchoř: Ohledně legislativy a licencí: tady se nebavíme o literárních dílech podle autorského zákona, ale o krátkých výstupech z automatického rozpoznávání obrazu. Ty právní spory se týkají spíš otázky "co se stane, když AI napíše román" a podobně. Tohle ale nemá s autorským zákonem nic společného. A taky nikomu neradím, aby ty výstupy dával do článků bez úprav a bez kontroly. Ohledně českosti: Modely OpenAI jsou trénované na všech dostupných jazycích včetně češtiny, i když souhlasím, že angličtiny dostávají nejvíc, protože je nejrozšířenější, a tak jsou v ní nejlepší. Ale i v jiných jazycích jsou mezi nejlepšími LLM, které existují. Je pravda, že zdaleka nejsou dokonalé, a právě proto se po nich musí výstupy kontrolovat a editovat. (Mimochodem se mi zdá, že nejvíc mizerné češtiny na Wikipedii generují rodilí mluvčí, kteří neumějí psát nebo překládat. Za to AI nemůže.)--Jan Spousta (diskuse) 11. 5. 2024, 21:01 (CEST)
@OJJ:
  1. Svůj počítač/mobil i internet do něj také většina z nás pořizuje komerčně. Stejně tak servery Wikipedie ani elektřina do nich nepadá z nebe zadarmo. Wikipedie není utopie mimo veškerou komerci, ale snaha vytvořit encyklopedii, jejíž text je svobodný, a to i s využitím komerčních služeb tam, kde je to potřeba. - Mimochodem čistě open sourcové LLMs jsou v posledních letech zhruba jednu generaci (= jeden dva roky) za OpenAI a dalšími komerčními modely. Takže podobnou kvalitu výstupů za rok možná dostaneme někde bezplatně, akorát zase špička komerčních modelů už bude v té době dál.
  2. Souhlasím, že alty jsou přežitek nultých let. (Nb jsou přežitek právě proto, že umělá inteligence začíná sama "vidět".) Pak by to ale chtělo změnit návod Nápověda:Bezbariérová Wikipedie a související návody.
  3. OK, při svém postoji k altům bys to asi nevyužil ani tak, takže nevadí. Kdybys potřeboval nějaký článek projet, tak mi řekni, a já ti pošlu výstup.
  4. Já si myslím, že AI v řadě věcí i pomůže. Vliv bude podle mě smíšený, k dobrému i špatnému. To platí i pro Wikipedii. Takže nehledím budoucnosti vstříc zhuseně, ale spíš přemýšlím, jak posílit ty dobré stránky a potlačit špatné.
--Jan Spousta (diskuse) 11. 5. 2024, 20:48 (CEST)

Jak píšou ostatní: Je to skvělý nápad, jak smysluplně využít AI. Ale jeho prezentovaná aplikace už vlastně nedává moc smysl.

  • Alty jsou na Wikipedii vůbec řešeny špatně. Alt by měl být součástí metadat obrázku, tj. uveden přímo v úložišti na Wikimedia Commons, aby byl snadno dostupný při jakémkoliv převzetí obrázku (třeba i mimo Wikipedii). Projekt strukturovaných dat na Commons tohle, k mému údivu, zatím vůbec neřeší.
  • Většina lidí alty nevyužije. Tedy pokud bychom pro všechny velké obrázky na Wikipedii (nebo na celém Commons) vygenerovaly alty, poměr impact : prostředky (zejména ty finanční) by byl blízko nule. (I když WMF a OpenAI by se možná na něčem mohly domluvit, když nejde o profit. Ale řekl bych, že priority jsou teď někde jinde.)
    • Nápad na snížení prostředků: Vygenerovat alt pomocí GPT-4 jen v jednom jazyce (angličtině) a do ostatních je strojově přeložit. To, co vidím, je přece nezávislé na tom, kterým jazykem mluvím. (Dobře, tohle není tak úplně pravda, viz třeba název barvy nebo en:Color term#Color-term hierarchy.)
  • Jako nejlepší řešení se mi jeví nástroj (třeba rozšíření prohlížeče), který bude napojený na API OpenAI a uživateli bude generovat alty na vyžádání. API je samozřejmě placené, ale dovedu si představit, že člověk se zrakovým postižením by mohl dostat určité množství obrázků za jednotku času zdarma. (Tady už vlastně vůbec neřeším alty jenom na Wikipedii.) Teoreticky by se pak jednou vygenerovaný alt mohl někam uložit, aby ho mohli využít další lidé a šetřily se prostředky.
    • A tímto by se vyplňování atributu alt v podstatě stalo přežitkem.

Kdyby vás napadlo, jak ještě umělou inteligenci nového typu na Wikipedii použít, tak budu rád, když se podělíte se svými myšlenkami. Za poslední rok, kdy se umělá inteligence řeší jako nikdy předtím, jsem spíš nabyl přesvědčení, že umělá inteligence nového typu zatím na Wikipedii využití spíš nemá. (Tvoje aplikace je vlastně první způsob, kde ten potenciál vidím.) Protože s čím potřebuje Wikipedie pomoct a co může umělá inteligence nového typu nabídnout?

  • Nový obsah jako výstup z LLMWP:OV (WP:LLM). Do jaké míry je obsah svobodný?
  • Ilustrace článků skrze Midjourney, DALL-E, Stable Diffusion aj. – Opět autorská práva. A vůbec zkreslení reality.
  • Fact-checking – LLM halucinují smyšlené zdroje a navíc mohly být trénovány na obsahu, který pak mají validovat.
  • Korektury – LLM by to pravděpodobně dokázaly (jsou to „jazykové“ modely), ale zase jsou to velké prostředky na něco, co do jisté míry zvládnu řešit korektorem v prohlížeči.
  • Odhalování problematických editací – dtto.

Pro to, abychom nezůstali v době kamenné, podle mě stačí zapojit nějakou umělou inteligenci, respektive strojové učení. Což je jenom statistika nad množstvím dat. A dat, těch se tu za dvacet let už vygenerovalo docela dost. --Matěj Suchánek (diskuse) 12. 5. 2024, 11:35 (CEST)

@Matěj Suchánek: Díky za reakci, Matěji. Souhlasím, že alty, pokud jsou vůbec potřeba, by měly být řešeny centrálně na Commons (a mohou tam klidně být v různých jazycích, a mohou tam být v různých jazycích i standardní popisky obrázků a standardní náhradní texty k nim). Ale nesouhlasím, že aplikace nedává moc smysl: alty totiž se reálně teď a tady požadují naší nápovědou a byly opakovaně vyžadovány různými recenzenty pro NČ a DČ. Přitom někteří lidé (jako třeba já) je dávají dohromady dost obtížně. A je očividné, že daleko dřív bude ChatGPT 4 i s mou aplikací v muzeu softwaru, než někdo zařídí správné ošetření altů na Commons. Jak píšeš, ještě to tam ani nezačali řešit.
Pokud jde o aplikace generativní AI, tak zatím tu obecně máme překladače (Příspěvky -> Překlady), které hodnotím jako velmi užitečné (rovnou navrhují interní odkazy a šetří moje nemotorné prsty), a tam nejspíš nikdo neřeší, do jaké míry je obsah svobodný, i když technicky vzniká na velice podobném základu jako výstupy univerzálních LLM - jen je to model úzce specializovaný.
  • V tuto chvíli mi generování nového textového obsahu připadá problematické proto, že ani nejlepší LLM ještě nepíší tak, aby to nevyžadovalo pořádnou korekturu, stejně jako zmíněné překladače. To si ale běžní uživatelé neuvědomují nebo ani nemají jazykový cit potřebný pro opravu takto vygenerovaných textů. Není to tedy zatím ještě technologie, kterou bychom chtěli doširoka nabídnout všem wikipedistům.
  • Ilustrace článků: to vlastně není potřeba tady implementovat. Jen by bylo dobré, kdyby nám pro tyto účely nadace zaplatila profi přístup k modelům. Pokud někdo uvidí, že mu model pomůže, použije ho mimo Wikipedii a obrázek nahraje na Commons (pokud je licence OK). Myslím, že by to mohlo být užitečné pro kreslení různých schémat a map ("narýsuj schéma elektrického obvodu, v němž je ke spotřebiči připojen zdroj a sériově zapojena cívka"). Pro malování rádoby realistických scén se to tady opravdu moc neužije.
  • Fact-checking - v tom nelze konkurovat Googlu a spol. (kteří samozřejmě AI také implementují, ale my se o to nemusíme starat)
  • Korektury - současné LLM umí dělat korektury na hrubé úrovni (hodně zprasený text, doplnění diakritických znamének tam, kde nejsou, a podobně). Ale takové hodně nekvalitní texty my tady většinou rovnou mažeme. Na profesionální redaktorskou korekturu AI ještě zdaleka nestačí. Je ale dost možné, že existuje nějaká oblast "mezi", kde by se LLM mohl uplatnit (napadá mě chytání slohových chyb, jež se těžko hledají pomocí regulárních výrazů, třeba vypadnutí z větné vazby, anebo upozorňování na netypické překlepy). Je pravda, že nestačíme opravovat ani věci, jež reguláry "vidí", a nelze asi nechat LLM, aby do Wikipedie zapisoval bez lidské kontroly. Nicméně bych to téma nezahazoval úplně, stojí to za vyzkoušení. A časem to asi bude aktuálnější, jak se LLM budou lepšit.
  • Odhalování problematických editací - tam si myslím, že by bylo použití AI na místě, pokud by šlo o zpřesnění dosavadního systému označování podezřelých editací. Mohlo by to zase trochu zkvalitnit stávající model a ušetřit práci patrolérům. Ale mělo by se to řešit centrálně - vandalismus působí na všech wiki podobně.
Dík za nápady a měj se,--Jan Spousta (diskuse) 12. 5. 2024, 12:20 (CEST)
Zformuloval jsem to asi trochu nešťastně. Jasně, pro účely těch NČ a DČ (kde teda ty alty prý vyžadujeme) to dle prezentovaných příkladů evidentně funguje velmi pěkně, nevýhodou je snad jen ten poplatek. Ale asi tím nepůjde vyřešit „nedostatek altů“ (který ale podle mě stejně není vyvolaný skutečnou poptávkou a vůbec by se neměl řešit tady).
  • Ad překlepy: Před časem jsem testoval, jestli ChatGPT vůbec dokáže gramatiku opravit (zejména mnou oblíbené zájmeno „jenž“). Použil jsem k tomu příklady přímo z Wikipedie: [1].
  • Ad problematické editace: Vím o tom, že už jsou na to připravené dva nové modely. Jeden z nich má být založen na BERTu, což je LLM (pro úplnost: druhý ne).
--Matěj Suchánek (diskuse) 12. 5. 2024, 15:36 (CEST)

Korektor založený na AI

Podle nápadu @Matěj Suchánek: jsem napsal jednoduchý korektor, který na jednotlivé kapitoly holého textu pouští ChatGPT 4 Turbo s promptem "Pokud jsou v následujícím textu hrubé jazykové chyby nebo překlepy, popiš je a navrhni opravu. Také upozorni na místa, kde sloh není v souladu s akademickým stylem psaní. Pokud je text v pořádku, nepiš nic a nekomentuj ho:" Na hledání chyb strojového překladu apod. se to moc neosvědčuje (LLM je zhruba stejně chytrý - či blbý - jako překladač). Zkusil jsem ho ale pustit na NČ Československý pavilon na Světové výstavě 1967 a pár užitečných komentářů to dalo, samozřejmě mezi různými chybami. Celkově mě spuštění přišlo na 13 centů.

Výstup modelu je mnou okomentovaný zeleně (užitečné upozornění na možnost zlepšení textu, i když samotný návrh modelu nemusí být optimální) nebo červeně (chyba). Nekomentovaná doporučení jsou na hraně správnosti nebo model nemá potřebnou informaci (tak, jak je naprogramován, nevidí např., kde je kursiva, i když i to by se mu dalo ukázat).

Celkem je 21 chybných doporučení a 21 užitečných (včetně nalezení několika opravdových chyb v textu), takže půl na půl. Samozřejmě u jiných článků může být poměr horší; tady byl model užitečný tím, že v řadě případů odchytil žurnalistické zkratky, které do akademického textu pronikly z jeho novinářských zdrojů. Jasné je tak to, že LLM není ani zdaleka neomylný, ale zároveň se pro vylepšení některých článků může hodit.

Rozšířený obsah

úvod Text je obecně napsán korektně, avšak objevují se zde místa, která by se dala stylisticky vylepšit pro akademický kontext:

1. „v závěru prohlídky mohli návštěvníci v expozici Kinoautomat zhlédnout první interaktivní filmový snímek na světě nazvaný Člověk a jeho dům.“ — Fráze "mohli návštěvníci" je stylisticky neformální. Lépe by bylo formulovat jako "návštěvníci měli možnost zhlédnout".

2. „k občerstvení příchozích sloužily restaurace a snack bar.“ — Slovo "snack bar" by mohlo být považováno za příliš neformální v akademickém textu, doporučuji použít "občerstvení".

3. Věta "Objekt pavilonu chtělo po výstavě získat město Montréal, ale jejich nabídku českoslovenští zástupci odmítli." může být přeformulována pro zlepšení fluidity a zdůraznění subjektu věty: "Po výstavě město Montréal projevilo zájem o získání objektu pavilonu, ale českoslovenští zástupci tuto nabídku odmítli."

Celkově by se text mohl upravit pro lepší akademický tón a formalitu, ale tyto změny jsou relativně drobné a primárně se zaměřují na stylistické nuance.

Historie Světová výstava 1967 ... V textu je několik jazykových nedostatků a stylistických nejasností:

1. **Geografické názvy**: Ostrovy Sainte Hélene a Notre Dame by měly být v češtině přepsány jako Sainte-Hélène a Notre-Dame pro zachování konzistence s francouzským pravopisem.

2. **Slovo "ostrovech"**: Ve frázi "na ostrovech Sainte Hélene, Notre Dame a poloostrově Cité du Havre" by bylo vhodnější použít výraz "v ostrovech" pro zlepšení stylu a pravdivosti výpovědi, protože se akce koná "v místě" a ne "na místě".

3. **Předložka "na" u řeky**: Výraz "na řece svatého Vavřince" by měl být opraven na "u řeky svatého Vavřince" pro správné geografické umístění.

4. **Datumy a formulace**: Datum "16. června 1964" by mělo být následováno spojkou "v" (ze dne 16. června 1964) pro lepší čitelnost a stylistickou správnost.

5. **Akademický styl**: Použití termínu "republika dostala" může působit neformálně a nejasně. Mohlo by být lepší specifikovat, že "Československo bylo pořadateli přiděleno..." pro jasnější a formálnější vyjádření.

6. **Plocha v m^2**: Použití slova "metrů čtverečních" může být zbytečně dlouhé a technické. Může být užitečnější použít jednoduše "m^2".

Opravená verze: Historie Světová výstava 1967 se konala od 27. dubna do 29. října 1967 na ostrovech Sainte-Hélène, Notre-Dame a poloostrově Cité du Havre u řeky svatého Vavřince, a to u příležitosti stého výročí vyhlášení kanadské konfederace (1867). O československé účasti na výstavě rozhodla vláda na svém zasedání 30. října 1964, kdy navázala na usnesení Ústředního výboru Komunistické strany Československa (ÚV KSČ) ze dne 16. června 1964. Pořadatelé pak přidělili Československu prostor na ostrově Notre-Dame o výměře 5043 m^2. V sousedství pavilonu dostaly své prostory Itálie a Venezuela. Generálním komisařem československé účasti na výstavě se stal Miroslav Galuška.

Příprava pavilonu Na koncepci ... Text je celkově napsán korektně a odpovídá formálnímu, akademickému stylu. Obsahuje potřebné informace a je strukturován logicky. Nicméně mohu upozornit na dva drobné jazykové detaily:

1. V první větě je mírně nešikovně formulované slovosled a nedostatek gramatické jasnosti: "Na koncepci československého výstavního prostoru byla 7. listopadu 1964 vypsána veřejná anonymní soutěž." Lepší by bylo slovosled upravit takto: - "Veřejná anonymní soutěž na koncepci československého výstavního prostoru byla vypsána 7. listopadu 1964."

2. Výraz „vítězně vzešlo“ v kontextu výher ve veřejné soutěži může znít mírně neobvykle, ačkoliv není přímo gramaticky chybný. Jde spíše o stylistickou preferenci. Možná úprava by mohla být: - "Ve veřejné soutěži zvítězil návrh architektů Miroslava Řepy a Vladimíra Pýchy."

Tato malá úprava zlepšuje čitelnost a jasnost textu. Celkově je ale text napsán správně a adekvátně k jeho účelu.

Výstava Za dobu konání výstavy... Text je většinou gramaticky správný a je napsán formálně, takže je vhodný pro akademický styl psaní. Nicméně, lze identifikovat několik drobných stylistických zlepšení:

1. Slovo "zavítalo" může působit poněkud neformálně. Můžeme ho nahradit formálnějším výrazem, například "přišlo" nebo "navštívilo".

2. V termínu "osmimiliontý" by bylo vhodnější použít spojovník pro lepší čitelnost: "osmi-miliontý".

3. Věta "jeden z exponátů výstavy, a sice tapiserii Javor a lípa od Juraje Kréna" by mohla být pro lepší srozumitelnost přeformulována: "tapiserii 'Javor a lípa' od Juraje Kréna, která byla jedním z exponátů výstavy".

To jsou drobné úpravy, které by mohly text dále zkvalitnit. Celkově je však text dobře napsán a vhodný pro akademické účely.

Po výstavě O pavilon mělo záje... V textu se objevují jisté stylistické nedostatky, které nejsou příznačné pro akademický styl psaní:

1. Využití některých výrazů není úplně formální, například "mělo zájem", "chtěl stavbu odkoupit" nebo "odmítli" by mohly být nahrazeny formalizovanějšími formulacemi, jako "projevilo zájem", "usiloval o odkoupení stavby" a "nabídku nepřijali".

2. Fráze "poblíž Ganderu" může být nahrazena přesnějším geografickým popisem, například "nedaleko Ganderu".

3. Použití fráze "polovina posádky" je v akademickém textu příliš neformální a mohlo by být nahrazeno formalizovanější formulí, například "polovina členů posádky".

4. Fráze "další čtyři osoby pak svým zraněním podlehly v nemocnicích" může být nahrazena formalizovanějším výrazem: "další čtyři osoby následně zemřely na následky zranění".

5. Fráze "jako výraz poděkování" může zavánět jistou emocionalitou, která se v akademickém psaní obvykle vyhýbá, mohla by být nahrazena opisem, který konkrétněji a objektivněji popisuje změnu rozhodnutí.

6. Přílišný detail o děnících po výstavě (například informace o restauraci) může působit nadbytečně a mohly by být prezentovány stručněji nebo v jiném oddílu textu.

Text jako celek je jinak srozumitelný a věcně korektní, ale pro akademické účely by mohl profitovat z vyšší formalizace a strukturování informací.

Objekt Zastavěná plocha činila... V daném textu jsou několik jazykových nedostatků a místa, která nejsou úplně v souladu s akademickým stylem psaní:

1. **"řeky svatého Vavřince"** - Název řeky by měl být psán s velkým počátečním písmenem: "řeky Svatého Vavřince".

2. **"skleněná fontána navržená René Roubíčkem"** - Slovosled působí nepřirozeně. Přirozenější by bylo formulovat větu takto: "skleněná fontána, kterou navrhl René Roubíček".

3. **"Pavilon se dočkal kladných hodnocení. Mezi jinými například v referátu o výstavě otištěném na stránkách deníku New York Times."** - Tato věta není úplně přesná a může vést k nedorozumění. Referát nemůže být "otištěn", spíše bylo o výstavě napsáno nebo referováno. Opravená verze by mohla znít: "Pavilon získal kladná hodnocení, mezi nimi například v článku o výstavě, který byl publikován na stránkách New York Times."

4. Akademický styl by měl být více objektivní a precizní, zatímco formulace jako "Mezi jinými například" působí poněkud neformálně a mohly by být vynechány pro zvýšení formálnosti a přesnosti.

Opravená verze textu může znít například takto: "Zastavěná plocha objektu byla 3000 metrů čtverečních a zbytek pozemku tvořily sadové úpravy. Před výstavní budovou byla umístěna nejen fontána v podobě 4,5 metru vysoké plastiky od Bohumila Eliáše, ale také skleněná fontána od Reného Roubíčka. Vstup do objektu byl umožněn jak od řeky Svatého Vavřince, tak také z jedné z hlavních návštěvnických cest na výstavišti, která je pojmenována Smetanova třída na počest českého hudebního skladatele Bedřicha Smetany. Pavilon obdržel kladná hodnocení, včetně zmínky v článku o výstavě publikovaném v New York Times."

Exteriér Konstrukce jednopatro... Text má několik jazykových nedostatků a stylistická záležitost k diskusi:

1. **Jazykové chyby a překlepy:**

- **"hurdiskami"** - zřejmě se jedná o překlep. Správně by mělo být "dřevěnými deskami" nebo "obkladovými deskami", v závislosti na kontextu. Slovo „hurdisky“ neexistuje v českém jazyce.

- **"manželi Jindřiškou a Pravoslavem Radovými"** - chyba ve shodě přívlastku s podstatným jménem v instrumentálu plurálu. Správně by mělo být "manželi Jindřiškou a Pravoslavem Radovými“ nebo ještě přesněji "manželi Jindřiškou a Pravoslavem Radovými".

2. **Stylistická záležitost:** - Text používá poměrně formální a akademický styl, což je vhodné. Nicméně, využití termínů jako „snack bar“ může působit mírně neformálně. Možná by bylo lepší použít "občerstvení" nebo "malé občerstvení".

Opravený text by mohl vypadat takto:

"Exteriér Konstrukce jednopatrové výstavní budovy s půdorysnými rozměry 51 × 33 metrů stála na čtyřech pilířích úhelníkového tvaru umístěných v rozích objektu. Přízemí bylo prosklené okny bez rámu, zatímco v prvním patře se okna nenacházela. Zvenčí bylo první patro obloženo dřevěnými deskami, které byly pokryty specifickou světle béžovou glazurou. Jednotlivé pruhy byly odděleny svislými zářezy. Uvnitř objektu se nacházelo excentricky umístěné atrium, které umožňovalo zeleni z okolního prostředí pronikat dovnitř. V sousedství pavilonu stála budova, která hostila restaurace a malé občerstvení. K výstavním prostorám byl objekt spojen přízemní vstupní halou, na jejíž střeše se nacházela terasa se keramickými figurami vytvořenými manželi Jindřiškou a Pravoslavem Radovými."

Expozice Na návrzích interiérů...

Text obsahuje několik drobných chyb a nepřesností, které by bylo vhodné opravit pro zlepšení čitelnosti a odbornosti vyjadřování:

1. **Hrubá jazyková chyba** - "Na návrzích" by mělo být "Na návrzích" Oprava: "Na návrzích interiérů pavilonu pracoval..." by mělo být "Na návrhu interiérů pavilonu pracoval..."

2. **Nepřesné formulace** - "věstonická venuše" by měla být napsána s velkým začátečním písmenem jako "Věstonická venuše". - "svatováclavské koruny" by mělo být s velkým S a K jako "Svatováclavské koruny".

3. **Slohové nevhodnosti** - Akademický text by se měl vyhnout útržkovitým větám a stylisticky by měl být více konzistentní a formačně nezávislá na znalostech čtenáře o detailech některých exponátů, umělců nebo technologií.

4. **Překlep** - "tavenou vitráž" je možná překlep nebo odborně nepřesný termín, pokud se skutečně nemyslí technika tavení skla použitá pro výrobu vitráží.

Výše zmíněné změny by mohly text učinit přesnějším a lépe odpovídajícím akademickému stylu vyjadřování.

Restaurační prostory Restaurač... V následujícím textu je několik gramatických chyb, překlepů a stylistických nedostatků. Dále jsou navrženy opravy:

1. **Gramatická chyba v časování slovesa:** "působíci" je chybně použité slovo. - Oprava: "působící"

2. **Slohová nepřesnost:** Věta "V jejím čele stál Miroslav Hříbek, tehdejší ředitel pražského hotelu Alcron, který totožnou pozici zastával i na předchozí Světové výstavě v roce 1958 v Bruselu." může být přeformulována pro lepší čitelnost a přesnost. - Oprava: "V čele restaurace stál Miroslav Hříbek, tehdejší ředitel hotelu Alcron, jenž zastával stejnou pozici i během předchozí Světové výstavy v Bruselu roku 1958."

3. **Slohová nepřesnost:** Výraz "vydělala" se může zdát nevhodně použitý v kontextu akademického psaní. - Oprava: "dosáhla tržeb"

4. **Slovosled a stylistická chyba:** "na jednu židli tržbu ve výši 6380 dolarů" je neobvyklé slovosledné spojení. - Oprava: "tržbu ve výši 6380 dolarů na jednu židli"

5. **Formulace s obecnějším neboli kolokviálním výrazem:** Slovo "párky" může být vnímáno jako neformální. - Oprava: "párové klobásy"

6. **Slohová nepřesnost:** Věta "Některé ingredience jako třeba ryby..." obsahuje konverzační výrazy "jako třeba", které mohou působit neformálně. - Oprava: "Některé ingredience, jako ryby..."

7. **Nejednotnost v použití číslovek:** Text obsahuje mix číslic a slovních vyjádření čísel, což může být považováno za stylistickou nekonzistentnost. - Doporučení: Buď používat čísla vyjádřená slovy, nebo číselné hodnoty pro udržení stylistické konzistence.

Celkově by text mohl být více akademicky orientovaný přesnějším a konzistentnějším slohovým jazykem, zejména při používání termínů a strukturování vět.

Ostatní výstavní prostory Mimo... Text obsahuje několik menších jazykových nepřesností a pár nesrovnalostí ve slohu:

1. **"Cikánská cimbálovka Farkašovci zvoucí"** – Použití termínu "cikánská" může být považováno za pejorativní. Lépe by bylo použít termín "romská" nebo obecnější "kapela Farkašovci". Také, místo slova "zvoucí" je vhodnější tvar "zvoucích" tak, aby správně korespondovalo s množným číslem podmětu (kapela).

Oprava: "romskou kapelu Farkašovci, která zvala kolemjdoucí k návštěvě a posezení."

2. **"živáňská pečeně složená ze tří druhů mas"** – Správně by mělo být "živáňská pečeně, složená ze tří druhů masa". (POZN J.S.: HLAVNÍ SLOHOVÁ CHYBA TU SPOČÍVÁ V NADBYTEČNÉM "SLOŽENÁ", ALE I TO "MASA" JE LEPŠÍ NEŽ "MAS")

Oprava: "živáňská pečeně, složená ze tří druhů masa"

3. Slohová nesrovnalost v akademickém textu: - Opisování konkrétních výrazů lidové kultury ("živáňská pečeně") nebo obecně populární jazyk ("z bedny") může působit neformálně. V akademickém textu by bylo vhodnější zachovávat konzistentně formální a informativní styl.

Vylepšení slohového výrazu: "...představení s názvem Revue z bedny..."

4. **"ve kterém Laterna magika až patnáctkrát denně uváděla představení"** – Formulace "až patnáctkrát denně" může působit zbytečně kolokválně.

Oprava: "ve kterém Laterna magika pravidelně, až patnáckrát denně, uváděla představení..."

Celkově by text prospěl důslednějšímu dodržování formálnějšího slohu a přesnější usočení jazyka ve smyslu gramatiky a slovní volby.

Odraz v kultuře Pro Krátký fil... Text obsahuje pár stylistických nedostatků, které nejsou úplně v souladu s akademickým stylem psaní:

1. **Sloveso "natočil" je poněkud neformální** - Místo "natočil" by mohl být použit formalnější výraz, například "vytvořil" nebo "realizoval".

2. **Příliš jednoduchý sloh** - Akademický text obvykle preferuje složitější a detailnější popis situace. Místo jednoduchého konstatování by mohl být text doplněn dalšími informacemi o historii, významu pavilonu nebo specifických rysů dokumentu.

3. **Název filmu by měl být v uvozovkách** - Akademický styl vyžaduje, aby názvy děl byly uvedeny v uvozovkách nebo kurzívou. Správně by tedy mělo být: dokumentární film pojmenovaný „Československý pavilon“.

Opravený text může vypadat takto: Odraz v kultuře Pro Krátký film Praha vytvořil režisér Rudolf Krejčík podle svého vlastního scénáře třicetijednominutový dokumentární film nazvaný „Československý pavilon“. Komentář k snímku přispěli herec Miroslav Horníček a hlasatel Richard Honzovič.

Tady je syntax v Pythonu 3, kdybyste si někdo chtěl hrát s různými prompty i pro jiné účely (LLM může text překládat, sumarizovat, komentovat jeho jiné aspekty...):

Rozšířený obsah
""" Generátor návrhů na alternativní popisky (alt) k obrázkům na zadané stránce české Wikipedie
Použití:
- níže zadejte
--  název článku na české Wikipedii, který chcete vylepšit   /page_title/ 
--  počet návrhů k jednomu obrázku, ze kterých budete vybírat nejzdařilejší   /suggestions/
--  svůj api_key pro OpenAI APIs   /my_api_key/ - lze zakoupit na webu firmy OpenAI
- spusťte program v Pythonu 3 (je potřeba mít nainstalovaný balíček openai)
- na Wikipedii otevřete článek klasickém editoru
- z výpisu vyberte pro každý obrázek nejzdařilejší návrh
- do odkazu na obrázek vložte "|alt=popis", a to na konec, před uzavírací dvojité hranaté závorky
--  např. [[Soubor:a.png|náhled|Písmeno A|alt=Černé tiskací A na bílém pozadí.]]
- případně ještě zeditujte, pokud návrh popisu má chyby (pozor, program občas něco nepozná nebo halucinuje)
- stránku na Wikipedii uložte
Neumí vektorovou grafiku. Vynechává galerie, obrázky vyvolané šablonami, obrázky bez popisků;
pro tyto obrázky je možné samostatně zavolat funkci altpopis(pic) níže s jménem obrázku jako argumentem.
Autor programu: Jan Spousta
"""
import requests
import re
import time
from openai import OpenAI

# Vstupy: následující dva řádky změň podle své potřeby
page_title = "Fafertin"  # jméno článku v uvozovkách
suggestions = 2  # počet návrhů popisky ke každému obrázku (čím víc, tím déle to trvá a víc peněz stojí)

client = OpenAI(api_key=my_api_key)   # za my_api_key dosadit klíč od firmy OpenAI - lze ho zakoupit na jejich webu


# Vlastní program
def get_image_names(page_title):
    """
    Funkce vytvoří seznam obrázků použitých ve wikitextu stránky v argumentu
    """
    # Define the API endpoint for Czech Wikipedia
    api_url = "https://cs.wikipedia.org/w/api.php"

    # Set parameters for the API request to get wikicode
    params = {
        'action': 'query',
        'format': 'json',
        'titles': page_title,
        'prop': 'revisions',
        'rvprop': 'content',
        'rvslots': '*'
    }

    try:
        # Make the API request
        response = requests.get(api_url, params=params)
        data = response.json()

        # Navigate through the JSON response to find the page's wikicode
        pages = data['query']['pages']
        page_id = next(iter(pages))
        wikicode = pages[page_id]['revisions'][0]['slots']['main']['*']

        # Use regular expression to find all instances of image links
        image_names = re.findall(r'\[\[(?:File|Image|Soubor):(.+?)\|', wikicode)

        return image_names

    except Exception:
        print("Page not found or other error in API response.")
        return []


def altpopis(pic):
    """
    Funkce k zadanému obrázku na Commons navrhne popis v češtině pomocí modelu gpt-4-turbo; cenově vychází
    v řádu 1 USD za 100 popisků. Vstupem je řetězec obsahující obrázek na Commons, např. "Brie noir.jpg".
    Neumí vektorovou grafiku.
    """

    prompt = """
       Krátce popiš obrázek. Soustřeď se na hlavní vyobrazený předmět.
       Začni druhem obrázku, např. Rytina muže... nebo Černobílá fotografie skupiny lidí...
       Nevypisuj své další znalosti o předmětu, který je zobrazen.
       """
    commons_path = "https://commons.wikimedia.org/wiki/Special:FilePath/"
    msg = [{
        "role": "user",
        "content": [
            {"type": "text",      "text": prompt},
            {"type": "image_url", "image_url": {"url": commons_path + pic,}, },
        ],
    }]

    tries, altdesc = 0, "Popis obrázku se nepodařilo získat"
    while tries < 4:
        tries += 1
        try:
            response = client.chat.completions.create(model="gpt-4-turbo", messages=msg, max_tokens=600)
            altdesc = response.choices[0].message.content
            break
        except Exception:
            time.sleep(3)

    print("|alt="+altdesc)
    return altdesc


# Vyhledá si obrázky, postupně k nim vygeneruje návrhy popisek a vypíše je.
obrazky = get_image_names(page_title)
for img in obrazky:
    print(img)
    print("\n")
    for i in range(suggestions):
        altpopis(img)
        print("\n")

Takže díky za nápad, pomoci opravdu může.--Jan Spousta (diskuse) 12. 5. 2024, 16:35 (CEST)

Ty jo, to je pěkný. Budoucnost je blízko. :) V praxi to je vlastně hrozně snadný, jen chytit ten nápad za pačesy. --frettie.net (diskuse) 12. 5. 2024, 19:00 (CEST)
Tohle si dokážu představit jako jednu z recenzí kandidáta na DČ/NČ. A co jsem to teď zkoušel, mělo by to jít do jisté míry po částech ctrl+C/ctrl+V i ve free verzi... --JAnD (diskuse) 12. 5. 2024, 19:29 (CEST)
@JAn Dudík: To by nebyla recenze, ale ideální způsob, jak dobrovolníkům znechutit psaní delších hesel. Stylistiku nechť si recenzent upraví sám podle jazykového citu. --OJJ, Diskuse 12. 5. 2024, 19:57 (CEST)
@OJJ: Stylistika je jen do jisté míry otázka jazykového vkusu. Hodně věcí je daných a popsaných různými pravidly a doporučeními, která bychom měli ctít, aby naše texty nezněly jako od Hotentotů nebo dokonce jako od AI. A kromě toho program v tom článku našel i očividné chyby: třeba nelze psát jeden a ten samý ostrov jednou Notre Dame a o kus dál jako Notre-Dame. Na druhou stranu máš pravdu, že ten surový výstup počítačového programu by určitě znechutil kdekoho, zejména když uvážíme, kolik je v něm je nesmyslů. Takže si myslím, že správný postup je, aby program spustil někdo soudný a správné češtiny znalý, vyextrahoval z výpisu užitečné poznatky a pokud možno je sám v článku rovnou uplatnil.--Jan Spousta (diskuse) 12. 5. 2024, 20:09 (CEST)
@Jan Spousta: Já měl s kontrolou pravopisu a stylistiky stejný nápad, akorát třeba Bing Copilot někdy nenašel ani cíleně zavlečené překlepy. Každopádně někomu do recenzí napsat podobným stylem připomínku, že mu někde chybí tiret, to je skutečně cesta, jak mu psaní znechutit. Zrovna o udělování DČ jsme se bavili už někdy loni v souvislosti s Popiš památku a osobně v tomto ohledu zastávám zdravý přístup, že DČ nemají přibývat zcela nekontrolovaně, ale recenze nemají představovat podobný buzerproces, kde se bude rozebírat pomalu každé použité slovo či věta. Na alty a podobné volovinky mám pak názor jednoznačný > zrušit jako balast. Někdy v dřevních dobách, když jsem tu začínal a plodil "DČ", jsem teprve zpětně viděl jejich obsahové nepřesnosti i stylistické neobratnosti. Řada kolegů se ale vyžívá spíše v řešení marginalit a omalovánek, a dělá tak z pro Wikipedii užitečného procesu (protiváha proti různým DoSům a podobně; propagace hesel na Hlavní straně; propagace Wiki na veřejnosti [máme významné živočišné kmeny/čínské císaře/dosaď v NČ!]; vzor pro tvorbu jiných podobných hesel]) nějaký tajemný rituál pro hrstku zasvěcených. Osobně už recenzuji jen zlomek hesel, často přímo se zdroji, a omezuji recenzi i na nějaká doporučení, co doplnit/ujastnit etc.
Jinak Tvůj výstup ukázal i skutečnost, na kterou upozorňoval Tchoř. Třeba navrhovanou úpravu "Na koncepci československého výstavního prostoru byla 7. listopadu 1964 vypsána veřejná anonymní soutěž." > "Veřejná anonymní soutěž na koncepci československého výstavního prostoru byla vypsána 7. listopadu 1964." mi právě připadá dost v duchu anglického slovosledu. Kouzlo češtiny je v tom, že může klást důraz na různé větné členy; autor chtěl zjevně zdůraznit, že na koncepci byla vypsána veřejná anonymní soutěž, nikoli datum, kdy byla vypsána.
Jinak už dávno jsem otevřel Wikipedie:Žádost o komentář/Velké jazykové modely – komplexní diskuse, tak by bylo dobré pokračovat tam. Mj. tam zmiňuji i revertaci vandalismů > na enwiki zvládali primitivní vandalismy ve stylu "Pepíček je vůl" roboticky revertovat roky před GPT módou, zatímco tady to řešíme stále ručním způsobem. --OJJ, Diskuse 13. 5. 2024, 05:39 (CEST)
@OJJ: No já třeba u té architektonické soutěže necítím potřebu zdůrazňovat, že šlo o soutěž, ale připadá mi zajímavé zdůraznit chronologii celého procesu, takže bych dával datum jednoznačně na sám závěr věty. Je možné, že robot na to přišel tím, že tak vypadá i normální pořadí slov v odpovídající anglické větě, ale stejně mi jím navržené znění připadá vhodnější do kontextu, ve kterém se popisují přípravy pavilonu. A ještě jednou opakuji: cíl udělátka není někoho buzerovat recenzemi na téma "oprav si akcenty ve francouzském názvu ostrova", ale prostě jít a ty akcenty opravit.
Ohledně nominací DČ a NČ situace opravdu nevypadá dobře. Podle mě někteří kolegové na kvalitu tlačili až moc silou a zapomněli, že věci musejí růst organicky a že to celé musí pořád zůstat zábava. Ale to by stálo za samostatné diskusní vlákno, sem bych to nezatahoval.
A pokud jde o ten ŽOK "Velké jazykové modely – komplexní diskuse", tak ten nastoluje téma "Jak velké jazykové modely na Wikipedii omezit / zakázat / odhalit". Tady řešíme naopak téma "Jak modely na Wikipedii využít pro její dobro a pro pohodlí nás wikipedistů". Přijde mi, že jsou to dvě dost odlišné otázky.--Jan Spousta (diskuse) 13. 5. 2024, 08:32 (CEST)
@Jan Spousta:Po e. k.: S puzzlíky souhlas, měl jsem potřebu na to upozornit s ohledem na zdejší komentáře o altech i názoru Honzy, že takto snad má vypadat recenze. To by nebyla recenze, ale buzerace ohledně slovíčkaření, v tomto ohledu jsme viditelně na stejné lodi. Situace ale vypadá relativně dobře, DČ přibývají po desítkách, nominanty jsi už dávno mohl poslat do hlasování :); akorát recenze pro recenzi určitých kolegů skutečně mohou tento proces otrávit (třeba kvůli altům články nenominuje jinak velmi plodný Podzemnik, přičemž třeba vrabec domácí, ikonický a všeobecně známý opeřenec, by byl jako NČ pro propagaci Wikipedie určitě přínos).
A v ŽoKu zmiňuji efektivní koevoluci >> nechci nic zakazovat, ale řízeně využívat pro dobro projektu (odhalování byl pouze jeden z bodů, byť klíčový). Takže tuto diskusi bych tam možná i přesunul. OJJ, Diskuse 13. 5. 2024, 08:48 (CEST)
Já mám spíš pocit, že není dost lidí, kteří by se věnovali recenzováním DČ. Občas se na nějaký článek kouknu, ale upřímně se mi často nechce a mnohem radši články píšu... --Ján Kepler (diskuse) 13. 5. 2024, 17:33 (CEST)
Máš pravdu, že jako veřejná recenze by to asi nebylo to pravé, ale šlo by přidat do návodu k nominaci, že si to může žadatel nechat projet a posoudit. Já to zkoušel na jeden svůj delší článek, takže ano, spousta toho jsou spíš prohození slovosledu, ale některé připomínky nebyly úplně od věci, byť jsem je nevyhodnotil jako podstatné.
Nakonec, i dnešní programování (co jsme vypozoroval u pywikibota) má do jisté míry strojového poradce, nějaký skript prochází kód, zda v něm třeba nevznikne nekonečný cyklus nebo kritická chyba - i když nezkontroluje, zda program dělá, co bylo záměrem. --JAnD (diskuse) 13. 5. 2024, 08:37 (CEST)
@JAn Dudík: Skvěle to formátuje text, např. rozcuchané odstavce vytažené z PDF. Akorát si člověk musí kontrolovat, aby mu do textu robot nezasahoval jinak. OJJ, Diskuse 13. 5. 2024, 08:48 (CEST)

AI vypisovač informace, která není obsažena v článku, ale je v interwiki

K dalšímu pokusu o využití umělé inteligence mě inspirovala diskuse o pahýlech výše. Jednou z definic pahýlovitosti je, že v článku chybí podstatné informace. Napsal jsem tedy program, který

  • k zadanému článku (pahýlu) vyhledá interwiki, a v nich najde tři (volitelně i jiný počet) nejrozvinutější, nejdelší cizojazyčné články
  • z těchto tří cizojazyčných článků vyextrahuje seznam faktů o daném tématu
  • vyextrahovaná fakta porovná s výchozím pahýlem a sestaví seznam těch faktů, která se v něm neobjevují

Samozřejmě se občas splete nebo něco halucinuje, takže se na to nedá 100% spoléhat, ale přinejmenším je to základ pro úvahu, zda neuvedená fakta jsou opravdu podstatná. A hlavně to může člověka inspirovat k rozšíření článku.

Například jsem program pustil na pahýl Dřevina. Výstup je:

Rozšířený obsah
*** Source languages: 
 fr
 bn
 ar
*** Chapters read: 17
1. Lignifikace je základní proces v evoluci suchozemských rostlin; umožňuje vertikální růst a vzpřímený postoj, který podporuje příjem světelné energie.
2. Dřevo stromů se vyznačuje svou tvorbou - fungováním kambia, které chybí jednoděložným - a svým složením - ligniny obvykle bez para-kumarového alkoholu (jednotka H), který je výrazně přítomný u cévnatých rostlin, které nejsou stromy (zejména jednoděložné).
3. Stromy mají dlouhou životnost, která se pohybuje od 20 do více než 100 let.
4. Stromy jsou považovány za cenný zdroj pro společnosti.
5. Jsou spojeny přímé a nepřímé výhody spojené se stromy.
6. Les lignines se objevily v devonu u prvních cévnatých rostlin.
7. První dřevnaté rostliny znamenaly začátek dobytí pevniny rostlinami asi před 400 miliony let.
8. Tyto první dřevnaté rostliny daly vzniknout konceptu kladu Lignophyty.
9. Synapomorfií Lignophytů by měla být vlastnost bifaciálního vaskulárního kambia, které produkuje skutečné dřevo.
10. Rostlina má dřevnatý stonek, který dovoluje sekundární tloustnutí.
11. Apikální meristém produkuje některé postranní meristémy, které mohou vytvářet nové dřevité buňky směrem dovnitř rostliny a nové buňky lýka směrem ven.
12. Hlavní růst stonku probíhá z apikálního meristému na špici rostliny.
13. Ptařídy tvoří parafyletickou skupinu, jejíž většina druhů jsou členové kladu Filicophyta.

Opět kdyby někoho zajímalo si s tím hrát, tak tady je ten program. Je potřeba dosadit tam vlastní klíč od firmy OpenAI (pokud ho nemáte zavedený v prostředí, pak by stačila prázdná závorka) a nastavit hodnoty tří proměnných pod hlavičkou Vstupy, především jména článku, který vás zajímá, do proměnné article_name:

Rozšířený obsah
import requests
import re
import time
from bs4 import BeautifulSoup
from openai import OpenAI
client = OpenAI(api_key=my_api_key)   # za my_api_key dosadit klíč od firmy OpenAI - lze ho zakoupit na jejich webu

# Vstupy:
article_name = "Dřevina"  # jméno článku v uvozovkách  
language = "cs"  # Wikipedie
n = 3    # s kolika články ho chceme porovnat 

def get_article_length(article_name, language='en'):
    """How long is a given article"""
    url = f"https://{language}.wikipedia.org/w/api.php?action=query&format=json&prop=extracts&titles={article_name}&exlimit=1&explaintext"
    
    response = requests.get(url)
    data = response.json()
    
    page_id = list(data['query']['pages'].keys())[0]
    
    if 'extract' in data['query']['pages'][page_id]:
        article_text = data['query']['pages'][page_id]['extract']
        article_length = len(article_text)
        return article_length
    
    return None


def get_interwiki(article_name, language='en', n=3, include_article_language = False):
    """Creates a list of n interwikis for a given article which have the most developed articles"""
    url = f"https://{language}.wikipedia.org/w/api.php?action=query&prop=langlinks&format=json&titles={article_name}&lllimit=500"
    
    response = requests.get(url)
    data = response.json()
    interwiki = []
    if include_article_language:
        interwiki = [{'language': language, 'article': article_name, 
                      'length': get_article_length(article_name, language)}]
    page_id = list(data['query']['pages'].keys())[0]
        
    if 'langlinks' in data['query']['pages'][page_id]:
        langlinks = data['query']['pages'][page_id]['langlinks']
        for link in langlinks:
            interwiki.append({"language": link['lang'], "article": link['*'],
                              "length": get_article_length(link['*'], link['lang'])})
            
    return  sorted(interwiki, key=lambda x: x['length'], reverse=True)[:n]  # only n iw with longest articles


def wiki_plain_text(article_name, language='en'):
    """List of texts of chapters of the article"""
    url = f"https://{language}.wikipedia.org/wiki/{article_name}"
    response = requests.get(url)
    soup = BeautifulSoup(response.text, 'html.parser')

    for unwanted in soup(["table", "figure", "sup"]):  # remove unwanted tag elements
        unwanted.extract()                             

    paras = []    
    article_text = ''
    pridej = True
    for header in soup.find(id='mw-content-text').find_all(["h2", "h3", "h4", "p", "ul", "ol", "li"]):
        headertext = re.sub(r'\[.*?\]', '', header.text.strip())
        headertext = headertext.replace('\xa0', ' ')
        delka = len(headertext)
        if header.name == "p":
            article_text += re.sub('\n', ' ', headertext) + "\n"
            if delka > 50:
                pridej = True
        else:
            if pridej:
                paras.append(article_text)
            article_text = headertext+'\n'
            pridej = False
    if pridej:    
        paras.append(article_text)
    
    return  [item for item in paras if item.strip() != ""]  # Only items which are not empty


def raw_info(article_name, language='en', n=3):
    """List of texts of chapters of n most developed articles = the basis for the reasoning about the subject"""
    interwiki = get_interwiki(article_name, language, n)
    print("*** Source languages: ")
    for i in interwiki:
        print('  ' + i['language'])
    orig = wiki_plain_text(article_name, language)

    info = [orig[0]]  # Start with the basic definition in the original language
    
    for iw in interwiki:  # Add chapters of the selected interwikis
        info += wiki_plain_text(iw['article'], iw['language'])
    return info    
        

def info_bits(article_name, language='en', n=3):
    """Creates bits of information about the subject and evaluates their importance"""
    info = raw_info(article_name, language, n)
    print("*** Chapters read: "+ str(len(info) - 1))
    
    defined = info.pop(0)
        
    prompt = f"We will create list of fact about {article_name}, which Wikipedia describes as: {defined}" 
    prompt += f"Take the following text and extracts facts about {article_name} from it. "  
    prompt += "The output will have one fact on one line. There will be short statement of the fact, "
    prompt += f"semicolon, and evaluation of the importance of the fact for understanding of {article_name} "
    prompt += """on the scale 'Very important', 'Important', 'Less important', 'Unimportant'. 
              Example of one line of the output: \nThe king had no daughters. ; Unimportant \n """
    prompt += f"Write in the language of the original text. The text about {article_name} is: "
    
    facts = ''
    
    for chapter in info:   # Process chapters one by one
        
        response = client.chat.completions.create(
            model="gpt-3.5-turbo-16k",    # "gpt-3.5-turbo-16k" or "gpt-4-turbo"
            max_tokens=1200,
            messages=[
                {
                  "role": "user",
                  "content": prompt + chapter
                },]
              )
        msgtext = response.choices[0].message.content
        
        if msgtext is not None:
            facts += msgtext
            facts += "\n"
        else:
            print("**No message Prompt** "+ prompt + chapter)
            print("**No message Response** "+str(response))
        #time.sleep(1)
        
    return facts

    
def final_list(article_name, language='en', n=3):
    """Compares a Wikipedia article with the information extracted from other interwiki articles"""
    
    info = info_bits(article_name, language, n)   # info from the most developed articles
    
    plaintext = ' '.join(wiki_plain_text(article_name, language))     # the analyzed article 
    
    prompt = f"The goal is to prepare a list of important fact which are not mentioned in an article \
             about {article_name} and can enhance it.  \
             Therefore write the output in the language of the article, which is  {language}. \
             Start by comparing the article about {article_name} with a list of facts about the same subject. \
             The facts are followed by an importance estimation, but this estimation may be wrong. \
             The facts may be written in different languages, \
             but you will use {language} in the output. Here is **the article**:\n"
    prompt += plaintext
    prompt += "\nAnd here is **the list of facts**:\n"
    prompt += info
    prompt += f"\nSome of the facts may repeat in the list. Create a new numbered list od facts about \
             {article_name}, this time without repetition. Each fact will be on a separate line.  \
             Drop the importance estimation. Mention only those fact which are substantial and not already mentioned  \
             in the article. Mention at most twelve most important facts. Sort the facts in order if importance.  \
             Write in the language of the article, which is {language}. Drop all the facts which are contained  \
             in the article you have read first."

    response = client.chat.completions.create(
        model="gpt-4o",    # "gpt-3.5-turbo-16k" or "gpt-4-turbo"
        max_tokens=2200,
        messages=[
                {
                  "role": "user",
                  "content": prompt 
                },]
              )
    msgtext = response.choices[0].message.content
    return [msgtext, info, plaintext]
    
    
info = final_list(article_name, language, n)
print(info[0])

Pozor, pokud si zadáte sken dlouhého článku s dlouhými interwiki paralelami, tak vás to může přijít na hodně peněz a můžete taky program "zavařit" překročením limitu tokenů za minutu, které posíláte chatbotovi. Nemám to tam zvlášť ošetřené, stejně jako ani jiné výjimky. Po troše úprav by se program dal využít i k porovnávání obsahu pahýlu s jinými elektronicky čitelnými zdroji.--Jan Spousta (diskuse) 13. 5. 2024, 22:41 (CEST)

@Jan Spousta Prosím, šlo by udělat ještě ukázku z jiného oboru, třeba geografie? Po přečtení předchozího výstupu mám dojem, že to nechalo většinu slov ve francouzštině a bengálštině a nebo že se to pokouší nadávat ;-) --JAnD (diskuse) 13. 5. 2024, 23:07 (CEST)
@JAn Dudík: Tak si řekni o konkrétní pahýl nebo dva a já to na ně pustím. A ano, jak bruslí různými jazyky, tak se v nich občas ztrácí. Zatím ani ta čtyřka není úplně dokonalá lingvistka. :-))) --Jan Spousta (diskuse) 13. 5. 2024, 23:23 (CEST)
@JAn Dudík: Zkusil jsem to na italském městečku Comacchio. Kód jsem trochu pozměnil, protože jednak vyšla nová verze modelu a jednak měl LLM tendenci psát o italském městě italsky, a tak jsem musel v promptu zdůraznit, že chci češtinu. Navíc jsem mu ještě musel říct, že chci nanejvýš 12 nejdůležitějších faktů, protože o tom městě se toho na různých Wikipediích píše hodně a on měl tendenci se rozepisovat do šířky. Výsledek je:
Rozšířený obsah
*** Source languages: 
 de
 it
 en
*** Chapters read: 40
1. Comacchio vzniklo na třinácti oddělených lagunových ostrovech mezi Valle Pega a Valle Isola.
2. Ve městě Comacchio byly již před dobou Římského impéria řecké a etruské osady.
3. Comacchio bylo dočasně obsazeno langobardským králem Desideriem mezi roky 772 a začátkem roku 774.
4. V roce 946 Benátčané město zasadili rozhodující úder zničením jeho flotily.
5. V roce 1232 bylo město a jeho obyvatelé pod zvláštní ochranou císaře Fridricha II.
6. V roce 877 papež požádal krále Karla Holého o pomoc proti Saracénům, kteří Comacchio zdevastovali.
7. Rakouské ochranné jednotky byly po Vídeňském kongresu rozmístěny v Comacchiu a klášter Sant'Agostino byl přeměněn na vojenský základ.
8. Solná produkce v Comacchiu byla v 19. století jednou z největších v Horní Itálii a byla klíčová pro zásobování severních provincií Papežského státu.
9. V lagunách kolem Comacchia se již ve středověku chovali úhoři.
10. Mokřady v okolí Comacchia jsou mezinárodně významné podle Ramsarské úmluvy pro ochranu a udržitelné využívání mokřadů.
11. Solná produkce byla v minulosti velmi významným zdrojem příjmů, což způsobilo četné spory s Benátskou republikou.
12. Mosty jsou definujícím prvkem historického centra Comacchia.
což mi připadá docela zdařilé.
Prompt ve funkci final_list teď vypadá:
Rozšířený obsah
     prompt = f"The goal is to prepare a list of important fact which are not mentioned in an article \
             about {article_name} and can enhance it.  \
             Therefore write the output in the language of the article, which is  {language}. \
             Start by comparing the article about {article_name} with a list of facts about the same subject. \
             The facts are followed by an importance estimation, but this estimation may be wrong. \
             The facts may be written in different languages, \
             but you will use {language} in the output. Here is **the article**:\n"
    prompt += plaintext
    prompt += "\nAnd here is **the list of facts**:\n"
    prompt += info
    prompt += f"\nSome of the facts may repeat in the list. Create a new numbered list od facts about \
             {article_name}, this time without repetition. Each fact will be on a separate line.  \
             Drop the importance estimation. Mention only those fact which are substantial and not already mentioned  \
             in the article. Mention at most twelve most important facts. Sort the facts in order if importance.  \
             Write in the language of the article, which is {language}. Drop all the facts which are contained  \
             in the article you have read first."
a jako model je tam použit nejnovější gpt-4o.--Jan Spousta (diskuse) 14. 5. 2024, 10:54 (CEST)
Ještě jsem to zkusil na pahýlu Rovník. Výstup je
Rozšířený obsah
*** Source languages: 
 fr
 ar
 en
*** Chapters read: 41
1. Sluneční kotouč přechází přes rovník dvakrát ročně, během rovnodenností v březnu a září.
2. Rovník má stabilní denní teploty po celý rok.
3. Přes rovník projíždí maximální rychlost otáčení bodu na povrchu Země, která činí přibližně 465 m/s.
4. Osa rotace Země není zcela stabilní, což znamená, že přesná poloha rovníku se mění v průběhu času.
5. Ekvádor je jižní americký stát pojmenovaný po rovníku (španělské slovo "Ecuador" znamená rovník).
6. Zemské klima v rovníkových oblastech se nazývá rovníkové klima, charakteristické dvěma deštivými obdobími.
7. Rovník prochází přes 11 suverénních států.
8. Rovník je jednou z pěti významných zeměpisných kružnic na Zemi.
9. Místa na rovníku zažívají konstantní délku dne a noci po celý rok, trvající 12 hodin.
10. Rovník je jediný zeměpisný kruh, který je zároveň velkým kruhem.
11. Letiště v blízkosti rovníku jsou ideální pro vesmírné přístavy díky své rychlosti rotace.
12. Výpočetní délka rovníku je přesně 2π krát jeho poloměr.
a připadá mi, že skoro všechno jsou to zajímavosti, které by se do toho pahýlu opravdu daly připsat, i když něco z toho v článku už je (Ecuador).--Jan Spousta (diskuse) 14. 5. 2024, 11:33 (CEST)
@Jan Spousta: Pěkné. Ale pro laika, který se v tématu článku neorientuje, bude těžké informaci ověřit, tedy zda LLM neměl halucinaci. Nedalo by se to nějak vylepšit, aby vedle chybějící informace ještě doplnil, odkud ji získal? Například k informaci „Stromy mají dlouhou životnost, která se pohybuje od 20 do více než 100 let“ by doplnil, že je to z litevské wikipedie, sekce „Popis stromů“, odstavec 2. Pak už by se to ověřovalo snadno, protože by si wikipedista jen dohledal, zda se informace na litevské wikipedii skutečně nachází a zda je ozdrojovaná. --Marek Genius (diskuse) 17. 5. 2024, 16:08 (CEST)
@Marek Genius: To je dobrý nápad. Když jsem psal tohle, myslel jsem hlavně na schopnost stroje informaci syntetizovat a vybírat tu nejdůležitější. Tam se zdroje spíš pletou. Ale určitě bych se mohl pokusit vytvořit i verzi, kerá naopak pracuje se zdroji a klade důraz na doslovnost a ověřitelnost. Zamyslím se nad tím.--Jan Spousta (diskuse) 17. 5. 2024, 16:19 (CEST)

Vyhledávání

Ahoj, nápady jsou skvělé a jistě pomůžou. Řeší současnost a budoucnost, ale já bych se rád vrátil i k palčivému problému z minulosti - nešel by konečně taky vyřešit? Vyhledávání na Wikipedii (a sesterských projektech) je enormě nespolehlivé. Například hledání "skocit na spek" na Wikislovníku - ačkoliv heslo existuje, při ledabylém zadání bez diakritiky systém nenabídne správnou kombinaci diakritiky a heslo zkrátka nenajde. Jiné, třeba i daleko méně významné stránky přitom s tímhle běžně pracují. Nebo by mohl systém nabídnout aspoň hesla špek nebo skočit. Nenabídne nic, v lepším případě úplně nesmyslné slovní spojení. Wikipedie (potažmo sesterské projekty) je přitom jedna z nejnavštěvovanějších stránek vůbec. --Palu (diskuse) 14. 5. 2024, 00:10 (CEST)

@Palu: Ahoj, podobné úlohy se teď s pomocí LLM často řeší technikami založenými na metodě Retrieval-Augmented Generation (RAG). Zhruba řečeno se obsah prohledávané databáze textů (u nás tedy Wikipedie a sesterských projektů) rozseká na malé překrývající se kousky (chunks), které se tzv. embeddují, tedy zvláštním způsobem zakódují do podoby vysokorozměrných číselných vektorů tak, aby kousky s podobným obsahem byly uloženy na blízkých místech vysokorozměrného vektorového prostoru. Tyto vektory se (s propojením na původní chunks) uloží v tzv. vektorové databázi. Dotaz uživatele se pak embedduje stejným způsobem, ve vektorové databázi se vyhledají nejbližší chunky, ty se spolu s dotazem předhodí LLM, a LLM zformuluje výstup pro uživatele. Je to však technika hodně náročná na výpočetní sílu a datový úložný prostor (v podstatě bychom museli celou Wikipedii uložit v databázi ještě jednou, tentokrát v podobě mnoharozměrných vektorů). Takže to nezvládneme udělátkem napsaným v Pythonu na pár desítkách řádků a pouštěným na soukromém notebooku. Jiná možnost je prostě dotaz "přehodit" na nějaký komerční vyhledávač, který už podobné technologie má implementované, a výsledek nějak převzít do Wikipedie či Wikislovníku. Případně - pokud vím - některé sw firmy samy nabízejí svou implementaci pokročilého vyhledávání do interních databází. I to by ale znamenalo řešit určité technické a právní otázky, které může zvládnout jedině nadace a asi s tím nemůžeme přijít tady na české wiki sami.--Jan Spousta (diskuse) 14. 5. 2024, 08:24 (CEST)
P.S. Ten RAG je už hodně silný kanón, vyhledávač by pak měl zvládat přímo odpovídat i na otázky typu "Patří Rakovník do Plzeňského kraje?", ne jen vyhladávat články.--Jan Spousta (diskuse) 14. 5. 2024, 09:31 (CEST)
Tohle mi přijde jako chyba designu nebo nastavení vyhledávače. Pohledem do dokumentace mám dokonce dojem, jako kdyby bylo technologií upřednostněno spíš fulltextové vyhledávání. Nicméně i to evidentně musí být explicitní, s pomocí různých kouzelných znaků. Hypotéza: vyhledávač je po prostém zobrazení stránky nejpoužívanějším endpointem (nejdřív hledám, abych mohl číst), proto musí být co možná nejvíce optimalizovaný. Snížení citlivosti jde možná proti tomuto požadavku.
Pokus:
  • ceska hokejova reprezentace – našeptávač nenajde nic, výsledky jsou nepoužitelné
  • ceská hokejová reprezentace – dtto
  • česka hokejova reprezentace – našeptávač nenajde nic, ale hledaný článek je první výsledek
  • česká hokejova reprezentace – našeptávač jako první nabídne hledaný článek
  • česka hokejová reprezentace, česká hokejov  reprezentace atd. – dtto
Vypadá to, že našeptávač toleruje rozdíl v jednom znaku, vyhledávač si poradí i se dvěma. Možná je taky kritická správnost prvního písmene. A nebo jsou háčky větší problém než čárky.
Mimochodem, vyhledávač na Wikidatech by měl využívat stejnou technologii (CirrusSearch). Tam zdá se diakritika nehraje žádnou roli, naopak (jeden) chybějící znak vyřeší až úplné vyhledávání. Evidentně existuje nějaký kompromis.
--Matěj Suchánek (diskuse) 14. 5. 2024, 12:30 (CEST)
@Matěj Suchánek: Na skwiki je vyhľadávanie (vrátane našepkávača) po iniciatíve phab:T223787 v 2019 invariantné voči diakritike, viď napr. fráza „ceske narodne hokejove muzstvo“ (odkazujem cez URL, pretože bez explicitného fulltext=1 to rovno presmeruje na dotyčný čl.). --Teslaton (diskuse) 14. 5. 2024, 12:52 (CEST)
... odkud vede odkaz na „náš“ task T293398. Takže je to jenom otázka správného nastavení. --Matěj Suchánek (diskuse) 14. 5. 2024, 13:00 (CEST)

Převod referencí aneb nechte umělou inteligenci udělat v článku pořádek

Další aplikace mě napadly ohledně "udělání pořádku" v článku. Napromptil jsem OpenAi, aby převedl reference v článku na harvardský tvar a přemístil všechny zdroje do sekce Literatura. To výrazně zvyšuje čitelnost v klasickém editoru i uživatelské pohodlí. Gpt-4o nepracuje bez chyb (může např. občas na některou referenci zapomenout nebo vyhalucinovat něco nového), ale na kratší články funguje tak dobře, že je mnohem rychlejší po něm dodělat než psát všechny reference ručně. Příklady jsou články Gundišápúr a Kalb Loze, na kterých jsem to teď vyzkoušel (viz jejich historii). Na dlouhé články to v této podobě nefunguje, jak pro omezení rozsahu výstupu použitého modelu, tak proto, že se model v záplavě textu ztratí, ale asi by se to dalo naprogramovat nějak po částech.

Pro experimentátory a hračičky zase zdrojový kód. První funkce načte zdrojový markup článku a druhá stroj přímočaře požádá, aby podle vzoru článku Buzici provedl úpravu na harvarské reference:

Rozšířený obsah
"""Upraví reference v (kratším) článku české Wikipedie na harvardský citační styl pomocí šablony sfn"""
import requests
from openai import OpenAI
client = OpenAI(api_key=my_api_key)   # za my_api_key dosadit klíč od firmy OpenAI - lze ho zakoupit na jejich webu

# Vstup:
article_name = "Kostel svatého Simeona Stylity"  # jméno článku v uvozovkách  


def get_wikipedia_source(article_title, language="cs"):
    """Gets the source code of a Wikipedia article"""
    # Define the endpoint and parameters
    endpoint = f"https://{language}.wikipedia.org/w/api.php"
    params = {
        "action": "query",
        "format": "json",
        "prop": "revisions",
        "titles": article_title,
        "rvprop": "content",
        "rvslots": "main"
    }

    # Make the request to the Wikipedia API
    response = requests.get(endpoint, params=params)
    
    if response.status_code != 200:
        raise Exception(f"Error fetching data from Wikipedia API: {response.status_code}")

    data = response.json()

    # Extract the page ID, as the structure of the response contains dynamic page IDs
    pages = data.get("query", {}).get("pages", {})
    
    if not pages:
        raise Exception("No pages found or an error occurred.")

    page_id = next(iter(pages))  # Get the first (and likely only) page ID key

    # Extract the content of the page
    page = pages[page_id]
    revisions = page.get("revisions", [])
    
    if not revisions:
        raise Exception("No revisions found for this page.")

    content = revisions[0].get("slots", {}).get("main", {}).get("*", "")
    
    return content

 
def sfn(article_name):
    """Upraví reference v článku české Wikipedie na harvardský citační styl pomocí šablony sfn"""
    
    vzor = get_wikipedia_source("Buzici")
    
    prompt = f"The goal is to change references in the markup of Czech Wikipedia article about {article_name}"
    prompt += """ to the Harvard Citation Style so that   \
             * All references use standard Czech citation templates like Citace monografie. 
             * All citation templates are in the section titled "=== Literatura ===" directly after the 
             section "=== Reference ===" as subsections of the section "== Odkazy ==" behind the body of the article.
             * None of the citation templates is in the body of the text
             * All citations use the template sfn. It has the form {{sfn|ref to the literature|s=page}}, 
             e.g. {{sfn|Král (1902)|s=152}}. The page may be missing, e.g. {{sfn|Král (1902)|}}, if there is 
             no known page in the citation.
             * The refs to the Literature items are in the form "Author name (year of publication)"
             * They are mentioned in the citation template, e.g. " | ref = Král (1902)"
             * Each cited work has its item in the section "Literatura" 
             * There are no <ref> tags used in the body, only sfn and <references/> in the section "Reference". 
             * Do not add new references which are not in the original article, even if they were useful.
             * Nor drop or change the cited literature.
             Print out only the source code of the corrected article. Do not change its text, only the references 
             and the section "Odkazy" and its subsections. You may create these sections if they are missing.
             Do not change the text at the end of the article (e.g. categories and templates other than citations). 
             An example of the Harvard Citation Style is the article about Buzici, whose code looks like this:\n"""
    prompt += vzor
    prompt += f"\nAnd here is the code of the article about {article_name}, which should be improved:\n"
    prompt += get_wikipedia_source(article_name)
    
    response = client.chat.completions.create(
        model="gpt-4o",    
        max_tokens=4096,
        messages=[
                {
                  "role": "user",
                  "content": prompt 
                },]
              )
    msgtext = response.choices[0].message.content
    print(msgtext)
    return msgtext
 

sfn(article_name)

Změnou promptu lze samozřejmě LLM požádat, aby s článek dělal něco jiného, třeba nějaké typografické úpravy.--Jan Spousta (diskuse) 14. 5. 2024, 16:14 (CEST)

Pro mě tedy dvoustupňovost zobrazovaných referencí v příkladech (nejprve bublina s kódovým jménem reference, nad ní bublina s skutečnou referencí) čitelnost i uživatelské pohodlí spíš zhoršuje. To, že se vše nahází do Literatury a z ní odkazuje v Referencích, není úklid, ale zdvojnásobení odkazů na konci článku. --Petr Karel (diskuse) 14. 5. 2024, 17:32 (CEST)
@Jan Spousta: Skvělý nápad ... až na to, že komunita něco podobného viditelně nechce. :-D --OJJ, Diskuse 14. 5. 2024, 17:35 (CEST)
@Petr Karel: Pokud se bavíme o dlouhých článcích, kde je hodně odkazů na jednu knihu, ale na její různé stránky, tak je to zdaleka nejpřehlednější systém, který na této Wikipedii znám. Zejména při čtení zdrojáku je to obrovský rozdíl oproti stavu, kde je pro jednu a tu samou knihu deset různých rozsáhlých citačních šablon, ve kterých se pořád opakují stejné informace. Ale samozřejmě to neznamená, že je to vhodné pro každý článek a pro každého editora.--Jan Spousta (diskuse) 14. 5. 2024, 17:55 (CEST)
@Jan Spousta: Dík za upřesnění, bál jsem se, že by se to dělalo šmahem, a vycházel ze zkušenosti s přírodovědnými články, do kterých přispívám svými editacemi. Jak by asi vypadaly "uklizené" např. biologické NČ, které co reference (zpravidla přes stovku), to jiný zdroj, často z odborných periodik? Dva skoro stejně dlouhé seznamy v oddílech referencí i literatury by byly hrozné. Ale stejně i u článků s většinou referencí opakovaných z několika málo knižních zdrojů bych byl pro odkazování s prostým použitím šablony SFN, a ne na odkazování přes položky oddílu Literatura, považuji to za čistější, nezneužívající účel oddílu Literatura. --Petr Karel (diskuse) 15. 5. 2024, 08:48 (CEST)
Šlo by podobným programem pouze převádět nestrukturované reference (prostý wikitext) na strukturované, tj. do citačních šablon?
Například v článku Divadlo jsou první tři položky v sekci Literatura zobrazené pomocí citační šablony, čtvrtá je zobrazená prostým wikitextem.
Cítím tu velký potenciál. Šlo by pomocí LLM nahradit citoid, tedy nástroj, kterým lze ve vizuálním editoru generovat citace automaticky? Samozřejmě to předpokládá, že si může například stáhnout webovou stránku nebo odněkud načíst metadata třeba vědeckého článku (teoreticky bychom tento krok mohli přeskočit tím, že metadata načteme sami a pošleme je jako prompt). --Matěj Suchánek (diskuse) 14. 5. 2024, 19:56 (CEST)
@Matěj Suchánek: Podle mě by (s podobnými omezeními) šlo vyrobit citace v jakémkoli stylu. Harvard je jenom příklad. Stačí správně odladit prompt (řádově hodina práce + cca dolar nákladů na opakované sjíždění modelu). Co se týče automatického stáhnutí dalších informací z jiných stránek, jak to dělá citoid, tak to by asi šlo naprogramovat taky, akorát by to bylo o něco pracnější, protože by člověk musel přijít na to, kam se koukat a jak k těm webovým databázím správně přistupovat. Pokud myslíš, že to má potenciál, tak by stálo se o to pokusit. Samotné vygenerování jedné citační šablony z rozumných podkladů mi připadá tak snadné, že by to možná zvládnul i nějaký opensourcový LLM, který by potenciálně bylo možné hostit někde na nadačních serverech, a tím se vyhnout komerčnímu světu.--Jan Spousta (diskuse) 14. 5. 2024, 20:09 (CEST)

Nový rozcestník a Urgentní upravovač

Dost se to rozrůstá, takže jsem založil rozcestník Wikipedie:Využití umělé inteligence na Wikipedii. Odkazuji odtud mj. na stránky se svými prográmky zmíněnými výše.

Kromě toho jsem tam dal odkaz na nový "Urgentní upravovač". Program, kterému zadáte článek na úrovni "k urgentní úpravě", a on do něj zavede štábní kulturu - přidá odkazy, kategorie, kapitoly, a tak dále. Zkusil jsem na pár případech jako Carlos Lehder a fakt hodně šetří práci.--Jan Spousta (diskuse) 14. 5. 2024, 22:50 (CEST)

Rozepsání odkazů na zdroje do referenčních šablon

Další ukázka je program, který nechává model GPT-4o rozepsat odkazy na zdroje do citačních šablon. Vizte jeho úpravu v článku Divadlo. Zdá se, že na AI je v tom poměrně spolehlivý, ale zatím je nastaven tak, aby ponechal dosavadní referenci v poznámce ve zdrojovém textu stránky, aby si to každý mohl překontrolovat. Mohlo by zajímat @Matěj Suchánek:.--Jan Spousta (diskuse) 16. 5. 2024, 22:04 (CEST)

Dost dobré! --Pavouk (diskuse) 17. 5. 2024, 00:06 (CEST)
Skvěle! Jak budu mít chvíli, vyzkouším si to. To ponechání komentáře ve zdrojovém kódu mě přivedlo na nápad: okamžitá zpětná vazba skrze rozbalování. Ve chvíli, kdy chatbot vrátí odpověď, ji robot před uložením může přes API Wikipedie rozbalit a porovnat se vstupem. Takhle se dá zjistit, jestli se např. něco neztratilo, a případně na to chatbota upozornit. --Matěj Suchánek (diskuse) 17. 5. 2024, 18:11 (CEST)

Claude

Pro Česko byla uvolněna Claude od Anthropicu (https://claude.ai/). Vyzkoušel jsem ji na překladu kratšího (Carl Thiemann) a delšího (Pierre Puget) článku, oba o kumštýřích z angličtiny. Jazykově je opravdu dobrá, i když ne dokonalá, ale vypadá slibně. U toho dlouhého článku jsem zadal ne přesný překlad, ale "podle". Přesný promt zněl "Podle toho [zdrojáku vzorového českého článku o umělci, který jsem ukázal v předchozí replice] prosím vytvoř článek o Pugetovi podle anglické Wikikpedie tak, aby byl vhodný pro českou. Tady je anglická verze: [copypastována z anglické W.]". Překvapilo mě, že nepřekládal, ale více či méně úspěšně parafrázoval, a hlavně rozdělil text na život a dílo přesně podle našeho stylového manuálu. Horší je vynechávání referencí a občasná lehká halucinace (pozměnění významu), takže bylo nutné článek pečlivě kontrolovat podle originálu, přičemž informace je v něm rozházená tak porůznu.

Odnáším si z toho zatím, že je Claude výborná na převyprávění textu, což by se mohlo uplatnit u nějakých zašmodrchaných a myšlenkově nebo slohově nekvalitních podkladů. Pro přímé překládání zatím nevím. Rozhodně ve mně vzbudila zájem a asi si s ní budu ještě hrát.--Jan Spousta (diskuse) 17. 5. 2024, 12:02 (CEST)

Vyzkoušel jsem Claude na náročné úpravě článku Acidifikace. Pomocí nástroje Wikipedie:GPT vypisovač informací a referencí z interwiki jsem napřed vyjel seznam zdrojovaných informací na toto téma z jiných Wikipedií (výstup mě stál řádově 10 Kč a je na Diskuse:Acidifikace). Pak jsem původní neupravený článek a tento seznam předložil volně dostupné verzi Claude s promptem "Následuje text článku české Wikipedie a potom seznam zdrojovaných faktů vypsaných z jiných Wikipedií. Tvým úkolem je článek české Wikipedie upravit tam, kde styl není encyklopedický nebo kde chybí interní odkazy a doplnit užitečné reference s pomocí zmíněného seznamu. Výstupem bude zdrojový text opraveného článku." + zdroják neupraveného článku + seznam zdrojovaných informací (prompt jsem si napřed připravil v LibreOffice Writeru, pak pastoval do Claude a vydal pokyn "Splň zadání."). Vylezlo to z ní naněkolikrát (pobízel jsem jí "pokračuj prosím"), protože výstup přesáhne nějakou mezní velikost jedné odpovědi. Nicméně nakonec jsem to z ní dostal skoro celé až na závrečnou sekci s externími odkazy a kategoriemi. Pastoval jsem pak celý výstup do Wikipedie. Po slohové stránce byl výsledek užitečný, ale kromě obvyklých chyb strojového psaní je potřeba dávat zvýšený pozor na umístění referencí - odhadem v 50 % případů je Claude umístila špatně (vyhalucinovala si, že reference obsahuje něco, co tam ve skutečnosti není). Vyvolalo to i reakci správce @OJJ: na mé diskusní stránce. Ten mě sice ještě nezablokoval, ale dal najevo nelibost nad podobnými experimenty. Což je nevýhoda toho, že se člověk otevřeně přizná k používání LLM ve shrnutí editace. Celkově jsem přesto aplikaci vyhodnotil jako užitečnou, ale příště bych prompt formuloval jinak.--Jan Spousta (diskuse) 18. 5. 2024, 11:22 (CEST)
@Jan Spousta: Diskuse je tady. Samozřejmě bych nikoho neblokoval, ale podobné kroky vnímám jako rizikové právě pro ony halucinace, kterým se nevyhnula ani Tvoje editace. Podobné experimenty pak ze zásady patří na pískoviště, nikoli do HJP (nebo alespoň užít {{pracuje se}}). Zrovna Honza Spousta je zkušený redaktor, viditelně nadšený do moderních technologií, který si to ošéfuje; chopí-li se toho ale nějaký nadšený nováček, který by takový kód nikdy nenapsal, ale o to horlivěji využil, tak může napáchat více škody než užitku. On se článek samozřejmě ověřit, resp. zjistit, že tam něco nesedí, dá i bez otevřeného přiznání. Osobně jsem kvůli ověřování porušení AP sháněl určité tištěné knihy. Jenže všechno to stojí čas a správci v současnosti nemají nic jiného než vlastní oči, volný čas a svůj úsudek, takže nemohou konkurovat nějaké zvýšené kadenci. Už i ten slavný ContentTranslate, co neměl s AI nic společného, byl prakticky souboj lidské síly se strojem. --OJJ, Diskuse 18. 5. 2024, 12:03 (CEST)
@OJJ: Malá hnidopišská poznámka. Roku 2017 Google vyházel dosavadní tým strojového překladače a najal lidi, kteří umí s neuronovými sítěmi. Od té doby má ContentTranslate (pokud v něm člověk zapne překladač Google) s AI společného velmi mnoho. :-) --Jan Spousta (diskuse) 18. 5. 2024, 15:52 (CEST)
@Jan Spousta: Jop, snad se tam angažoval i nějaký Čech. Ale není to samozřejmě ten kecací model. --OJJ, Diskuse 18. 5. 2024, 15:55 (CEST)
Ten „nějaký“ Čech bude Tomáš Mikolov. --Matěj Suchánek (diskuse) 18. 5. 2024, 18:18 (CEST)

Výpis informací z interwiki a jejich zdrojů

Nápad od @Marek Genius:. Po zadání článku vyhledá informace z n nejrozsáhlejších interwiki a jejich případné reference. Ohodnotí je také podle důležitosti a vypíše k nim článek a kapitolu, odkud je získal. Zde výstup pro článek Jan Čep. Program uveřejním a odkážu na Wikipedie:Využití umělé inteligence na Wikipedii.--Jan Spousta (diskuse) 17. 5. 2024, 23:22 (CEST)

Fact Fact_cs Reference Importance Chapter_number Fact_number Heading Chapter_length Article_title Language
Ян Чеп был чешским писателем, переводчиком и журналистом. Jan Čep byl českým spisovatelem, překladatelem a novinářem. Very important 0 0 334 Чеп, Ян ru
Ян Чеп родился 31 декабря 1902 года в Михловитц в Оломоуцком крае. Jan Čep se narodil 31. prosince 1902 v Michlovicích v Olomouckém kraji. Very important 0 1 334 Чеп, Ян ru
Ян Чеп умер 25 января 1973 года в Париже. Jan Čep zemřel 25. ledna 1973 v Paříži. Very important 0 2 334 Чеп, Ян ru
Родился в Моравии, в большой крестьянской семье. Narodil se na Moravě ve velké rolnické rodině. Very important 1 0 Биография 2332 Чеп, Ян ru
Сын столяра. Syn tesaře. Important 1 1 Биография 2332 Чеп, Ян ru
Окончил философский факультет Карлова университета (1922—1926). Absolvoval filozofickou fakultu Univerzity Karlovy (1922-1926). Very important 1 2 Биография 2332 Чеп, Ян ru
Подружился с Вилемом Завадой. Sprátelil se s Vilem Zavadou. Useful 1 3 Биография 2332 Чеп, Ян ru
После университета сблизился с католической общиной Йозефа Флориана. Po univerzitě se sbližil s katolickou komunitou Josefa Floriana. Important 1 4 Биография 2332 Чеп, Ян ru
Испытал влияние таких мыслителей-персоналистов, как Романо Гвардини, Жак Маритен, Габриэль Марсель. Byl ovlivněn takovými mysliteli-personalisty, jako Romano Guardini, Jacques Maritain, Gabriel Marcel. Important 1 5 Биография 2332 Чеп, Ян ru
Был дружен с Яном Заградничеком, Якубом Демлом, Егоном Хостовским, Франтишеком Халасом, Бедржихом Фучиком, Франтишеком Грубином. Byl přáteli s Janem Zahradníčkem, Jakubem Demlem, Egonem Hostovským, Františkem Halasem, Bedřichem Fučíkem, Františkem Hrubínem. Useful 1 6 Биография 2332 Чеп, Ян ru
С началом нацистской оккупации вернулся в родные места. S počátkem nacistické okupace se vrátil do rodného kraje. Very important 1 7 Биография 2332 Чеп, Ян ru
Вел затворническую жизнь, время от времени посещая доминиканский монастырь в Оломоуцe. Vedl samotářský život, čas od času navštěvoval dominikánský klášter v Olomouci. Important 1 8 Биография 2332 Чеп, Ян ru
Переписывался с Яном Заградничеком. Dopisoval si s Janem Zahradníčkem. Useful 1 9 Биография 2332 Чеп, Ян ru
В 1995—2000 их переписка вышла двумя томами. V letech 1995-2000 jejich korespondence vyšla ve dvou svazcích. Useful 1 10 Биография 2332 Чеп, Ян ru
После войны вернулся в Прагу, работал в журнале Вышеград. Po válce se vrátil do Prahy, pracoval v časopise Vyšehrad. Important 1 11 Биография 2332 Чеп, Ян ru
После прихода коммунистов к власти был в феврале 1948 исключен из Союза чешских писателей. Po převzetí moci komunisty byl v únoru 1948 vyloučen ze Svazu českých spisovatelů. Very important 1 12 Биография 2332 Чеп, Ян ru
Эмигрировал во Францию в августе 1948. V srpnu 1948 emigroval do Francie. Very important 1 13 Биография 2332 Чеп, Ян ru
Жил в Париже (1948—1951), затем в Мюнхене (1951-1954), работал комментатором на радио Свободная Европа. Žil v Paříži (1948-1951), poté v Mnichově (1951-1954), pracoval jako komentátor v rádiu Svobodná Evropa. Very important 1 14 Биография 2332 Чеп, Ян ru
В 1954 году вернулся в Париж и женился на дочери французского литературного критика Шарля Дю Бо. V roce 1954 se vrátil do Paříže a oženil se s dcerou francouzského literárního kritika Charlese du Bos. Important 1 15 Биография 2332 Чеп, Ян ru
Существовал как свободный журналист. Přežil jako svobodný novinář. Important 1 16 Биография 2332 Чеп, Ян ru
В 1965 году перенес инфаркт, оказался парализован. V roce 1965 prodělal infarkt a byl paralyzován. Important 1 17 Биография 2332 Чеп, Ян ru
Переводил произведения Рамю, Бернаноса, Стивенсона, Конрада, Мёрике, Гальегоса. Překládal díla Ramuz, Bernanos, Stevenson, Conrad, Mörike, Gallegos. Important 1 18 Биография 2332 Чеп, Ян ru
Книги писателя с 1948 года были исключены из книжных магазинов и библиотек Чехословакии. Spisovatelovy knihy byly od roku 1948 vyřazeny z knihkupectví a knihoven v Československu. Important 1 19 Биография 2332 Чеп, Ян ru
Его сочинения на родном языке издавались в Германии, Италии, Швеции, США. Jeho díla v rodném jazyce byla vydávána v Německu, Itálii, Švédsku, USA. Important 1 20 Биография 2332 Чеп, Ян ru
Книги Чепа широко публикуются на родине после 1991 года. Čepovy knihy jsou široce publikovány doma po roce 1991. Very important 1 21 Биография 2332 Чеп, Ян ru
Награжден Орденом Томаша Масарика в 1991 году. Byl oceněn Řádem Tomáše Masaryka v roce 1991. Very important 1 22 Биография 2332 Чеп, Ян ru
Jan Čep was a Czech writer and translator. Jan Čep byl český spisovatel a překladatel. Very important 0 0 240 Jan Čep en
Jan Čep was born on 31 December 1902 in Myslechovice. Jan Čep se narodil 31. prosince 1902 v Myslechovicích. Important 0 1 240 Jan Čep en
Jan Čep died on 25 January 1974 in Paris. Jan Čep zemřel 25. ledna 1974 v Paříži. Important 0 2 240 Jan Čep en
Dvojí domov (1926, Double Being) is a collection of short stories. Dvojí domov (1926, Dvojí domov) je sbírka povídek. Very important 2 0 Books 683 Jan Čep en
Zeměžluč (1931, Centaury) is a collection of short stories. Zeměžluč (1931, Zeměžluč) je sbírka povídek. Very important 2 1 Books 683 Jan Čep en
Letnice (1932, Pentecost) is a collection of short stories. Letnice (1932, Letnice) je sbírka povídek. Very important 2 2 Books 683 Jan Čep en
Děravý plášť (1934, Perforated Cloak) is a collection of short stories. Děravý plášť (1934, Děravý plášť) je sbírka povídek. Very important 2 3 Books 683 Jan Čep en
Hranice stínu (1935, Border of Shade) is a novel. Hranice stínu (1935, Hranice stínu) je román. Very important 2 4 Books 683 Jan Čep en
Modrá a zlatá (1938, Blue and Gold) is a collection of short stories. Modrá a zlatá (1938, Modrá a zlatá) je sbírka povídek. Very important 2 5 Books 683 Jan Čep en
Polní tráva (1946, Field Grass) was published in 1946. Polní tráva (1946, Polní tráva) byla vydána v roce 1946. Important 2 6 Books 683 Jan Čep en
Rozptýlené paprsky (1946) is a collection of essays. Rozptýlené paprsky (1946) je sbírka esejí. Important 2 7 Books 683 Jan Čep en
Cikáni (1953, Gypsies) is a novel published in Munich exile. Cikáni (1953, Cikáni) je román vydaný v mnichovském exilu. Very important 2 8 Books 683 Jan Čep en
O lidský svět (1953, Human World) is a collection of essays published in Rome. O lidský svět (1953, O lidský svět) je sbírka esejí vydaná v Římě. Important 2 9 Books 683 Jan Čep en
Samomluvy (1959) is a collection of essays published in Lund. Samomluvy (1959) je sbírka esejí vydaná v Lundu. Important 2 10 Books 683 Jan Čep en
Sestra úzkost (1975, My Sister Fear) is a memoir/essay published in Rome. Sestra úzkost (1975, Sestra úzkost) je paměti/esej vydaný v Římě. Very important 2 11 Books 683 Jan Čep en
Etudy pro paní J. (1986, Etudes for Mrs. J.) is a novel published posthumously in Munich. Etudy pro paní J. (1986, Etudy pro paní J.) je román vydaný posmrtně v Mnichově. Important 2 12 Books 683 Jan Čep en
Jan Čep est né le 31 décembre 1902 à Myslechovice. Jan Čep se narodil 31. prosince 1902 v Myslechovicích. {{date|31 décembre 1902}} Very important 0 0 490 Jan Čep fr
Il est mort le 25 janvier 1974 à Paris. Zemřel 25. ledna 1974 v Paříži. {{date|25 janvier 1974}} Very important 0 1 490 Jan Čep fr
Jan Čep est un écrivain et traducteur tchécoslovaque. Jan Čep je československý spisovatel a překladatel. Very important 0 2 490 Jan Čep fr
Après 1948, il a vécu principalement en France. Po roce 1948 žil převážně ve Francii. Important 0 3 490 Jan Čep fr
Il s'inscrit dans un courant d'inspiration catholique. Patří do proudu katolické inspirace. Important 0 4 490 Jan Čep fr
Jan Čep est né en Moravie, dans une famille paysanne. Jan Čep se narodil na Moravě, do rolnické rodiny. Very important 1 0 Biographie 1599 Jan Čep fr
Il a fait ses études supérieures de 1922 à 1926 à l'université de Prague. Studoval na univerzitě v Praze od roku 1922 do roku 1926. Very important 1 1 Biographie 1599 Jan Čep fr
Il a étudié la linguistique tchèque, française et anglaise. Studoval českou, francouzskou a anglickou lingvistiku. Important 1 2 Biographie 1599 Jan Čep fr
Il rejoint en 1926 la petite maison d'édition de Josef Florian à Stará Říše en Moravie. V roce 1926 se připojil k malému nakladatelství Josefa Floriana ve Staré Říši na Moravě. Important 1 3 Biographie 1599 Jan Čep fr
Il effectue des traductions littéraires pour Josef Florian. Vykonává literární překlady pro Josefa Floriana. {{Harv|Blust|1999|p=12}} Useful 1 4 Biographie 1599 Jan Čep fr
En 1927, il travaille pour une maison d'édition pragoise comme lecteur et traducteur. V roce 1927 pracuje pro pražské nakladatelství jako čtenář a překladatel. Important 1 5 Biographie 1599 Jan Čep fr
Pendant la Seconde Guerre mondiale, Jan Čep se retire dans son village natal et poursuit son œuvre littéraire. Během druhé světové války se Jan Čep stáhl do svého rodného vesnice a pokračoval ve svém literárním díle. Important 1 6 Biographie 1599 Jan Čep fr
L'arrivée des communistes au pouvoir en 1948 le contraint à l'exil en tant qu'intellectuel catholique. Příchod komunistů k moci v roce 1948 ho přinutil do exilu jako katolického intelektuála. Very important 1 7 Biographie 1599 Jan Čep fr
Il se réfugie en France. Uprchl do Francie. Very important 1 8 Biographie 1599 Jan Čep fr
Il épouse en 1954 la fille de Charles Du Bos, Primerose. V roce 1954 se oženil s dcerou Charlese Du Bose, Primerose. Important 1 9 Biographie 1599 Jan Čep fr
Il a eu en janvier 1955 des jumeaux, Jean et Claire. V lednu 1955 měl dvojčata, Jean a Claire. {{Harv|Blust|1999|p=12}} Useful 1 10 Biographie 1599 Jan Čep fr
Elle a publié des traductions, notamment "Deux contre un" du sociologue américain Theodore Caplow. Publikovala překlady, zejména „Deux contre un“ amerického sociologa Theodora Caplowa. [http://data.bnf.fr/12660780/primerose_cep/ Notice sur data.bnf.fr] Useful 1 11 Biographie 1599 Jan Čep fr
Il est enterré au cimetière de La Celle-Saint-Cloud. Je pohřben na hřbitově v La Celle-Saint-Cloud. Important 1 12 Biographie 1599 Jan Čep fr
Jan Čep a publié plusieurs recueils de nouvelles, un seul roman et des essais. Jan Čep publikoval několik sbírek povídek, jediný román a eseje. Important 2 0 Œuvre 1027 Jan Čep fr
Les traductions représentent une part très importante de la production littéraire de Jan Čep. Překlady představují velmi důležitou část literární tvorby Jana Čepa. <ref>[http://www.universalis.fr/encyclopedie/jan-cep/ Milan Burda, article dans l’''Encyclopaedia Universalis''].</ref> Very important 2 1 Œuvre 1027 Jan Čep fr
Il traduit en tchèque à partir de l'anglais, de l'espagnol, de l'allemand, mais principalement du français. Překládá do češtiny z angličtiny, španělštiny, němčiny, ale hlavně z francouzštiny. <ref>[http://www.universalis.fr/encyclopedie/jan-cep/ Milan Burda, article dans l’''Encyclopaedia Universalis''].</ref> Important 2 2 Œuvre 1027 Jan Čep fr
Parmi les auteurs français ou francophones qu'il a traduits, on peut citer Balzac, Flaubert et Ramuz. Mezi francouzské nebo frankofonní autory, které přeložil, patří Balzac, Flaubert a Ramuz. Useful 2 3 Œuvre 1027 Jan Čep fr
Mention particulière doit être faite de Georges Bernanos, dont il a été le secrétaire particulier en 1935. Zvláštní zmínku si zaslouží Georges Bernanos, jehož byl osobním sekretářem v roce 1935. Useful 2 4 Œuvre 1027 Jan Čep fr
Jan Čep a traduit plusieurs romans de Georges Bernanos. Jan Čep přeložil několik románů Georgese Bernanose. Important 2 5 Œuvre 1027 Jan Čep fr
Il a fait apprécier le "Gaspard des montagnes" d'Henri Pourrat en Tchécoslovaquie. Učinil známým "Gasparda des montagnes" Henri Pourrata v Československu. Useful 2 6 Œuvre 1027 Jan Čep fr
Díky za to. Zatím jsem nezkoušel, ale vypadá to skvěle. --Marek Genius (diskuse) 17. 5. 2024, 23:39 (CEST)
Ještě jsem přidal přepínače umožňující vypsat jen zdrojovaná fakta a vypsat jen vybrané sloupce. Po jejich aktivaci to vypadá jako užitečný nástroj pro zpracování článků v kategorii Články k ověření. Výstup na Agama australská následuje. (Je legrační, jak zápasí s překladem názvu ještěra.)--Jan Spousta (diskuse) 18. 5. 2024, 08:49 (CEST)
Fact_cs Reference Importance Heading Language
Baardagame má vědecký název Pogona vitticeps. {{Harv|Blust|1999|p=12}} Very important Naamgeving en taxonomie nl
Mezinárodní organizace na ochranu přírody a přírodních zdrojů IUCN přiřadila ochranářský status "bezpečný" (LC). <ref name="IUCN2">{{Citeer web | url = https://www.iucnredlist.org/species/83494364/83494440 | titel = ''Pogona vitticeps '' - IUCN Red List| auteur = International Union for Conservation of Nature and Natural Resources - Red List | archiefurl = https://web.archive.org/web/20230326235135/https://www.iucnredlist.org/species/83494364/83494440 | archiefdatum = 2023-03-26}}</ref> Very important Verspreiding en habitat nl
Dospělý baardagame může dosáhnout celkové délky těla asi 60 centimetrů. {{Harv|SPECTRUM}} Important Uiterlijke kenmerken nl
Samci jsou větší než samice a lze je rozpoznat podle větší hlavy a tmavší až černé 'brady' na spodní straně krku. {{Harv|DAVIES}} Important Uiterlijke kenmerken nl
Samci mají tzv. femorální póry; jedná se o zvětšené póry na spodní straně stehen. {{Harv|DAVIES}} Important Uiterlijke kenmerken nl
Samci mají také větší kloakální otvor než samice. {{Harv|DAVIES}} Important Uiterlijke kenmerken nl
Barva těla baardagame má stejnou barvu jako jeho okolí, červenohnědou s nepravidelnými tmavými skvrnami na zádech a pruhy na hlavě. {{Harv|SPECTRUM}} Important Uiterlijke kenmerken nl
Starší exempláře mají obvykle jednolitou barvu. {{Harv|SPECTRUM}} Useful Uiterlijke kenmerken nl
Velké tělo hraje roli při udržování tepla, takže může být aktivní i při nižších teplotách. {{Harv|SPECTRUM}} Important Thermoregulatie nl
Aby se zahřály, často se agamy opalují na vyvýšeném místě jako větev nebo kámen. {{Harv|SPECTRUM}} Important Thermoregulatie nl
Ležením na vyvýšeném místě může agamy během opalování dobře přehlédnout okolí. {{Harv|SPECTRUM}} Useful Thermoregulatie nl
V upraveném prostředí vytvořeném člověkem se používají také ploty a piknikové stoly. {{Harv|SPECTRUM}} Useful Thermoregulatie nl
Během opalování se tělo co nejvíce zplošťuje, což zvětšuje povrch a zvyšuje účinnost. {{Harv|SPECTRUM}} Important Thermoregulatie nl
Pokud je ještěrka zahřátá, je velmi rychlá a velmi těžko se chytá. {{Harv|SPECTRUM}} Useful Thermoregulatie nl
Baardagame snese teplotu až 40 °C. {{Harv|SPECTRUM}} Important Thermoregulatie nl
Při každé snůšce se naklade přibližně 20 vajec, může se však lišit mezi 8 a 24. <ref name="SPECTRUM" /> Important Voortplanting nl
Centrální vousatá agama je druhem agamových ještěrek. <ref name=":0" /> Very important en
Centrální vousatá agama se vyskytuje v široké škále suchých až polosuchých oblastí východní a střední Austrálie. <ref name=":0" /> Important en
Pogona vitticeps byla poprvé popsána německým zoologem Ernstem Ahlem v roce 1926. <ref>Ahl, E. 1926. Neue Eidechsen und Amphibien. Zool. Anz. 67: 186–192</ref> Very important Taxonomy en
Ernst Ahl umístil Pogona vitticeps do rodu Amphibolurus. <ref>{{NRDB species|genus=Pogona|species=vitticeps}}</ref> Important Taxonomy en
Zralé agamky mohou dosáhnout celkové délky kolem 60 cm. <ref name=Doneley>{{cite journal|author=Doneley, B.|year=2006|title=Caring for the bearded dragon|journal=[[Proceedings of the North American Veterinary Conference]]|volume=20|pages=1607–1611}}</ref> Very important Description en
Ocas tvoří více než polovinu délky agamky vousaté. <ref name=Doneley>{{cite journal|author=Doneley, B.|year=2006|title=Caring for the bearded dragon|journal=[[Proceedings of the North American Veterinary Conference]]|volume=20|pages=1607–1611}}</ref> Useful Description en
Samci se od samic odlišují širším kloakálním otvorem. <ref name=Doneley>{{cite journal|author=Doneley, B.|year=2006|title=Caring for the bearded dragon|journal=[[Proceedings of the North American Veterinary Conference]]|volume=20|pages=1607–1611}}</ref> Important Description en
Samci mají širší základnu ocasu než samice. <ref name=Doneley>{{cite journal|author=Doneley, B.|year=2006|title=Caring for the bearded dragon|journal=[[Proceedings of the North American Veterinary Conference]]|volume=20|pages=1607–1611}}</ref> Important Description en
Samci mají větší a úhlovější hlavu. <ref name=Doneley>{{cite journal|author=Doneley, B.|year=2006|title=Caring for the bearded dragon|journal=[[Proceedings of the North American Veterinary Conference]]|volume=20|pages=1607–1611}}</ref> Useful Description en
Samci mají více vyvinuté vousy a hemipenis. <ref name=Doneley>{{cite journal|author=Doneley, B.|year=2006|title=Caring for the bearded dragon|journal=[[Proceedings of the North American Veterinary Conference]]|volume=20|pages=1607–1611}}</ref> Useful Description en
Samci mají více vyvinuté femorální póry než samice. <ref>{{cite web |url=http://www.reptilespecialists.com/caresheets/beardeddragon.html |archive-url=https://web.archive.org/web/20120219111255/http://www.reptilespecialists.com/caresheets/beardeddragon.html |archive-date=2012-02-19 |title=Reptile Care and Husbandry: Bearded Dragons |year=2008 |publisher=Reptile Specialists LLC }}</ref> Useful Description en
Přezdívka vousáč pochází z hltanového váčku připomínajícího vousy. <ref name=Doneley>{{cite journal|author=Doneley, B.|year=2006|title=Caring for the bearded dragon|journal=[[Proceedings of the North American Veterinary Conference]]|volume=20|pages=1607–1611}}</ref> Useful Description en
Pogona mají temenní oko, které se používá k termoregulaci a regulaci hormonů. <ref>{{Cite web |last=Nairn |first=Tina |date=2020-06-05 |title=Bearded Dragons Third Eye [how it changes behaviors & care] |url=https://beardeddragonsworld.com/bearded-dragons-third-eye/ |access-date=2023-01-25 |language=en-AU}}</ref> Very important Description en
P. vitticeps pochází z polopouštního lesního porostu, suchého lesního porostu a skalnatých pouštních oblastí Střední Austrálie. {{More citations needed section|date=November 2018}} Very important Ecology and behaviour en
Často tráví rána a brzké večery vyhříváním se na odhalených větvích nebo kamenech a v nejteplejší části odpoledne se uchylují do stinných oblastí nebo nor. {{More citations needed section|date=November 2018}} Important Ecology and behaviour en
P. vitticeps jsou příležitostní všežravci. {{cite web | url=https://animaldiversity.org/accounts/Pogona_vitticeps/ | title=Pogona vitticeps (Central Bearded Dragon) | website=[[Animal Diversity Web]] }} Very important Ecology and behaviour en
Žijí v oblastech, kde je těžké najít potravu, a proto nejsou obzvláště vybíraví v jídle. {{cite web | url=https://animaldiversity.org/accounts/Pogona_vitticeps/ | title=Pogona vitticeps (Central Bearded Dragon) | website=[[Animal Diversity Web]] }} Important Ecology and behaviour en
Jejich žaludky jsou dostatečně velké, aby pojaly značné množství vegetace, ovoce, hmyzu, červů a příležitostně malých hlodavců nebo ještěrek. {{cite web | url=https://animaldiversity.org/accounts/Pogona_vitticeps/ | title=Pogona vitticeps (Central Bearded Dragon) | website=[[Animal Diversity Web]] }} Important Ecology and behaviour en
Oblíbenými hmyzími kořistmi jsou cvrčci, kobylky, brouci, housenky, můry, motýli nebo jakýkoli hmyz, který se dá pohodlně spolknout. {{cite web | url=https://animaldiversity.org/accounts/Pogona_vitticeps/ | title=Pogona vitticeps (Central Bearded Dragon) | website=[[Animal Diversity Web]] }} Useful Ecology and behaviour en
Komunikují prostřednictvím barevných projevů, postoje a fyzických gest, jako je mávání paží a kývání hlavou. {{Cite web|title=BEARDED DRAGON (Pogona vitticeps)|url=http://www.lihs.org/files/caresheets/P_vitticeps.htm|access-date=2020-08-16|website=www.lihs.org}} Important Ecology and behaviour en
Agamy fousaté nejsou společenská zvířata, ale někdy se shromažďují ve skupinách, zejména v oblíbených krmících nebo vyhřívacích oblastech. {{Cite web|title=BEARDED DRAGON (Pogona vitticeps)|url=http://www.lihs.org/files/caresheets/P_vitticeps.htm|access-date=2020-08-16|website=www.lihs.org}} Useful Ecology and behaviour en
Ve skupinách vzniká jasná hierarchie, přičemž nejvýše postavená zvířata si zabírají nejlepší vyhřívací místa. {{Cite web|title=BEARDED DRAGON (Pogona vitticeps)|url=http://www.lihs.org/files/caresheets/P_vitticeps.htm|access-date=2020-08-16|website=www.lihs.org}} Important Ecology and behaviour en
Pokud se nízko postavené zvíře pokusí vyzvat jednoho z dominantních ještěrů, dominantní zvíře bude kývat hlavou a nafukovat bradu. {{Cite web|title=BEARDED DRAGON (Pogona vitticeps)|url=http://www.lihs.org/files/caresheets/P_vitticeps.htm|access-date=2020-08-16|website=www.lihs.org}} Useful Ecology and behaviour en
Nízko postavení draci mohou signalizovat podřízenost máváním jednou paží v pomalém nebo rychlém kruhu. {{Cite web|title=BEARDED DRAGON (Pogona vitticeps)|url=http://www.lihs.org/files/caresheets/P_vitticeps.htm|access-date=2020-08-16|website=www.lihs.org}} Useful Ecology and behaviour en
Pokud se nízko postavený drak nepodřídí, může dojít k patové situaci nebo boji. {{Cite web|title=BEARDED DRAGON (Pogona vitticeps)|url=http://www.lihs.org/files/caresheets/P_vitticeps.htm|access-date=2020-08-16|website=www.lihs.org}} Useful Ecology and behaviour en
Pomalé klanění se často používá u dospělých samic k signalizaci podřízenosti samci. {{Cite web|url=https://thepetenthusiast.com/bearded-dragon-behaviors/|title=Understand Your Bearded Dragon Behaviors and Body Languages|date=2019-10-11|website=The Pet Enthusiast|language=en-US|access-date=2019-12-30}} Unimportant Ecology and behaviour en
Rychlé kývání hlavou používají samci k signalizaci dominance. {{Cite web|url=https://thepetenthusiast.com/bearded-dragon-behaviors/|title=Understand Your Bearded Dragon Behaviors and Body Languages|date=2019-10-11|website=The Pet Enthusiast|language=en-US|access-date=2019-12-30}} Unimportant Ecology and behaviour en
Násilné kývání hlavou používají samci těsně před pářením. {{Cite web|url=https://thepetenthusiast.com/bearded-dragon-behaviors/|title=Understand Your Bearded Dragon Behaviors and Body Languages|date=2019-10-11|website=The Pet Enthusiast|language=en-US|access-date=2019-12-30}} Unimportant Ecology and behaviour en
Rychlé a násilné kývání hlavou u samců i samic označuje stres. {{Cite web|url=https://thepetenthusiast.com/bearded-dragon-behaviors/|title=Understand Your Bearded Dragon Behaviors and Body Languages|date=2019-10-11|website=The Pet Enthusiast|language=en-US|access-date=2019-12-30}} Unimportant Ecology and behaviour en
Samci mávají, aby ukázali podřízenost vůči dominantnímu samci. {{Cite web|url=https://thepetenthusiast.com/bearded-dragon-behaviors/|title=Understand Your Bearded Dragon Behaviors and Body Languages|date=2019-10-11|website=The Pet Enthusiast|language=en-US|access-date=2019-12-30}} Unimportant Ecology and behaviour en
Samice mávají a poté pomalu kývají hlavou, aby ukázaly připravenost k páření. {{Cite web|url=https://thepetenthusiast.com/bearded-dragon-behaviors/|title=Understand Your Bearded Dragon Behaviors and Body Languages|date=2019-10-11|website=The Pet Enthusiast|language=en-US|access-date=2019-12-30}} Unimportant Ecology and behaviour en
Březí samice často odmítají námluvy samců tím, že je pronásledují a lehnou si na jejich záda. {{Cite web|url=https://thepetenthusiast.com/bearded-dragon-behaviors/|title=Understand Your Bearded Dragon Behaviors and Body Languages|date=2019-10-11|website=The Pet Enthusiast|language=en-US|access-date=2019-12-30}} Useful Ecology and behaviour en
Při přímém útoku agamy fousaté otevřou ústa, aby ukázaly žluté membrány a natáhly bradu. <ref>Witten, G.J. (1993). No. 29 Family Agamidae. Fauna of Australia. Volume 2A. AGPS Canberra</ref> Important Ecology and behaviour en
Ztmaví barvu své kůže a zploští tělo, bude syčet a dělat malé skoky směrem k útočníkovi. <ref>Witten, G.J. (1993). No. 29 Family Agamidae. Fauna of Australia. Volume 2A. AGPS Canberra</ref> Useful Ecology and behaviour en
Agamy fousaté nejsou známy tím, že by útočily na lidi. <ref name=Doneley /> Important Ecology and behaviour en
Dospělí samci agamy fousaté mohou kousat s větší silou než dospělé samice. <ref name="Jonesetal2020a">{{cite journal |author=Jones |first1=Marc E. H. |last2=Pistevos |first2=Jennifer C. A. |last3=Cooper |first3=Natalie |last4=Lappin |first4=A. Kristopher |last5=Georges |first5=Arthur |last6=Hutchinson |first6=Mark N. |last7=Holleley |first7=Clare E. |year=2020 |title=Reproductive phenotype predicts adult bite-force performance in sex reversed dragons (''Pogona vitticeps'') |journal=Journal of Experimental Zoology A |volume=333 |issue=4 |pages=252‒263 |doi=10.1002/jez.2353 |pmid=32061035 |hdl-access=free |hdl=10141/622643 |s2cid=211122728}}</ref> Useful Ecology and behaviour en
Rozdíl v síle kousnutí je spojen s většími rozměry hlavy. <ref name="Jonesetal2020a">{{cite journal |author=Jones |first1=Marc E. H. |last2=Pistevos |first2=Jennifer C. A. |last3=Cooper |first3=Natalie |last4=Lappin |first4=A. Kristopher |last5=Georges |first5=Arthur |last6=Hutchinson |first6=Mark N. |last7=Holleley |first7=Clare E. |year=2020 |title=Reproductive phenotype predicts adult bite-force performance in sex reversed dragons (''Pogona vitticeps'') |journal=Journal of Experimental Zoology A |volume=333 |issue=4 |pages=252‒263 |doi=10.1002/jez.2353 |pmid=32061035 |hdl-access=free |hdl=10141/622643 |s2cid=211122728}}</ref> Useful Ecology and behaviour en
Agamy fousaté se mohou učit pozorováním chování jedinců svého druhu. {{cite web|url=http://www.reptilesmagazine.com/Lizards/Information-News/Bearded-Dragon-Lizards-Are-Smarter-That-You-Might-Think/|title=Bearded Dragon Lizards Are Smarter Than You Might Think!|website=Reptile Magazine|author=John Virata|date=1 October 2014}} Important Ecology and behaviour en
Experiment ukázal, že poté, co byl jeden jedinec vycvičen k otevření dveří, aby se dostal k potravě, většina ostatních agam fousatých, které to sledovaly, byla schopna tento úkon také provést. {{cite web|url=http://www.reptilesmagazine.com/Lizards/Information-News/Bearded-Dragon-Lizards-Are-Smarter-That-You-Might-Think/|title=Bearded Dragon Lizards Are Smarter Than You Might Think!|website=Reptile Magazine|author=John Virata|date=1 October 2014}} Important Ecology and behaviour en
Věk pohlavní dospělosti nebyl změřen, ale odhaduje se na jeden až dva roky. <ref name=":0">{{Citation |title=Pest Risk Assessment - Central bearded dragon |date=May 2011 |url=https://nre.tas.gov.au/Documents/Central-bearded-dragon.pdf |archive-url=https://web.archive.org/web/20230217012851/https://nre.tas.gov.au/Documents/Central-bearded-dragon.pdf |publisher=Tasmania Department of Primary Industries, Parks, Water and Environment |archive-date=17 February 2023}}</ref> Important Reproduction en
Velikost těla a rychlost růstu jsou důležitější než věk při určování pohlavní dospělosti u agam vousatých. <ref name=Doneley /> Important Reproduction en
Vysokoteplotní inkubace vajec přeměňuje geneticky samčí jedince na funkční samice. <ref name="Holleleyetal2015">{{cite journal |last1=Holleley |first1=Care E. |last2=O'Meally |first2=Denis |last3=Sarre |first3=Stephen D. |last4=Graves |first4=Jennifer A. Marshall |last5=Ezaz |first5=Tariq |last6=Matsubara |first6=Kazumi |last7=Azad |first7=Bhumika |last8=Zhang |first8=Xiuwen |last9=Georges |first9=Arthur |year=2015 |title=Sex reversal triggers the rapid transition from genetic to temperature-dependent sex |journal=Nature |volume=523 |issue=7558 |pages=79‒82 |bibcode=2015Natur.523...79H |doi=10.1038/nature14574 |pmid=26135451 |s2cid=1741119}}</ref> Very important Thermally induced sex reversal en
Když jsou jejich vejce inkubována při teplotách nad 32 °C (90 °F), někteří geneticky samčí jedinci se narodí jako samice. <ref>{{cite web |url=http://www.iflscience.com/plants-and-animals/male-bearded-dragons-turn-female-in-the-heat/ |title=TMale Bearded Dragons Turn Female In The Heat |date=8 June 2016 |publisher=[[IFLScience]]}}</ref> Important Thermally induced sex reversal en
Tyto samice jsou plodné, někdy produkují více vajec než ZW samice. <ref>{{cite web |url=http://www.iflscience.com/plants-and-animals/male-bearded-dragons-turn-female-in-the-heat/ |title=TMale Bearded Dragons Turn Female In The Heat |date=8 June 2016 |publisher=[[IFLScience]]}}</ref> Important Thermally induced sex reversal en
Jako mladistvé se ZZ samice s přepólovaným pohlavím podobají samcům ZZ vzhledem k relativní délce ocasu a nebojácnosti. <ref>{{cite journal |title=The behavioural consequences of sex reversal in dragons |journal=Proceedings of the Royal Society B: Biological Sciences |volume=283 |issue=1832 |pages=20160217 |year=2016 |doi=10.1098/rspb.2016.0217 |last1=Li |first1=Hong |last2=Holleley |first2=Clare E. |last3=Elphick |first3=Melanie |last4=Georges |first4=Arthur |last5=Shine |first5=Richard |pmc=4920310 }}</ref> Useful Thermally induced sex reversal en
Několik druhů rodu Pogona je chováno v zajetí jako domácí mazlíčci; nejoblíbenější jsou tento druh a Rankinův drak (Pogona henrylawsoni). <ref>{{cite web |url=http://www.abc.net.au/tv/petshow/txt/s1653176.htm |title=Pet Profile – Bearded Dragons |year=2008 |work=The Pet Show |publisher=[[Australian Broadcasting Corporation]]}}</ref><ref>{{cite book |last=Browne-Cooper |first=Robert|author2=Brian Bush|author3=Brad Maryan|author4=David Robinson |title=Reptiles and Frogs in the Bush: Southwestern Australia|year=2007|publisher=[[University of Western Australia]] Press|isbn=978-1-920694-74-6 |pages= 161|quote=Western Bearded Dragon, ''Pogona minor minor''}}</ref> Important Captive breeding en
Většina dnes v zajetí chovaných vousatých draků pravděpodobně pochází z nelegálně vyvezených zásob z Austrálie v 70. letech. <ref>Steve Grenard – Your Happy Healthy Pet: Bearded Dragon 2nd Edition, page 35</ref> Very important Captive breeding en
Vousatí draci mohou být ohroženi zácpou nebo zažívacími problémy z požití písku, štěrku nebo nevhodně velkého hmyzu. <ref>{{Cite journal |last=Cannon |first=Michael James |date=October 2003 |title=Husbandry and veterinary aspects of the bearded dragon ( pogona spp. ) in Australia |url=http://dx.doi.org/10.1053/s1055-937x(03)00036-7 |journal=Seminars in Avian and Exotic Pet Medicine |volume=12 |issue=4 |pages=205–214 |doi=10.1053/s1055-937x(03)00036-7 |issn=1055-937X}}</ref> Important Captive breeding en
Morf s nedostatečně vyvinutými hřbetními šupinami je oblíben jako terarijní mazlíček pod názvem "vousatý drak leatherback". <ref>{{cite web|url=https://beardiesrule.com/what-is-a-leatherback-bearded-dragon-a-leatherbac/|title=What Is A Leatherback Bearded Dragon?|website=BeardiesRule|date=23 April 2022 }}</ref> Useful Captive breeding en
Borodatá agama je ještěrka z čeledi agamovití. {{lang-la|Pogona vitticeps}} Very important ru

Odhalování vandalismu pomocí AI

Protože to není poprvé, co s tím někdo přišel [2][3][4][5], zkusím shrnout, na čem jsme nyní a co by se dalo udělat.

ORES

Data za posledních 30 dní
(55 913 editací, 4 831 revertováno)
Práh damaging goodfaith
Přesnost Citlivost Přesnost Citlivost
0.97 0.9000 0.0019
0.96 1.0000 0.0019 0.9655 0.0058
0.95 0.9412 0.0066 0.9839 0.0126
0.94 0.9753 0.0164 0.9796 0.0199
0.93 0.9322 0.0342 0.9655 0.0290
0.92 0.9318 0.0594 0.9624 0.0424
0.91 0.9168 0.0890 0.9626 0.0586
0.90 0.9061 0.1178 0.9619 0.0785
0.89 0.8991 0.1513 0.9566 0.1004
0.88 0.8911 0.1813 0.9300 0.1265
0.87 0.8796 0.2087 0.9247 0.1501
0.86 0.8728 0.2416 0.9236 0.1776
0.85 0.8623 0.2645 0.9210 0.2026
0.84 0.8555 0.2854 0.9129 0.2233
0.83 0.8520 0.3109 0.9082 0.2438
0.82 0.8369 0.3293 0.9063 0.2602
0.81 0.8214 0.3475 0.9033 0.2765
0.80 0.8122 0.3662 0.8997 0.2915
0.79 0.8003 0.3834 0.8915 0.3028
0.78 0.7889 0.4007 0.8850 0.3124
0.77 0.7798 0.4177 0.8773 0.3213
0.76 0.7721 0.4347 0.8747 0.3310
0.75 0.7580 0.4519 0.8650 0.3407
0.74 0.7439 0.4684 0.8614 0.3498
0.73 0.7282 0.4819 0.8555 0.3589
0.72 0.7228 0.4997 0.8495 0.3658
0.71 0.7133 0.5154 0.8467 0.3749
0.70 0.7018 0.5295 0.8404 0.3838
0.69 0.6942 0.5427 0.8322 0.3933
0.68 0.6832 0.5545 0.8258 0.4003
0.67 0.6740 0.5684 0.8224 0.4082
0.66 0.6641 0.5825 0.8152 0.4210
0.65 0.6531 0.5955 0.8051 0.4318
0.64 0.6399 0.6065 0.7996 0.4436
0.63 0.6287 0.6189 0.7905 0.4531
0.62 0.6202 0.6307 0.7795 0.4647
0.61 0.6104 0.6421 0.7730 0.4759
0.60 0.6014 0.6572 0.7642 0.4856
0.59 0.5916 0.6682 0.7534 0.4982
0.58 0.5834 0.6798 0.7425 0.5098
0.57 0.5742 0.6897 0.7344 0.5202
0.56 0.5638 0.6999 0.7249 0.5312
0.55 0.5549 0.7096 0.7159 0.5419
0.54 0.5472 0.7218 0.7105 0.5543
0.53 0.5387 0.7336 0.7025 0.5659
0.52 0.5286 0.7431 0.6948 0.5821
0.51 0.5213 0.7533 0.6860 0.5939
0.50 0.5138 0.7622 0.6744 0.6055
0.49 0.5061 0.7694 0.6637 0.6185
0.48 0.4997 0.7783 0.6509 0.6313
0.47 0.4923 0.7856 0.6346 0.6417
0.46 0.4857 0.7936 0.6211 0.6539
0.45 0.4790 0.7998 0.6125 0.6680
0.44 0.4721 0.8065 0.6030 0.6769
0.43 0.4668 0.8131 0.5939 0.6862
0.42 0.4613 0.8199 0.5845 0.6972
0.41 0.4553 0.8251 0.5738 0.7063
0.40 0.4505 0.8301 0.5677 0.7168
0.39 0.4441 0.8350 0.5597 0.7251
0.38 0.4385 0.8400 0.5526 0.7328
0.37 0.4328 0.8433 0.5444 0.7404
0.36 0.4293 0.8479 0.5401 0.7464
0.35 0.4250 0.8512 0.5346 0.7533
0.34 0.4195 0.8534 0.5281 0.7595
0.33 0.4147 0.8561 0.5219 0.7655
0.32 0.4101 0.8597 0.5158 0.7715
0.31 0.4064 0.8623 0.5099 0.7798
0.30 0.4012 0.8640 0.5038 0.7864
0.29 0.3963 0.8667 0.4992 0.7916
0.28 0.3917 0.8708 0.4945 0.7969
0.27 0.3866 0.8731 0.4894 0.8023
0.26 0.3814 0.8754 0.4854 0.8065
0.25 0.3763 0.8781 0.4817 0.8135
0.24 0.3704 0.8808 0.4762 0.8166
0.23 0.3650 0.8841 0.4715 0.8212
0.22 0.3600 0.8870 0.4687 0.8270
0.21 0.3540 0.8890 0.4653 0.8305
0.20 0.3463 0.8913 0.4610 0.8334
0.19 0.3381 0.8948 0.4568 0.8381
0.18 0.3288 0.8969 0.4529 0.8416
0.17 0.3190 0.9000 0.4469 0.8441
0.16 0.3090 0.9033 0.4422 0.8481
0.15 0.2999 0.9075 0.4372 0.8524
0.14 0.2897 0.9122 0.4300 0.8551
0.13 0.2790 0.9160 0.4239 0.8576
0.12 0.2677 0.9193 0.4181 0.8609
0.11 0.2563 0.9249 0.4124 0.8638
0.10 0.2465 0.9313 0.4044 0.8673
0.09 0.2356 0.9354 0.3969 0.8702
0.08 0.2226 0.9396 0.3906 0.8748
0.07 0.2099 0.9454 0.3815 0.8781
0.06 0.1942 0.9499 0.3714 0.8810
0.05 0.1762 0.9567 0.3559 0.8851
0.04 0.1512 0.9663 0.3341 0.8911
0.03 0.1280 0.9770 0.2985 0.9062
0.02 0.1040 0.9923 0.2304 0.9352
0.01 0.0889 0.9992 0.1524 0.9731
0.00 0.0864 1.0000 0.0864 1.0000

Od roku 2017 tu máme ORES. Kdykoliv někdo zveřejní editaci, služba na serverech WMF bezprostředně spočítá její skóre (číslo mezi 0 a 1). Na cswiki počítají skóre hned dva modely: model kvality (damaging) a model úmyslu (goodfaith). Tato dvě skóre jsou součástí filtrů v posledních změnách. Správci a patroláři (vlastně kdokoliv) si tak můžou vyfiltrovat pouze změny, jejichž skóre je v rámci určitých mezí (např. dost možná problematická editace). Není mi známo, že by se od té doby tyto modely využívaly i jinak.

Jak byly modely natrénovány? Byl vytvořen nástroj, pomocí nějž uživatelé ručně označovali náhodně vybrané editace jako škodlivé nebo bez problémů. (Celkem jich bylo označeno 17 718.) Vývojáři poté na těchto datech naučili dva klasifikátory, založené na metodě gradient boosting (tedy žádné hluboké sítě, které byly tehdy teprve na vzestupu).

Jak si tedy ORES, natrénovaný někdy v roce 2017, vede v roce 2024? Úspěšnost binárního klasifikátoru lze vyhodnotit např. pomocí plochy pod tzv. precision-recall křivkou [6]. K tomu je nutné mít data z roku 2024. Než bychom získali stejnou procedurou dostatek takových dat, možná už by byl rok 2025. Naštěstí byla v roce 2020 zavedena funkce, kdy systém permanentně označuje zrušené editace značkou „revertováno“. Ne každý vandalismus je takto označen (systém má jasně daná kritéria, kdy značku přiřadí) a ne každá takto označená editace je vandalismus (mohlo jít jen o omyl, žádný špatný úmysl). Ale ve většině případů tomu tak je. Od té doby bylo touto funkcí označeno 245 tisíc editací, to je opravdu velké množství dat. Potenciál této malé funkce je tedy značný.

Vyhodnocení modelů ORES (data z posledních 30 dní, po tuto dobu jsou skóre uložena v databázi) vzhledem ke značce revertováno (average precision):

  • damaging – 67,5 %
  • goodfaith – 70,1 % (poznámka: skóre jsem obrátil, tedy 1 = špatný úmysl)

Pro podrobné údaje viz tabulku. Ve zkratce:

  • Model odhadu úmyslu koreluje s predikcí vandalismu o něco lépe než odhad kvality.
  • Samotný ORES spíše nelze pro automatizované odchytávání vandalismu použít. (A to i proto, že je to nedoporučeno.)

Konkrétní příklad: dejme tomu, že pomocí goodfaith modelu budeme chtít automaticky revertovat 25 % vandalismů s nejvyšším skóre. V pátém sloupci nalezneme hodnotu 0.25 někde mezi prahem 0.82 a 0.83. To odpovídá přesnosti 90,6–90,8 %, tj. chybovosti skoro 10 %. Takže automatické revertování 25 % vandalismů současně znamená, že zhruba každý desátý revert bude falešně pozitivní.
Podobně: automatické revertování 50 % vandalismů odpovídá chybovosti blízké 25 %. Za předpokladu 200 vandalismů denně to v průměru odpovídá 133 revertům, z čehož 33 pravděpodobně nebude žádoucích.
Alternativní přístup: chceme míru falešně pozitvních revertů udržet pod určitou mezí. Maximálně 1% chybovost je pravděpodobně nedosažitelná. Nejvýše 2% chybovost odpovídá záchytu cca 2 % vandalismu (což odpovídá asi čtyřem revertům denně).

Příčiny/Hypotézy:

  • Trénovací data obsahovala málo příkladů vandalismu (cca 2,5 %, resp. 1,1 %). Dataset použitý pro vyhodnocení modelů obsahuje 8,5 % revertovaných editací.
  • Asi by dávalo větší smysl model aplikovat pouze na editace IP adres a nových účtů a ignorovat zavedené uživatele, správce, roboty apod. V takovém případě však měníme distribuci dat.
  • Vandalismus před rokem 2017 vypadal jinak než v roce 2024 („příprava na proběhlou válku“).

Jaké jsou alternativy?

Naší „spásou“ by mohl být aktuálně vyvíjený Automoderator s novými modely (jedním založeným na LLM, který byl učený na textech Wikipedií, včetně české) odhadujícími pravděpodobnost, že editace bude revertována (pro učení použili právě značku revertováno).

Další možností je inspirovat se enwiki a vytvořit vlastního ClueBota. Možností je například vytvořit bayesovský model podobný spam filtru, který naučíme na revertovaných editacích. Teď když tu značku máme, je nějaké strojové učení daleko snadnější.

--Matěj Suchánek (diskuse) 18. 5. 2024, 21:04 (CEST)

Díky za shrnutí, Matěji. Myslím si, že opravdu od vzniku modelu uběhla tak dlouhá doba, že by se určitě vyplatilo vytvořit nový, který by mohl být o dost kvalitnější. Máme víc dat, díky té značce asi lépe olabelovaných a také technologie modelování od té doby zase pokročila. Myslím, že i poměrně "jednoduchý" open sourcový velký jazykový model by nám s klasifikací hodně pomohl. Ty tradiční spam modely tenkrát ještě pro zpracování jazyka používaly různé nepřímé technky jako bag-of-words a n-gramy, zatímco LLM už do jisté míry "rozumí" napsanému slovu v kontextu. Co se týče vynechání prověřených uživatelů ze vzorku, tak to nevnímám jako problém - ti stejně moc nevandalizují, a když už, tak mnohem sofistikovaněji. Když tak by se na kvalitu jejich výtvorů dal netrénovat zvláštní model.
Otázky ale zůstávají: kdo by to dělal, na jakém železe a jak by se to implementovalo.--Jan Spousta (diskuse) 18. 5. 2024, 21:22 (CEST)
Jak píšu, nové modely už byly natrénovány na nesrovnatelně větším množství dat (podíl revertovaných editací dokonce přibližně odpovídá skutečnosti). Jsou i nasazené na serverech a lze se jich dotazovat (skript, API). Jenom ještě nejsou integrovány do posledních změn (takže je nemůžu vyhodnotit tak jako ty dva starší). Ale řekl bych, že to je blízko: phab:T348298.
Železo a implementaci tedy WMF vyřešila za nás. Snad se to dotáhne do konce a tyhle věci nebudeme muset řešit my. --Matěj Suchánek (diskuse) 19. 5. 2024, 18:35 (CEST)

Update: menší aktualizace analýzy, některé závěry byly příliš zjednodušené a pesimistické. --Matěj Suchánek (diskuse) 19. 5. 2024, 11:50 (CEST)

Použití LLM ke korektuře strojových překladů

Na nové strojové překlady DeepLu a spol. asi nemá cenu chatboty pouštět, protože za každou opravenou chybu nejspíš zanesou jednu další novou - jsou podobně schopné jako DeepL. Díky úsilí nejmenovaného kolegy však tady máme plno prakticky neopravených strojových překladů z dob, kdy ještě překladače nebyly tak dobré. Na pár z nich jsem LLM vyzkoušel s instrukcí Následuje strojový překlad ze slovenštiny. Zbav ho chyb a slovakismů. Wikimedia markup ponechej. Výsledek si můžete prohlédnout: [7], [8] (oba GPT-4o), [9] a [10] (oba Claude 3 Sonnet). Můžete se také podívat, jak jsem to upravil dál, abyste viděli, kolik chyb tam po LLM ještě zůstalo. Mé závěry:

  • na výstupy překladačů o generace zpátky už moderní LLM fungují, opraví daleko víc chyb, než jich vytvoří,
  • ale neopraví zdaleka všechno a musí se to po nich stejně pečlivě kontrolovat.

Z toho pro mě plyne závěr, že při ručním opravování se vyplatí text pouštět skrz LLM jenom v případě, že článek je delší a hodně pokažený (třeba jako byl lorica musculata). U kratších a méně chybových textů ušetřím čas, když je opravím rovnou a nenahazuji LLM. Kdyby se to dalo automatizovat a na starší ještě pořádně nezeditovanou produkci zmíněného kolegy pustit nějaký model hromadně třeba i bez kontroly, tak je vysoce pravděpodobné, že tím Wikipedii celkově zlepšíme, ale ty články stejně ještě nebudou OK.--Jan Spousta (diskuse) 19. 5. 2024, 16:47 (CEST)

Vítací Wikirobůtek: jak může AI pomoci vychovávat nováčky

Pro otestování možnosti automaticky vítat nové uživatele s pomocí umělé inteligence jsem zbastlil robůtka poháněného modelem GPT-4o, který umí pochválit uživatele, jenž založil svůj první článek na české Wikipedii, a dát mu tip na vylepšení. Je samozřejmě nevyladěný, uvádím ho jen jako demonstraci možnosti, ne že by se s ním takhle dalo hned jít ven.

Jeho prompt je psaný anglicky, jelikož je to levnější a možná to lépe odliší metajazyk příkazu a češtinu textů, s nimiž robot pracuje. Zní:

You work for Czech Wikipedia. You are tasked with responding to a person who started his/her first article (whose content follows this instruction). Write in Czech, format your text in the Wikimedia markup and take into account that you do not know the age or gender of the author of the article. You can tell the author that they are doing an important thing to help spread free information (šířit svobodné informace). If they have questions, they can contact Wikipedie:Potřebuji pomoc and also use the Nápověda:Obsah help portal. In addition, you can praise their text, if it is worthwhile, and offer them one or at most two short tips for improvement, if the article lacks something. Specifically, in order of importance: The article text must be clear and address an encyclopedically relevant topic. It must be written in the correct academic Czech language. It must be written impartially. It must be based on the sources to be cited. It must not be too short or too long. The first sentence should contain a definition of the subject of the article and the subject should be in bold there. The article should contain a reasonable number of internal links. If long enough, it should contain chapters marked by == Heading ==. It should be reasonably categorised. It may contain reasonable number of pictures, if they are available.

Introduce yourself as the robot Wikirobůtek who welcomes new Wikipedians. Always write in the singular about yourself and use formal vykání e.g. Vítám Vás na Wikipedii. The expection is if you see that the author is a child, then you may use Vítám Tě na Wikipedii. Try to be warm and funny, but not arrogant. If giving the one or two tips, be very specific and cite the article, but try not to sound like a strict judge. Everything can be easily corrected on Wikipedia and it is important not to be afraid. Do not use Wikipedia templates or commentaries about your task other than addressed to the author, start just by addressing the reader.

Poté následuje text nově založeného článku.

Vyzkoušel jsem to na pár případech, většinou ze starší historie Wikipedie:

Založení článku Mariánský sloup (Staroměstské náměstí)

Založila jakási jednorázová uživatelka, stálo tam jen „Marianský sloup je v Praze na staroměstském náměstí.“ Odpověď robota:

Vítám Vás na Wikipedii, milý autorem!

Já jsem Wikirobůtek a mám obrovskou radost, že jste se rozhodl/a vytvořit svůj první článek! Děláte tím velmi důležitou věc a pomáháte šířit svobodné informace.

Podíval jsem se na Váš článek "Mariánský sloup." Dovolte mi pochválit Vás za jeho založení, protože je důležité, abychom měli články i o méně známých, ale historicky významných památkách.

Měl bych pro Vás jednu dobrou radu: zkuste přidat více informací a rozvinout text. Například byste mohl/a začít první větu definicí: **Mariánský sloup je barokní památka umístěná na Staroměstském náměstí v Praze.**

Dále je dobré se trochu více rozepsat o jeho historii, významu a třeba i o tom, kdy a proč byl postaven. Nezapomeňte také na zdroje a odkazy na další články na Wikipedii, které by mohly čtenáře zajímat.

Pokud budete mít nějaké otázky nebo budete potřebovat pomoc, můžete se obrátit na stránky Wikipedie:Potřebuji pomoc nebo využít Nápověda:Obsah.

Ještě jednou Vám moc děkuji za Váš příspěvek a těším se na další Vaše články!

S pozdravem,

Váš Wikirobůtek

Založení článku Směrodatná odchylka

Můj první článek, už zkraje celkem slušný ([11]), až na ty reference.

Vítám Vás na Wikipedii!

Já jsem Wikirobůtek, robot, který s radostí vítá nové wikipedist(k)y. Jsem nadšen z Vašeho článku o směrodatné odchylce. Díky Vaší práci pomáháte šířit svobodné informace a přispíváte k bohatství české Wikipedie. Skvěle jste vysvětlil/a pojem směrodatné odchylky, vaší práce si velmi cením!

Rád bych Vám nabídl jednu užitečnou radu pro zlepšení článku: Bylo by dobré přidat odkazy na zdroje, ze kterých jste čerpal/a informace. Odkazy na věrohodné zdroje zvýší důvěryhodnost článku a dodají mu akademický charakter.

Kromě toho jste odvedl/a skvělou práci! Máte-li jakékoli dotazy nebo potřebujete další pomoc, neváhejte se obrátit na stránky Wikipedie:Potřebuji pomoc nebo využijte Nápověda:Obsah.

Ještě jednou děkuji za Váš příspěvek a těším se na další Vaše články.

S přátelským pozdravem,

Váš Wikirobůtek

Založení článku Antilopa modrá

První článek od @OJJ:, taky na nováčka velmi slušný ([12]).

Vítám Vás na Wikipedii!

Já jsem Wikirobůtek, váš virtuální průvodce Wikipedií. Je skvělé vidět, že jste vytvořil/a svůj první článek o **antilopě modré**. Tímto způsobem významně přispíváte k šíření svobodných informací, a to je velmi důležité. Váš článek je poutavý a čtivý, takže za to Vám patří velká pochvala!

Rád bych Vám nabídl jednu malou radu k vylepšení Vašeho článku: zvažte přidání více interních odkazů na další související články na Wikipedii (například odkazy na další druhy savců nebo na téma vyhynulých zvířat). Interní odkazy čtenářům pomohou snadněji najít více informací o souvisejících tématech.

Také by bylo skvělé, kdyby se do článku podařilo přidat nějaké věrohodné zdroje. Přítomnost zdrojů zvýší důvěryhodnost článku. Například, když tvrdíte, že poslední antilopa modrá zahynula v roce 1800, pokuste se uvést odkaz na literaturu nebo studii, kde je tato informace zmíněna.

Máte-li jakékoli dotazy nebo potřebujete pomoc, neváhejte se obrátit na stránky Wikipedie:Potřebuji pomoc nebo využít Nápověda:Obsah.

Děkuji Vám ještě jednou za Váš příspěvek a těším se na další Vaše články!

S přátelským pozdravem,

Váš Wikirobůtek

Založení článku Ježci Heřmanův Městec

Založil nováček, obsah byl:

Ježci Heřmanův Městec je hokejbalový klub který hraje v druhé nejvyšší české soutěži a sídlí v Heřmanovi Městci. Hokejbalový klub vznikl v červnu 1999, s názvem Aligátoři Heřmanův Městec ale v roce 2001 se už přejmenoval na Ježci Heřmanův Městec. V sezóně 2001-2002 hrál A-tým první oficiální soutěž a to v okresní hokejbalové lize Chrudimsko.

ARÉNA JEŽKÁRNA

V roce 2002 se postavil první domácí stadion s názvem Aréna ježkárna.

Vítám Vás na Wikipedii!

Já jsem Wikirobůtek a s velkou radostí vítám nové tvůrce článků. Váš příspěvek o „Ježcích Heřmanův Městec“ je velmi zajímavý a cenný. Díky Vám se může širší veřejnost dozvědět více o tomto hokejbalovém klubu a jeho významu.

Mám pro Vás dvě malé rady, jak článek ještě vylepšit:

1. Pokuste se rozšířit úvodní větu tak, aby obsahovala definici a byla více srozumitelná: například takto: **„Ježci Heřmanův Městec je český hokejbalový klub sídlící v Heřmanově Městci, který hraje ve druhé nejvyšší hokejbalové soutěži v České republice.”**

2. Zkuste přidat více interních odkazů na související články, například: hokejbal, okresní liga, Chrudim nebo domácí stadion. Interní odkazy čtenářům usnadní orientaci a možnost najít více informací o příbuzných tématech.

Máte-li jakékoli dotazy nebo potřebujete další pomoc, neváhejte se obrátit na stránky Wikipedie:Potřebuji pomoc nebo využijte Nápověda:Obsah.

Ještě jednou Vám děkuji za Váš příspěvek! Přispíváte k šíření svobodných informací, což je velmi důležitá práce.

S přátelským pozdravem,

Váš Wikirobůtek

Zhodnocení

Připadá mi, že po doladění by něco podobného mohlo být užitečné a lépe pomoci nováčkům se orientovat tím, že je to personalizované a vysvětlí jim poměrně konkrétně, co na své práci mohou vylepšit. GPT se občas splete, ale když se představí jako robůtek, tak to uživatelé snad zkousnou. Kdybychom byli první Wikipedie na světě, která nováčky doprovází pomocí AI, tak by to mohlo být sexy.--Jan Spousta (diskuse) 19. 5. 2024, 21:19 (CEST)

@Jan Spousta Ehm, tohle skoro překonává můj odpor k automatickému vítání :-). Potneciál to určitě má. Pro vítání autorů pahýlů by to šlo, jako důležité vidím určité odladění aby to nechválilo za subpahýly a nevýznamné články. Tam by možná šlo hlídat určitou délku. Otázkou je, zda by stroj dokázal odhalit problematickou významnost... --JAnD (diskuse) 20. 5. 2024, 08:22 (CEST)
@Jan Spousta: Jop, díky. Jenže u nových hesel je toho na posuzování tolik, že by to v současnosti nemělo valný smysl >> navíc by vypadalo divně, kdyby robůtek něco pochválil a správce tam pak vlepil údržbové šablony pro nevýznamnost atd. A pak je samozřejmě otázka, jak by to vzali lidi, když už jim vadí standardní šablony.
Antilopa modrá je jinak samozřejmě žumpa (ach bóže, co jsem to sem před deseti lety importoval, alespoň každý ví, kdo sem původně vlezl jako hlavní OJJák :-D), rozhodně ne poutavé a čtivé heslo (taky bych to ale nováčkovi nenapsal). Zdroj na vyhynutí tam ale je (když si otevřeš tu revizi a odkaz na BioLib, tak tam rok 1800 je), někdo ho zas může hodit třeba do shrnutí, někde musíš odhalit, že je to přeložené, a jestli to není copyvio atd. Takže zde stále bude skutečný personalizovaný přístup nenahraditelný.
Co bych fakt ocenil, je ale začlenění nějakého překlepáře, ne reformulátora. Nějaké rozšíření, co by zvýraznilo překlepy, chybějící čárky, gramatické chyby atd., to by fakt na patrole pomohlo. Ale muselo by to být spolehlivé, včera jsem to vyzkoušel a musel jsem po tom stroji dost opravovat. --OJJ, Diskuse 20. 5. 2024, 08:45 (CEST)
A tedy zdůrazňuji jednoduchého. Ty programy jsou na jednu stranu fajn, ale na druhou stranu vyžadují znalosti programování (pro někoho, kdo v Pythonu udělal minimum, jsou těžkopádné), párování s placenými klíči, ten robot to dlouho vypisuje a musí se to po něm kontrolovat atd. Ve výsledku to třeba přinese inspiraci, ale neušetří moc času. Chápej, třeba kontroluju článek, mám ho přečtený řekněme za pět minut (co se týče překlepů a čárek). Nepotřebuji, abych stejnou dobu čekal na generované opravy, pročítal je (:-)) a začleňoval je, ale abych někam hodil text a dostal jsem spolehlivě zvýrazněné chyby třeba za 10 sekund. Ušetřený čas by se dal využít i pro tu personalizovanou zpětnou vazbu. OJJ, Diskuse 20. 5. 2024, 09:08 (CEST)
@JAn Dudík, OJJ: Ahoj, jak píšu, tohle je jenom demonstrace, ukázka, že ta technologie má potenciál, ale není to ani zdaleka hotové řešení. Kdybychom to chtěli udělat pořádně, tak bychom mimo jiné museli napřed analyzovat dosavadní chování nováčka a hrubou kvalitu jeho příspěvku (jestli je to subpahýl nebo naopak rozumný pokus, možná i jaké jsou v příspěvku hlavní nedostatky, jestli je to copyvio atd.), a až podle toho instruovat vítacího Wikirobůtka - tady se jedním promptem snažím spláchnout všechny eventuality, což není tak efektivní. Muselo by to být tak dobré, aby to mohlo běžet automaticky někde na pozadí a jen velmi zřídka se dopouštělo větších úletů.
Osobně mám pocit, že tohle je potenciálně hodně nadějná aplikace, která může výrazně zlepšit uživatelskou zkušenost wikipedistů-nováčků. Byl bych ochotný se jí věnovat, ale potřebovalo by to tým aspoň tří lidí: kromě programátora AI (mě) ještě někoho, kdo zná technologii Wikipedie a má zkušenost s provozováním botů, a dále někoho, kdo se vyzná v politice komunity Wikipedie a nadace Wikimedia a práci s nováčky (potřebujeme sbírat zpětnou vazbu, testovat, komunikovat s komunitou a nadací a nakonec zajistit průběžné financování AI = odhaduji řádově 10 korun na přivítaného nováčka, pokud bychom použili ChatGPT, jako jsem to udělal tady já).
Pokud jde o kontrolu jazyka, OJJi, tak to je úplně jiná úloha. Chatboty k tomu pomalu spějí, ale pořád z nich nemám dojem, že by byly až tak dobré - možná za pár let. Viz tu kontrolu čs pavilónu na světové výstavě výše v tomhle vlákně - hodně možností zlepšení jazyka našel, ale celková úspěšnost tak 50 %. Šlo samozřejmě o NČ, takže tam těch chyb už není tolik, zatímco u nějakého hodně špatného textu by LLM byl asi o hodně efektivnější. Ale na úrovni Karla Čapka sloh zatím nezvládá a asi ani ještě několik let nebude.
A jinak - prakticky všechno, co tady demonstruji, by se dalo implementovat tak, aby to nevyžadovalo žádné programátorské znalosti, ale vyjelo na stisknutí tlačítka. Je to jen otázka, kam nás s tím Wikipedie pustí a kolik by do podobných nástrojů chtěla případně investovat.--Jan Spousta (diskuse) 20. 5. 2024, 14:32 (CEST)
Je to zajímavý nápad, takové osvěžení. Díky za něj. Nějakým „free“ LLM modelem jsem takto projel dva ze svých článků a výsledek není hrozný. I když mi to pokaždé vytklo potřebu zdrojovat fakta, která však v obou případech zdroj měla. Na druhou stranu nebudu lhát – k využitelnosti LLM jsem skeptický obecně, nejenom tady na Wiki. Totiž si nejsem jist, jestli by tento způsob vítání vedl k nějakému zásadnímu zlepšení získávání nových wikipedistů*wikipedistek. Šablonu {{vítejte}} pokládám za dobrou věc a klidně bych ji na DS vkládal automaticky, než až s (první, několikátou) editací. Byl bych ale pro, abychom tento nástroj v praxi aspoň zkusili, získali nějaká data. Práci s nováčky se jinak věnuje tým Growth. --Ján Kepler (diskuse) 20. 5. 2024, 18:14 (CEST)
@Ján Kepler, Jan Spousta: V reálu je nováčků za den dost málo, resp. jednotky použitelných a dá se to podchytit ručně. Je otázka, kolik lidí by se naopak urazilo, že jim za feedback nestojíme (nekomentuji "nováčky", co ve skutečnosti nováčky nejsou a další folklór). Já si třeba uvědomil, že na jednu AI generovanou zprávu jsem kvůli tomu odmítl reagovat, časem to ale asi bude normální. Koneckonců taky používáme šablony.
Honza Spousta se toho teď chytil fest, nějaké ty nápady se mi zamlouvají, některé míň, některé vůbec. Ve finále z toho mám rozporuplné pocity. --OJJ, Diskuse 20. 5. 2024, 20:17 (CEST)
@Ján Kepler, OJJ: Podle mě se teď nováčci vítají spíš nahodile. Občas vídám, že nováček tu už nějakou dobu pracuje, a pořád mu nikdo nic nenapsal. Navíc ten robůtek umožňuje dát personalizovanou zpětnou vazbu, což lidští uživatelé dělají zřídka, snad s výjimkou šablon typu Urgentně upravit, přičemž ale stejně většinou nováčkovi podrobně nevysvětlí, jak má svůj výtvor upravit.
A robotické uvítání nebrání, aby živý wikipedista nováčkovi něco napsal taky. Může klidně přihodit větu "Ahoj, taky tě vítám na palubě, kdybys potřeboval s něčím poradit, napiš mi na diskusní stránku." a bude to to nejlepší uvítání.--Jan Spousta (diskuse) 21. 5. 2024, 11:46 (CEST)
Návrh na automatické vítání se objevuje opakovaně (naposled loni), ale nikdy nebylo dosaženo konsenzu pro (ale ani proti, takže platí status quo). Respektive jsme se nikdy neshodli, jestli vítat automaticky a) hned po založení účtu, b) hned po první editaci, c) po první editaci, kterou vyhodnotíme jako konstruktivní atd.
Líbí se mi, jak robot umí vyzvat k rozšíření článku využitím kontextu („Dále je dobré se trochu více rozepsat o jeho historii, významu a třeba i o tom, kdy a proč byl postaven.“). Přitom ale (naštěstí) neříká, co přesně by uživatel měl vložit.
Nápad: Pojďme takového robota vyzkoušet, ale abychom se vyhnuli adresnému uvítání (dejme tomu, že to mu zatím přenechat nechceme), pišme zatím výstupy z robota do diskuse k článku (nebo na nějakou její podstránku), ne do diskuse uživatele. Díky tomu bude možné ladění a sběr dat za běhu. V diskusi nemůže způsobit velké škody, z ní se to vždycky dá smazat. --Matěj Suchánek (diskuse) 21. 5. 2024, 15:44 (CEST)
@Matěj Suchánek: Tohle je zatím jen neodladěná ukázka, proof-of-concept, navíc bez dalších potřebných součástí, takže se to nasadit nedá ani nanečisto. Smyslem je jenom ukázat, že je taková věc se současnou technologií už myslitelná. Pro reálné použití bychom museli:
  • dát dohromady malý tým lidí, který by to chtěl dělat, z toho aspoň jeden člověk znalý programování botů a jeden kolem wiki-politiky a nováčků
  • zajistit obecný souhlas komunity
  • zajistit souhlas spolku Wikimedia a financování tímto spolkem (na ladění spálíme možná až malé tisíce korun a na ostrém provozu řádově tisícovku měsíčně, což se mi nechce platit z vlastní kapsy)
  • vymyslet přesnou koncepci (koho. kdy a jak chceme oslovovat, jak budeme reagovat na různé kategorie nováčků od vandalů po ty skoro profesionální, co požadujeme od bota a jak se bude jmenovat,...)
  • AI bota naprogramovat a odladit (týdny práce, pokud bychom to chtěli dělat pořádně - potřebujeme také stáhnout řadu dalších dat a zpracovat je, např. automatizovat rozhodnutí o copyviu)
  • testovat během vymezeného období, třeba jeden měsíc, pod přísným dohledem (někdo by si musel každý den poctivě přečíst, co robot vyplodil, a reagovat na případné chyby opravou programu)
  • vyhodnotit a rozhodnout se, zda AI vítání nasadíme trvaleji
Zatím se mi nikdo nepřihlásil, kdo by to chtěl dělat se mnou, takže ještě není splněn ani první bod.--Jan Spousta (diskuse) 21. 5. 2024, 17:08 (CEST)
Ahoj, za mě to vítání uživatelů je super nápad, bohužel však v současný době nejsem schopen se tomu progamátorsky věnovat. Ale tedy myslím, že je to krásnej příklad pro Wikipedie:Komunitní minigranty --~~~ --frettie.net (diskuse) 24. 5. 2024, 14:29 (CEST)
@Frettie: To je dobrý nápad, Frettie, dík. Ale sám to neutáhnu, potřeboval bych ještě někoho k sobě. Minimálně někoho, kdo provozuje a trochu programuje boty a uměl by naprogramovat jednoduchý scheduler a vkládání těch vítacích zpráv na diskusní stránky nováčků. Já jsem tu v životě bota neměl a nechce se mi to učit.--Jan Spousta (diskuse) 24. 5. 2024, 14:45 (CEST)
Tak botovodičů je tu spousta, jen je potřeba někdo, kdo má dost času a píle. @Matěj Suchánek, napadá tě někdo? --frettie.net (diskuse) 24. 5. 2024, 16:39 (CEST)
Chtěl jsem zareagovat už dřív, ale nebyl čas.
Naprosto rozumím té finanční stránce problému. Peníze nás stojí už jen to, že si s tím hrajeme, abychom zjistili, jestli se to dá použít. To je k ničemu.
scheduler a vkládání těch vítacích zpráv na diskusní stránky je něco, co půjde v Pythonu celkem snadno a klidně to můžu udělat já (za odpoledne). K tomu by se hodil i nějaký čistě algoritmický filtr, který nám řekne „tohle chatbotovi nedávejme“ (není to potřeba nebo nemá to cenu).
Ještě nápad: Jak je to vlastně s formátováním promptu? Je prompt wikitext, nebo prostý text (robot to samozřejmě zvládne očistit)? Co takhle použít LLM čistě na jazykovou stránku věci (tj. ptát se jenom na styl textu), různé wikizáležitosti místo toho odchytit algoritmicky (např. žádné nadpisy, žádné kategorie) a jenom je „podsunout“ jako součást promptu („Také uživatele upozorni, že v článku nejsou žádné nadpisy.“)? --Matěj Suchánek (diskuse) 24. 5. 2024, 21:35 (CEST)
@Frettie, Matěj Suchánek: Díky, pánové! Pokud dáme dohromady nějaký tým, tak si především budeme muset někam na pár hodin sednout a říct si, co ta aplikace bude dělat. Koho má vítat (logické podmínky zahrnutí), kdy ho má vítat (co nejdřív po činu, nebo se má počkat, jak zareaguje patrola?), jak se má prezentovat (jméno, tón, grafika) a jak má reagovat na různé možnosti toho, co nováčci dělají. Možná bude výstup (a prompt LLM) formulovaný jinak pro někoho, kdo jenom "zlobí" a experimentuje, a jinak pro někoho, kdo už konstruktivně přispívá. A může to záležet i na dalších okolnostech, jako je dosavadní editační historie dotyčného, zda je registrovaný nebo IP, zda a jak na článek a uživatele reagovali živí wikipedisté. No pak půjdeme programovat a testovat na minulých případech. (Což znamená z historie wiki stáhnout stovky případů, kdy v minulosti nějaký nováček založil článek, abychom viděli, jak by na to náš robůtek reagoval.) Pak si musíme nechat schválit zkušební běh, vyhodnotit, případně upravit program, a pak teprve můžeme říct, že jsme hotoví a provozovat to více méně rutinně. Takže to znamená kromě peněz na LLM také hodně práce a času, abychom zajistili co nejlepší uživatelskou zkušenost pro nováčky i zkušené wikipedisty. Proto se taky nedivím, že se mi moc lidí nehlásí. :-) A pokud byste se někdo chtěli účastnit, tak budu rád, můžeme se někde sejít, jestli jste někde v dohledu od Prahy, nebo si aspoň dát videohovor, pokud nejste.--Jan Spousta (diskuse) 24. 5. 2024, 22:09 (CEST)
Ahoj @Jan Spousta, jak já, tak Matěj jsme v Praze, možná by bylo dobrý popřemýšlet o tom, zda nevzít někoho z týmu komunity nebo nováčků (@Martin Urbanec). Ale jinak jsi to nastínil asi nejsprávněji – hlavně musíme myslet na to, že součástí toho textu musí být i informace (a to asi i opakovaná), že mu píše "nečlověk". --frettie.net (diskuse) 25. 5. 2024, 08:39 (CEST)

Shrnovač diskusí

Pustil jsem gpt-4o na diskusi o smazání Kartuziánského nakladatelství se systémovou instrukcí "After you get a Wikipedia discussion, you produce a table in a Wikipedia markup format, one line for each person in the discussion. The table has two columns: the first is the link to the person, the second is the summary of their views." - tedy výzvou, aby udělal přehled účastníků diskuse a jejich názorů. Výstup byl:

Odkaz Shrnutí názorů
Vojtasafr Článek neobsahuje nezávislé netriviální věrohodné zdroje (NNVZ), navrhuje doložit encyklopedickou významnost nebo smazat článek.
Týnajger Argumentuje přítomností zdroje Encyklopedie českých nakladatelství 1949–2006, což považuje za NNVZ. Spíše ponechat s dodatkem dalších zdrojů.
Stavrog Navrhuje ponechat článek, přestože uznává nedostatek NNVZ, věří, že má článek užitnou hodnotu.
PetrVod Přidal referenci na Almanach Labyrint a zastává názor, že článek by neměl být smazán, poněvadž zdroje tam jsou a je dobré mít přehled různých českých nakladatelství.
Samikhorak Není konkrétněji uvedeno, pouze výrazné "ponechat," což avizuje podporu pro zachování článku.
Xyzabec Navrhuje článek ponechat a být velkorysejší k malým českým nakladatelstvím. Argumentuje, že je důležité psát o českých firmách.
KPX8 Reaguje na výše uvedený argument s tím, že "Nevšímejte si žádných pravidel" se týká tvorby článků a nikoli diskusí o smazání. Praví, že dodržování pravidel je důležité pro zachování kvality Wikipedie.
Jklamo Navrhuje smazání článku kvůli chybějícím NNVZ a pochybuje o významnosti nakladatelství.
Ján Kepler Plně podporuje smazání, zpochybňuje významnost pro větší okruh lidí.
Marek Genius Navrhuje ponechat článek s tím, že nakladatelství existuje již 30 let a významnost by měla být dohledatelná, pokud si někdo dá tu práci.
Chalupa Zdůrazňuje, že encyklopedie a další zmíněná referenční literatura jsou důkazem významnosti a proti mazání vystupuje.
95.129.96.163 Zastává názor ponechat, kritizuje orientaci na pravidla na úkor logiky a rozumu.
JAn Dudík Podporuje ponechání článku s tím, že encyklopedie jako zdroj a Almanach jsou dostačující, navrhuje označit k úpravě.
Vít Karásek Rozhoduje se prodlužovat diskusi, protože neexistuje shoda ohledně striktní aplikace pravidla NNVZ.
Svenkaj Navrhuje revizi pravidel a hodnocení významnosti nakladatelství třeba podle doby působení a kvality vydávaných knih.

Nezkoušel jsem to jinde ani neladil, ale připadá mi to jako užitečná možnost pro rychlé shrnutí dlouhých diskusí.--Jan Spousta (diskuse) 23. 5. 2024, 22:42 (CEST)

Ještě jsem instrukci rozšířil o požadavek úvodního shrnutí diskuse a přidání sloupce se symboly Pro nebo Proti, aby se snadno počítalo, jaký je současný stav diskuse.
After you get a Wikipedia discussion, you summarize it shortly. If there is a motion in the discussion, state it shortly in the summary. Then produce a table in a Wikipedia markup format, one line for each person in the discussion. Start with {| class="wikitable sortable mw-collapsible mw-collapsed". The table has two columns: the first is the link to the person, the second is the summary of their views. You do not translate the content: use the language of the writers. If there is a single clearly stated motion in the discussion, you add a third column with the template {{Pro}} for those supporting the motion and {{Proti}} for those opposing it. Then stop.
Výstup LLM následuje.
Diskuse o článku na Wikipedii o Kartuziánském nakladatelství se zaměřuje na otázku jeho encyklopedické významnosti a potřeby doložení této významnosti věrohodnými a nezávislými zdroji (NNVZ). Uživatelé se přou o to, zda uvedení v tištěné encyklopedii postačuje k doložení významnosti, nebo zda je potřeba více netriviálních zdrojů. Někteří argumentují, že článek přináší užitnou hodnotu a měl by být ponechán, zatímco jiní trvají na tom, že chybí důkazy o významnosti, a článek by měl být smazán. Diskuse dále zmiňuje pravidla Wikipedie a přístup k jejich aplikaci, včetně využití zdravého rozumu a přirozeného citu při rozhodování o významnosti.
Odkaz na uživatele Souhrn názorů Podpora/Nesouhlas s návrhem
Wikipedista:Vojtasafr Navrhuje doložit encyklopedickou významnost nebo článek smazat. Argumentuje absencí NNVZ a malou reflexí v sekundárních zdrojích. ProPro Pro
Wikipedista:Týnajger Namítá, že článek obsahuje zmínku v Encyklopedii českých nakladatelství, která by mohla být považována za NNVZ. Doporučuje hledat další zdroje. ProtiProti Proti
Wikipedista:Stavrog Zpochybňuje návrh na smazání, argumentuje užitnou hodnotou článku a zmínkami o nakladatelství na internetu. ProtiProti Proti
Wikipedista:JAn Dudík Souhlasí s ponecháním článku, argumentuje existencí tištěné encyklopedie jako zdroje a významností nakladatelství z principu. ProtiProti Proti
Wikipedista:Xyzabec Podporuje ponechání článku, argumentuje, že významnost by měla být přiznána díky existenci článku v encyklopedii a užitné hodnotě pro čtenáře. ProtiProti Proti
Wikipedista:KPX8 Souhlasí s mazáním článku kvůli absenci NNVZ a pochybuje o významnosti nakladatelství pro širší publikum. ProPro Pro
Wikipedista:Jklamo Podporuje smazání článku kvůli nedostatku NNVZ a významnosti. ProPro Pro
Wikipedista:Chalupa Argumentuje pro ponechání článku a využití zdravého rozumu a citu při posuzování významnosti. ProtiProti Proti
Wikipedista:Marek Genius Podporuje ponechání článku, navrhuje dohledat další NNVZ a argumentuje existencí tištěné encyklopedie. ProtiProti Proti
Wikipedista:Svenkaj Navrhuje změnu pravidel pro hodnocení významnosti nakladatelství a zohlednění kvality vydávaných knih. ProtiProti Proti
Wikipedista:Vít Karásek Sleduje diskusi a navrhuje prodloužení doby diskuse pro vyjasnění názoru komunity na pravidla a významnost.
--Jan Spousta (diskuse) 24. 5. 2024, 07:26 (CEST)
Nepřijde mi vhodná myšlenka automatizace, respektive ne teď. Diskuse o smazání jsou diskuse, ne hlasování a počítat hlasy jednoduše nejde; obzvlášť při slabé (nebo neexistující) argumentaci. Co se týče vyhodnocení, dokážu ze stejné diskuse dostat dva rozdílné výsledky na základě formulace požadavku, což je něco poměrně nechtěného a nejjednodušší je tedy si tu diskusi přečíst, protože jedna věta (nebo souvětí) nedokáže ani zdaleka vystihnout argumenty v diskusi, které obsahují řádově stovky slov od každého. Ač si myslím, že někdy v budoucnu by se toho mohlo využít, možná až za několik let. --Vít Karásek (diskuse) 24. 5. 2024, 07:52 (CEST)
@Vít Karásek: To je nedorozumění. Tohle nemá udělat vyhodnocení diskuse a ani se nic takového v zadání pro LLM nepožaduje. Cílem je vypsat shrnutí, o čem diskuse je, a přehled účastníků s jejich názory. Aby zájemce nemusel číst kilobajty vášnivých sporů jen proto, aby si udělal hrubý přehled. Vyhodnocovat diskuse mají správci a křemíkového správce asi ještě dlouho mít nebudeme. I správce samozřejmě tohle shrnovátko může použít jako východisko vyhodnocení, jestli chce, ale musí počítat s tím, že stroj se může mýlit a že konečné rozhodnutí je na člověku.--Jan Spousta (diskuse) 24. 5. 2024, 08:38 (CEST)
V tom případě jsme se skutečně špatně pochopili, protože text model umí shrnout vesměs libovolný a shrnutí diskuse mi přivodilo dojem výše; ale stále stojím za tím, že výsledek lze ovlivnit právě formulací otázky a ani pro shrnutí diskuse, kde je často každá věta důležitá, mi to jako vhodný nástroj nepřijde. Vzhledem k tomu, že momentálně jsou v modelu ještě dost znát korekce (upravení pravděpodobnostního modelu na základě feedbacku), na to ještě není čas, ale věřím, že za několik let, až nasbíraná data úplně převáží korekce, na to čas bude. Otázka je ale kdy se tomu tak stane a jak k tomu poté přistoupit. --Vít Karásek (diskuse) 24. 5. 2024, 08:48 (CEST)
@Vít Karásek: Myslím si, že čas, kdy bychom tady mohli výstupy LLM rovnou brát za závazná vyjádření k čemukoli, je ještě dost daleko. Je potřeba se na to dívat jako na pomůcku pro zrychlení práce, ne jako na orákulum. Když vyhodnocuješ složitou diskusi, tak si pravděpodobně děláš excelovou tabulku s přehledem účastníků, názorů a hlasů, a tady ti ji model předpřipraví, čímž ti ušetří čas, ale pak to stejně musíš projít repliku po replice a kontrolovat, opravovat, doplňovat. V 50 % případů možná zůstaneš u toho, co napsal model, takže ti ušetřil polovinu práce. Víc nemůžeš čekat.--Jan Spousta (diskuse) 24. 5. 2024, 09:00 (CEST)
Pro další wikivývoj jistě dobrý námět, ale využívat zatím ne... Jen poznámka míněná jako podnět pro vylepšování či ladění: vyjádření, že pro "českou Wikipedii je důležitější psát o českém nakladatelství než o laoském zpěvákovi" dejme tomu lze intepretovat i jako "užitnou hodnotu pro čtenáře", ale "existencí článku v encyklopedii" jsem (tedy pokud vím) neargumentoval :) --Xyzabec (diskuse) 24. 5. 2024, 16:01 (CEST)
@Xyzabec: Nepřesné shrnutí je asi dané hlavně tím, že se shrnuje hodně obtížný text. To je prostě úroveň "inteligence", na které teď velké jazykové modely jsou, a čekám, že bude vyžadovat minimálně ještě několik let, než budou schopné takto intelektuálské a zamotané výroky spolehlivě rozšifrovat. Jak už tu bylo mnohokrát zmíněno, výstupy LLM se musejí brát s rezervou a pokud na nich něco podstatného záleží, tak překontrolovávat.--Jan Spousta (diskuse) 24. 5. 2024, 16:15 (CEST)
Pěkný den, domnívám se, že to v tuto chvíli není nejlepší nápad. Jednak to zplošťuje vyřčené názory, jednak to v takto navržené formě svádí k návratu z diskusi o smazání do hlasování o smazání. Vím o tom, že to tak není míněno, ale rozhodně to k tomu svádí, což není šťastné, zvláště když mnozí uživatelé stále nepochopili, že v DOS je důležité vznášet kvalitní argumenty a nikoliv přidávat hlasy. Vzhledem k tomu, jak je proces DOS nastaven (tedy že cílem je posoudit, zda je článek v souladu s (aktuálně platnými) pravidly), nemyslím si, že je dost dobře možné s komentáři nakládat tímto způsobem.
Další problém vidím třeba v tom, že AI nerozumí pravidlům a zkresluje je (viz např. doložení této významnosti věrohodnými a nezávislými zdroji (NNVZ) – NNVZ jsou nezávislé netriviální věrohodné zdroje. Kolem slova netriviální se třeba v tomto případě diskuse točí, ale ve shrnutí je opomenuto.
Šlo by udělat podrobnější rozbor tohoto shrnutí, třeba se zaměřit na to, do jaké míry zapracovává osobní útoky či argumentační fauly, ale v tuto chvíli snad není třeba jít až takto do hloubky.--Vojtasafr (diskuse) 24. 5. 2024, 09:32 (CEST)
@Jan Spousta: Ahoj, jedním očkem sleduji, co tu kutíš, a byť jsem zatím neměl čas nic z toho vyzkoušet, sleduji to se zájmem. Shrnovač diskusí vypadá zajímavě, myslím si, že shrnování čehokoliv je obecně vlastnost, kterou ChatGPT umí dobře. Měl bych dva náměty na vylepšení: Za prvé shrnutí je vzhledem k diskutujícím neproporcionální. Třeba Vít Karásek vůbec nemusel být uveden, protože se nevyjádřil. Naopak někteří by si možná zasloužili více prostoru (zakladatel Vojtasafr a Týnajger). Za druhé by mohlo pomoci, kdyby se LLM zabýval jen tím, co se skutečně týká nastolené otázky. Diskuse na Wikipedii jsou často velmi rozplizlé, konkrétně zde pak Svenkaj se vůbec nevyjádřil ke smazání/ponechání, ale mimo téma otevřel otázku změny pravidel. Ale toto už by asi bylo na LLM moc, to už by musel i vědět, co jednotlivé pojmy znamenají (tzn. znát pravidla a místní terminologii). Ale s tím prvním (s proporcionalitou) by si snad poradit mohl.
Jinak vidím, že to začíná být velké. Snad by se našlo zájemců víc a dal by se na to založit i WikiProjekt. --Marek Genius (diskuse) 27. 5. 2024, 14:32 (CEST)

@Vojtasafr: Nevím, jak zdůraznit, že toto není vyhodnocovač ani uzavírač diskusí, ale jenom jejich (nedokonalý) shrnovač, a že se dá použít nejen na diskuse o smazání, ale na jakékoli diskuse. Asi jsem si vybral špatný příklad diskuse. Takže tady je ukázka podobné systémové instrukce shrnující cizojazyčné diskuse v češtině, a pak výsledek jejího použití na diskusní stránku arabské Wikipedie u článku o současné válce v Gaze. Očividně není dokonalé, ale umožňuje rychle zjistit, o čem si arabští kolegové ohledně této války povídají. Bez ambice jim něco vyhodnocovat.--Jan Spousta (diskuse) 24. 5. 2024, 10:12 (CEST)

After you get a Wikipedia discussion, you summarize it shortly in Czech. If there is a motion in the discussion, state it shortly in the summary. Then produce a table in a Wikipedia markup format, one line for each person in the discussion. Start with {| class="wikitable sortable mw-collapsible mw-collapsed". The table has two columns: the first is the link to the person, the second is the summary of their views. Write in Czech. If there is a single clearly stated motion in the discussion, you add a third column with the template {{Pro}} for those supporting the motion and {{Proti}} for those opposing it. Then stop.

Diskuse na Arabské Wikipedii se točí kolem několika klíčových bodů:
1. Přidání fotografie izraelského domu po teroristickém útoku do článku o Palestinsko-izraelské válce.
2. Diskuze, zda zahrnout zmínku o Jemenu v souvislosti s válkou.
3. Požadavky na úpravu počtu obětí, zraněných a další přesnosti údajů ve článku.
4. Návrh na změnu názvu článku na „Izraelsko-Hamas válka“.
Odkaz na osobu Shrnutí jejich názorů
ס.ג'יבלי Podporuje přidání fotografie izraelského domu do obecného článku o válce.
Mohammdaon Nepodporuje přidání fotografie, navrhuje specifický článek pro masakr Be'eri.
أيوب Nepodporuje přidání fotografie, uvádí, že v článku již jsou dostatečné vizuální materiály z obou stran konfliktu.
Mr. Ibrahem Navrhuje odstranit zmínku o Jemenu jako zemi zapojené do konfliktu.
عبد الله محمد الحسن Nesouhlasí s návrhem Mr. Ibrahema, tvrdí, že střely byly vypuštěny ze suverénního území Jemenu.
SEEFALI Nesouhlasí s odstraněním zmínky o Jemenu, považuje útoky za akt státu.
Mohammad Jezawe Žádá o úpravu terminologie v článku, vyžaduje označení obětí jako „mučedníků“.
حسن مصطفى جليل Požaduje přidání počtu zraněných v izraelské armádě.
Tanvir 360 Navrhuje změnu názvu článku na „Palestinsko-izraelská válka (2023–současnost)“.
Nobody8647 Nesouhlasí s uvedením Iráku jako země zapojené do konfliktu, tvrdí, že jde o aktivity milicí.
Saulsmith17 Tvrdí, že je článek zaujatý.
Acharton Volá po nestranném zpracování článku, odsuzuje násilí na obou stranách.
211.30.42.97 Poukazuje na aktuální diskuse na anglické Wikipedii ohledně názvu konfliktu.

Přehled diskusí z interwiki článku

Na podobnou notu jsem napsal Wikipedie:GPT vypisovač shrnutí diskusí z interwiki: udělá přehled a shrnutí všech diskusí na diskusních stránkách interwiki zadaného článku. Testoval jsem to na "svém" článku Dvorní dámy a hned díky tomu našel zajímavou informaci, která článek vylepšila, takže to může být užitečné - kolegové na cizojazyčných wiki někdy diskutují i témata, která mohou zajímat také nás. Na ukázku přehled diskusí o dršťkové polévce. Pokud vás něco zaujme, můžete se z tabulky prokliknout rovnou do diskuse a přečíst si ji, třeba pomocí nějakého překladače.--Jan Spousta (diskuse) 24. 5. 2024, 22:32 (CEST)

@Jan Spousta: Předpokládám, že co se článku Dvorní dámy týče, šlo o tuto editaci. Docela by mě (pro lepší představu) zajímalo, z jaké diskuse to pocházelo a jak jsi z výstupu udělal toto doplnění. Protože konkrétně tabulka o dršťkové polévce je taková nepřehledná, těžce se mi v ní orientuje a někdy mi z ní není jasné, co vlastně v diskusích řešili (může to být tím, že jsem nečetl článek Dršťková polévka, a tak nevím, o čem přesně je). Máš ještě výstup modelu k Dvorním dámám k dispozici? Bych se rád podíval, jak vypadal. Mimo téma: fráze „snad mohl být“ z článku není moc encyklopedická. Mělo by se spíš napsat, kdo to tvrdí a na základě jakého důkazu. Možná rozepsat to, lépe vysvětlit, ideálně i napsat, kdo to ten Diego Ruiz Azcona byl. --Marek Genius (diskuse) 27. 5. 2024, 14:44 (CEST)
@Marek Genius: Ty Dvorní dámy jsem už zahodil, bylo to příšerně dlouhé. Konkrétně tam šlo o to, že na jedné diskusní stránce rozebírali identitu jedné postavy na obraze, kterou se dlouho nedařilo ztotožnit, ale později kdosi přišel s teorií, kdo by to mohl být. Takže jsem si ten pramen stáhnul a článek podle něj doplnil. Tím pádem jsou už všechny postavy obrazu spojeny se jmény konkrétních lidí, kteří asi stáli modelem. - Obecně kvalita shrnutí GPT někdy pokulhává, tím spíš, že používám horší a levnější verzi modelu (3.5 Turbo místo čtyřky), abych to finančně utáhnul. Ale většinou to stačí, protože předpokládané užití je takové, že výstup poskytne hrubý přehled a uživatel si z něj vybere témata, která ho zajímají, a na ta se půjde podívat přímo ke zdroji.--Jan Spousta (diskuse) 27. 5. 2024, 15:05 (CEST)
Translation Start_date Summary Item Heading_orig Language Article_name
Vyhazujte ten recept!!! 8. 1. 2022 Vyhazujte ten recept, pokud ho někdo vaří, zhnusí si dršťkovou polévku navždy! Pokud se dršťky vaří čerstvé, polévka by strašně zapáchala. Dršťky se vaří zvlášť a první a druhý vývar se vyleje - dršťky se vaří jen k čištění a pak se používají do polévky. 0 vyhodte ten recept!!! cs cs:Talk:Dršťková polévka#vyhodte ten recept!!!
Diskuse o tureckých jídlech a nápojích 10. dubna 2021 Diskuse se zaměřuje na turecké jídla a nápoje a zahrnuje informace o turecké kuchyni a tradičních pokrmech. Diskutující se shodli na důležitosti projektu Wiki v oblasti turecké kultury a stravování. 0 ar ar:Talk:شوربة الكرشة
Podobnost polévek v rakouských korunních zemích od Čech až po Dalmácii 20. dubna 2007 Diskuze se zaměřuje na podobnost polévek v různých evropských zemích a vztah k Osmanské říši. Zmiňuje se též o historickém významu polévky z Königsbergu a různých variantách podávání kuchyně z vnitřností v Evropě. Komentáře zahrnují diskuzi o chuti a vnímání různých pokrmů z vnitřností v různých zemích. 0 de de:Talk:Kuttelsuppe
Königsberský flek 27. ledna 2009 Diskuse se týkala způsobu přípravy jídla Kuttelfleck, kde se debatovalo o použití mouky při smažení masa. Následně diskuse rozvinula do různých odkazů na historické zmínky o pokrmu Kuttelfleck a jeho přípravě. Došlo také k diskuzi o názvech různých pokrmů a jejich vztahu k sobě, stejně jako o odstranění některých historických odkazů z německé kuchyně na Wikipedii. 1 Königsberger Fleck de de:Talk:Kuttelsuppe#Königsberger Fleck
Česká Dršťková polévka 8. ledna 2016 Diskuze se týkala populárnosti Dršťkové polévky v Čechách, kde byla tradičně známá jako druhá snídaně pro řemeslníky. Upozorněno bylo na skutečnost, že žádný tradiční český recept na tuto polévku neobsahuje ocet, což je prvek prý pocházející ze švábské kuchyně. České recepty uvádějí použití ingrediencí, jako je světlá jíška, cibule, česnek, kmín, paprika, pepř a máta. 2 tschechische Dršťková polévka de de:Talk:Kuttelsuppe#tschechische Dršťková polévka
Diskuse o polévce 9. dubna 2021 Diskuse se týkala začlenění polévky do různých projektů týkajících se jídla a východní Evropy. Diskutováno bylo zejména o významu polévky, zemích, které jsou s ní spojeny, a ohodnocení důležitosti v rámci těchto různých projektů. 0 en en:Talk:Tripe soup
Turecký název 21. října 2005 Diskuze se zabývá pojmenováním tradiční polévky, která je rozšířená v celém Balkáně a v Turecku. Uživatel Zocky navrhuje používat anglický název 'Tripe soup' namísto tradičního tureckého názvu 'Shkembe Chorba'. Následně uživatel Emil Petkov upřesňuje, že slova 'shkembe' a 'chorba' jsou tureckého původu a že podobná polévka existuje i v Turecku. Další diskutující se zaměřují na diskusi o tureckém a perském vlivu na bulharský jazyk. Diskuze končí omluvou za nedorozumění v důsledku jazykové bariéry. 1 Turkish title en en:Talk:Tripe soup#Turkish title
Původ z Balkánu 3. října 2006 Ve skutečnosti je Shkembe Chorba jižní balkánské jídlo. Vím o něm jako o oblíbeném makedonském jídle, ale je široce rozšířen v Pirinské Makedonii (dnes jihozápadní Bulharsko) a jižním Bulharsku a zejména v Egejské Makedonii (dnes severní Řecko), čímž se stává regionálním jídlem! Navrhuji, aby bylo přidáno i do makedonské kuchyně a možná i do řecké kuchyně. V Turecku máme podnik nazvaný işkembeci, který podává pouze işkembe çorba (polévka işkembe) a najdeme je široce po celé zemi. Každý normální rozum by přijal, že işkembe çorbası má turecký původ, vím, že je těžké rozdělit dědictví Osmanské říše, ale tato polévka má turecký původ. Ten článek je strašný.... Přepracuji ho, jakmile budu mít čas. 2 Balkan origin en en:Talk:Tripe soup#Balkan origin
Polské flaki 27. dubna 2012 Diskuze se zaměřuje na polskou polévku z dršťek zvanou flaki a její začátek v Polsku ve 14. století. Uživatel TrueHistoryPoland upravil stránku tak, aby prezentovala flaki jako hlavní druh polévky z dršťek a nikoliv obecně dršťkovou polévku. Uživatel Macrakis vyzval k editaci více spolupracovně a nedávat přílišný důraz na konkrétní druh polévky. Diskuse zahrnovala i názory na původ dršťkových polévek a jejich začlenění do encyklopedie. 3 Polish flaki en en:Talk:Tripe soup#Polish flaki
Připojení k článku o dršťkových jídlech? Vytvořme stránku - DRŠŤKOVÁ JÍDLA? 17. října 2012 Diskuze se točila kolem otázky, zda je smysluplné mít samostatný článek o dršťkových polévkách, když máme individuální stránky o většině polévek a stránku o dršťkách, která ve skutečnosti obsahuje seznam všech... Diskutující se shodoval, že je třeba články o dršťkových jídlech spojit pod jednu stránku a zdůvodňoval to tím, že dršťková jídla jsou mezinárodní. Nakonec bylo rozhodnuto zastavit diskuzi kvůli zjištění, že její původce je sockpuppeteer. 4 Joining with tripe article? Let's create a page - TRIPE DISHES? en en:Talk:Tripe soup#Joining with tripe article? Let's create a page - TRIPE DISHES?
Žádost o změnu 23. září 2018 23. září 2018 Diskuze se týkala návrhu přejmenování a rozdělení článku o polévkách s tripe. Někteří uživatelé navrhovali rozdělit článek, protože se současný stav nestaral o specifika jako chorba z Turecka či flaki z Polska. Dále se diskutovalo o vhodnosti vytvoření samostatných článků pro jednotlivé druhy polévek s tripe a o transformaci současného článku na disambiguační stránku. Diskuze se rozvinula do otázky, zda je správné řešit rozdělení článku přes WP:RM. Původní návrh změny byl uzavřen s rozhodnutím „Není přesunuto“. Diskuze byla později přesunuta k dalšímu vyhodnocení. Diskuze probíhala v září a říjnu 2018. 5 Requested move 23 September 2018 en en:Talk:Tripe soup#Requested move 23 September 2018
Sloučení s Tripe chorba 8. dubna 2020 Diskuze se točila kolem návrhu na sloučení s Tripe chorba do článku o polévce. Někteří uživatelé se shodovali s návrhem, zatímco jiní poukázali na rozdíly mezi tureckým/balkánským Tripe chorba a dalšími polévkami s býčím žaludkem. Byla zmíněna možnost přesunutí článku do Işkembe çorbası, který se specificky zaměřuje na tureckou variantu polévky. 6 Merger with Tripe chorba en [[:en:Talk:Tripe soup#Merger with Tripe chorba]]
Propojení rumunského jazyka článku s anglickým článkem 24. dubna 2023 Diskuze se točí kolem rumunského článku týkající se polévky Ciorbă de burtă a jeho propojení s anglickým článkem. Uživatel Kataadj navrhuje, aby byly tyto články spojeny, protože se jedná o podobné recepty z Balkánu. Diskuze se zaměřuje na možný společný původ a souvislosti mezi různými recepty. 7 linking Romanian language article to the English article en en:Talk:Tripe soup#linking Romanian language article to the English article
Externí odkazy byly upraveny (prosinec 2019) 7. prosince 2019 Diskuse se týká nedávné úpravy jednoho z externích odkazů na stránce o Supe Sirabi. Uživatel InternetArchiveBot provedl změny, kde archivní odkaz byl aktualizován na aktuální URL adrese. Uživatel vyzývá k případným dotazům nebo ohledně specifikací chování robota v externích odkazech k návštěvě uživatelské stránky nebo FAQ. Diskuze obsahuje i odkazy na manuál pro nahlášení chyb robota. 0 پیوندهای خارجی اصلاح شدند (دسامبر ۲۰۱۹) fa fa:Talk:سوپ سیرابی#پیوندهای خارجی اصلاح شدند (دسامبر ۲۰۱۹)
Projekt diskuse na Wikipedii 20. srpna 2021 Diskuze se zaměřuje na různé projekty na Wikipedii, jako turecký projekt s kvalitou tříštivého textu a průměrnou důležitostí, projekt týkající se jídla a pití s kvalitou tříštivého textu a střední důležitostí a řecký projekt s kvalitou tříštivého textu a vysokou důležitostí. 0 ko ko:Talk:양탕
Diskuse o projektech v oblasti kuchyně ve východní Evropě 27. března 2019 Diskuse se zaměřuje na různé projekty v oblasti kuchyně a kulinářství ve východní Evropě. Členové diskutují o potenciálních příspěvcích a nezbytných úpravách. Zdůrazňují se projekty týkající se kuchyně v Turecku, Polsku, Rumunsku, Řecku, Severní Makedonii a Bulharsku. 0 tr tr:Talk:İşkembe çorbası

Použití LLM jako asistenta

Skript na XYZ

Inspirován @Jan Spousta: jsem zkusl použít ChatGPT ve free verzi na vytvoření vlastního skriptu pro import z Wikizdrojů na Wikidata - import prvních veršů básně do incipit (P1922). Předložil jsem mu jako základ funkční skript harvest_template.py a popsal, co si představuji. Po několika upřesněních jsem dostal skript, který úspěšně dělá zadané, viz třeba zde. (samozřejmě, zbývá ošetřit různé výjimky, ale pro 90% případů to bude vyhovovat). Tož pro inspiraci. JAnD (diskuse) 27. 5. 2024, 15:40 (CEST)

@JAn Dudík: Super! Ano, to je dobrá myšlenka, GPT se dá používat jako asistent při programování, i programování různých udělátek na projektech Wikimedia. Děkuji za ukázku.--Jan Spousta (diskuse) 27. 5. 2024, 15:58 (CEST)
Coby člověk, který JAnovi občas napíše nějaký skript, jsem to prošel a je to podobné tomu, co bych nejspíš vytvořil já.
Ale samozřejmě jsem našel záležitosti, které by ještě šlo upravit:
  • import na Wikidata i se zdrojem (byť jen převzato z wiki (P143))
  • pokud platí target.text.startswith(value), pak je kratší ("shorter") naše hodnota (value), ne to, co už je v položce (nejsem si jistý, jestli to je záměr, každopádně je to trochu matoucí)
  • shrnutí editace při odstraňování tvrzení
--Matěj Suchánek (diskuse) 27. 5. 2024, 17:39 (CEST)

Změny v nastavení ContentTranslation

V návaznosti na naše požadavky (viz zejména Wikipedie:Žádost o komentář/Omezení pro ContentTranslation) bylo pro českou wikipedii přenastaveno rozšíření ContentTranslation. Ukládání do hlavního jmenného prostoru je přístupné jen prověřeným uživatelům, ale už není stanoven limit pro shodu s originálem (tedy v samotném nástroji zůstává, ale výsledek se již dá uložit bez potřeby to nějak aktivně obcházet). Důkazem budiž Alexander Zahlbruckner. --Jklamo (diskuse) 14. 5. 2024, 18:45 (CEST)

Super! Moc dík.--Jan Spousta (diskuse) 14. 5. 2024, 20:11 (CEST)
Díky za zprávu. Sice mě to zrovna včera zaskočilo v kurzu, kde jsem před týdnem něco vysvětloval a teď to najednou fungovalo jinak, resp. nefungovalo, ale dlouhodobě je to zřejmě krok dobrým směrem. --Bazi (diskuse) 14. 5. 2024, 20:33 (CEST)
Nějak mi to nefunguje. Zatímco Samuel Hlavaj jsem takto z sk.wiki přeložil a uložil, tak dneska se snažím uložit dalšího a píše mi to "Váš překlad nemůže být zveřejněn, protože obsahuje příliš mnoho neupraveného textu." a zaboha to nejde uložit. --Palu (diskuse) 24. 5. 2024, 16:34 (CEST)
Jklamo: Asi je to tím, že nejsem Wikipedie:Prověření uživatelé, nicméně rád bych slovneské články překládal a tohle mi to v podstatě znemožňuje. Dá se s tím něco udělat? --Palu (diskuse) 24. 5. 2024, 16:40 (CEST)
Koukám práva prověřeného uživatele (nepřekvapivě) máte, tedy by vám to mělo fungovat (bez limitu a bez obezliček). Opravdu vás to nepustilo k uložení? Ona prakticky ta hláška o malé originalitě překladu tam zůstává, ale pak vám to dovolí bez dalšího uložit. --Jklamo (diskuse) 24. 5. 2024, 16:49 (CEST)
Aha, tak to potom nevím, ale opravdu jsem na to klikal několikrát, pak z toho odešel, pak se tam vrátil, a zkoušel to nějak přesvědčit, a opravdu mě to nenechalo uložit, až když jsem vložil do každého odstavce nějaký další random text. Při tom minulém článku přitom mi to nezobrazilo ani tu růžovou hlášku o stejném textu, jestli si dobře pamatuju, přitom poměr neupraveného textu byl dost podobný si myslím. --Palu (diskuse) 24. 5. 2024, 16:54 (CEST)
Teď jsem přeložil další, zase v podobném rozsahu změny textu a zase jako u toho prvního bez problémů. Bez růžové hlášky o nemožnosti uložení, takže bez problémů uloženo. Palu (diskuse) 24. 5. 2024, 17:10 (CEST)
Opět další bez problémů, tak nevím, kde byla chyba. --Palu (diskuse) 24. 5. 2024, 17:32 (CEST)
Obešel jsem to takto, ale asi to není úplně ideální stav. --Palu (diskuse) 24. 5. 2024, 16:43 (CEST)

Přehršel kategorií u některých článků

Asi to tu bylo v obdobné podobě nedávno, ale i tak dávám. Článek Evropská dálková trasa E3 popisující 7000 km dlouhou trasu přes celou Evropu je kategorizován mj. Suchdol nad Odrou, Starý Jičín, Bernartice nad Odrou, Hodslavice... atd. Naštěstí obce v jiných zemím (a v Čechách), přes které trasa vede, v kategoriích zatím chybí. Polská, německá či slovenská podoba článků je v kategoriích přiměřeně uměřená. Podobně nevhodně Evropská dálková trasa E10, tam je to "jen" na úrovni okresů. Znáte jiné podobně špatné příklady a odkaz na pravidla/doporučení, dle kterých ty kategorie promazat? Za mě třeba, z jiného soudku, nevadí spousta kategorií u Einsteina, jako celkově rozkročené osoby, až na ty poštovní známky ve stylu "Osobnosti na xyz poštovních známkách" a bankovky. --Pavouk (diskuse) 30. 4. 2024, 22:51 (CEST)

"Kategorii: Mezinárodní turistické trasy" přejmenovat (bez přesměrování) na "Kategorie: Mezinárodní turistické trasy v Evropě. Tuhletu kategorii vložit jako podkategorii do "Kategorie: Turistické trasy v Evropě". A pro tyhlety články co zmiňujete používat pouze jenom tu kategorii "Mezinárodní turistické trasy v Evropě". Víc podle mě není třeba. --Tiwi98 (diskuse) 1. 5. 2024, 09:07 (CEST)
Ano, kategorizace geografických objektů které mají velkou plochu nebo velkou délku je problém. Osobně to vidím takto:
  • pokud zasahuje na území pár obcí, kategorizovat dle obcí.
  • Pokud je na území více obcí, kategorizovat dle okresu
  • Pokud zasahuje na území více okresů/krajů a zároveň více než pár obcí, kategorizovat dle okresu/kraje, jinak též podle obce.
    • Tedy u objektu ležícího na území dvou obcí na území dvou okresů dát čtyři kategorie (případě, že tento typ kategorizujeme dle okresu).
  • Jde-li třeba o pohoří, pak kategorizovat dle největšího správního celku v porovnání s velikostí pohoří, tedy nejčastěji okres či kraj.
Řekněme, že se rozhodneme, že pár je číslo v rozsahu 1-5. Pokud třeba cesta vede přes pět obcí, pak kategorizovat dle obcí. Když už povede přes šest, kategorizovat dle okresu. Atd.
Potom je zde princip křížových odkazů. Pro vesnici je rozhodně zmínkyhodné, že přes její katastr vede třeba dálnice D1, ale naopak pro dálnici D1 není zmínkyhodné, že vede přes tuto vesnici, protože podobných jsou desítky až stovky. U dálnice tedy stojí za zmínku kraje, přes které vede, už okresy jsou sporné, jelikož je jich mnoho a obce už jsou nepoužitelné.
----
Je sice krásná představa, že v kategorii Zlámaná Lhota budu mít vše, co zasahuje na území Zlámané Lhoty, ale opačného pohledu je to právě tento problém. Navíc jsou kategorie opravdu záležitostí pár desítek wikipedistů, běžný čtenář je obvykle nevyužije. Dle statistik třeba článek České Budějovice vidělo za posledních 30 dní 9218 návštěvníků, oproti tomu Kategorie:České Budějovice 10. Pro srovnání, Kategorie:Praha měla 18 zobrazení, Kategorie:Česko měla 33 zobrazení a Kategorie:Evropa 16. --JAnD (diskuse) 1. 5. 2024, 09:56 (CEST)
Kategorie celkem sleduji, protože vlastně dávají možnost propojovat 'články' v různých kontextech. Viděl jsem v tom potenciál a něco zkoušel kolem úzkých témat, co mě zajímají. Pak se nějak o kategorie probudil živý zájem a výsledkem jsou ve spoustě případů strašná odstupňovanost či vrstevnatost, samozřejmě mnohde nesourodá... Je k tomu někde nějaká soustavná diskuse s možností námitek apod.? Kdysi jsem navrhoval, aby kategorie byly i 'nahoře' 'článku' (mohlo by to někdy zhoršovat přehlednost, takže by to třeba mohlo být k individuálnímu zapnutí, 'rozbalení'); často z toho plyne skutečně spousta souvislostí, které zaslouží pozornost (asi by to zvýšilo i návštěvnost). Také je skličující, že není možné spatřit celou větev 'nad' právě vypsanou kategorií (nadkategorie > podkategorie > kategorie...; třeba by se to mohlo ukázat v bublině?). Chybí mi i to, že nelze vidět verze obsahu kategorie... --MONUDET (diskuse) 1. 5. 2024, 11:32 (CEST)
@MONUDET: Zobrazení kategorií nad vším by šlo určitě pomocí nějakého udělátka, tipuji, že by někdo šikovnější dokázal upravit toto z Commons. Surfovat v nad/podkategoriích jde podle mě velmi dobře v HotCatu a ještě lépe v Cat-a-lot. Na průniky a další operace pomůže PetScan. — Draceane diskusepříspěvky 1. 5. 2024, 16:21 (CEST)
@MONUDET: K diskuzi o kategorizaci by (v ideálním světě) měla sloužit Diskuse k Wikipedii:WikiProjekt Kategorizace. Ovšem zde si to přečte o hodně víc lidí.., takže vznesení dotazu nebo návrhu na tamní diskuzi bych doprovázel upozorněním zde. --Jann (diskuse) 2. 5. 2024, 17:43 (CEST)
Myslím, že jsem se do řešení podobné problematiky zapletl někde právě v případě té D1 (nakonec byly kategorie všech vesnic odebrány). Další podobný případ jsou třeba i řeky (viz např. Labe). Chápu, že informace o všech objektech / přírodních úkazech nacházejících se na daném území je užitečná, použití kategorií k tomuto účelu nepovažuji za vhodné. Nápad na dobré řešení nemám (ideální by bylo čistě datové řešení, ale WD v současné podobě takovou poptávku spíš neuspokojí). Jinak viz JAn. — Draceane diskusepříspěvky 1. 5. 2024, 16:21 (CEST)
Vkládat do článků o trasách zasahujících na území desítek a stovek obcí kategorie těchto obcí je špatný způsob kategorizace, vedoucí akorát k nepřehlednosti. Evropské trasy mají být v „evropské“ kategorii, maximálně v kategoriích podle zemí. Problém je obecnější: ze stejného důvodu existuje Kategorie:Fauna podle kontinentů, ale mazala se Fauna podle zemí (kromě ojedinělé Kategorie:Fauna Česka), protože stejně jako u turistických tras, nechceme aby kdejaké rozšířenější zvíře bylo zařazené v desítkách kategorií "Fauna státu XY". --Jann (diskuse) 2. 5. 2024, 17:43 (CEST)
@Pavouk Ano, česká Wikipedie dlouhodobě trpí příliš rozkošatělou kategorizací, kvůli které jsou kategorie v některých hesel mimořádně nepřehledné a použitelné fakticky jen s obtížemi, když člověk hodně moc chce. K uvedenému příkladu souhlasí s tím, že uvádět rozsáhlé stavby či krajinné prvky v kategoriích obcí je chybné zařazování. Dané prvky se totiž obce týkají sekundárně a primárně jsou zásadním prvkem úplně jiného geografického celku. --Krabiczka (diskuse) 4. 5. 2024, 11:56 (CEST)
Přemíra kategorií, přemíra portálů, spoustu editací a handrkování a přitom čtenář (údajně) tyhle věci používá minimálně. Snad se blíží doba, kdy kategorie budou přiřazovány automaticky bez zásahu editorů (a portály budou pro zbytečnost zrušeny :)). --Chrz (diskuse) 5. 5. 2024, 09:44 (CEST)
Teoreticky by to šlo přes Wikidata už dnes - dá se zadat například dotaz na všechny lidi narozené v Plzni, kteří byli spisovatelé (nebo cokoliv spadá pod spisovatele), čili náhrada hypotetické kategorie Spisovatelé narození v Plzni. Kdyby kategorizátoři místo řazení do podrobných kategorií vyplnili příslušný údaj na Wikidatech, udělali by lépe.
Věci jako umístění v administrativní jednotce, datum čehokoliv, do určité míry povolání... to vše lze dotazovat, zobrazovat v mapách, v grafech, udělat galerii. Jen to není pro složitější dotazy úplně user-friendly, ale odhadem 50% kategorií by šlo nahradit vhodnými dotazy na Wikidata. --JAnD (diskuse) 6. 5. 2024, 09:14 (CEST)

Pokud by vznikla shoda na nekategorizování liniových objektů do kategorií obcí (či ještě níže, částí obcí, aj.), tak by bylo myslím vhodné vyjasnit (a patrně i zanést do nějakého pravidla a/nebo nápovědy):

  • Do jaké hloubky kategorizovat? Okres, kraj?
  • Jakých liniových objektů se to týká? Napadají mě: pozemní komunikace, železniční tratě, tramvajové tratě, lanovky, vodní cesty, produktovody, turistické trasy, cyklotrasy, cyklostezky, vodní toky. Ještě něco? Týká se to všech typů, nebo jen některých? Pokud jen některých, proč zrovna těch?
  • Máme tu kategorie typu Kategorie:Vodstvo Českých Budějovic, Kategorie:Doprava v Brně, apod. Co s nimi? Ponechat tam jen bodové/plošné objekty (třeba rybník, nádraží), ale potoky, řeky, železniční tratě, silnice, atd. tam nekategorizovat? --Harold (diskuse) 7. 5. 2024, 16:14 (CEST)
Říct A (nekategorizovat liniové objekty do kategorií obcí) je sice fajn a strašně jednoduché, ale je škoda, že pak už není žádný zájem řešit B, C, D, atd., tedy konsekvence, které takové rozhodnutí vyvolá, upřesnění, čeho se to vlastně týká a v jakých případech, návody pro obecné i specifické případy a v neposlední řadě i reálné provedení takového rozhodnutí. --Harold (diskuse) 30. 5. 2024, 00:02 (CEST)
@Harold Hm, tuhle otázku jsem přehlédl. Je pravda, že třeba kategorie Vodstvo XY bez řek protékajících XY nedává úplně smysl. Pro tento případ mne napadají dvě možná řešení 1) omezit tyto kategorie jen na města, která splňují podmínku X (mají alespoň určitý počet obyvatel / mají alespoň určitou rozlohu / jsou alespoň okresní...) nebo mít tyto kategorie jen tam, kde existuje hlavní článek a zbytek smazat.
Naopak kategorie Doprava v XY ve velké části obsahuje jen nádraží a místní hromadnou dopravu. Část z těchto kategorií obsahuje i železniční tratě a pouze minorita i silnice procházející tímto městem. Zde by jako možné řešení bylo například kategorizovat tratě pouze v případě, že je na území dané obce více zastávek nebo že trať vede z velké části po katastru této obce. Což lze aplikovat jako důsledek omezení kategorizace na maximálně N obcí. Obdobně u silnic - maximum N kategorií, takže krátké kategorizovat, dlouhé pouze podle okresů. --JAnD (diskuse) 30. 5. 2024, 11:56 (CEST)
Díky za reakci i nápady. Přiznám se, že nemám ambice do toho nějak moc šťourat, takže to spíš nechávám na jiných, ať se na tom nějak dohodnou. X editorů se tu sice vyslovilo pro nekategorizování, ale bez vyjasnění všech okolností, které se na to váží, a stanovení nějakých jasných pravidel to má v podstatě jen deklaratorní charakter bez nějakého závěru a bez reálného dopadu. --Harold (diskuse) 30. 5. 2024, 14:31 (CEST)

Co dát do ToDo i jednočlánkové kategorie, aby se případně rušit. Ne každá je samozřejmě zbytečná, ale drtivá většina, dle mého názoru, ano.--Railfort (diskuse) 7. 5. 2024, 19:01 (CEST)

K tomu by bylo třeba přistoupit jen velice opatrně. V mnoha případech jsou totiž takové kategorie součástí systematických stromů, v nichž rozhodně mají svoje místo. Reprezentativním příkladem je třeba systém kategorií Narození/Úmrtí/Pohřbení v... + Lidé z... K rozbití těchto systémů, poměrně pracně systematicky doplňovaných a udržovaných, by určitě nemělo dojít. --Krabiczka (diskuse) 7. 5. 2024, 23:30 (CEST)
K tomu ale může/nemusí dojít bez ohledu na to, zda budou uvedeny v ToDo. --Railfort (diskuse) 8. 5. 2024, 11:59 (CEST)
@Railfort Ano, tohle by bylo také řešením. Kategorie do úrovni obcí jsou OK, nižší kategorie dle jejich částí nebo podle typu objektů (doprava, vodstvo, kultura, stavby etc.) pouze v případě, že mají alespoň tři prvky, jinak kategorizovat do obce. U osob ponechat stávající systém - u osob je tento počet kategorií konečný, a v kategoriích podkategorie tolik nevadí.
Vpis kategorie má na jedné stránce až 200 položek, takže není nutné obsah kategorií za každou cenu drobit. --JAnD (diskuse) 30. 5. 2024, 12:03 (CEST)
Udělal jsem draft doporučení k bližší diskusi. --JAnD (diskuse) 3. 6. 2024, 21:53 (CEST)

Dušan Kreheľ (bot) – Nová jednorazová úloha

Ahojte, chcel by som oznamiť o pláne jednorazovej úlohe s rozsahom zmeny maximálne 229 stránok pre stránky ktoré daný bot upravoval dňa 23. 4. 2024 s nasledujúcou činnosťou:

--Dušan Kreheľ (diskuse) 14. 5. 2024, 22:11 (CEST)

@Dušan Kreheľ: 1. pozor, ono to genericky nie je vôbec triviálna úloha, hoci to tak na prvý (aj druhý) pohľad môže pôsobiť. Nie je žiadúce prosté naivné zoradenie (ani podľa poradia v defaultnom volaní v dokumentácii, kde nemusia byť vyčerpávajúco uvedené všetky nepovinné parametre); vo volaniach môžu byť roztrúsené komentáre, komentármi vyznačené sekcie a pod., čo je žiadúce zachovať; v hodnotách môžu byť vnorené volania šablón a iný rekurentný markup, ktorý je vo všeobecnom prípade potrebné parsovať rekurentne korektným parserom; whitespace treba buď zachovávať alebo korektne normalizovať, v súlade s hodnotou format parametra v TemplateData tej-ktorej š.; atď.
2. je to zbytočné, dotyčné parametre je žiadúce odstrániť v prospech doťahovania z WD (bez ohľadu na stav aktualizácie tam, v „najhoršom“ prípade sa tam dotiahnu demografické údaje zo sčítania z 2021, čo je stále vyhovujúce). --Teslaton (diskuse) 14. 5. 2024, 22:32 (CEST)
Souhlasím, zejména s bodem 2. Pokud se dotyčné parametry mohou nahrávat automaticky z Wikidat, je určitě žádoucí řešení ty vybrané parametry uvolnit od obsahu vepsaného přímo. --Krabiczka (diskuse) 19. 5. 2024, 22:02 (CEST)
Jako trošku bokem, ale proč je ta diskuse na dvou místech? Viz Wikipedie:Bot/Žádosti#Dušan_Kreheľ_(bot)_–_Nová_jednorazová_úloha --frettie.net (diskuse) 15. 5. 2024, 01:10 (CEST)
Taky moc nevím, proč tomu tak je. Wikipedie:Bot/Žádosti slouží k žádosti o příznak bota, nikoliv pro schválení úloh. Bot již příznak má, takže diskuse tam je poměrně zbytečná a preferoval bych diskusi tady, jelikož žádosti (až na jedince) sledují spíše byrokraté, kterých se žádosti týkají. --Vít Karásek (diskuse) 15. 5. 2024, 01:27 (CEST)
Robot v minulosti dělal kontroverzní editace, takže je jedině dobře, že o tom informuje, i když technická lípa by byla vhodnější. A na některých wiki je třeba si nechat schválit každý typ úlohy zvlášť.
K úloze - srovnání parametrů může být v některých případech užitečné, ale je otázka, zda to stojí za samostatnou úlohu - větší smysl by mělo třeba srovnání závěrečných sekcí / šablon. Navíc z uvedeného není patrný předpokládaný výsledný stav. --JAnD (diskuse) 15. 5. 2024, 08:48 (CEST)
@Frettie, @Vít Karásek, @JAn Dudík: Pravidla neriesia dalsiu ulohu. Možno chcem aj prípadne názor bežných ľudí. Ak potom niekto bude vidieť napr. takú zmenu, tak bude mať aspoň trochu šajnu, čo sa deje.
Áno, radšej výhrady vopred ako potom a s nespokojnosťou/zlosťou a atď.
Na druhej strane, možno pre tých maximálne 229 stránok je to zbytočne halo. Ale čo ak je to aj „prieskum“ na niečo väčšie. Napr. „prieskum“ pre zoradiť všetky volania Infobox - sídlo světa a to už by činilo až 23000+ úprav. --Dušan Kreheľ (diskuse) 19. 5. 2024, 21:22 (CEST)
Hele, já si furt myslím, že to je zbytečný ... ale pokud tě to potěší a udělá ti to radost. Jen teda když koukám na ty diffy, to je hrůza tyhle změny pořadí ... --frettie.net (diskuse) 20. 5. 2024, 00:08 (CEST)
Na pořadí parametrů nezáleží, výsledné HTML to nijak nemění, editace jsou v podstatě zbytečné. Na druhou stranu, pokud je tato úloha jen „úklid“ po úloze minulé, kdy bylo nedodržování pořadí vytknuto (čímž mu de facto byla přisouzena důležitost), tak nad tím asi zavřeme oči, co? Ale jak píše Teslaton, je důležité aspoň zajistit, že nemusí vzniknout další úloha, která bude uklízet tuto. A pak další... --Matěj Suchánek (diskuse) 17. 5. 2024, 18:20 (CEST)

Boli vykonané 3 testovacie úpravy:

--Dušan Kreheľ (diskuse) 19. 5. 2024, 15:12 (CEST)

Špatně to nevypadá, ale také lze udělat tuto editaci a tahat většinu věcí z Wikidat. A možná by šlo už teď tahat ještě víc... --JAnD (diskuse) 20. 5. 2024, 08:18 (CEST)
@JAn Dudík: K tvojím úpravám:
  • 2 medzery sú pred | (zvyčajne je jedna),
  • používaš vlastné zoradenie,
  • a nemalo by byť preberanie dát v backende?
Ja chcem elementárnu zmenu. Malá rola, malý vplyv. … Sú na Wikidátach správne dáta (striktne nie je garancia)? Ja mením, ja zodpovedám – mám časovú rezervu na dané sťažnosti, opravy či iné? Aj na toto treba prípadne brať ohľad. --Dušan Kreheľ (diskuse) 20. 5. 2024, 13:47 (CEST)
Udělejme něco pro to, aby na Wikidatách byla správná, aktuální a zdrojovaná data. To nám vyřeší spoustu věcí,
ad 2 mezery před ... ok, tak tam bude jen jedna.
ad vlastní řazení ... je to jedno, ale pokud to potřebuješ.
ad preberanie dat v backende? vždyť je, ne? Nebo jak to myslíš?
Jo, kdybys odmazal ty Tooltipy v aktuálním datům a klidně i ty řádkový refy z položek infoboxu, to bude zlatý. --frettie.net (diskuse) 20. 5. 2024, 21:45 (CEST)
Dvě mezery jsou (jako další věci) nestandardní JAnova libůstka v rámci tzv. AKÚ. Správně je jedna.— Draceane diskusepříspěvky 20. 5. 2024, 22:28 (CEST)
@Frettie: V backende, myslel som tak, že používateľ nevidí hodnoty pri vyplňovaní šablóny. --Dušan Kreheľ (diskuse) 22. 5. 2024, 22:46 (CEST)

Zopakujem ešte raz: čo sa týka SK sídiel, v kontexte cswiki, kde je dlhoročný trend preklápať tento typ údajov na preberanie z WD, je momentálne žiadúca skôr hromadná úprava na spôsob [13], tzn. odmazanie parametrov rozloha, rozloha reference, počet obyvatel, obyvatelé aktuální k a hustota zalidnění, čím sa ad 1) zabezpečí preberanie aktuálnych hodnôt z WD a ad 2) odstráni to nekonzistencie formátovania a poradia parametrov v dôsledku Dušanovej predošlej aktivity. Navrhovaná zábava s formátovaním povedie akurát k ďalšej zbytočnej medziľahlej várke a stránky bude následne potrebné strojovo upravovať znova pre odstránenie spomínaných parametrov. --Teslaton (diskuse) 21. 5. 2024, 02:10 (CEST)

Všetkým a @Draceane, @Frettie, @JAn Dudík@Krabiczka, @Matěj Suchánek, @Teslaton, @Vít Karásek: Ruším úlohu. … Rozhodol som sa pre myšlienku aby sa inak prípadne aktualizovali údaje, ako meniť hodnôt parametrov na každej stránke. --Dušan Kreheľ (diskuse) 22. 5. 2024, 22:17 (CEST)

Bezvadný, jak to nakonec dopadne? --frettie.net (diskuse) 23. 5. 2024, 13:19 (CEST)
@Frettie: Možno tak, že v prvej 1/3 roka 2025 sa to realizuje z mojej strany prostredníctvom Tabular Data. --Dušan Kreheľ (diskuse) 30. 5. 2024, 08:06 (CEST)
Tak asi lepší než nic, ale Wikidata by byly standardnější. --frettie.net (diskuse) 31. 5. 2024, 08:10 (CEST)
@Frettie: Dokončím načaté preberanie z WD (a import tohtoročných na WD). Akurát tieto týždne bohužiaľ nemám času na hobby aktivity toľko, koľko by som si predstavoval, chcem doriešiť ešte citovanie na enwiki, aby to tam po zrealizovaní importu ideálne nehádzalo červené hlášky namiesto korektne vygenerovaných cit., viď debata [14]. --Teslaton (diskuse) 31. 5. 2024, 08:17 (CEST)
Klobouk dolů! --frettie.net (diskuse) 31. 5. 2024, 08:30 (CEST)

Služby pro fotografy

Ahoj Wikipedisti,

Na základě podnětů z dotazníků ke strategickým plánům zvažujeme jak bychom mohli více podpořit fotografy nahrávající na Wikimedia Commons.

Jedná se o dvě konkrétní služby: pomoc se získáním fotografické akreditace na akce (průvody, sportovní akce, festivaly, koncerty) a pomoc s žádostí o získání přístupu k focení běžně neveřejných míst. Dalším nápadem bylo vytvoření wiki průkazu “Fotím pro Wikipedii”. Tento průkaz by mohl v určitých případech pomoci fotografům, aby se snaze dostali kam potřebují, případně legitimovali svou přítomnost.

Co se týká žádostí o vstup/akreditaci, tak má představa je taková, že by fotograf/ka napsal koordinátorovi fotografických programů o jaké místo/akci se jedná a koordinátor by se jménem spolku pokusil kontaktovat majitele/správce a získat povolení ke vstupu/akreditaci. K tomuto příkladu se nabízí několik otázek - má být stanovena podmínka minimálního počtu nahraných fotografií na Commons před odesláním žádosti o pomoc? Má být předem stanoven počet fotek, které musí fotograf po focení nahrát na Commoms? Jistým rizikem může být i nezodpovědnost fotografa, který se např. nedostaví na domluvené focení, což může vrhat špatné světlo na spolek.

Měly byste zájem o některou z těchto služeb? Uvítáme jakékoliv další komentáře nebo nápady, jak nastavit podmínky, aby tato činnost vedla k podpoře focení a rozšiřování obsahu Wikimedia Commons. --Richard Sekerak (WMCZ) (diskuse) 23. 5. 2024, 15:20 (CEST)

@Richard Sekerak (WMCZ) Průkazka i pomoc s žádostí mi přijdou jako skvělý nápad. Dokonce si občas říkám, že by to chtělo mít i samolepku na autě, když zastavuji kvůli fotce u krajnice :-D
Nějaká vstupní kritéria budou asi potřeba, minimálně posouzení nějakého počtu nahraných fotek zkušeným fotografem, zda jsou dostatečně použitelné (většina lidí dnes fotí spíše na telefon, což může být dostačující pro fotky z neveřejného místa, ale možná ne pro focení na nějaké větší akci).
Požadavky na počet fotek by asi také měly být, ale spíš dle konkrétní situace - focení v jinak nepřístupném prostoru může mít smysl i při pár fotografiích, naopak při focení na mistrovství bude žádoucí nafotit většinu významných soutěžících (@Packa:). --JAnD (diskuse) 23. 5. 2024, 16:06 (CEST)
@Richard Sekerak (WMCZ) Ahoj, pomoc s akreditací vítám, akreditace se získat dá, ale pokud bude žádat někdo ze spolku za fotografa, tak to vypadá "profesionállněji". Rizika tam jsou, ale vzal bych to tak, že podmínkou bude to, že fotograf přijde – a pokud ne, tak příště už holt akreditaci za něj WM ČR nezařídí. A podmínky s počtem fotografií ... nevím. Ale tohle chválím komplet, snad to někdo brzy využije. --frettie.net (diskuse) 24. 5. 2024, 14:23 (CEST)
@Richard Sekerak (WMCZ) A jak zmiňuje Honza Dudík výš – magnetická "samolepka" na auto typu "fotograf" by se hodit mohla. Sem tam se pohybuju s autem na tak divných místech, že jasný označení, že nejsem zloděj nebo tak něco by se hodilo. :) --frettie.net (diskuse) 24. 5. 2024, 14:24 (CEST)
Zájem sice nemám, ale líbí se mi to, protože zatím nemáme v podstatě nic k probíhajícímu mistrovství světa v hokeji. Fotek je plný internet, ale nikdo z těch statisíců diváků se nechce otravovat s nahráváním na Commons (nebo je to vůbec nenapadne), takže pokud tam nebyl nějaký wikipedista máme asi smůlu. To jen takové povzdechnutí. --TFerenczy (diskuse) 25. 5. 2024, 12:44 (CEST)
@TFerenczy: Tak něco by se našlo, ne? --Jan Polák (diskuse) 26. 5. 2024, 01:39 (CEST)
@Richard Sekerak (WMCZ) To je myslím dobrá aktivita. Ohledně vstupních kritérií bych se spíš než na počet více zaměřil na kvalitu fotek, které zájemce produkuje. Někdy mám dojem, že na Commons je velké množství balastu. Zájemce by měl být schopen nafotit obrázky, které splňují nějakou základní kvalitu. --PetrVod (diskuse) 25. 5. 2024, 23:41 (CEST)
Díky moc za iniciativu. Sám jsem navrhoval a využil bych. — Draceane diskusepříspěvky 4. 6. 2024, 22:47 (CEST)

Nastavení vzhledu a nová výchozí standardní velikost písma budou k dispozici i pro odhlášené uživatele

Ahoj! Jsme Web tým Nadace Wikimedia. Pracujeme na tom, aby bylo prohlížení Wikipedie co nejsnazší, v souladu s cílem „Zlepšení uživatelského zážitku“ plánu pro tento rok. Pro dosažení tohoto cíle jsme nasadili beta verzi funkce „Přístupnost pro čtení“. Ta do vzhledu Vector 2022 přidává menu, které registrovaným uživatelům umožní výběr velikosti písma a barevných schémat na základě jejich potřeb.

Menu zavádí nové nastavení Standardní velikosti písma, které je o něco větší a vyšší. To bylo zvoleno na základě několika podnětů. Více informací najdete v sekci „O novém nastavení Standardní velikosti písma“.

Co se změní?

  • Jsme připraveni zpřístupnit přihlášeným i nepřihlášeným uživatelům nové nastavení Vzhled.
  • Současně také nastavíme Standardní velikost písma jako výchozí pro nepřihlášené uživatele.
  • Pokud se neobjeví žádné technické problémy, plánujeme tuto změnu provést během následujících dvou týdnů příští týden - SG[WMF].
  • Později bude toto nastavení obsahovat také možnost volby tmavého režimu, které prozatím zůstane funkcí v beta verzi. Další informace naleznete na projektové stránce.
O nové nabídce

Nová nabídka umožní přihlášeným i nepřihlášeným uživatelům nastavit předvolby pro:

  1. Velikost písma a výška řádku (nyní k dispozici v beta verzi): Uživatelé si budou moci vybrat mezi možnostmi Malé (současná výchozí velikost), Standardní (doporučená pro lepší přístupnost) a Velké. Výběrem možnosti se změní velikost písma i výška řádku textu.
  2. Tmavý režim (nyní k dispozici v beta verzi): Uživatelé si budou moci vybrat, zda chtějí stránky trvale zobrazovat v nočním režimu, nebo použít „automatické“ nastavení, které adaptuje denní nebo noční režim na základě preferencí zařízení nebo prohlížeče.
  3. Šířka obsahu (dříve dostupné jako přepínací tlačítko): Přepínač šířky obsahu jsme přesunuli z ikony v dolní části stránky na označené přepínací tlačítko v nové nabídce. Bude fungovat úplně stejně jako přepínač. Předchozí přepínací tlačítko již nebude k dispozici.

Tato nabídka byla testována v beta verzi přihlášenými uživateli napříč wiki a také v uživatelském testování se čtenáři. Na základě výsledků těchto testů jsme menu vylepšili, abychom zlepšili jeho nalezitelnost a snadnost používání a přizpůsobili jej kompatibilitě s udělátky.

Nabídka se zobrazí v pravé části stránky, hned pod nabídkou Nástroje, pokud byla připnuta. Na rozdíl od nabídky Nástroje je nabídka Vzhled ve výchozím nastavení připnutá, ale lze ji odepnout. Po odepnutí se sbalí pod ikonu v horní části stránky.

O novém nastavení Standardní velikosti písma

Aktuálním výchozím nastavením je „Malé“ písmo. Pro nepřihlášené uživatele ho změníme na „Standardní“, zatímco pro přihlášené uživatele ponecháme jako výchozí možnost „Malé“. Možnosti „Standardní“ a „Velké“ byly vytvořeny a testovány na základě:

  • Akademických studií a doporučení pro nejlepší průměrnou velikost písma pro většinu čtenářů. Tato doporučení uvádějí, že naše současná velikost písma je pro většinu lidí na pohodlné čtení příliš malá. To znamená, že lidé v průměru čtou pomaleji, namáhají si při čtení oči nebo mají potíže s jasným viděním textu. Zvětšení výchozí velikosti písma tyto problémy zlepšuje pro všechny uživatele, včetně těch, kteří nemusí mít dostatek času na úpravy nastavení prostřednictvím nabídky vzhledu nebo prohlížeče. Důležitá je také hustota informací, a proto jsme chtěli zvětšit velikost písma, aniž bychom obětovali hustotu informací. Toho jsme dosáhli změnou nejen velikosti písma, ale i výšky řádků a mezer mezi odstavci.
  • Návrhů předložených více než 630 wikipedisty z 13 wiki různých jazyků, písem a velikostí. Většina z nich (~450) si vybrala větší velikost písma, než je výchozí. „Standardní“ představuje průměr nejoblíbenějšího clusteru odpovědí (15-20 pixelů). „Velké“ představuje potřebu ještě většího fontu, kterou reprezentuje cluster velikostí mezi 21-26 pixely. Přečtěte si více informací o tom, jak jsme do procesu zapojili dobrovolníky a dospěli k těmto možnostem.
  • Beta testování ukázalo, že většina uživatelů, kteří s funkcí alespoň jednou interagovali, volilo větší velikost písma, než je současná výchozí.

Naše dosavadní práce a další postup

Přihlášeným uživatelům zůstane prozatím jako výchozí nastavení „Malé“, ale kdykoli si ho mohou změnit na kterékoliv jiné. Za několik měsíců prozkoumáme, kolik přihlášených uživatelů přechází na standardní nastavení, a zahájíme diskusi o tom, zda má smysl, aby na standardní nastavení přešli i přihlášení uživatelé. Z prvních údajů z beta testování funkce vyplývá, že 55 % interagujících zvolilo standardní nebo větší nastavení.

Pokud byste chtěli pomoct, máme pro vás několik jednoduchých kroků:

  1. Prosím, zapněte si danou beta funkci („Accessibility for Reading (Vector 2022)“)
  2. Vyzkoušejte novou nabídku. Je něco matoucí? Rozumíte všem popiskům a fungování nabídky?
  3. Vyzkoušejte si malou, standardní a velkou velikost, barevná schémata a přepínání šířky. Obraťte se na nás, pokud si všimnete nějakých chyb nebo máte dotazy či připomínky.

Pokud se chcete o projektu dozvědět více, podívejte se na často kladené otázky. Komentáře a dotazy jsou vítány. Děkujeme!

I wanted to apologize - I meant to send this last week, but until today, didn't notice that I hadn't done that. --SGrabarczuk (WMF) (diskuse) 3. 6. 2024, 17:29 (CEST)

Překlad: „Chtěl bych se omluvit - plánoval jsem poslat oznámení už minulý týden, až teď jsem si všiml, že jsem to neudělal.“
Zpod technické lípy přesunul --Matěj Suchánek (diskuse) 3. 6. 2024, 18:37 (CEST)