Wikipedie:Žádost o komentář/Indexace stránek ve vyhledávačích

Z Wikipedie, otevřené encyklopedie
Skočit na navigaci Skočit na vyhledávání

Vyjasnění pravidel/zvyklostí zákazu indexace stránek[editovat | editovat zdroj]

K založení této stránky mě vedl konkrétní spor o ne/indexaci jedné diskuse o smazání. Na osobní žádost osoby, o které probíhala daná diskuse, jsem se pokusil dohledat pravidla, podle kterých se indexace řídí, ale žádná jsem nenašel. Myslím, že současná situace, kdy ani správcům, ani ostatním wikipedistům není zcela jasné, jak postupovat, a konsensus se pak tvoří případ od případu přímo editováním či revertováním, není žádoucí.

Co jsem pochopil, tak dosavadní praxe je taková, že když nějaká osoba požádala nějakého wikipedistu o zákaz indexace (většinou stránky diskuse o smazání), tak ten ji často (netuším, zda typicky) vyhověl (příklad). Velká část zákazu indexace je bez uvedení důvodu (příklad). V kategorii neindexovaných stránek vidíme 47 diskusí o smazání a 4 hlasování o smazání (je možné, že některé další stránky odtamtud vypadly, protože zákaz indexace byl jiným wikipedistou revertován).

Hlavní sporná otázka je tedy asi právě o ne/indexaci stránek s diskusemi o smazání či dalších stránek s „citlivými“ informacemi. Střetávají se tu dva důležité principy: transparentnost, na které je Wikipedie založena, a právo na ochranu osobnosti plus vytváření vstřícného prostředí. Myslím, že většina wikipedistů se bude přiklánět k transparentnosti. Na druhou stranu se tu nebavíme o skrývání obsahu před wikipedisty (vyhledávání na Wikipedii ne/indexací nijak ovlivněno není), ale doslova před „náhodnými kolemjdoucími“, kteří nemají o vnitřních procesech na Wikipedii ponětí (tím neříkám, že pro „outsidery“ není přistup k diskusím o smazání užitečný, naopak může být dokonce žádoucí; pouze už tu nevnímám tak silnou převahu transparence před ochranou soukromí jako ji vnímám v rámci samotné komunity wikipedistů).

Poznámka na okraj: Trochu paradox: na ochranu soukromí lidí, kteří mají článek, tu máme poměrně tvrdé pravidlo (plus ještě tuto stránku), ale případnou ochranu lidí, kterým byl článek smazán, se nikdo nezabývá. Samozřejmě to nelze zcela srovnávat: stránka s diskusí o smazání není encyklopedický článek; vždyť mnoho encyklopedických článků má také u sebe diskusi s dost nelichotivými výroky a ty se revertují jen když jsou zcela mimo; diskuse o smazání je naopak na „nelichotivých“ výrocích založena ze své podstaty a jinak to ani nejde.

Na anglické Wikipedii nejsou např. indexovány žádné probíhající diskuse o smazání o lidech (jak je to s uzavřenými diskusemi se mi nepodařilo rozklíčovat). Také nejsou indexovány např. drafty (ale to hádám spíš z důvodu boje proti PR článkům než z důvodu ochrany soukromí). Tamní stránka řeší ještě další případy, které se nás tolik netýkají, ale určitě může anglická stránka (v rámci možností) posloužit k rozšíření této české stránky.

Řešení, která mě napadají

  1. všechny diskuse o smazání jsou automaticky neindexovány (kontroverzní řešení, ale zabránilo by se tím dilematu, kdy posuzujeme jednotlivé případy subjektivně, což je pak snadno napadnutelné a může to vést ke sporům)
  2. všechny diskuse o smazání o žijících lidech jsou automaticky neindexovány (podobné problémy jako předchozí bod, jen o něco menší)
  3. jakákoli diskuse o smazání může být neindexována na soukromou žádost (koho? asi kohokoli? totožnost beztak neověříme); zákaz indexace provede správce a přidá i vysvětlení (do shrnutí editace či na diskusní stránku); ostatní wikipedisté by pak měli tuto editaci respektovat
  4. jakákoli diskuse o smazání může být neindexována na soukromou žádost, ale ostatní wikipedisté můžou po vyjádření v diskusi (či shrnutí editace) opatření revertovat (v podstatě současná praxe, jen není nikde zapsána jako doporučený postup)
  5. u žádné diskuse o smazání nesmí být indexace zakázána

Také by se hodilo do této stránky přidat nějaké další poučky k jiným jmenným prostorům či typům stránek, kde se neindexace někdy nabízí. To už bude asi více technické a méně kontroverzní, tak prosím znalé o to, aby se v tomto směru nebáli stránku rozšiřovat.

Ještě prosba na závěr: nerad bych, aby se diskuse zde stočila k probírání té konkrétní kauzy, která mě vedla k založení této stránky; o té se píše dost jinde a je natolik komplikovaná, že by nám to tu asi přerostlo přes hlavu. Otázka zde zní, jestli potřebujeme kodifikovat nějaký doporučený obecný postup a jak by měl případně vypadat.

--Vojtěch Veselý (diskuse) 21. 5. 2020, 13:08 (CEST)

Poznámka: Na formát žádosti o komentář převedl --Mario7 (diskuse) 23. 5. 2020, 00:33 (CEST)

Související stránky[editovat | editovat zdroj]

Komentáře[editovat | editovat zdroj]

Vojtasafr[editovat | editovat zdroj]

V prvé řadě bych rád poznamenal, že nevím, zda má toto být doporučení, případně závazné pravidlo. Obecně jsem proti zavádění dalších pravidel, neboť ve výsledku spíše škodí, neboť omezují komunitu v přijetí nějakého nestandardního řešení, které by ale Wikipedii pomohlo; prostě snižují naši flexibilitu. Pokud vznikají na základě jediného sporu, považuji to dokonce za nebezpečné – pak by se mohlo rychle stát, že tu budeme mít pravidlo úplně na cokoliv. Nemyslím si tedy, že je třeba řešit nějakým konsenzem takovou marginálii, jako je neindexace stránky.
Pokud ale z diskuse vzejde, že je třeba mít pravidlo/standardizovaný postup i na neindexaci stránky, můj názor je následující:

  1. V žádném případě tento bod nepodporuji. Subjektivní hodnocení by se v DoSech mělo objevovat co nejméně – měly by tam být argumenty, opřené o pravidla, nikoli hodnocení dané osoby. Pokud někdo z kolegů hodnotí tu osobu, měl by být, jako spolutvůrce encyklopedie, natolik kompetentní, aby to nebylo problematické, pokud by si toho popisovaná osoba všimla. A v tomto případě by měl za své výroky nést plnou zodpovědnost – stejně jako kdekoli jinde. Jako ochranu popisované osoby to nevnímám – v naprosté většině případů jsou DoSy bezproblémové a kvůli promili případů je nesmysl dělat pravidlo pro všechny. Nehledě na to, že osoba encyklopedicky významná by měla počítat s tím, že se o ní lidé budou bavit.
  2. Ten samý případ – viz výše.
  3. Tento bod také nepovažuji za šťastný. Jednak podporuje vyčleňování správců, jako "elitní skupiny". Proč by tuto pravomoc nemohl mít kterýkoli wikipedista, když to technicky udělat může? Pokud tuto pravomoc bude mít skutečně jen správce – proč by to ostatní "měli respektovat"? Vidím to jako pokus o předejití diskusím – bohužel dále jen dělící Wikipedii na "vyvolené" správce a nesprávce.
  4. Tento bod považuji za nejlepší možné řešení a plně jej podporuji (v případě, že by se došlo k závěru, že je nové pravidlo/standardizace postupu nezbytně třeba)
  5. Zas až nesmyslně přísné, někdy důvod může být.

--Vojtasafr (diskuse) 21. 5. 2020, 13:57 (CEST)

Harold[editovat | editovat zdroj]

Myslím, že bod 4 je v zásadě nepsaný a dodržovaný úzus. Nevylučoval bych ale ani druhou variantu. DoSy se obvykle netýkají EV veřejně známých osob, ale spíše právě takových, které jsou s EV na hraně. A tam to neindexování chápu, tím spíš u někoho, kdo se nejmenuje Jan Novák. Ať už byl daný článek založen v dobré víře nějakým fanouškem nebo kamarádem dotyčné osoby, který nezná nebo nevyhodnotil dobře pravidla projektu, nebo se jednalo o snahu o (sebe)propagaci, a na prvním místě v Googlu vám vyskočí nějaká "diskuse o smazání" na Wikipedii kvůli nevýznamnosti... Domnívám se, že by nemuselo být až nutné to tak explicitně sdělovat světu. Škodolibě bych sice řekl, ať si to (sebe)propagátoři klidně vyžerou, ale z celkového pohledu se mi zdá, že neindexace všech DoSů by nebyl špatný nápad. Koukal jsem, že třeba na francouzské wiki DoSy neindexují (např. fr:Discussion:Sebastian Bieniek/Suppression, ať jsme u aktuálního tématu), další jazyky jsem ale nezkoumal. Nicméně en:Wikipedia:Articles for deletion/Sebastian Bieniek mi Google nenajde, i když noindex v kódu nevidím, takže to asi mají zařízeno jinak. --Harold (diskuse) 21. 5. 2020, 17:50 (CEST)

@Harold: Anglická Wikipedie to typicky řeší přes šablony, tj. noindex přímo v kódu je zřídka. --Vojtěch Veselý (diskuse) 22. 5. 2020, 08:55 (CEST)
Právě ani žádnou šablonu jsem včera v odkazované diskusi nenašel. Ale objasnil to dole Jklamo, že to mají řešeno přes Robots.txt. --Harold (diskuse) 22. 5. 2020, 09:15 (CEST)

JAnD[editovat | editovat zdroj]

Paušální zákaz u všech Dosů se mi nelíbí. Občas si člověk vzpomene, že někde zahlédl na Wikipedii nějaké okrajové či obskurní téma a už jej nedokáže najít. Pokud najde alespoň diskusi o smazání, je to lepší. Paušální zákaz jen u lidí mi přijde jako vhodný, viz Harold, a nakonec i ti spammeři by možná uvítali, když by jim vyhledávač našel na Wikipedii alespoň zmínku v Dosu. Zákaz na žádost je minimálně slušnost. JAn (diskuse) 21. 5. 2020, 22:20 (CEST)

Viz Vojtův úvod, stránka je i nadále dohledatelná přes hledání Wikipedie, jde pouze o indexaci v internetových vyhledávačích.--Jklamo (diskuse) 22. 5. 2020, 02:17 (CEST)
To je mi jasné, beru to z pohledu BFU, který použije google nebo seznam a na WP má standardně jen hledání v hlavním jmenném prostoru (+portály a rejstříky). Schválně jsem si zkusil vyhledat určité fráze z bývalých dosů jako nepřihlášený přes bing a přímo na WP. Osoby to nenajde, jiná témata najdu na bingu aspoň dos. Což mi přijde jako přijatelná situace.
Pokud bude k tématu ŽOK, vyjádřím se ve stejném duchu. JAn (diskuse) 22. 5. 2020, 09:37 (CEST)
K níže uvedenému, že lze zakázat přímo u googlu @Blahma::
  • Není jen google, byť je nejpoužívanější.
  • Nevím, zda tam lze zakázat jen výsledky z Wikipedie.
Modelový příklad - jsem "známý" youtuber Franta Vopršálek, stojím o to, abych byl nalezitelný pod svým jménem, ale nestojím o negativní reklamu ve formě WP/DOS/Franta Vopršálek, kde se mluví o ubohém selfpromu a nevýznamné rádobyhvězdičce. Proto je pro mne rozhodně lepší, dokážu-li nějakým způsobem zamezit indexaci pouze té jedné stránky. JAn (diskuse) 25. 5. 2020, 20:57 (CEST)
1) Ano, pro hvězdičku je zákaz indexace dobrý, pokud si dělá PR, že je megastar. Není to dobré pro uživatele Wikipedie. 2) V rámci evropského "práva na zapomnění" se žádá o neindexování konkrétních webových stránek. Stránky ovšem fungují nadále, protože na vydavatele (ať už je to kdokoliv) Evropská unie nemá páky. 3) Pokud chceš vymazat svoji osobní historii, musíš žádat všechny vyhledávače. Týká se to hlavně Google a Bing. Myslím, že na lokální Seznam se to nevztahuje a asijské vyhledávače se takovými ohledy nezabývají, ale nejsem v tom až zase tak "honěný". Google má právo rozhodnout, zda převažuje právo na informace, nebo právo na zapomnění. Důvody nemusí ze zákona sdělovat a také tak nečiní. --Kuba Turek (diskuse) 25. 5. 2020, 21:11 (CEST)

Jklamo[editovat | editovat zdroj]

Přední díky za návrh, který se blízce týká ožehavých problematik ochrany osobních údajů a bujení PR aktivit na Wikipedii.

Co se týče situace na anglické Wikipedie, indexovány nejsou samozřejmě i archivované diskuze o smazání (všechny, nikoliv pouze ty o lidech), ale i velká spousta dalších stránek, např. všechny stránky mladší 90 dnů a mnoho dalších (viz en:MediaWiki:Robots.txt, mj. též nástěnka správců a různá osobní hlasování).

Co se týče diskuzí o smazání, jsem rozhodně pro řešení první, žádnou přidanou hodnotu v indexování stránek tohto druhu v internetových vyhledávačích nevidím. V nejhorším též druhé nebo třetí řešení.

Co se týče jiných jmenným prostorů či typů stránek, určitě bych zvážil Nástěnku správců, Žádosti o ověření uživatele, URL blacklist, arbitrážní stránky a klidně i různé volební stránky.--Jklamo (diskuse) 22. 5. 2020, 02:17 (CEST)

F.ponizil[editovat | editovat zdroj]

Vždycky říkám, že když někoho kousne pes, tak druhý den nějaký poslanec začne sepisovat novelu trestního zákona a formulovat skutkovou podstatu kousnutí psem. Ale tak se přece právo nemá dělat.
— Josef Baxa

Dobré odpoledne všem, za mě nechat tak jak je. Souhlas s Vojtasafr (citát je asociací na jeho příspěvek). Pokud se mám přiklonit k některému z výše načrtnutých řešení tak zcela jistě bod č. 4, a tím kodifikovat současnou praxi... S pozdravem--F.ponizil (diskuse) 22. 5. 2020, 19:05 (CEST)

J. Kepl.[editovat | editovat zdroj]

Byť jsem se diskuse nějak nezúčastnil, podporuji návrh 2. Taky jako Jklamo žádný bonus, že jsou DoSy ve vyhledávačích nevidím, ale osoby, které nežijí, nebo něčeho, co už neexistuje, asi není potřeba. Také bych byl pro indexaci ŽOOU, blacklistu a arbitrážních stránek taky. Nástěnku bych asi ne NEINDEXOVAL, protože například vandalizace na NS je asi ta nejlepší vandalizace (až na to, že správcům může přijít tisíc pingů).--Ján Kepler (diskuse) 23. 5. 2020, 09:14 (CEST)

Aha, tak když je tu ta možnost požádat o neindexaci Google, udělejme jen nějakou nápovědu. --Ján Kepler (diskuse) 25. 5. 2020, 17:41 (CEST)

Hugo[editovat | editovat zdroj]

Myslím, že indexovat by se měl hlavně encyklopedický obsah, proto podporuju řešení č. 1. Co přinese čtenářům (editorům) indexování různých diskuzí o wikipedii? --Hugo (diskuse) 23. 5. 2020, 10:13 (CEST)

Přinese jim vhled do Wikipedie. Jak funguje. Proč v ní něco není a něco je. A tím pádem i důvěru v informace na Wiki obsažené. --Kuba Turek (diskuse) 23. 5. 2020, 18:17 (CEST)
To je doufám myšleno ironicky. Pokud by nezasvěcený čtenář procházel diskuze na wikipedii, tak to určitě důvěru nezvýší, spíš naopak. Tady jsou lidi schopni se zhádat o kde co. --Hugo (diskuse) 23. 5. 2020, 18:22 (CEST)
Myslím to vážně. Tak to funguje ve všech médiích. Pokud něco tajíš, tak se to nakonec vynese ven, a lidi ti stejně nebudou věřit. --Kuba Turek (diskuse) 23. 5. 2020, 19:30 (CEST)
OK, ale zpět k tématu. Toto nesouvisí s indexováním. Diskuze budou stále přístupné, jen je nebudou ukazovat vyhledávače. Pokud člověk hledá informace např. o herci, tak by se imho neměl primárně dostat např. k diskuzi o encyklopedické významnosti. --Hugo (diskuse) 23. 5. 2020, 19:34 (CEST)
OK k tématu. Vždyť o něm stále mluvím: Diskuse i cokoliv dalšího by z důvodů, které jsem už uvedl, měly být indexované vyhledávačem. --Kuba Turek (diskuse) 23. 5. 2020, 19:43 (CEST)

Blahma[editovat | editovat zdroj]

Pokud někdo nechce, aby se určitá stránka objevovala v Googlu – typická motivace a zdůvodnění žádosti o neindexaci vyhledávači – má možnost o toto požádat přímo společnost Google, což mi přijde i navýsost logické a vhodnější, než kvůli takovému soukromému požadavku zasahovat do chodu Wikipedie. Už jsem kdysi kohosi na tuto možnost odkázal, když se mu nelíbila veřejná dostupnost informace o tom, že byl kdysi členem jednoho spolku, přičemž tato informace zůstávala uvedena v archivní kopii již mnoho let neměněných webových stránek toho spolku z oné doby, do nichž však už z principu není vhodné zasahovat (pro zachování historické autentičnosti) a v daném případě nebylo úplného skrytí onoho jména ani technicky snadné případnou jejich dodatečnou editací dosáhnout (šlo o stránky s přístupnou historií editací, jako na Wikipedii).

Formulář pro odstranění stránky z výsledků vyhledávání Googlu z důvodů ochrany soukromí se nachází zde: [1] Výhodou pro žadatele je, že jestliže jeho žádost uspěje, k blokaci dochází přímo ve vyhledávači, tedy úspěšnost opatření není ohrožena např. budoucí změnou přístupu k pokynu "noindex" Googlem nebo změnou stavu či pravidel na Wikipedii a z toho vyplývajícím případným budoucím odstraněním tohoto pokynu z dotčené stránky. Výhodou pro naši komunitu je, že v tomto případě je břemeno rozhodování na straně Googlu (který ho na sebe sám bere a ke kterému by se stejně v případě neúspěchu u nás někteří žadatelé „odvolávali“ a „zkoušeli“ to u něj), a to včetně ověřování identity žadatele a s tím i oprávněnosti požadavku (dovedu si představit, že wikipedistům by někteří žadatelé mohli mít problém své doklady poskytovat, musel by existovat nějaký postup na jejich vyhodnocování – kdo, jakým postupem a z jakého pověření – a wikipedisté, kteří by se jinak mohli plnohodnotně účastnit diskuzí a tvorby článků, by se tak i zbytečně dozvídali další soukromé informace, což by je zbytečně stavělo do střetů zájmů a samozřejmě hrozilo i selháním jednotlivce s negativním dopadem na celý projekt).

Za mne: Pokud někdo píše „nechci být dohledatelný na Googlu“, tak ať si toto vyřídí právě u toho Googlu. Jde to, funkční postup na to existuje už teď. --Blahma (diskuse) 24. 5. 2020, 23:32 (CEST)

@Blahma: Díky za info nevěděl jsem, že jde požádat Google o neindexaci. Za mě je to nejelegantnější řešení :-)--F.ponizil (diskuse) 25. 5. 2020, 18:47 (CEST)

Kacir[editovat | editovat zdroj]

Mám shodný názor s kolegou Blahmou, tedy přenechat požadavek na neindexaci Googlu. Taky mi není jasná případná metodologie nutného ověření identity žadatele. --Kacir 25. 5. 2020, 01:14 (CEST)

Hnetubud[editovat | editovat zdroj]

Pokud je možné přenechat tuto agendu Googlu, přenechme ji klidně Googlu, o nic nepřijdeme. Děkuji Blahmovi za radu a navrhuji sestavení nějakého instruktážního textu, jak reagovat na další obdobné žádosti.--Hnetubud (diskuse) 25. 5. 2020, 17:15 (CEST)

Instruktáž je velmi jednoduchá: Nereagovat. Neslibovat. Nezakazovat indexaci. --Kuba Turek (diskuse) 25. 5. 2020, 17:40 (CEST)
Rozumím, že podobné požadavky jsou někdy iritující, zvlášť jestliže následují po nějaké delší nepříjemné diskuzi či aktivitách žadatele a také s přihlédnutím ke svobodám, na kterých byla původně Wikipedie i celý internet vystavěny. Přesto však, když nás někdo jakožto Wikipedii/Wikimedii/wikipedisty osloví, je slušné odpovědět. A pokud pro takové případy bude předpřipraven na nějaké stránce text, na který dotyčného odkážeme, zajistí se tak snadnost a jednotnost poskytovaných odpovědí. V tom textu přitom právě nemusí být nic víc než jen stručné poukázání na to, že diskuzní stránky jsou důležitou součástí procesu tvorby Wikipedie, že samotnou stránku určitě není možné smazat a že v případě zájmu o vymazání z výsledků vyhledávání vyhledávačem doporučujeme dotyčnému obrátit se na ten vyhledávač (+ odkaz). To je podle mne dobrá kombinace dostatečné obrany a minimálního vycházení vstříc, kterou se zároveň úsilí dotyčného efektivně přesměruje někam jinam (tam, kam by mělo logicky směřovat), tedy pokud se mu bude chtít v tom pokračovat (tu možnost má vždycky a to my stejně neovlivníme). --Blahma (diskuse) 25. 5. 2020, 23:35 (CEST)
Přesně tak. Nereagovat na slušné dotazy, to prestiž wikipedie dvakrát nepozvedne. Zkusme tedy vymyslet, jak by ta odpověď měla vypadat.--Hnetubud (diskuse) 26. 5. 2020, 20:16 (CEST)
Standardní odpověď: "Děkuji za e-mail. Wikipedie je otevřené médium a nic před svými uživateli neskrývá. V případě námitek se prosíme obraťte na Google.com. S pozdravem podpis." Zdůvodnění strohosti navrhované odpovědi: Už to, že se někdo dožaduje nějaké změny ve svůj prospěch v encyklopedii, je velmi neslušné chování. --Kuba Turek (diskuse) 26. 5. 2020, 21:42 (CEST)
To ale není pravda. Není možné odpovědět na email lží. Ján Kepler (diskuse) 27. 5. 2020, 07:38 (CEST)
Jakou lež máš na mysli? --Kuba Turek (diskuse) 27. 5. 2020, 09:27 (CEST)
Spíš necelá pravda. Wikipedie ledacos skrývá (skrývání verzí z historie, mazání) a navíc zamlčuje, že lze stránku neidexovat (nenabídnout k indexaci) i ze strany WP.
A všichni tu operují googlem, ale, byť google využívám primárně, v některých prohlížečích stačí přepnout třeba na anonymní mód a člověk se dostane na jiný vyhledávač, případně Windows ledaskde otevřou stránku místo preferovaného prohlížeče v IE a použijí bing. Osobně používám Operu a Vivaldi a čas od času se dostanu bez svého aktivního přičinění na vyhledávání přes duckduckgo nebo qwant. JAn (diskuse) 27. 5. 2020, 10:05 (CEST)
Pokud chceš vysvětlovat v odmítacím e-mailu všechny technické, organizační i publisherské nuance, tak jednak tím zahltíš adresáta, že nebude vědět, kde mu hlava stojí, zároveň začne hledat kličky, jak odmítnutí obejít, zároveň začne s Tebou diskutovat o detailech - a vytratí se základní sdělení: "Žádný NOINDEX od Wikipedie nečekejte." --Kuba Turek (diskuse) 27. 5. 2020, 10:37 (CEST)
Shodneme se asi na tom, že odpověď má být zdvořilá, ale jednoznačná. Upřímně řečeno, já bych formulování té odpovědi s důvěrou přenechal kolegům, kteří mají na rozdíl od nás dostatek zkušeností s komunikací jménem wikipedie navenek, např. z práce v nadaci nebo z vedení kursů. --Hnetubud (diskuse) 28. 5. 2020, 18:21 (CEST)