Diskuse k Wikipedii:Údržbové seznamy/Nepropojené články vzniklé překladem

Obsah stránky není podporován v jiných jazycích.
Přidat téma
Z Wikipedie, otevřené encyklopedie

Neřešitelné položky[editovat zdroj]

(první dva příspěvky zkopírovány z Diskuse s Wikipedistou:Blahma#Wikipedie:Údržba/Nepropojené články vzniklé překladem)

Přemýšlím, jestli se může objevit případ, kdy článek na tomto seznamu zůstat má? Napadá mne aktuálně jen překlad, který byl následně upraven, ale jeho zdrojový článek byl smazán/jinak zařazen. Asi ano, pokud by vznikl článek překladem třeba českého Bob a Bobek a ten byl následně rozdělen na Bob a Bobek, přeložený by neměl na co odkazovat. Hm, i když zase se odkazuje permanentním odkazem … jak je to vlastně s permanentními odkazy na smazané články? Objevil se ti už na tom seznamu nějaký takovýto případ? --11. 2. 2014, 19:45 (UTC), Utar (diskuse)

Ano, Maserati 4CLT vzniklo překladem z enwiki. Některé Wikipedie (i právě enwiki) přitom mají jen jeden článek pro Maserati 4CL a Maserati 4CLT dohromady. Opravuji spoje na WD, ze seznamu ale takto článek nezmizí. Je možné zavést nějaký blacklist pro bota? Nebo jak toto řešit? --11. 2. 2014, 19:57 (UTC), Utar (diskuse)
Utare, Ty bys mi určitě mohl poradit s článkem Polské království. 20 minut jsem dumal, jak propojit ta Wikidata a nepřišel jsem na to. Nějaký nápad? --Jan Kovář BK (diskuse) 11. 2. 2014, 21:16 (UTC)
Technicky lze využít třeba popis na d:Help:Merge, na přesuny a spojování lze nově použít i udělátka z Nastavení. Nebo myslíš co s čím propojit? Koukal jsem jen na cs vs. en, odkud bylo překládáno: prostě nijak. Podle všeho ten souhrnný článek, který tu teď máme my, byl na enwiki rozporcován na jednotlivé etapy. --11. 2. 2014, 22:06 (UTC), Utar (diskuse)
Myslel jsem to druhé, co s čím propojit. Už jsem koukal, že článek byl přidán dolu do seznamu článků, co jen tak nezmizí. Díky za info. --Jan Kovář BK (diskuse) 11. 2. 2014, 22:29 (UTC)

@Utar (s editačním konfliktem): Odkazy na překlady jdou přes ID revize a článek se skládá z revizí nezávisle na tom, jak se mění jeho název. Proto se může časem stát, že nám přestane sedět do šablony zadávaný název článku, ale odkaz do cizí Wikipedie vedený přes ID revize (které má přednost) pořád povede na správné místo; a to až do té doby, dokud nebude revize daného ID vysloveně smazána (obvykle s celým článkem, tj. nepůjde už vidět v historii editací žádného článku), tedy např. pouhé přejmenování článku nevadí. Opět by bylo možné strojově zjistit, kolik takových případů je (ID revize by mělo být jedinčné a nerecyklované, takže by nemělo dojít k záměně staré smazané revize za nějakou jinou novou), ale odhaduji to na jednotky či maximálně desítky. Cílem šablony {{Překlad}} nicméně je především udržet spojení na původní text (jeho znění a jména autorů), takže čísla revize ani názvy článků není nutné ručně měnit – nanejvýš se jednou stane, že revize zmizí, ale i tehdy je ještě někdy dohledatelná v archivu revizí (pro správce) a téměř jistě též v Internet Archivu (a tam právě pod známým, i když třeba dnes již neplatným ID revize a současně názvem článku). Proto bych doporučoval do už jednou uvedených spojení na zdroje překladu nezasahovat.

Jestliže u některých stránek chybí odkaz na stránku v jazyce, který je uveden jako zdrojový, jde o případy, kde byl text z cizího článku o určitém tématu použit v českém článku o tématu příbuzném, ale nestejném (obecnějším, specifičtějším, rozcestník…), které ve zdrojovém jazyce samostatnému článku neodpovídá. Takové případy podle mne většinou nepředstavují řešitelný problém a měly by se ignorovat – i proto jsem zavedl antichronologické řazení seznamu. Nějaký blacklist by byl asi možný (někdy příště mohu zavést), ale zase by se mohlo stát, že protože je Wikipedie neustále v pohybu a Wikidata fungují přes název článku a nikoliv ID revize, dojde po čase ke změně tématu (zahrnutí všeobecností, vyloučí podrobností apod.) cizího článku, jehož historie editací zůstane zachována, ale položka Wikidat bude změněna. V takovém případě by pak blacklist mohl být kontraproduktivní, protože by takovouto změnu ukryl. Sice by podobná změna šíře tématu měla být většinou doprovázena i změnou titulku článku (kterou by šlo zaznamenat), ale asi ne vždy. Do hry by tedy muselo vstoupit ještě číslo položky Wikidat (která se považuje, co se vymezení tématu připojených článků týče, za neměnnou) a celé by se to zkomplikovalo asi až příliš. Zatím bych to tedy nechal, jak to je, protože jakmile se teď kategorie naplní, budou nám přibývat nové položky vlastně už jen téměř výhradně na začátek seznamu, takže ty starší bude možné snadno ignorovat. --Blahma (diskuse) 11. 2. 2014, 21:22 (UTC)

Seznam zkontrolovaných článků, které ze seznamu nepropojených jen tak nezmizí[editovat zdroj]

Patří sem např. články, u nichž bylo zjištěno, že výchozí článek, z něhož byly přeloženy, byl později rozdělen na menší a nyní tak mezi danými jazyky není přímé interwiki spojení.

Všechny tyto položky se mi podařilo vyřešit:

Petr Matas 7. 6. 2017, 21:34 (CEST) (upraveno)Odpovědět

Kategorie[editovat zdroj]

Neměla by to být spíše kategorie? --Dvorapa (diskuse) 7. 3. 2016, 12:46 (CET)Odpovědět

Mohla. Pokud se tedy lze modulem získat interwiki aktuální článku ve vybraném jazyce. Vedlo by to i k zaktuálnění seznamu a mohl by se odstavit můj robot. Zřejmě by se toho muselo dosáhnout rozšířením Šablony:Překlad. Akorát nevím, co s těmi řádově možná až stovkami případů, kdy propojení nelze provést z důvodu, že zdrojový článek mezitím zanikl, byl sloučen s jiným apod. – ty by nám v takovém případě svítily jako kategorie u článku věčně (stejně tak jako zůstávají věčně v tomto seznamu, kde ale tolik nepřekážejí). Snad jedině by se musel na to přidat nějaký potlačující parametr přímo do šablony, ale to by se pak zase mělo navíc hlídat alespoň to, aby se generovalo nějaké chybové hlášení (opět nejlépe skrytou kategorií) v okamžiku, kdy případně propojení do zdrojového jazyka opět vznikne (a ten potlačující parametr se tedy stane bezdůvodným). Nakonec by to nemuselo být zas až tak špatné, pokud bychom společnými silami ty věčně nepropojitelné projeli a takto označkovali a pokud by se to dobře zdokumentovalo u šablony i pro pozdější používání. Byl bys ochoten se do příslušné úpravy šablony Překlad pustit? Já teď mám na takovéto věci kvůli aktivitám Wikimedie méně času a toto chce udělat pořádně. P.S. Tvoji editaci související stránky ti v pondělí robot opět přepíše (navíc u sledovaných stránek platí pravidlo, že stačí sledovat jednu z dvojice stránka–diskuze a dostaneš upozornění i na tu druhou). --Blahma (diskuse) 26. 3. 2016, 11:33 (CET)Odpovědět
@Blahma: Aha, přesunu šablonu sem (aby stránka svítila zatím v kategorii). Zkusil jsem zatím nějakou základní detekci, ale asi tam jak říkáš bude potřeba pak na ty nepropojitelné zavést nějakou korekci. Napadlo mě pomocí modulu vytáhnout českou stránku u stránky, ze které bylo překládáno a pokud by byla, tak kategorii nevkládat. Tím bychom vyškrtali články, které byly přeloženy ze širšího/užšího článku apod. --Dvorapa (diskuse) 26. 3. 2016, 17:22 (CET)Odpovědět
Dobrý nápad, ale ono bohužel nejde jen o ty případy, kdy zdrojový článek dosud existuje, ale není prostě vhodné/možné ho napojit přes interwiki. Troufám si říct, že mnohem častější je případ, kdy zdrojový článek byl časem v horším případě smazán, v lepším případě sloučen s jiným článkem. Takhle tu máme třeba článek o jedné manželce izraelského prezidenta, který byl na zdrojové hebrejské Wikipedii sloučen s článkem o tom prezidentovi. No a nám tu teď článek o paní prezidentové vyčnívá jako nepropojený, přičemž na zdrojovém názvu je zřejmě přesměrování. Když se to vezme kolem a kolem, tak ono to uvádění původu šablonou Překlad je stejně nedokonalé – sice používá číslo verze, ale závisí přitom na názvu článku – což je, jak asi všichni víme, věc poměrně vratká, a to navíc napříč wiki, kdy sice po přesunu obvykle aktualizuje robot všechny staré názvy v té které Wikipedii, ale kde všude je mají zadrátované ve volání šablon na jinojazyčných Wikipediích, o tom samozřejmě nemá ani páru, takže i prosté přejmenování zdrojového článku pro nás znamená ztrátu stopy (mimochodem, není třeba chodit ani až k překladům – ona se tato slabina projevuje dost už i jen při linkování do jednotlivých Wikipedií z Wikimedia Commons nebo Meta Wiki). Teoreticky by se dalo používat v šabloně namísto názvu ID stránky, ale tím by ty odkazy dále nabyly na kryptičnosti a všechno by se tím stejně nevyřešilo. Informace ze současné šablony Překlad je spolehlivě využitelná jedině v případě, že máš po ruce dump zdrojové Wikipedie ze stejného data; úspěšnost jakékoliv snahy o zobrazení zdroje (a tím spíše jeho dodatečné dohledávání) klesá s rostoucím časovým odstupem od doby, kdy byl překlad proveden.
Nicméně ano, tvůj výše prezentovaný návrh může v několika případech pomoct a asi toho moc nezkazí. Stojí ale za zamyšlení, jestli má smysl kvůli tomu kódování tak komplikovat (a jestli naopak není žádoucí, abychom na rozpad vazby vyčleněním zdrojového článku z wikidatové položky českého článku byli upozorňováni a věděli tedy, že se na zdrojové Wikipedii v této věci „něco děje“). Pokud by se tvůj návrh měl skutečně programovat, musel by ses umět dotázat Wikidat, resp. zdrojové Wikipedie, na číslo položky odpovídající cizojazyčnému článku určitého názvu a pak na interwiki odkazy náležející této položce. Netrvrdím, že to už v současnosti nejde, ale znamená to minimálně zase další zvýšení technických nároků na takovou šablonu a je otázka, za jakou cenu. --Blahma (diskuse) 26. 3. 2016, 20:02 (CET)Odpovědět
P.S. Vidím, že s tím už dnes odpoledne něco aktivně děláš – blahopřeji a držím palce! --Blahma (diskuse) 26. 3. 2016, 20:04 (CET)Odpovědět
@Blahma: Kolega Dvorapa si všiml mého snažení kolem falešných hlášení nepropojených článků a navedl mě sem. Rád bych poznamenal, že číslo revize činí odkaz na zdrojový článek nezávislý na názvu zdrojového článku, takže funguje, dokud není zdrojový článek skutečně smazán - pak máme opravdu smůlu a pomůže jedině ten potlačující parametr. Pokud byl zdrojový článek sloučen s jiným, mělo by být na jeho místě přesměrování, a to by mělo být stále propojené s položkou Wikidat, takže k zařazení mezi nepropojené nedojde. (Již aktivní přesměrování sice propojit nejde, ale dá se to obejít dočasnou deaktivací přesměrování.) Petr Matas 7. 6. 2017, 13:50 (CEST)Odpovědět
Ještě mě napadlo, že pokud bychom dokázali detekovat, že odkazovaná revize patří smazané stránce (s čímž nás vývojáři nejspíš pošlou do háje), mohli bychom automaticky zařazovat do Kategorie:Údržba:Články vzniklé překladem smazaných článků. Petr Matas 7. 6. 2017, 14:01 (CEST)Odpovědět
Cílem této stránky/související kategorie je odhalit články, které byly přeloženy (obsahují šablonu překlad), ale neexistuje propojení na zdrojový článek. V nejideálnějším případě by tedy bylo potřeba vzít číslo revize a zdrojovou Wikipedii (př.: en, 12345678) ze šablony překlad, získat z nich aktuální jméno článku na zdrojové Wikipedii a následně zjistit, zda je zdrojový článek a přeložený článek propojeny. Komplikují to však následující výjimky:
  • článek na zdrojové Wikipedii již neexistuje
  • článek na zdrojové Wikipedii byl sloučen do jiného
  • článek na zdrojové Wikipedii byl zásadně přepracován, téma článku se zásadně změnilo a propojení tedy bylo schválně přerušeno
  • článek na české Wikipedii byl napsán sloučením překladů více článků ze zdrojové Wikipedie
(snad jsem nic nevynechal). Jde o to, jak takového seznamu článků dosáhnout (ideálně modulem, v krajním případě i roboticky) a zda je to vůbec možné (spoiler: asi není). Lépe řečeno tedy, jak se alespoň co nejvíce takovému ideálnímu seznamu přiblížit. Seznam Blahmova robota na této stránce má chytrý nápad, ovšem bohužel však obsahuje také dost falešných nálezů. Kategorie má také chytrý nápad, ale bohužel kvůli T74815 funguje zatím ještě hůře než seznam sestavený roboticky a poté by fungoval skoro stejně jako robotické řešení. Co tedy s tím? --Dvorapa (diskuse) 7. 6. 2017, 14:46 (CEST)Odpovědět
Pokud článek již neexistuje, resp. nic na zdrojové Wikipedii našemu článku ani přibližně neodpovídá, řeší to potlačující parametr. Ve všech ostatních případech na zdrojové Wikipedii existuje přesměrování odpovídající našemu článku nebo takové přesměrování lze vytvořit a propojit s datovou položkou (vizte výše). Jedná se tedy o regulérní chybu, která je kategorií i botem správně detekovaná a lze ji opravit, třeba takto: d:Special:Diff/496919904. Petr Matas 7. 6. 2017, 16:28 (CEST)Odpovědět
Jojo, ovšem nový parametr je čistě technickou záplatou na naši neschopnost tu detekci lépe navrhnout a myslím, že to není vhodné dlouhodobě řešit právě takto. Nevím, jestli jsem dostatečně popsal pocit, jaký z toho parametru mám, ale je to v podstatě stejná situace, jako kdybychom u infoboxů s chybnými souřadnicemi zavedli parametr |chybné souřadnice = nevadí. Příliš to práci neulehčuje, ba možná naopak. Spíš místo takovéhoto parametru bych kategorizaci zatím vypnul zcela, dokud nevymyslíme víceméně funkční řešení. --Dvorapa (diskuse) 7. 6. 2017, 17:48 (CEST)Odpovědět
To přirovnání se mi nezdá zrovna přiléhavé: V tomto případě není propojení chybné, ale není s čím stránku propojit. To v každém jednotlivém případě (věřím, že jich nebude více než 200) ověříme a parametrem zaznamenáme. Za takový počet falešně pozitivních nálezů není třeba se stydět, ruční zpracování tolika položek ještě není nedůstojné. Ostatní nálezy lze opravit těmi přesměrováními, která jsou užitečná: Často to bude jediné dostupné mezijazykové propojení. Petr Matas 24. 6. 2017, 00:55 (CEST)Odpovědět
@Petr Matas: Navrhuji kategorizaci zatím dočasně vypnout, dokud nebude existovat funkční řešení. Beztak tu stále existuje tento seznam, který plní stejnou funkci a je pravidelně aktualizovaný. --Dvorapa (diskuse) 13. 6. 2017, 11:49 (CEST)Odpovědět
Já bych ji nevypínal a neřekl bych, že je nefunkční. Když už někdo postiženou stránku edituje, může si všimnout kategorizace a hned ji (vetšinou) propojit nebo (zřídka) označit. Seznam cíleně navštěvuje málokdo. Petr Matas 24. 6. 2017, 00:55 (CEST)Odpovědět

Výpadek[editovat zdroj]

Omlouvám se za několikatýdenní výpadek seznamu, na který mne dnes zprávou upozornil Tomas62, jemuž tímto děkuji. Způsobila ho změna ve fungování šablony {{Překlad/kategorie}}, kterou koncem července provedl JAn Dudík, ovšem už bez návaznosti na tento seznam (ta ale, přiznávám, nemusí být zřejmá). Nově se kategorie pro jednotlivé jazyky jmenují „Kategorie:Monitoring:Články přeložené z xxwiki“ (což mi dává smysl, ačkoliv nadkategorie, kam se také někdy články řadí, neexistuje-li ještě pro daný jazyk kategorie, se stále jmenuje bez toho „Monitoring“, což mi smysl tak úplně nedává, a pokud se to opraví, budu na to potřebovat být opět upozorněn, protože na ni odkazuju z textu této stránky). Robot však dál hledal postaru články v kategoriích, které už dnes neexistují – než jsem změnu do něj dnes zanesl a seznam obnovil. Díky všem, kteří se o překlady na Wikipedii starají. --Blahma (diskuse) 5. 9. 2016, 10:26 (CEST)Odpovědět

Pro úplnost doplňuji, že již dříve mne na problém v diskuzi upozornil Matěj Suchánek, ale protože to bylo poněkud nepřímo, zpočátku jsem tomu nevěnoval pozornost a pak na to už zapomněl. Takže i jemu patří dík. --Blahma (diskuse) 5. 9. 2016, 10:38 (CEST)Odpovědět

Propojení jinak nepropojitelných článků[editovat zdroj]

U většiny článků, které nelze propojit, se tak děje proto, že článek například nepokrývá celé téma článků na většině ostatních wikipedií (vizte #Neřešitelné položky). V tomto případě by pomohlo, kdybychom v datové položce zaznamenali alternativní položku, ze které je možné čerpat mezijazykové odkazy, a wikipedie by jí využila.

Příklad: párek v rohlíku (Q13231338) má kromě češtiny minimum mezijazykových odkazů, protože se jedná o českou variantu konceptu hot dog (Q181055). Pokud bychom do párek v rohlíku (Q13231338) přidali tvrzení, že odkazy lze čerpat i z hot dog (Q181055), a wikipedie by je uměla načíst a zobrazit, rázem by byl seznam odkazů u článku Párek v rohlíku plný.

Kdysi jsem na Wikidatech navrhoval odpovídající vlastnost (a nebyl jsem jediný, koho to napadlo), ale nesetkal jsem se s pochopením. (Prosím za odpuštění malého forum shoppingu :)) Petr Matas 24. 6. 2017, 01:38 (CEST)Odpovědět