Diskuse s wikipedistou:Miner~cswiki

Obsah stránky není podporován v jiných jazycích.
Přidat téma
Z Wikipedie, otevřené encyklopedie

Chybějící články[editovat zdroj]

Moc děkuji za aktualizaci seznamu Wikipedie:Nejžádanější články. To je rozhodně velmi záslužná práce! --Šandík 01:12, 10. 11. 2007 (UTC)

Díky za aktualizaci, ale jen nápad: nešlo by při generování byhodit odkazy, na které se odkazují pouze stránky Wikipedie:Chybějící lánky a Wikipedie:Chybějící interwiki? ty stránky nejsou téměř vůbec aktualizované (nápad?) a přežívá v nich mnoho již dávno změněných tvarů odkazů, třeba Sovětskaja (samarské metro). Vyhodit stránky typu [{WP:Archiv porušení práv]] už by bylo asi složitější. Díky JAn 21:06, 21. 3. 2008 (UTC)

Stránky které odpovídají regexpu ^Wikipedie:(Nejžádanější články|Chybějící stránky|Seznam rozcestníků|Chybějící primární články|Seznam nejvíce odkazovaných rozcestníků) se pro účely mých seznamů (Wikipedie:Nejžádanější články, Wikipedie:Seznam nejvíce odkazovaných rozcestníků, Wikipedie:Chybějící primární články a Wikipedie:Seznam nejvíce odkazovaných přesměrování) ignorují.

Chybějící interwiki (včetně podstránek) tam do ignore-listu přidám. Chybějící lánky mají být Chybějící stránky? Pokud ano, tak ty už na ignore-listu jsou. Archiv porušení práv jsem tam přidal taky (vůbec to není složité :). Změny se projeví až v příštím dumpu (ten současný se mi nechce už znovu parsovat)

Nějaké další nápady "servisních stránek" které tam přicpat? :) --Miner 03:38, 22. 3. 2008 (UTC)

Seznam nejvíce odkazovaných rozcestníků[editovat zdroj]

Nemohl bys prosím trochu pročistit seznam nejvíce odkazovaných rozcestníků? Nějak se nám tu do toho pustili boti a dokonce bych si troufl tvrdit, že už ani nebude potřeba.--Majkl.tenkrat 16:30, 31. 3. 2008 (UTC)

Pročistit - ten seznam, se generuje z dumpua poslední dump vyšel 20.3.2008, tedy před 11 dny. Jediný způsob jak lze seznam "pročistit" je vygenerovat ho znovu z novějšího dumpu. Který ale ještě nevyšel. Tipuju, že vyjde tak za 14 dní.

Jinak to, že se do toho pustili boti je dobře, poslední půlrok se tomu seznamu moc pozornosti nedostávalo. Ale nebál bych se toho, že nebude potřeba, protože nových odkazů na rozcestníky přibývá denně několik desítek až stovek, takže boti pořád budou mít co dělat :)

Asi jediný způsob jak momentálně vyplodit nový seznam je udělat si patřičný dump sám. Můžu to spustit, ale bude to chvíli trvat. Pak by mohl být čerstvější seznam. --Miner 19:33, 31. 3. 2008 (UTC)

Seznam rozcestníků[editovat zdroj]

Ahoj, díky za rozcestníky, jen možná ještě ignorovat (i v seznamu nejodkazovanějších) uživatelské stránky - dost wikipedistů si tam píše svoje počiny. JAn 22:20, 27. 4. 2008 (UTC)

Ty seznamy se vyrábějí z "menšího" dumpu (pages-articles.xml.bz2), který neobsahuje (narozdíl od pages-meta-current.xml.bz2) uživatelské stránky a diskusní stránky. Tímpádem jsou odkazy z nich vlastně automaticky ignorovány :). Navíc jsou ignorovány některé speciální stránky v NS wikipedie, konrétně všechny, které vyhovují regexpu /^Wikipedie:(Archiv knihy smazaných stránek|Archiv hlasování o smazání|Archiv porušení práv|Chybějící interwiki|Hlasování o smazání|Nejžádanější články|Chybějící stránky|Seznam rozcestníků|Chybějící primární články|Seznam rozcestníků|Seznam nejvíce odkazovaných rozcestníků)/, tyto jsou technické seznamy, které by se do toho neměly počítat. Myslím, že na tom seznamu už jsou všechny důležité stránky kde by se odkazy neměly počítat, ale lze tam další v případě potřeby přidat :) --Miner 00:02, 28. 4. 2008 (UTC)

Dobrý den, dne 23.10 2010 mi byl zablokován účet z důvodu vkládání spamu. Avšak odkaz na jediný neziskový portál o zubním lékařství revidovaný profesory 1.lf UK, a tudíž poskytující ty nejrelevantnější informace bez jakékoliv reklamní snahy, zcela nevystihuje pojem spamu. Omlouvám se, ale pokud chcete, aby wikipedia byla přístupna české populaci a splňovala její poslání vzdělávát, tak Vašemu postoji příliš nerozumím. Na wikiskriptech jsem založil přes 100 článků o problematice zubního a všeobecného lékařství pod hlavičkou 1.lf UK a doposud jsem se nesetkal s jediným problémem. Chápu Vás, že chcete WP a zároveň všem čtenářům být ku prospěchu věci, avšak stačí si prohlédnout některé odkazy, ryze komerčního charakteru bez relevantní obsahové složky a zjistíte, že neprosazuji své zájmy, ale zájmy všech čtenářu wikipedie. Největším problémem dnešní medicíny je fakt, že za námi dochází pacienti/zákazníci, kteří si diagnózu určili sami dle zaručených informací z internetu.

Prosím, nechápejte to jako výtku, nýbrž prosbu o pochopení.

Děkuji za kladné vyřízení.

-- Tento nepodepsaný komentář přidal(a) uživatel(ka) Sultis (diskusepříspěvky)

Již jsem mezitím odpověděl na vaší diskusní stránce
--Miner 24. 10. 2010, 14:21 (UTC)

Chápu Vaše argumenty avšak odkaz na web Lékařské fakulty v Hradci králové na téma Kouření a dutina ústní pochází z roku 2004 ale informace v sekci Kouření a choroby parodontu z publikace Základy parodontologie z roku 1994. Medicína není beletrie, každým dnem se něco mění, natož po 16 letech. Některé informace tam uvedené jsou dnes považované za přežité.

Ukázka refenrencí, které jste také vrátil zpět.

↑ KINDERSLEY, Dorling. 1001. Odkaz, který jste vrátil zpět na hesle Zub odkazuje na dětské knihy.

↑ Paradentóza-prevence.cz |. - Diagnostika VariOr®Dento společnosti gentrend? Prostředku, který není podporován žádnou oficiální stomatologickou společností.

Nebo desítky odkazů na www.ordinace.cz, stránky, které v diskuzi a textu vždy doporučují určitý stomatologický prostředek?

Takto bych mohl pokračovat na každé stránce a obzvláště s anglickými odkazy. Jakmile budu mít čas vytvořit komplexní stránky pro wikipedii, udělám to. Ale v současnou dobu mě vytěžuje "studentská wikipedia". Proto pochopte, že moje snaha je myšlena dobře. Také chápu, že nemůžete vědet vše a práce zde je dobrovolná a neplacená o to více si ji vážím. A možná proto, také needituji články, kde si nejsem stoprocentně jist.

Nejodkazovanější rozcestníky na jiných wikipediích[editovat zdroj]

Ahoj, co bych mohl udělat pro to, abych zjistil nejodkazovanější rozcestníky na jiných wikipediích? Je program, který používáš, někde k disposici? Nebo jsi ho ochoten pustit i na jiný dump? --Tchoř (diskuse) 12. 6. 2012, 09:21 (UTC)

Stačí vzít cca 6 let starý skript co jsem dal na http://cswiki.php5.cz/dscripts.tgz a pustit ho. Jelikož formát dumpu se asi nemění, neměl by být s ním snad žádný problém. Tohle zjišťování je pak dvoustupňový proces. Nejprve se pustí parse.php co přechroustá dump (pro cswiki běží řádově několik málo minut) a vygeneruje několik souborů s mezivýsledky. Zbylé skripty pak z toho generují finální výsledky (to už trvá jen pár vteřin).

Adaptace na jinojazyčnou wiki by neměl být problém. Je nutno upravit soubor "rozclist" aby obsahoval názvy rozcestníků na dané jiné wiki a pak možná i skripty pokud výsledek nemá být v češtině, ale v jiném jazyku.

Na kterou wiki to chceš pouštět?

No, v archivu je i stručný návod, kdyby nestačil nebo něco nebylo jasného, zeptej se.

--Miner (diskuse) 23. 1. 2013, 20:58 (UTC)

Díky!
Uvažoval jsem, že bych si to pustil na slovenské Wikipedii. Ale uvidím, kdy na to budu mít náladu :). --Tchoř (diskuse) 23. 1. 2013, 22:44 (UTC)
Stáhl jsem si skripty a dump, nainstaloval PHP a Perl, přejmenoval dump a spustil. V okně se objevovaly čísla po stovkách a názvy článků a stránek, ale kolem hodnoty 260000 (odhadem podle názvů - stránky vzniklé koncem roku 2009) se skript ukončil a nikde žádný výstup. Systém Windows 7. Prosím, kde by mohla být chyba? JAn (diskuse) 24. 1. 2013, 12:36 (UTC)
Těžko říct, i když napadá mě pár příčin:
Nedostatek paměti pro PHP - v php.ini může být příliš restriktivní nastavení a pak to prostě někde před koncem spadne.
Ověřil bych nastavení "memory_limit" v php.ini, byť skript se pokouší si tohle zvětšit. Pokud nepomůže, tak zkusit v php.ini nebo ve skriptu zvětšit z 1 GB na 2 GB. Jaká je tam verze PHP?
Potom bych ověřil jestli to vygenerovalo dočasné soubory: MISSLINK.txt, NLINK.txt, ROZCLIST.txt, REDIRLIST.txt
Pokud jo, tak je asi dump useklý nebo nějak poškozený. Pokud ne, tak to nějak zbuchlo. Hodilo to do konzole nějakou hlášku?
--Miner (diskuse) 27. 1. 2013, 23:10 (UTC)
Nastavení php.ini zkusím zkontorolovat, mám to na jiném počítači, kam se pro nemoc pár dní nedostanu. konzoli jako takovou se mi nepodařilo najít, naskočí okno, které se s koncem programu zavře, takže případné hlášky nevidím. a soubory se nevytvořily. JAn (diskuse) 29. 1. 2013, 10:23 (UTC)
Aha, typický problém Windows. Je nutno nejdřív spustit explicitně konzoli (zmáčknout Win+R a spustit "cmd") a z ní pak až ten skript. Pak se okno samo nezavře a pokud se tam objeví nějaká chybová hláška, tak by měla jít přečíst. S trochou štěstí napoví kde je problém. --Miner (diskuse) 30. 1. 2013, 23:14 (UTC)
Díky, obojí funguje, limit paměti byl 128 MB, zvedl jsem na 2064 a skript po 1251 sekundách nahlásí dokončení práce. konzolové okno pouštím takto někdy pro python, u toho PHP mne zmátlo, že ten interpreter, co mám, po spuštění nahodí okno, ale bez příkazového řádku. JAn (diskuse) 31. 1. 2013, 07:54 (UTC)

Chybějící a zdroje[editovat zdroj]

Děkuji, za update. Namátkou jsem se podíval na fotografické články, například je tam i odkaz na [1], který existuje na cs jako fotochrom z února 2011, nesedí ani interwiki v tabulce.--Svajcr (diskuse) 24. 1. 2013, 06:25 (UTC)

Skript co to generuje není tak inteligentní aby zkoumal na cizích wiki interwiki (to bych musel parsovat jejich dumpy, což vzhledem k jejich velkému objemu nehrozí), zkoumá pouze jestli na jiné wiki se náhodou nenachází něco se stejným názvem. Tyhle případy se musí vyřešit tak, že z požadovaných se ten odkaz prostě odstraní (pokud tu ten článek už je, tak tam nemá co dělat) a při příštím updatu možných zdrojů to pak zmizí. --Miner (diskuse) 27. 1. 2013, 23:17 (UTC)

Wikipedie:Nejžádanější články ‎[editovat zdroj]

Mohl bys udělat a dát někam ke stažení Wikipedie:Nejžádanější články‎ bez omezení na prvních 1000? ideálně ještě seřazené podle abecedy :-) Dalo by se to využít pr aktualizaci WP:Chybějící stránky. JAn (diskuse) 24. 1. 2013, 07:42 (UTC)

Mohl. Problém by to nebyl, co se týče aktualizace WP:Chybějící stránky, tak něco takového by pak šlo obdobně robotem rovnou vygenerovat "někde mimo" (prostě by se to nějak jen rozstránkovalo po písmenech) a nemuselo by se to pak pracně udržovat (je to pár stovek stránek) tady na wiki. Zkusim to vyrobit a až to někam nahodím, tak dám vědět.
--Miner (diskuse) 27. 1. 2013, 23:03 (UTC)

Tak jsem to vyrobil. Ale má to háček - jelikož to obsahuje přes milion odkazů, tak to má asi 220 MB. Příliš velké abych to někam dal vcelku a moc velké aby to browser v rozumném čase přechroustal.

Vyrobil jsem lehce osekanou verzi (s odkazy co chybí min. 5x) a nahodil ji na http://cswiki.php5.cz/missl-large.html - je tam asi 40000 odkazů.

--Miner (diskuse) 28. 1. 2013, 02:13 (UTC)

Díky, podívám se. Ta kompletní verze by šla dát někam na uloz.to či úschovnu. myslím, že aktualizace postupně během roku by byla dostačující. JAn (diskuse) 29. 1. 2013, 10:21 (UTC)
Sice šla, ale bude to nepoužitelné, většina browserů má problémy i u tabulek s pouhými 70000 řádky a obávám se že tak jak to je to polovinu browserů shodí a další se zaseknou a budou to nahrávat několik minut .... až tam doprogramuju nějaké stránkování co to rozkouskuje na rozumně velké soubory (max. tak po 20000 záznamech, což by dalo asi 50 souborů), tak to někam pak hodím. --Miner (diskuse) 30. 1. 2013, 23:38 (UTC)
Jen jeden dotaz. Proč je mezi nejžádanějšími na 4. místě Italian Football Federation, když na něj není odkazováno ze žádné stránky ? --Jowe (diskuse) 29. 1. 2013, 10:28 (UTC)

Protože všechny výskyty pocházejí ze špatně použité šablony footballbox

Je tam vždy něco jako

 {{footballbox
 ...
 |referee = [[Tullio Lanese]] ([[Italian Football Federation|Italy]])
 }}

Parametr referee ve kterém je odkaz na Italian Football Federation ale šablona nepoužívá. Místo toho to vypadá, že je tam parametr Rozhodčí co by měl mít nejspíš stejný význam.

Skript se nesnaží parsovat wikikód a resolvovat šablony (jelikož se odkazy ze šablon zde nemají počítat), nicméně počítá odkazy pokud jsou v parametrech šablon. Předpokládá, že budou někde v šabloně pak zobrazeny, což v tomto případě není pravda.

Skript je tedy "korektní", situace by se měla opravit buď tak, že se opraví šablona footballbox aby brala parametr referee, případně se opraví použití šablony aby se použil parametr Rozhodčí. Pak skutečně nastane to, že ve wiki bude udávaný počet červených odkazů na Italian Football Federation.

Asi to nadhodím na lípu, třeba to někdo spraví.

--Miner (diskuse) 30. 1. 2013, 23:38 (UTC)

Ještě je ve skriptu jedna chyba: zatímco MediaWiki považuje [[1. listopad]] a [[1. listopad]] za stejné odkazy, (1. listopad a 1. listopad) skript nikoliv (pominu to, že je to ve většině případů zbytečné použití a znepřehledněný kód). JAn (diskuse) 31. 1. 2013, 07:24 (UTC)

Skript jsem opravil, mělo by se to projevit v příštím dumpu co vygeneruji .... --Miner (diskuse) 3. 2. 2013, 01:05 (UTC)

Můžete to generování chybějících stránek omezit jen na odkazy vedoucí z hlavního jmenného prostoru? Například v diskusích nebo projektovém jmenném prostoru to nemá smysl opravovat (někde je to snad i nežádoucí, např. Speciální:Co odkazuje na/1. FC Brno (copyvio)) a délka stránky by se tím mohla snížit. Já jsem to před časem chtěl dělat, mám na to i vyzkoušené SQL dotazy, ale jednak nedostatek času (který jsem raději věnoval jiným projektům), jednak problém na mém počítači (kdy MySQL při provádění dotazu generuje dočasné tabulky zabírající řádově gigabajty prostoru a tolik místa mám na disku málokdy volného) způsobily, že jsem to přerušil. Pokud to půjde, díky za to. --Milda (diskuse) 31. 1. 2013, 12:41 (UTC)

Skript má za zdroj "core dump" který neobsahuje diskusní stránky nebo userpages. Obsahuje sice projektový jmenný prostor, nicméně některé stránky (např. archiv copyvio, seznam samotný a další podobné seznamy, atd ...) jsou ze zpracování vyřazeny. Ovšem stránku Wikipedie:Chybějící_stránky a její podstránky jsem negeneroval já (byť se teď pokouším dát dohromady něco co by to mohlo nahradit) - to je dílo někoho jiného. Já generuji Wikipedie:Nejžádanější články a Wikipedie:Chybějící primární články. A tam "1. FC Brno (copyvio)" není. --Miner (diskuse) 3. 2. 2013, 01:05 (UTC)

Váš účet bude přejmenován[editovat zdroj]

17. 3. 2015, 23:41 (CET)

Přejmenováno[editovat zdroj]

19. 4. 2015, 05:10 (CEST)

Wikipedie:Požadované články/Možné zdroje[editovat zdroj]

I @Honza chodec:: Dobrý den, mohl by jeden z vás aktualizovat opět Wikipedie:Požadované články/Možné zdroje? Díky. S pozdravem --23. 3. 2016, 15:58 (CET), Utar (diskuse)