Diskuse:Cvikov (Německo): Porovnání verzí

Obsah stránky není podporován v jiných jazycích.
Z Wikipedie, otevřené encyklopedie
Poslední komentář: před 5 lety od uživatele Tomas62 v tématu „Mezní případ
Smazaný obsah Přidaný obsah
Chotěbuz ve Slezsku je vzdálenější?
Řádek 370: Řádek 370:
::Po čase koukám na tuto diskusi a jen zírám, kolik zde těmito dohady bylo promarněno času, který bylo možno využít určitě mnohem smysluplněji. Množství onoho času sice nedovedu vyčíslit, ale myslím, že by z něj postačil pouhý zlomek, aby se někdo z debatérů - hlavně z těch nejaktivnějších - podíval na obsah aspoň jednoho z článků, o jejichž názvech se zde diskutovalo. Například český Cvikov obsahoval řadu pravopisných i věcných chyb - a vůbec nikomu to nevadilo (opraveno před chvílí)! Jinak se dívám na nové názvy článků o Cvikově a Zwickau, "vyšperkované" rozlišovači a, upřímně řečeno, žádné vylepšení zde nevidím, spíše naopak...--[[Wikipedista:Dirillo|Dirillo]] ([[Diskuse s wikipedistou:Dirillo|diskuse]]) 2. 1. 2019, 04:33 (CET)
::Po čase koukám na tuto diskusi a jen zírám, kolik zde těmito dohady bylo promarněno času, který bylo možno využít určitě mnohem smysluplněji. Množství onoho času sice nedovedu vyčíslit, ale myslím, že by z něj postačil pouhý zlomek, aby se někdo z debatérů - hlavně z těch nejaktivnějších - podíval na obsah aspoň jednoho z článků, o jejichž názvech se zde diskutovalo. Například český Cvikov obsahoval řadu pravopisných i věcných chyb - a vůbec nikomu to nevadilo (opraveno před chvílí)! Jinak se dívám na nové názvy článků o Cvikově a Zwickau, "vyšperkované" rozlišovači a, upřímně řečeno, žádné vylepšení zde nevidím, spíše naopak...--[[Wikipedista:Dirillo|Dirillo]] ([[Diskuse s wikipedistou:Dirillo|diskuse]]) 2. 1. 2019, 04:33 (CET)
::P. S. - Ale pořád lepší [[Cvikov (okres Česká Lípa)]] než "Cvikov (Česko)"! Možná i to Zwickau by vypadalo aspoň malinko přijatelněji, kdyby tam místo "Cvikov (Německo)" bylo aspoň "Cvikov (Sasko)".--[[Wikipedista:Dirillo|Dirillo]] ([[Diskuse s wikipedistou:Dirillo|diskuse]]) 2. 1. 2019, 04:54 (CET)
::P. S. - Ale pořád lepší [[Cvikov (okres Česká Lípa)]] než "Cvikov (Česko)"! Možná i to Zwickau by vypadalo aspoň malinko přijatelněji, kdyby tam místo "Cvikov (Německo)" bylo aspoň "Cvikov (Sasko)".--[[Wikipedista:Dirillo|Dirillo]] ([[Diskuse s wikipedistou:Dirillo|diskuse]]) 2. 1. 2019, 04:54 (CET)
::::{{Re|Dirillo|skrýt=ano}}Cvikov (Německo) je pro mne vyhovující. Nemohu přijít na to, proč je Cvikov (Sasko) přijatelnější, jak píšete zde, či přesnější, jak píšete v komentáři k přesunu. Stejný rozlišovač v obdobném případě Chotěbuz (Německo) je akceptován.--[[Wikipedista:Tomas62|Tomas62]] ([[Diskuse s wikipedistou:Tomas62|diskuse]]) 28. 3. 2019, 15:38 (CET)
:::Souhlas. Tisíckrát mohlo zvítězit nějaké doporučení o přejmenování článku, zdravý rozum ovšem prohrál. Čtenář neaktivní na Wikipedii jistě bude nejdříve zadávat na Gůglu ''Cvikov (Německo)'' a bude rád, že našel článek o 5,6 kB a k němu diskuzi o 157 kB. Hlavně že jsme bohatší o dva rozcestníky, mimochodem s chybným počtem obyvatel. Deset tisíc duší navíc přece nevadí, hlavně že jsme to přejmenovali. [[Wikipedista:Gumideck|Gumideck]] ([[Diskuse s wikipedistou:Gumideck|diskuse]]) 2. 1. 2019, 08:15 (CET)
:::Souhlas. Tisíckrát mohlo zvítězit nějaké doporučení o přejmenování článku, zdravý rozum ovšem prohrál. Čtenář neaktivní na Wikipedii jistě bude nejdříve zadávat na Gůglu ''Cvikov (Německo)'' a bude rád, že našel článek o 5,6 kB a k němu diskuzi o 157 kB. Hlavně že jsme bohatší o dva rozcestníky, mimochodem s chybným počtem obyvatel. Deset tisíc duší navíc přece nevadí, hlavně že jsme to přejmenovali. [[Wikipedista:Gumideck|Gumideck]] ([[Diskuse s wikipedistou:Gumideck|diskuse]]) 2. 1. 2019, 08:15 (CET)
::::Můžu se zeptat, jak a čemu na druhou stranu pomohly tyhle komentáře a jak se liší od proběhlé diskuse? --[[Wikipedista:Palu|Palu]] ([[Diskuse s wikipedistou:Palu|diskuse]]) 2. 1. 2019, 09:26 (CET)
::::Můžu se zeptat, jak a čemu na druhou stranu pomohly tyhle komentáře a jak se liší od proběhlé diskuse? --[[Wikipedista:Palu|Palu]] ([[Diskuse s wikipedistou:Palu|diskuse]]) 2. 1. 2019, 09:26 (CET)

Verze z 28. 3. 2019, 16:38

Návrh na přesun na české exonymum

Podle zásady „Pokud cizí město má zažitý český ekvivalent (české exonymum), použijte ten“ navrhují článek k přesunu na běžné české exonymum Cvikov. U českého, méně známého Cvikova, navrhuji použít rozlišovač. --Palu (diskuse) 15. 11. 2018, 12:20 (CET)Odpovědět

S návrhem nesouhlasím, v českém povědomí je jako "Cvikov" znám rozhodně spíš ten Cvikov v severních Čechách (a méně známý je zřejmě jak pro koho). Označit německé město, které se tak oficiálně jmenuje, jako "Zwickau" je podle mě dostatečné rozlišení. Především tady vyvstává otázka, co to je "zažitý ekvivalent" - a Zwickau přece jen není Mnichov nebo Vídeň... Vůbec ty opakované snahy o předělávky německých názvů měst (navíc běžně používaných i obyvatelstvem sousedních Čech) nepovažuji v řadě případů za smysluplné - lepší by bylo, kdybychom čas ztracený v takových debatách raději věnovali tvorbě nových článků o obcích a městech v sousedních zemích či jejich vylepšování (pravda, bývá to pracnější, než tyto diskuse) . A podobně jako Němci u svých verzí článků o českých či polských městech (včetně těch původně německých) respektují jejich česká/polská jména, měli bychom my zachovat stejný respekt i v opačném gardu.--Dirillo (diskuse) 15. 11. 2018, 12:46 (CET)Odpovědět
Musím namítnout, že přednost má jednoznačně WP:Název článku před WP:Rozlišovač. Rozlišení názvů nemůže být argument pro neužití exonyma. Lze to řešit například doložením, že český Cvikov je frekventovanější a rozlišovač tedy má mít německý Cvikov. Co se pak týče vašich názorů na to jak to má chodit, tak to patří spíše k debatě o případnou změnu pravidla WP:Města a obce, nikoliv sem. -- (diskuse) 15. 11. 2018, 13:09 (CET)Odpovědět
Možná by bylo lepší, kdyby jste naopak vy jako navrhovatel této změny prokázal, že označení "Cvikov" se v češtině všeobecně ujalo jako název pro saské město Zwickau. Podle ČNK to tak rozhodně nevypadá.--Eleiodromos (diskuse) 15. 11. 2018, 13:23 (CET)Odpovědět
Nejsem si jist, z čeho pramení, že to tak nevypadá. Korpus.cz Cvikov zná: 1. Hospodářské noviny, 2012; 2. MF Dnes 2011; 3. Nepokojná léta 2000; 4. MF Dnes 2011; 5. AutoProfi 2014.
Další výskyty jsou běžně na internetu: [1]; [2]; [3]; [4]; [5]; [6]; [7]; [8]; [9]; [10]; [11]; [12]; [13]; [14]; [15]; [16]; [17]; [18]; [19]; [20]; [21]; [22]; [23]; [24]; [25]; [26]; [27]; ad.
Máte zde přes 30 různorodých zdrojů od knih přes články až po užití v reálném životě.
Ostatně proč mám dokládat, že se označení Cvikov v češtině všeobecně ujalo? Máte dojem, že ne? To mě popravdě u vás jako v tématu zběhlého člověka překvapuje. Chápu, že můžete mít jiný názor u hraničních případů, ale tady podle mě nemůže být o hraničním případě řeč a Cvikov je už po prvním zadání do Google jednoznačně používané exonymum. --Palu (diskuse) 15. 11. 2018, 14:39 (CET)Odpovědět
Naprosto souhlasím s kolegou Palu, že by bylo vhodné otevřít diskusi o změně pravidla WP:Města a obce. Někdy je situace až trapně komická - viz třeba polské Glucholazy, které jsou takto (lehce počeštěně, bez polského "ł") uvedeny dokonce i v [jízdních řádech ČD] a v regionálních zdrojích, ale na cswiki zatvrzele máme "Hlucholazy", které nikdo nepoužívá. Taková změna pravidel by měla být primární - přece jen už trochu pokročila doba od chvíle, kdy se v naší kotlině vše apriori počešťovalo.--Dirillo (diskuse) 15. 11. 2018, 15:15 (CET)Odpovědět
Jak už jsem napsal, tohle do téhle debaty nepatří. Zkuste otevřít diskusi u příslušného pravidla nebo na jiném vhodném místě. --Palu (diskuse) 15. 11. 2018, 16:30 (CET)Odpovědět
@Palu:Zatím jste prokázal pouze to, že české exonymum existuje. O tom není sporu. Na Českém národním korpusu je ale možné použít pokročilejší funkce, např. formát CQL dotazu, který odfiltruje frekventovaný český Cvikov a najde pouze výskyt, kdy po sobě následují lemmata "německý" a "Cvikov" ve všech pádech těchto slov. Relativní frekvence (odhad pravděpodobnosti výskytu jevu v jazyce krát 1 milion) u toho slovního spojení v největším korpusu ČNK "syn v6" je pouze 0.02. U spojení "saský" a "Cvikov" potom 0.01. Název Zwickau má tamtéž relativní frekvenci 0.31.--Eleiodromos (diskuse) 15. 11. 2018, 15:29 (CET)Odpovědět
Jsem přesvědčen o tom, že jsem prokázal to, že je exonymum užívané celkem běžně napříč různými typy užití a že nejde o okrajové nebo zastaralé exonymum (= jde o zažité exonymum). --Palu (diskuse) 15. 11. 2018, 16:29 (CET)Odpovědět
Mě jste nepřesvědčil. Pořád tady šermujete s poněkud vágním pojmem "zažitost", ale co je tato zažitost jiného než právě přesně definovatelná relativní frekvence.--Eleiodromos (diskuse) 15. 11. 2018, 16:41 (CET)Odpovědět
Mám za to, že zažitý je "ten, co byl zažit", tj. "ten, ze vešel v užívání". Relativní frekvence tohle nevypoví. Relativní frekvence vypoví jedině to, které synonymum je nejpoužívanější, nikoliv které je nebo není zažité. Mimo to jazykový korpus nedovede přesně definovat relativní frekvenci, jelikož nikdy neobsahuje veškeré texty lidstva, nýbrž pouze jejich výběr. Například ze mnou citovaných 32 zdrojů obsahuje pravděpodobně jen 5. --Palu (diskuse) 15. 11. 2018, 18:02 (CET)Odpovědět
Děkuji za poučení. Když má něco zanedbatelnou frekvenci výskytu v jazyce, tak to zcela určitě nemůže být "zažité". Zažitá je malá násobilka, kterou umí člověk zpaměti. Korpus definuje přesnou relativní frekvenci (tj. absolutní frekvenci poměřovanou celkovou délkou korpusu). Jiný způsob, jak relativní frekvenci výskytu jevu v jazyce měřit, zatím neexistuje. Čili to, že je název Cvikov pro saský Zwickau zažitější/frekventovanější než originální název, jste neprokázal.--Eleiodromos (diskuse) 15. 11. 2018, 18:28 (CET)Odpovědět
Prokazovat něco podobného nebylo mým cílem. Mým cílem bylo doložit zažitost, nikoliv poměřit zažitost vůči jiným synonymům. O tom pravidlo nic neříká. To by pak nemusela existovat tato specializovaná výjimka z pravidla "očekávatelnost". --Palu (diskuse) 15. 11. 2018, 18:44 (CET)Odpovědět
Vaše osobní filozofie "zažitosti" a "očekávatelnosti" do toho asi moc světla nevnese. Pro mě jste prostě nedoložil ani frekventovanost, ani zažitost. Říkejte tomu, jak chcete.--Eleiodromos (diskuse) 15. 11. 2018, 19:08 (CET)Odpovědět
Pravidlo o očekávatelnosti mluví o tom, co popisujete vy - zvolit ten název, který je frekventovanější. Z něj existuje výjimka pro města, která říká, že pokud má město zažitý český ekvivalent, použijme ten. Město Zwickau má zažitý český ekvivalent, což dokládá jeho rozšířené užívání. Máte nějaké jiné vnímání pravidla? --Palu (diskuse) 15. 11. 2018, 19:13 (CET)Odpovědět
U pravidla očekávatelnosti není ani zmínka o tom, že by „zažitost“ byla nějakou výjimkou, spíše snad aplikací tohoto pravidla na speciální případy.--Eleiodromos (diskuse) 15. 11. 2018, 19:44 (CET)Odpovědět
Kdyby byl váš výklad správný, pak by tam nemusela být ta aplikace toho pravidla vůbec popsána, protože by nepřinášela žádný rozdíl oproti základnímu pravidlu. Pravda? --Palu (diskuse) 15. 11. 2018, 20:10 (CET)Odpovědět
V každém případě tam není o nějaké výjimce ani zmínky. To, že tím vzniká nějaký rozdíl (např. okrajový název se může stát základem pro pojmenování článku apod.), je pouze vaše zcestná interpretace.--Eleiodromos (diskuse) 15. 11. 2018, 20:14 (CET)Odpovědět

┌─────────────────────────────────────┘OK, přeformuluju to. Jedná se o specializované pravidlo v rámci obecného pravidla, kterým vzniká určitý rozdíl. Čili má přednost před obecným pravidlem. Města se tedy řídí obecným pravidlem (jméno se volí podle očekávatelnosti, tj. obvykle podle největší frekvence), ale pokud mají zažitý český ekvivalent, pak má tento ekvivalent přednost. Je taková formulace blíže shodě s vaším pojetím? --Palu (diskuse) 15. 11. 2018, 20:36 (CET)Odpovědět

Zažitý název, ať už to interpretujete jakkoliv, nemůže mít zanedebatelnou frekvenci výskytu. Pak prostě není zažitý. "Londýn, Vídeň, Řezno" mají frekvenci vysokou, což lze doložit, Lobava, Ojvín a německý Cvikov ji mají zanebatelnou, což lze doložit.--Eleiodromos (diskuse) 15. 11. 2018, 21:03 (CET)Odpovědět
Skutečně má Cvikov zanedbatelnou frekvenci? Podle čeho tak usuzujete? Právě jsem vám dal 32 užití v nejrůznějších okruzích textů. Jak přesně určujete tu "zandebatelnost"? Protože pravidlo je vystavěno evidentně jinak, než co tady prosazujete - má to na něj nějakou návaznost? --Palu (diskuse) 15. 11. 2018, 21:38 (CET)Odpovědět
32 jednotlivých výskytů (nezřídka v literatuře starší) vůbec nic nemění na prokazatelně nízké relativní frekvenci tohoto názvu v ČNK. Názvy měst jsou problematika čistě lingvistická, jediným přesným ukazatelem zažitosti/frekvence daného názvu je jeho výskyt v jazykovém korpusu.--Eleiodromos (diskuse) 15. 11. 2018, 21:55 (CET)Odpovědět
Jazykový korpus je neúplný a nemůže zahrnovat veškeré texty, většinu ze zmíněných 32 textů jich ani neobsahuje. S vaší poslední větou tedy nesouhlasím. Kvůli několika starším textům, které jsem záměrně také zahrnul, abych ukázal, že exonymum je běžné už drahnou dobu, nelze smést ze stolu jednoznačně prokázané současné užívání doložené ostatními refy. Myslím, že dál se nepohneme a budeme muset počkat, jestli nepřijdou další kolegové s nějakým novým pohledem nebo argumenty. Zatím díky za diskusi. --Palu (diskuse) 15. 11. 2018, 22:07 (CET)Odpovědět
Jazykový korpus neobsahuje všechny české texty, ale je podle lingvistických měřítek dostatečně velký a reprezentativní. Stejným způsobem byste mohl najít třeba 32 jednotlivých výskytů slova čistonosoplena nebo jakéhokoliv jiného slova. Teď tedy záleží na tom, koho jste (kromě sebe) přesvědčil o tom, že heslo Zwickau je nutné přejmenovat. Mě tedy rozhodně ne. Pěkný večer.--Eleiodromos (diskuse) 15. 11. 2018, 22:24 (CET)Odpovědět
To by mě zajímalo, kolik lidí v roce 2005 přemluvil Kyknos, když přesouval z názvu Cvikov na Zwickau. Nevidím ani pokus a jím uvedený argument šel řešit rozcestníky. Srovnávat čistonosoplenu s Cvikovem je argumentační faul, běžné užívání Cvikova jsem doložil, o okrajovosti názvu nejsou jiné známky než vaše tvrzení. Dokonce i vámi zmíněný korpus Cvikov zná v rozličném užití (3x noviny, 1x časopis, 1x kniha, vše současné). --Palu (diskuse) 15. 11. 2018, 22:36 (CET)Odpovědět
Vy se prostě neumíte rozloučit. Nízkou frekvenci výskytu označení "Cvikov" pro ono saské město dokládá ČNK. Můžete si to klidně přeměřit. Počet několika jednotlivých výskytů v žádném případě není ukazatelem zažitosti/frekvence. Tu jste měl prokázat a přesvědčit auditorium. A to jste tady podle mě nepředvedl.--Eleiodromos (diskuse) 15. 11. 2018, 22:44 (CET)Odpovědět
Zažitost lze doložit dostatečně rozšířeným užitím. To jsem splnil. Nikde není psána podmínka, že to lze splnit pouze korpusem a dosud se tak ani běžně nedělo. Vždy většinou otrockým průzkumem zdrojů. --Palu (diskuse) 15. 11. 2018, 22:46 (CET)Odpovědět
Což právě vedlo k mnoha zbytečným sporům a k situaci, kdy byla a je řada měst pojmenována archaickými názvy. 32 jednotlivých výskytů nic neprokazuje.--Eleiodromos (diskuse) 15. 11. 2018, 22:51 (CET)Odpovědět
Tohle ale není ten příklad. Jak jsem ukázal, použití exonyma Cvikov je zcela současné, je dostatečně široké a má i tradici. Jen není jeho použití nejširší ze všech, jak pořád dokola poukazujete. To ale není předmětem pravidla. Pravidlo říká "pokud existuje zažité české exonymum, použijte jej". Váš pohled by byl relevantní v případě, kdy by toto speciální pravidlo neexistovalo a platilo by pouze pravidlo o očekávatelnosti. Pak bychom řešili, které ze synonym je nejzažitější. Doufám, že se mi už podařilo ten rozdíl vysvětlit. --Palu (diskuse) 15. 11. 2018, 22:56 (CET)Odpovědět
Ano, a právě tohle exonymum prokazatelně zažité není.--Eleiodromos (diskuse) 15. 11. 2018, 22:58 (CET)Odpovědět
Právě, že jsem prokázal, že zažité je. Prokázal jsem to 32 užitími (včetně korpusu) v rozličných zdrojích od oficiálních stránek německých úřadů, přes české současné noviny, současné knihy, motoristické časopisy, až po historickou literaturu nebo literaturu o historii. Je to zcela běžně používané jméno a to je podstata toho pojmu zažitost. Takže znovu prosím, nepleťte si to se soutěží co je zažitější. --Palu (diskuse) 15. 11. 2018, 23:04 (CET)Odpovědět
32 výskytů jakéhokoliv slova nedokazuje, že to slovo je zažité. To lze přesně zjistit jedině v jazykovém korpusu. Nedokázal jste vůbec nic.--Eleiodromos (diskuse) 15. 11. 2018, 23:07 (CET)Odpovědět

┌───────────────────────────────────┘To by byla pravda jedině pokud by byl korpus všeobjímající. Korpus všeobjímající není, stejně jako není všeobjímající můj vzorek. Můj vzorek ale dokládá, že se Cvikov používá v rozličných typech textů v běžném jazyce. Nedokládá to tím, že vyčítá, že se používá hodně, v kvantech. Dokládá to tak, že tu ten výskyt je. Je to podobné, jako když děláte průzkum mezi lidmi, jestli by volili Babiše. Taky nemusíte vyzpovídat 10 milionů lidí, abyste to zjistil. Stačí pár a už budete mít představu. A myslím, že na mém vzorku není důležité ani tolik číslo 32, jako celkem přesvědčivá šířka záběru co do typu textů. --Palu (diskuse) 15. 11. 2018, 23:12 (CET)Odpovědět

Dokázal jste, že to exonymum existuje, to je jasné. Proč ale nepoužít daleko přesnější metodu měření frekvence výskytu slova v jazyce? Když máme výsledek voleb, proč důvěřovat neaktuálnímu předvolebnímu průzkumu?--Eleiodromos (diskuse) 15. 11. 2018, 23:21 (CET)Odpovědět
Právě, že o výsledek voleb nejde ani v případě korpus.cz. To by musel obsahovat i zdroje, které dosud neobsahuje. Ale i kdyby obsahoval všechny zdroje, to, co byste doložil není, že "Cvikov není zažitý", ale že "existují zažitější synonyma než Cvikov". A to není to, co v tomhle případě potřebujeme dokládat. --Palu (diskuse) 15. 11. 2018, 23:26 (CET)Odpovědět
Metoda jazykového korpusu je v souladu se současnými poznatky matematické lingvistiky. Metoda: "mám 32 výskytů, pojďme přejmenovávat" je spíše smutným specifikem diskusí na české Wikipedii.--Eleiodromos (diskuse) 15. 11. 2018, 23:33 (CET)Odpovědět
Pro určité účely je to ten nejsofistikovanější nástroj. Pokud bychom poměřovali co je nejfrekventovanější, určitě by nám dobře pomohl. Pokud ale hledáme všechny frekventované v dostatečně širokém záběru typů textů, pak nám moc nepomůže, protože 1. nemá záběr do všech typů textů a 2. prosté automatické poměřování čísel nedokáže nahradit lidský výběr typu "od každého trochu". My zde nepotřebujeme poměřit kvantitu (= nejočekávatelnější), ale šířku záběru (= existuje české exonymum, které není mrtvé nebo neskomírá?) a k tomu nám korpus nemůže posloužit. --Palu (diskuse) 15. 11. 2018, 23:45 (CET)Odpovědět
To se právě fatálně mýlite. Inteligentní lidský výběr od každého trochu je právě podle přesných metodik zakomponován do ČNK. Vaše pokroucená argumentace, která se snaží dokázat, že málo zažitým/frekventovaným názvem je možné v encyklopedii pojmenovávat města, je absolutně mimo. V pravidle se o žádné výjimce, ani rozdílu nemluví. Šířku záběru jste svými 32 výskyty rozhodně nepoměřil.--Eleiodromos (diskuse) 15. 11. 2018, 23:55 (CET)Odpovědět
V pravidle o městech se hovoří o tom, že pokud existuje zažité české exonymum, máme ho použít. Tím se vymyká od ostatních témat, kde se rozhodujeme pouze na základě frekvence tak, jak říkáte. Čili tato debata není o tom, jestli je něco frekventovanějšího než Cvikov, ale o tom, jestli je Cvikov živé exonymum. Živost exonyma samozřejmě lze poměřit frekvencí - pokud bude nejfrekventovanější, pak je nepochybně živé. Neznamená to ale, že pokud nebude nejfrekventovanější, živé nebude. Toto je příklad, kdy možná není nejfrekventovanější (a já jsem se tohle ani nepokoušel studovat, takže to mám jen z vašeho tvrzení o korpusu, ale například napříč novinovými servery jsem si průzkum nedělal), ale podařilo se mi prokázat, že je živé a není okrajové. --Palu (diskuse) 16. 11. 2018, 00:02 (CET)Odpovědět
Ano a právě exonymum Cvikov použité pro výše zmíněné saské město zažité NENÍ.--Eleiodromos (diskuse) 16. 11. 2018, 00:10 (CET)Odpovědět

Cituji: „U českého, méně známého Cvikova, navrhuji použít rozlišovač“. Na to jste přišel kde? Nějaký důkaz pro tvrzení „méně známého“? Lze toto tvrzení doložit nějakými zdroji, články o malé známosti Cvikova, nebo je to jen váš pocit? --Jan KovářBK (diskuse) 15. 11. 2018, 23:09 (CET)Odpovědět

OK, beru zpět. Co ze dvou měst bude mít rozlišovač, nechám na další bod debaty po rozhodnutí, jestli použít české exonymum. Přiznám se, že tohle byl skutečně jen můj pocit. --Palu (diskuse) 15. 11. 2018, 23:12 (CET)Odpovědět
Díky za vysvětlení. Jinak Zwickau znám jako Zwickau i Cvikov, takže na použití českého exonyma nemám zcela jasný názor. --Jan KovářBK (diskuse) 15. 11. 2018, 23:21 (CET)Odpovědět
Já samozřejmě znám také oba názvy. Nicméně u měst, která mají zažitá česká exonyma, bychom podle pravidla měli preferovat právě ty. To je důvod, proč jsem navrhl tento přesun. --Palu (diskuse) 15. 11. 2018, 23:27 (CET)Odpovědět
Jsem proti přesunu, mám stejný názor jako Dirillo, a německá jmena bych vrátil na mnohem více exonym. Jinak je stále komunita rozdělená, a divím se, že to Palua stále baví. Města mají také úřední název, a tím v Německu česká exonyma nejsou, bohužel.Mirek256 16. 11. 2018, 06:07 (CET)Odpovědět
Tak na dohadování musí být víc lidí. Já jsem zase spíš příznivec exonym a úřední jména pokládám za méně významná, takže v osobním životě budu užívat spíš Cvikov, protože se mi s ním lépe pracuje. Což tedy automaticky neznamená, že jsem pro přesun - Wikipedie nemá být nástrojem jazykové revoluce.--Tchoř (diskuse) 16. 11. 2018, 07:10 (CET)Odpovědět

Musím uznat, že znění doporučení pro názvy měst a obcí chápu spíše stejně jako Palu. Nechci do toho promítat můj osobní názor na používání endonym nebo exonym, ale pro zajímavost bych chtěl poznamenat, že Cvikov je pro mě mnohem srozumitelnější, než Řezno. Ona ta zažitost nebude všude v Česku stejná, ale bude se jistě lišit lokálně, takže sporům o pohraniční města se asi hned tak nevyhneme... --YjM | dp 16. 11. 2018, 08:39 (CET)Odpovědět

Jakožto člověk, který přes oba Cvikovy má sem tam cestu: Pokud už přejmenovávat Zwickau na Cvikov, pak ale rozlišovač by měly dostat německé město nebo obě města s rozcestníkem. Stále mi to však přijde tisíckrát krkolomnější než nechat to jak to je (+ do úvodní věty článku o německém městě vysvětlit, že se tomu městu říká Cvikov, a do článku o českém městě zase Možná hledáte). --Dvorapa (diskuse) 16. 11. 2018, 10:21 (CET) Bohužel co se týče nějakého předešlého systému, kterým bychom se mohli řídit: na první pohled žádný moc není. Štětín, Svídnice (Polsko), Žitava vs. Valbřich, Chudoba, Jelení Hora. --Dvorapa (diskuse) 16. 11. 2018, 10:30 (CET) Pozn.: beru zpět svůj čechocentrismus, obě města jsou si významem dost podobná. (upraveno 16. 11. 2018, 20:45 (CET) wikipedistou Dvorapa (diskuse))Odpovědět

No ta krkolomnost podle mě není dobrý argument. Řešení typu "Různé významy" + rozlišovač mi nepřijde nějak krkolomné. Nebo myslíte, že je lepší mít Mnichov a München místo Mnichov (okres Cheb) a Mnichov? Tím chci říct, že standardní řešení doteď žádnou krkolomnost nevykazovalo a může tak jít jen o dojem plynoucí z toho, že není lehké si situaci představit. Zkuste se tedy podívat na mnou zmíněný citovaný případ (Mnichov vs. Mnichov (okres Cheb)) a říct, jestli vám přijde krkolomný (jen se prosím neupínejte na to, že bude hlavním významem německé město a vedlejším české, to je totiž jiný, podružný bod). Tedy jestli jsme správně pochopil co má být na tom řešení krkolomné. --Palu (diskuse) 16. 11. 2018, 11:41 (CET)Odpovědět
Ono je na tom nejvíce krkolomné, že těch případů, kde to je pokaždé jinak bychom mohli nacházet stovky. Zde se přeme o dvě města, vy jste vyjmenoval nyní další dvě obce, já vyjmenoval výše dalších šest a pokud bych z těchto desíti obcí chtěl učinit nějaký závěr, jak se to běžně dělá, tak to nejde, prostě si to každý dělá jak chce. Proto by nemělo být podstatné, co se líbí mně nebo vám, ale co očekávají čtenáři a ideálně to standardizovat napříč Wikipedií. Řešení Mnichova rozhodně zakládá na dominanci 1,5 mil. města proti 400 obyvatelům vesnice. Jenže u Cvikova tak jasně dominanci rozhodnout nelze, obě města jsou spádová pro přilehlé vesnice, rozdíl ve velikosti sice je, ale co do významu už tak moc ne. Proto pokud přejmenovat, tak ale přidělit rozlišovač oběma. V tom případě ale přejmenovat i Jelení Horu, Chudobu nebo Valbřich. Anebo to ponechat jak to je. Ovšem poté by bylo vhodné přejmenovat i Štětín, Svídnici, Žitavu nebo oba Mnichovy. Jednoznačně si myslím, že to není problém jen těchto dvou měst, bylo by dobré už tento stále problematický jev konečně globálně vyřešit a poté se jasným a přesným zněním pravidla/konsensu ohánět jak bičem. --Dvorapa (diskuse) 16. 11. 2018, 20:45 (CET)Odpovědět
Stávající pravidlo stanovuje "zažitost jako Londýn, Vídeň, Řezno". Není problém s pomocí Českého národního korpusu stanovit průměrnou relativní frekvenci z těchto tří měst, tu případně snížit na polovinu, aby nebyla favorizována větší města, případně, aby se vyšlo vstříc těm, kteří zde dávají přednost českým exonymům. Takto stanovená relativní frekvence v ČNK by potom mohla sloužit k rozhodování podobných sporů o názvy obcí. Co by bylo pod tuto hranici, to by zůstalo pod originálním názvem v němčině, polštině atd.--Eleiodromos (diskuse) 16. 11. 2018, 21:09 (CET)Odpovědět
To je příliš složité na běžného českého wikipedistu. Navíc je potřeba u podobných korpusových výpočtů zahrnout i aktuálnost zdroje (těžko budeme město na Wikipedii nazývat Nový Bezděz, když název v 15. století postupně nahradil název nový a od té doby se původní nepoužívá) a ani si nemyslím, že bychom měli kdy šanci se na jednotném vzorci shodnout. Asi bych volil nějaký jednodušší přístup, který bude moci použít i „každý blbec“. Třeba pomocí zdrojů, pokud v posledních x letech existují 2NNVZ uvádějící český název zahraniční obce, pak použít ten. --Dvorapa (diskuse) 17. 11. 2018, 11:23 (CET)Odpovědět
Jestli tomu správně rozumím, je potřeba vyjasnit dvě věci: za jakých podmínek použít český název (viz výše) a pokud je použit český název, pak jak to udělat s rozlišovači v případě shody. Pro druhý bod navrhuji použít rozlišovače u obou obcí, pokud se jedná o města podobného významu (Cvikovy), a pouze u významější obce, pokud se jedná o propastný rozdíl mezi významem obou obcí (Mnichov). --Dvorapa (diskuse) 17. 11. 2018, 11:23 (CET)Odpovědět
Tento systém jsem si nevymyslel já. Používá se úspěšně na dewiki a předchází se tak zbytečným sporům. Každý má svůj individuální jazykový cit, nebo zkušenost s místními názvy v rámci regionu. Tohle je ale spravedlivý způsob, jak řešit stávající chaos. Jak jsem již uvedl, když někdo najde 32 výskytů "saského Cvikova" v českých textech, není problém najít stejných 32 výskytů "saského Zwickau" v českých textech. Je to tedy opět patová situace. Texty v jazykovém korpusu "Syn verze 6" pocházejí z let 2010–2016. Odrážejí tedy současnou podobu české publicistiky. "Zažitost", o které mluví pravidlo, tak lze číselně vyjádřit a v případě sporu porovnat.--Eleiodromos (diskuse) 17. 11. 2018, 11:48 (CET)Odpovědět
Jak už jsem řekl, příliš složité na běžného wikipedistu. 2NNVZ z nedávné doby zmiňující český název by mohla být mnohem jednodušší a přesto efektivní a nesporná možnost. --Dvorapa (diskuse) 17. 11. 2018, 11:58 (CET)Odpovědět
2NNVZ mohou bez problémů dodat obě strany sporu. Následkem by byla záplava absurdních archaismů, které by zdejší slavjanofilská lobby mohla hravě a bez jakékoliv míry prosazovat. Např. Seina by mohla být tímto způsobem přejmenována na staročeský název Sekvana apod. Tyto mrtvé názvy by pak byly ve zjevném rozporu s pravidlem očekávatelnosti.--Eleiodromos (diskuse) 17. 11. 2018, 12:21 (CET)Odpovědět
Nemohou, když říkám, že musí být z nedávné doby. A také nevím, proč by protistrana sporu chtěla dodávat 2NNVZ vyvracející svůj názor (PS: přečtěte si pořádně, co říkám, zdá se mi, že mi vůbec nerozumíte). --Dvorapa (diskuse) 17. 11. 2018, 12:24 (CET)Odpovědět
Z nedávné doby mohou pocházet 2NNVZ, které jedné straně ("saský Cvikov") dodají argumenty. Jiné 2NNVZ z nedávné doby však mohou dodat také jejich názoroví oponenti ("saský Zwickau"). Proč by měla být favorizována první skupina, když "saský Zwickau" má v českých textech větší frekvenci? Takový postup by o skutečném užívání obou názvů v reálném světě nic nevypovídal a vedl by k následkům, které jsem uvedl výše.--Eleiodromos (diskuse) 17. 11. 2018, 12:55 (CET)Odpovědět
K jakým by mohlo dojít následkům? Proč by měla být favorizována první skupina? Ono u těch textů hlavně záleží, kdo je jejich autor. A často se setkávám s tím, že místní/Češi žijící v pohraničí říkají obci česky (viz Cvikov, Chudoba, Kladsko, Jelení Hora), zatímco drtivá většina Čechů mimo východočeský kraj tomu budou říkat cizojazyčně (Zwickau, Kudowa, Klłodzko, Jelenia Góra). Jenže v takovou chvíli váš systém selhává, protože přestože se obci říká běžně Česky, lidé z druhé strany republiky o tom neví. --Dvorapa (diskuse) 17. 11. 2018, 13:10 (CET)Odpovědět
Přesně to by použití korpusu řešilo. Jsou zde totiž významně zastoupeny regionální deníky, které odrážejí místní specifika publicistického stylu. Když má být ovšem podle pravidla něco "zažité jako Londýn, Vídeň, Řezno", tak by tomu měli rozumět čtenáři ze všech koutů ČR. Originálním názvem se potom nic nezkazí.--Eleiodromos (diskuse) 17. 11. 2018, 13:26 (CET)Odpovědět
To ano, ale pokud bychom na korpus aplikovali nějaký vzorec, tak ale stejně ty výskyty v reqionálních denících mohou být oproti ostatním, např. celonárodním v menšině ne? Procentuálně by tedy místní v pohraničí stále utřeli. Nebo pořád nerozumím, jak byste to tedy dle korpusu vybíral, aby to bylo dostatečně fér. Řekněme to konkrétně (omlouvám se, použiji příklad ze svého regionu): tři regionální deníky z Orlických hor (třeba i jen obecní/reqionální zpravodaje) napíší zprávu, že v Kladsku na polské straně hor zítra začnou vánoční trhy, ovšem když se poté nedejbože v Kladsku stane teroristický útok a někdo najede do lidí, 30 českých velkých deníků hned napíše, že se stala hrůza v Kłodzku. A je to nepoměr 30:3 ne? (zrovna v tomhle případě Kladska a Cvikova jsou oba snad dostatečně zažité i u velkých deníků, berte to spíš jen jako příklad, ale u jiných názvů, třeba u Chudoby nebo Jelení Hory už si myslím že by takový problém nastat mohl).
A zpátky k těm 2NNVZ: Pokud by přišel wikipedista a dodal 2NNVZ, konkrétně třeba jednu zprávu z nějakého Orlickohorského deníku, že v Kladsku začínají vánoční trhy, a druhou třeba z Náchodského zpravodaje, že Kladští zastupitelé rozhodli o dokončení cyklostezky Kladsko–Náchod, asi bych neměl problém mu to uznat spíš než nějaký výsledek vzorce z korpusu, který by mi 30:3 říkal, že mám článek pojmenovat Kłodzko. --Dvorapa (diskuse) 17. 11. 2018, 18:54 (CET)Odpovědět
Na Český národní korpus není třeba aplikovat nějaký vzorec, metoda zjištění relativní frekvence výskytu jevu v jazyce je stejně intuitivní jako používání Google. Šlo by jen o tu případnou hranici, kdy název je nebo není zažitý. Pokud jde o zastoupení regionálních deníků, tak vězte, že v korpusu "syn verze 6" zaujímají deníky Bohemia a Moravia polovinu z celkového množství, viz graf. Jazyk encyklopedie by měl odpovídat publicistickým standardům, nikoliv nějakému místnímu nespisovnému nářečí. Kladsko má v "syn verze 6" relativní frekvenci 0.43 (Kłodzko 0.02), to je řádově výše než 0,02 "saského Cvikova".--Eleiodromos (diskuse) 17. 11. 2018, 19:12 (CET)Odpovědět
On je právě nespisovný třeba jenom proto, že ÚJČ o daném názvu třeba ani moc neví a přitom se třebas používá v celém východočeském kraji. Nicméně já bych právě dal přednost místnímu názvu než tomu, co nějací pražáci píšící do celonárodních novin vyčetli z Google map a myslí si, že to tak má být. Krom toho také záleží, jak v tom korpusu hledáte, zkoušel jsem si nyní vyhledat Kudowa-Zdrój x Lázně Chudoba a dospěl jsem k závěru 0,01 x 0. Ovšem pod slovem Chudoba jsou stovky různých jmen lidí a rostlin a produktů a kdovíčeho, čili kdo ví, jak to vlastně je (nemám čas projít všech 6000 výskytů slova Chudoba)? Stejně tak by mě zajímalo, jak jste procházel všech 7000 výskytů slova Cvikov a polemizoval, zda daný text pojednává o saském nebo lužickém městě. Jen z prvních 20, které mi to dalo, to je cca půl na půl. A to není jen problém korpusu, to i problém Google testu a myslím si, že tyto metody nám bohužel u takovýchto případů nepomohou. Já věřím, že ty pokročilé funkce korpusu to umí vyfiltrovat a také věřím, že existují lidé, kteří to umí perfektně ovládat a dokáží mně, neznalému člověku rychle vypsat, jak to s těmi Cvikovy nebo Chudobou vlastně je. Ovšem běžný pisatel Wikipedie tyto složité vyhledávací mechanismy nezná a na první dobrou dopadne jako já s mými pokusy. Z mého pohledu to je, jako kdybyste na základní škole doporučoval dětem vypočítat hmotnost kuličky pomocí kvantové fyziky (trochu přeháním). Jistěže to funguje spolehlivě, ale v testu vám ty děcka dosvědčí, že kvantovce nemají šanci moc rozumět. Raději bych tedy opravdu apeloval na nějaký jednodušší přístup s tím, že pokud bude název navíc doložený šikovně vyhledanými klíčovými slovy v korpusu, pak jen lépe. (myslím, že už se oba opakujeme, tak toho prozatím nechme a počkejme ještě, co si myslí/co vymyslí ostatní). --Dvorapa (diskuse) 17. 11. 2018, 19:57 (CET)Odpovědět
Pro plnohodnotné používání ČNK je třeba se do něj nejprve zaregistrovat. Je to totiž projekt chráněný autorskými právy. Pro stanovení výskytu "německý Cvikov" a "saský Cvikov" jsem použil pokročilejší vyhledávání vzhledem k tomu, že Cvikovy jsou dva. Návod najdete zde. Tzv. gůgltest je naprosto něco jiného, Google stavěný pro angličtinu např. neumí zahrnout skloňované tvary daného slova. Cílem Google navíc není výzkum jazyka, ale byznys. Běžný pisatel Wikipedie musí zvládnout např. kód. Myslím, že není důvod dělat z wikipedistů hlupáky. Kdo chce prosadit přejmenování nějakého města, může se na wiki ČNK dozvědět vše potřebné.--Eleiodromos (diskuse) 17. 11. 2018, 20:16 (CET)Odpovědět
Wikipedisté však pro prosazení přejmenování v první řadě vůbec nebudou zkoušet korpus, ale právě Google test. Máme to na Wikipedii i v pravidlech a doporučeních. Umí skloňování slov velmi dobře. A také dokáže dát alespoň trochu pohled na věc, i když zahrnuje i výsledky z nedůvěryhodných zdrojů a výsledky z osobních blogísků apod. Tady však nejde o to, že by chtěl někdo prosadit jedno přejmenování, tady jde o hledání plošného konsensu, kterým by se řídili všichni u všech obcí bez rozdílu a většina z nás smrtelníků vážně nebude tápat, jak sepsat dotaz na korpus, než vytvoří článek. Každé dítě ze základní školy by mělo být schopné na základě jednoduchého pravidla říct, zda se bude článek na Wikipedii jmenovat tak či onak. Teď mi řekněte, kolik lidí by před napsáním článku chtělo pročítat wiki korpusu a přemýšlet, jak zadat do korpusu dotaz. Nikdo. Máte-li nějaký jiný nápad než mnou navržené 2NNVZ, protože nic lepšího zatím v diskusi asi nepadlo (i když je fakt, že jsem ji neměl čas číst celou), sem s ním. --Dvorapa (diskuse) 17. 11. 2018, 20:45 (CET)Odpovědět
Exonyma jsou problematikou lingvistickou. S tím skloňováním mimochodem nemáte pravdu. Lingvisté zdůrazňují, že vyhledávání v Google má zcela jiné parametry.[1] Obecně uznávaný je diachronní korpus vytvořený z Googlebooks: Google Ngram Viewer, který ovšem dosud nemá českou verzi.[2] Chorvatská lingvistka Pavlina Krešimir se ve svém článku Using Google Search Engine for Word Frequency Analysis pokouší porovnat výsledky běžného vyhledávání chorvatských slov ve vyhledávači Google s hledáním v chorvatských korpusech. Dochází při tom k závěru, že mezi výsledky existuje určitá korelace.[3] Nic víc. Metoda korpusu je tedy podle názoru současné lingvistiky tím nejlepším řešením.--Eleiodromos (diskuse) 17. 11. 2018, 21:00 (CET)Odpovědět
Úplně z jiného pohledu: Nutnost se někde zaregistrovat mi přijde ohrožením anonymity / pseudonymity editorů a z tohohle hlediska by se mi pravidlo něco takového vyžadující pro plnohodnotnou účast na diskusi hodně nelíbilo.--Tchoř (diskuse) 17. 11. 2018, 21:19 (CET)Odpovědět
Žijeme v době, kdy na nás Google a Facebook vědí vše a kdy je možné kohokoliv odpálit raketou na základě údajů z chytrého telefonu. Projevovat v takové situaci krajní nedůvěru aplikaci Ústavu Českého národního korpusu mi přijde přehnané. Registrace je soukromou věcí každého případného uživatele, jsem přesvědčen, že ČNK nikoho nepráskne.--Eleiodromos (diskuse) 17. 11. 2018, 21:34 (CET)Odpovědět
Problém je, že jako Wikipedie nemůžeme uživatele nutit se zaregistrovat do korpusu, jen kvůli našim pravidlům (dobrý poznatek Tchoři). --Dvorapa (diskuse) 17. 11. 2018, 22:45 (CET)Odpovědět
Ale k tomu, abych se registroval u Facebooku či Googlu mne naštěstí Wikipedie nijak nenutí. A já vykládám poměrně značné úsilí na to, aby o mne věděli co nejméně. Nehledě k tomu, že tradičně je pro člověka problém narušení soukromí spíš lidmi geograficky bližšími, kteří jej mohou potkat i v jiné roli, než někým vzdáleným.--Tchoř (diskuse) 17. 11. 2018, 22:46 (CET)Odpovědět
Přirovnal bych to asi k tomu, že Wikipedie nemůže nutit wikipedisty, aby se zaregistrovali v nejrůznějších knihovnách. Jenže z pouhého gůglení (které se Vás samozřejmě netýká) se encyklopedie dělat nedá.--Eleiodromos (diskuse) 17. 11. 2018, 22:52 (CET)Odpovědět
@Tchoř: Nutno zdůraznit, že registrace kdekoliv jinde, ať už jde o sociální síť nebo o aplikaci ČNK, nijak nenarušuje anonymitu či pseudonymitu wikipedisty, jenžto mezi těmito účty není žádné propojení. --YjM | dp 18. 11. 2018, 18:57 (CET)Odpovědět
Registrace minimálně, ovšem využití podstatně. V situaci, kdy na základě diskuse na Wikipedii začne zčistajasna deset uživatelů veřejně debatovat ve Wikipedii nad nějakým exonymem a zároveň hledat v korpusu všechny jeho možné varianty, přičemž sedm z nich se se svým občanským jménem na Wikipedii netají, takže lze jejich účty spárovat okamžitě, tak těm zbylým třem už moc té anonymity nezbyde.--Tchoř (diskuse) 19. 11. 2018, 04:38 (CET)Odpovědět
@Dvorapa: Nechci posuzovat, zda je registrace a vyhledávání v ČNK „příliš složité na běžného českého wikipedistu“, ale troufám si tvrdit, že běžný český wikipedista by ani potenciálním zavedením nového pravidla nic takové nepotřeboval – českých exonym totiž existuje konečně mnoho a už samotný Seznam českých exonym naznačuje, že nejde o nějaké ohromné číslo. Validitu všech českých exonym proti tomuto pravidlu by stačilo poměřit pouze jednou (resp. periodicky při vydání nové verze korpusu), hromadně. Nehledě na to, že velká část článků, kterých se problém týká, je již pod nějakým názvem založených. Tj. wikipedista, který by chtěl založit nový článek o městě s „problematickým“ názvem už tolik možností nemá. --YjM | dp 18. 11. 2018, 18:57 (CET)Odpovědět
Pokud to stačí provést jen jednou (za čas), pak bych doporučil místo dlouhých nesmyslných hádek zde tuto věc provést a vypsat někam třeba pod lípu seznam článků, které se jmenují počeštěně a asi by neměly + seznam článků, které se počeštěně nejmenují a asi by měly. Projdeme to, zjistíme konkrétně, jak moc se dá výsledkům z korpusu/sče věřit (věřím, že by bylo na první pohled zřejmé, že to je dobrá věc nebo to produkuje blbosti) a provedeme přejmenování (případně vymyslíme strategii přejmenování, pokud bude konflikt jako u Cvikovů). --Dvorapa (diskuse) 18. 11. 2018, 19:40 (CET)Odpovědět
Kvalitní myšlenka, všema deseti pro. Chrzwzcz (diskuse) 18. 11. 2018, 19:56 (CET)Odpovědět
Pořád nějak nechápu, proč bychom měli místo standardních testů v tématických zdrojích + google testu zavádět test korpusem. Korpus obsahuje jen výběr textů, například co se týče textů zmiňujících německé pohraničí nebude obsahovat pravděpodobně ani desetinu existujících textů. To z něj dělá pro tento účel naprosto nevypovídající zdroj. Tak proč se vám tak líbí? Jen proto, že je teoreticky nejobsáhlejším zdrojem, abychom si zjednodušili analýzu a prostě mrkli na jeden zdroj místo projíždění mnoha článků? Jenže tím se naprosto vzdálíme od reality do nějakého absurdního teoretického abstraktna. Uvědomte si, že ze 32 skutečných reálných zdrojů, které píší o Cvikově, jich korpus obsahuje pouze 5. Je to statisticky zcela nedostatečné. --Palu (diskuse) 18. 11. 2018, 21:00 (CET)Odpovědět

Je směšné, že tady chce jazykovou revoluci dělat někdo, kdo ani neovládá české skloňování řeckých jmen.--Eleiodromos (diskuse) 16. 11. 2018, 12:26 (CET)Odpovědět

„Nebuďte jedovatí – pokud to bezprostředně nesouvisí s probíraným tématem, nevyčítejte svému názorovému odpůrci například formální úpravu jeho diskusního příspěvku či jiné, pro spor nepodstatné věci.“ To jenom cituju Wikipedie:Wikietiketa, jestli článek přejmenujete nebo ne, to je mi samozřejmě úplně egál.--Hnetubud (diskuse) 16. 11. 2018, 13:38 (CET)Odpovědět

Seznam českých exonym pro německá toponyma, Seznam českých exonym - zkuste si z toho vydedukovat, jak to tedy je teď a jak to ladí s pravidlem. Jsou tam tři typy - jména historická už nepoužívaná (jméno české je kurzívou, původní jméno je modré), jména sice současná ale ne tak moc užívaná (jméno české je normálně, původní jméno je modré), a jména používaná a wikipedií podporovaná (jméno české je modré, původní je normální). Za mě: Ne že by se česká jména měla úplně upřednostňovat stůj co stůj, ale zas bych po nich nevyžadoval více než 50%, to si vykládám pod "zažité". Z článků snad bude vidět, co je a není zažitost. Chrzwzcz (diskuse) 16. 11. 2018, 19:08 (CET)Odpovědět

50 % čeho?--Eleiodromos (diskuse) 16. 11. 2018, 19:19 (CET)Odpovědět
100 * Cvikov / (Cvikov + Zwickau). V korpusu nebo jakkoliv jinak chcete měřit.Chrzwzcz (diskuse)
Nechápu. Když někdo najde 32 výskytů "saského Cvikova", není problém najít v českých publicistických textech stejných 32 výskytů "saského města Zwickau".--Eleiodromos (diskuse) 16. 11. 2018, 22:12 (CET)Odpovědět
Nechápu co nechápete, jednoznačněji než matematickým vzorcem to snad už napsat nejde. Cvikov = počet výskytů Cvikova, Zwickau = počet výskytů Zwickauů. Vyřízeno. 32 tam nikde nevystupuje, nemotat ji tam. Chrzwzcz (diskuse) 16. 11. 2018, 22:18 (CET)Odpovědět
Absolutní frekvenci/počet obou názvů v reálném světě změřit nelze. Měřit se dá pouze v korpusu, přičemž rozhodující není počet jednotlivých výskytů, ale relativní frekvence. Není mi jasné, čeho se tím Vaším vzorcem lze dopočítat. Podle mého názoru nemá smysl vymýšlet tady něco, co už je matematickými lingvisty dávno vymyšleno.--Eleiodromos (diskuse) 16. 11. 2018, 22:38 (CET)Odpovědět
Bojuje proti sobě Zwickau a Cvikov. Můj vzorec (a těžko si budu dávat copyright na vzorec pro poměr) vypočítá třeba že z 51 % používají zdroje Cvikov (a nepřekvapivě 49 % Zwickau). Pak není co řešit. A já tvrdím, že českým názvům by se přece jen mohlo trochu nadržovat i když jsou někde nehluboko pod 50 %. Chrzwzcz (diskuse) 16. 11. 2018, 22:59 (CET)Odpovědět
Jak ale chcete všechny ty jednotlivé výskyty napočítat? To je zhola nemožné. I já jsem českým exonymům ochoten nadržovat slevením relativní frekvence (průměr z relativní frekvence názvů "Londýn, Vídeň, Řezno") na polovic. Viz výše. Navrhuji tak něco, co se dá měřením v Českém národním korpusu snadno realizovat. Vy chcete patrně spočítat všechny výskyty v reálném světě, což nelze.--Eleiodromos (diskuse) 16. 11. 2018, 23:28 (CET)Odpovědět
Co navrhuje Chrzwzcz je vzít si třeba Mladou Frontu a porovnat výskyty. Nebo to udělat s encyklopediemi o Německu apod. V podstatě přijímá vaší teorii o frekvenčním poměřování s tím, že pro Cvikov nemusí být nadpoloviční většina, abychom ho použili. Jen se neomezuje na korpus.cz, který je sestaven jen z některých textů a jehož výběr tak není dostatečně reprezentativní. Místo toho chce prozkoumat reálné prostředí, kde se o Cvikovu píše. --Palu (diskuse) 17. 11. 2018, 07:58 (CET)Odpovědět
Vy si tomu říkejte poloviční relativní frekvence, já tomu budu říkat poměr 33:66 a půjde o totéž. V odkazech výše by se dalo zkoumat, jestli Wikipedie už teď nenadržuje českým exonymům ještě víc. Chrzwzcz (diskuse) 17. 11. 2018, 08:01 (CET)Odpovědět
O totéž právě vůbec nejde. Nejprve je třeba si ujasnit, zda počítat jablka nebo hrušky.--Eleiodromos (diskuse) 17. 11. 2018, 10:21 (CET)Odpovědět
Korpus "SYN verze 6", který navrhuji použít jako nástroj měření, zahrnuje korpusy SYN2000, SYN2005, SYN2006PUB, SYN2009PUB, SYN2010, SYN2013PUB a SYN2015; kromě nich se skládá také z publicistiky z let 2010–2015, která je již součástí korpusů SYN verze 4 a verze 5, a také z dosud nezveřejněné publicistiky z roku 2016 v objemu téměř 200 mil. slov. O složení jeho publicistické části si můžete udělat představu zde.--Eleiodromos (diskuse) 17. 11. 2018, 08:49 (CET)Odpovědět

Ad debata Chrzwzcz-Eleiodromos, pro Eleiodromose: Chrzwzcz říká, že při výběru ze dvou možností máme zjistit, jak často se užívají, a české exonymum užít, pokud je používané aspoň dejmetomu cca ve 40 procentech případů. Obvykle se používanost zjišťuje google testem, vy navrhujete použít korpus, v tom není problém. Postup vyhovující vám oběma by pak zněl: České exonymum se použije, pokud jeho relativní četnost v korpusu není výrazně nižší než relativní četnost cizojazyčného názvu. Například je-li relativní četnost originálního jména 0.31, pak by české exonymum mělo nárok na použití pouze pokud by jeho relativní četnost byla 0.20 a výše. (Což asi Cvikov nedá. I když jestli jsem pochopil způsob jakým jste pracoval s korpusem, tak jste našel výskyty typu "německý Cvikov" ve všech pádech; ale nikoliv případy typu "Cvikov (Německo)" ani případy kde jsou "Cvikov" a "německý" od sebe více vzdálené.) (Pro pochopení použité matematiky: je-li relativní četnost cizího jména 0.30/0.60/3/12, má české exonymum být použito, má-li relativní četnost aspoň 0.20/0.40/2/8.) --Jann (diskuse) 17. 11. 2018, 22:20 (CET)Odpovědět

Já samozřejmě nejsem proti tomu, aby byl název, který se v české publicistice moc neobjevuje vzhledem ke své okrajovosti, např. Lubáň, upřednostněn proti téměř stejně frekventovanému názvu Lubań. V tom jsem dal Paluovi za pravdu a proti přesunu jsem jako hlavní autor tohoto článku nic nenamítal. Je to jen otázka nastavení určité hranice relativní frekvence, popř. porovnání obou názvů. Máte pravdu v tom, že jsem při testování "německého či saského Cvikova" nezohlednil výskyt typu "Cvikov AND Německo". Zatím jsem totiž nenašel způsob, jak tento problém řešit, protože na ČNK fungují operátory AND a OR mnohem přesněji. To ale není problém podle situace lépe vychytat. Ve Vašem vysvětlení mi není jasné, k čemu se vztahují jednotlivé hodnoty za lomítky, ale jak jsem řekl, hranice "zažitosti", která by byla k českým názvům vstřícná, může být předmětem další diskuse.--Eleiodromos (diskuse) 17. 11. 2018, 22:38 (CET)Odpovědět
Spíš říkám: najděte si na stránkách Seznam českých exonym pro německá toponyma, Seznam českých exonym taková 2 3 4 česká exonyma, na jejichž užití byste si ani netipli a přesto se na české Wiki nezpochybněně drží. U nich přeměřte procenta, nebo i váhu zdrojů, a třeba to bude hluboko pod 40 %. Pokud bude Cvikov vykazovat podobných čísel jako ten výběr nečekaných názvů, má právo na Wiki být (druhý přístup je přejmenovat na původní názvy ty 2 3 4 neuvěřitelné případy :)) Chrzwzcz (diskuse) 18. 11. 2018, 14:47 (CET)Odpovědět
Stránky na Wikipedii by neměly být kriteriem pro debatu o exonymech. To je čistě lingvistická problematika a záležitost zdrojů samotných. To, co navrhujete, připomíná věštění z kávové sedliny. Pokud jde o poměřování, jak říkáte "váhy zdrojů", to by bylo ještě spornější.--Eleiodromos (diskuse) 18. 11. 2018, 15:10 (CET)Odpovědět
Jaké věštění, co to zase píšete? Wikipedie má pravidlo o tom, že se mají používat česká exonyma pokud jsou zažitá. Prohlédnutím stránek s nejméně očekávanými exonymy se jendoduše ukáže, co si pod "zažítá exonyma" česká wikipedie ještě představuje jako absolutní minimum. Váhování zdrojů je naprostý wikistandard, takže to asi nebudu ani dál pokračovat...Chrzwzcz (diskuse) 18. 11. 2018, 16:05 (CET)Odpovědět

Ad Palu: 32 výskytů v různých zdrojích je zažitost, pokud se alternativa vyskytuje také cca v desítkách kusů. Pokud se jméno v českých textech vyskytuje orientačně v desítkách a stovkách tisíc výskytů ([28]) musí alternativa mít k prokázání zažitosti řádově stejnou početnost. Odlišit český a německý Cvikov v googlu i korpusu je ovšem problém, nicméně googl ukazuje že například "německý Cvikov" dost zaostává za "německé Zwickau". PS. A samozřejmě, navrhujete změnu z pokojného stavu, věc není na první pohled jasná, tudíž důkazní břemeno je na vás. --Jann (diskuse) 17. 11. 2018, 22:20 (CET)Odpovědět

Já jsem v diskusi nepopíral, že Zwickau je požívaný časěji. Mluvil jsem o tom, že název Cvikov je zažitý a měli bychom tedy použít jej dle našeho pravidla. Není to nějaký obskurní staromilecký relikt, nýbrž známé, srozumitelné slovo. Předmětem pravidla není prokazovat, že je nejčetnější, ale to, že je zažité. A to reprezentuje právě široké použítí napříč různými tématy i typy textů, jaké jsou v oněch 32 zdrojích. Mnoho jich je z článků novin, mnoho z knih, snad nejvíce z atomobilových časopisů (ve Cvikově se vyráběly Trabanty a dnes VW) a abych ilustroval, že to není ani nějaký nový výmysl, uvedl jsem i starou literaturu nebo literaturu o historii. Rozhodně nebylo mým cílem dokládat, že je toto exonymum používanější nebo stejně používané (nebo používané ze 40 procent) než endonymum. Je to totiž úplně jiné kritérium než kritérium obsažené v pravidle Města a obce. --Palu (diskuse) 18. 11. 2018, 14:00 (CET)Odpovědět
"Mnoho, mnoho, nejvíce", ale na přejmenování málo.--Eleiodromos (diskuse) 18. 11. 2018, 14:22 (CET)Odpovědět
Dobře, můžeme hledat dál. Korpus je k tomu ale nevhodný. Hledejme v reálných encyklopediích, článcích, knihách, poměřujme výskyty. V korpusu ale určitě nehledejte texty o německém příhraničí. Pro studium exonym korpus použít nelze (pakliže nebude sestaven přímo za tímto účelem, což ten vámi citovaný není). --Palu (diskuse) 18. 11. 2018, 15:09 (CET)Odpovědět
To je pouze váš momentální subjektivní názor, že jazykový korpus je k řešení jazykových problémů nevhodný. Měl byste ho doložit citací lingvistických zdrojů.--Eleiodromos (diskuse) 18. 11. 2018, 15:16 (CET)Odpovědět
Nikdy jsem nenapsal, že jazykový korpus není vhodný k řešení jazykových problémů. Je to podsouvání absurdního názoru, abyste zpochybnil můj postoj. V této diskusi už asi třetí logický klam. Chcete vyhrát ve při nebo najít pravdu? --Palu (diskuse) 18. 11. 2018, 15:22 (CET)Odpovědět
Jinými slovy jste řekl totéž: "korpus je k tomu nevhodný", "pro studium exonym korpus použít nelze". To je z hlediska jazykovědy absurdní. Je směšné, že zrovna vy mi po vší té demagogii výše podsouváte, že se tu dopuštím nějakých logických klamů.--Eleiodromos (diskuse) 18. 11. 2018, 15:27 (CET)Odpovědět
Proč přesně dáváte rovnítko mezi "jazykové problémy" a "studium exonym"? --Palu (diskuse) 18. 11. 2018, 15:30 (CET)Odpovědět
Exonyma jsou samozřejmě jazykový problém. Ke studiu jazykových problémů se pak používá jazykový korpus.--Eleiodromos (diskuse) 18. 11. 2018, 15:32 (CET)Odpovědět
Jazykových problémů je mnohem více, než jenom exonyma. K některým lze použít korpus a k jiným ne. Já jsem napsal, proč si myslím, že pro exonyma je korpus nevhodný - neobsahuje vhodný soubor textů. Stejně tak lze těžko pomocí korpusu poměřit přechylovanou anepřechylovanou podobu příjmení, protože zkrátka korpus takové texty neobsahuje. Jestli chcete můj názor zpochybnit nějak inteligentně, doložte, že korpus obsahuje obsáhlou sbírku českých textů o německém pohraničí. Jinak prosím, přečtěte si tuto stránku. --Palu (diskuse) 18. 11. 2018, 15:36 (CET)Odpovědět
V korpusu "syn verze 6" zaujímají deníky Bohemia a Moravia (tedy včetně pohraničních regionů) polovinu z celkového množství, viz graf. Řekl bych, že se už točíme v kruhu. Vaše momentální subjektivní názory na ČNK mě nezajímají. Půjdu se asi věnovat něčemu smysluplnějšímu...--Eleiodromos (diskuse) 18. 11. 2018, 15:41 (CET)Odpovědět
Musím říct, že podobné vedení diskuse (váš názor mě nezajímá, je to demagogie, je to subjektivní, apod.) je až nepříjemně agresívní a neumožňuje příliš dobrat se konce debaty, spíše to výsledek blokuje. Poud bych se vrátil k věcné rovině, pak deníky Bohemia a Moravia možná píšou i o německém pohraničí (což ale osobně trochu pochybuju), ale určitě to není reprezentativní vzorek, z kterého můžete seskládat celkový přehled co do šířky typů textů (encyklopedie, noviny, časopisy, běžný web, ...). Skutečně nám pomůže v naší debatě vědět, jestli deníky Bohemia a Moravia používají více Cvikov nebo Zwickau? Já myslím, že pro určení zažitosti tyto deníky nestačí a vzorek je naprosto nevypovídající. --Palu (diskuse) 18. 11. 2018, 15:47 (CET)Odpovědět
Q.E.D.--Eleiodromos (diskuse) 18. 11. 2018, 15:51 (CET)Odpovědět
Co tak každému diskutujícímui kb a slova vynásobit deseti, a v tomto rozhasu přidat obsah do článků?Komunita se zde neshodne, tak proto zde mlčím.Mirek256
  1. LÜDELING, Anke; EVERT, Stefan; BARONI, Marco. Using Web Data for Linguistic Purposes [online]. 2007 [cit. 2018-05-24]. Dostupné online. (anglicky) 
  2. FRIGINAL, Eric; WALKER, Marsha; RANDALL, Janet Beth. Exploring mega-corpora:Google Ngram Viewer and the Corpus of Historical American English [online]. 2014 [cit. 2018-05-24]. Dostupné online. (anglicky) 
  3. KREŠIMIR, Pavlina. Using Google Search Engine for Word Frequency Analysis. Information Technology Interfaces (ITI), Proceedings of the ITI 2012 34th International Conference on. 2012, s. 393-396. ISSN 1334-2762. (anglicky) 

Průzkum periodik - Google test

Parametry hledání
\
Periodikum
Cvikov Německo
-českolipsko
Zwickau Německo
-českolipsko
% Cvikov % Zwickau
iDNES.cz 308 výskytů 250 výskytů 55 % 45 %
iHNed.cz 85 výskytů 285 výskytů 23 % 77 %
Lidovky.cz 109 výskytů 73 výskytů 60 % 40 %
Česká televize 87 výskytů 74 výskytů 54 % 46 %
Novinky.cz 69 výskytů 67 výskytů 51 % 49 %
Ceskenoviny.cz 31 výskytů 13 výskytů 70 % 30 %
Aktuálně.cz 130 výskytů 107 výskytů 55 % 45 %
Celkem 53 % 47 %

Eleiodromos opřel shození Cvikova ze stolu tvrzením "Relativní frekvence (odhad pravděpodobnosti výskytu jevu v jazyce krát 1 milion) u toho slovního spojení v největším korpusu ČNK "syn v6" je pouze 0.02.", přitom ale nenapsal, kolik je tento ukazatel relativní frekvence u Zwickau. Logicky předpokládám, že je nepoměrně větší, což bylo důvodem, proč Eleiodromos Cvikov zamítl. Vzhledem k reálným výskytům výše, které dokazují, že Cvikov je nejen zažitý, ale dokonce i používaný častěji než endonymum, lze říct, že Eleiodromosova metoda dokládání exonym/endonym pomocí korpusu je naprosto neprůkazná a nepoužitelná. Snad jsem svá tvrzení z diskuse výše o nesmyslnosti užití korpusu pro tento typ problému na tomto průzkumu dostatečně vysvětlil. Ovšem, google test má také své ohromné problémy, především ve výběru funkčních parametrů pro vyhledávání, ale i tak si troufám tvrdit, že je o mnoho přesnější, jelikož vybíráme ty texty, které se tématu věnují, nikoliv texty "já o voze, ty o koze". --Palu (diskuse) 20. 11. 2018, 19:27 (CET)Odpovědět

Dík za google test, tak se má argumentovat. Ncméně: Zaprvé Eleiodromos napsal frekvenci Zwickau (.. Název Zwickau má tamtéž relativní frekvenci 0.31.--Eleiodromos (diskuse) 15. 11. 2018, 15:29 (CET) ..). Za druhé, část Cvikovů ve vaší tabulce je český Cvikov - např. u Českých novin jde o 6 případů z těch 31. --Jann (diskuse) 21. 11. 2018, 15:30 (CET)Odpovědět
Ano, to asi ano. Stejně tak může být teoreticky mezi Zwickau český Cvikov, protože jeho německá varianta je totožná. Nicméně z pohledu zažitosti ztráta pár procent pro Cvikov příliš nezmění. Možná tak z pohledu očekávatelnosti, kde by třeba Cvikov spadl pod 50 procent. Ale ta není u exonym to, co chceme sledovat - konsensem je nadržovat českým exonymům, pakliže nejsou obskurní (jeden z důvodu je kultivovaný jazyk Wikipedie). Jinak druhé relativní frekvence jsem se nevšiml, takže se omlouvám. --Palu (diskuse) 21. 11. 2018, 22:57 (CET)Odpovědět
Jen připomínám, že v diskusi Oybin byly provedeny testy validity tzv. Google testu, které dopadly následovně:
Toponyma Chomutov, Chotumov, Chomuvot a Chovutom (Google test)
Toponymum
Chomutov 290
Chotumov 90
Chomuvot 10
Chovutom 2

(Eleiodromos)

Toponyma Praha a Prag (Google test)
Toponymum
Praha 290
Prag 311

(Lubor Ferenc)

Název Prag je tedy podle tzv. Google testu na českém internetu používanější než název Praha.--Eleiodromos (diskuse) 21. 11. 2018, 19:41 (CET)Odpovědět

Ano, Google test má své potíže, je potřeba jednotlivé výsledky kriticky posoudit. Přesto je ale vzhledem k uvedenému nepoměrně přesnější a vhodnější než test korpusem. --Palu (diskuse) 21. 11. 2018, 22:59 (CET)Odpovědět
Samozřejmě je to nějak divně naklikaný googletest. Přece si nebudeme myslet že na českém internetu se najde jen 290 zmínek o Praze :D Chrzwzcz (diskuse) 22. 11. 2018, 19:08 (CET)Odpovědět
Přesně tímhle způsobem se v podobných diskusích na české Wikipedii běžně argumentuje.--Eleiodromos (diskuse) 22. 11. 2018, 19:15 (CET)Odpovědět
Jakým zas? Chrzwzcz (diskuse)
Apelováním na racionální argumenty, zdravý rozum a elementární logiku, které teoreticky u rozumných lidí přebíjí předsudky. V podobných diskusích nejen na Wikipedii však často předsudky vyhrávají. Myslím však, že by jste se neměl přestat snažit o vedení debaty "přesně tímhle způsobem". --Jann (diskuse) 24. 11. 2018, 22:48 (CET)Odpovědět

Ke google testům: třeba s Prahou - google dá rozumné výsledky takto: Praha (do vyhledávače postě napsat Praha + zaškrtnout volbu "stránky pouze česky") a Prag s poměrem 249 : 7,7 ve prospěch Prahy. Palu dělá tu chybu, že si navíc prokliká až na poslední stránku kterou mu google ukáže, a protože google ukáže vždy jen pár desítek stránek (při deseti heslech na stránce tedy u Prahy/Prag to bylo 29 a 31 stránek výsledků - viz výše) tak mu vždy vyjde číslo kolem dvou tří stovek které jen slabě závisí na reálném počtu použití slova v prostorách internetu. Paluova metoda je jakžtakž použitelná pro slova vyskytující se na internetech v desítkách případů, ale pro města, o kterých se píše tisíckát nebo milionkrát vydává nesmysly. U Prahy evidentní, u Oybinu je však zkreslení také výrazné - srovnejte Ojvín a řádově více Oybin s Paluovými tabulkami. Čili google test použitelný je, avšak musí se současně používat i hlava :-) PS. Korpus má zase jiné problémy, jeho tvůrci evidentně dávají před neutrální vědou přednost vědě politicky a ideologicky angažované, bohužel... --Jann (diskuse) 24. 11. 2018, 22:48 (CET)Odpovědět

Smím se zeptat, čím máte podložené to smělé tvrzení o politickém a ideologickém profilu ČNK?--Eleiodromos (diskuse) 24. 11. 2018, 22:59 (CET)Odpovědět
Tvrzením na wiki.korpus.cz: Složení publicistické části korpusu SYN verze 5 pokrývá produkci hlavních celostátních deníků (Mladá fronta DNES, Lidové noviny, Právo, Hospodářské noviny, Blesk, Sport), - pánové zahrnuli mezi "hlavní" všechny celostátní deníky kromě jednoho, všechny kromě jednoho, lišícího se opoziční politickou orientací. Ten je "ne-hlavní". Čím jiným než ideopředsudky tohle rozdělení vysvětlit? Navíc následuje úžasné tvrzení, že deníky s jednotnou celostátní částí doplněnou krajskou regionální přílohou jsou "celostátní deníky", kdežto deníky s jednotnou celostátní částí doplněnou okresní regionální přílohou (Deníky Bohemia) jsou "regionální deníky". Jako sranda dobrý, ale brát takovéhle "vědce" vážně je fakt odvaha. -- Tento příspěvek přidal Jann (diskusepříspěvky) 25. listopadu 2018, 10.51 (CE(S)T)
Z celostátních českých deníků chybí AHA!, Šíp a Haló noviny. Jen připomínám, že Ústav Českého národního korpusu je příspěvkovou organizací s omezenými finančními možnostmi. Bylo by např. zajímavé studovat jazyk bulvárních novin. Hlavním cílem ČNK však není zachycení nějaké politické ideologie, ale standardizované češtiny v žánru publicistiky. Vyhledávací managery aplikace KonText, které na rozdíl od Google nejsou určeny pro komerční účely, bych z nějaké politicko-ideologické podjatosti rovněž nepodezíral.--Eleiodromos (diskuse) 25. 11. 2018, 12:28 (CET)Odpovědět
Podle mě je úplně jedno proč je ČNK nekompletní. Zkrátka nekompletní je. Google test naproti tomu kompletní je alespoň v oblasti digitalizovaných zdrojů dostupných na internetu. --Palu (diskuse) 25. 11. 2018, 12:59 (CET)Odpovědět
"Alespoň v oblasti digitalizovaných zdrojů dostupných na internetu" je značné a citelné omezení. Český národní korpus, který tak jako každý jiný korpus kdekoli na světě neobsahuje všechny texty daného jazyka, zahrnuje rovněž určitý podíl české odborné literatury. Práce s ním však vyžaduje více pozornosti než pět minut gůglování.--Eleiodromos (diskuse) 25. 11. 2018, 13:12 (CET)Odpovědět
Proto je vhodné doplnit google test o průzkum dalších relevantních zdrojů v knihovně, pokud je ta šance. Máte pak kompletní přehled na internetu + kompletní přehled ve vámi vybraném souhrnu knih o dané problematice. Použitím ČNK máte přehled z nekompletního souhrnu rozličného typu textů. Taky připomínám, že i google test zahrnuje mnoho tištěné literatury dostupné například na Google knihách, webarchive, apod. --Palu (diskuse) 25. 11. 2018, 13:19 (CET)Odpovědět
To je jako stavět dům z vepřovek a pak to na ušlapané hlíně zachraňovat betonovou podlahou. Já bych ten dům přece jen raději stavěl z lepšího materiálu.--Eleiodromos (diskuse) 25. 11. 2018, 13:28 (CET)Odpovědět
V této debatě nám může pomoct jedině objektivní argumentace. Při subjektivním "mě se to zdá nekvalitní" nevím na co vlastně odpovědět. Pokud máte takový pocit, podpořte ho nějakým porovnáním, analýzou, logickým tokem, apod. --Palu (diskuse) 25. 11. 2018, 13:47 (CET)Odpovědět
Viz literatura,[1][2][3] kterou jsem tu opakovaně argumentoval.--Eleiodromos (diskuse) 25. 11. 2018, 13:52 (CET)Odpovědět
  1. LÜDELING, Anke; EVERT, Stefan; BARONI, Marco. Using Web Data for Linguistic Purposes [online]. 2007 [cit. 2018-05-24]. Dostupné online. (anglicky) 
  2. FRIGINAL, Eric; WALKER, Marsha; RANDALL, Janet Beth. Exploring mega-corpora:Google Ngram Viewer and the Corpus of Historical American English [online]. 2014 [cit. 2018-05-24]. Dostupné online. (anglicky) 
  3. KREŠIMIR, Pavlina. Using Google Search Engine for Word Frequency Analysis. Information Technology Interfaces (ITI), Proceedings of the ITI 2012 34th International Conference on. 2012, s. 393-396. ISSN 1334-2762. (anglicky) 
A kde a čím ta literatura dokazuje, že pro naše účely je google test nepoužitelný, nebo i jen horší než prohledání korpusu? --Jann (diskuse) 5. 12. 2018, 14:54 (CET)Odpovědět
Ve studii Using Web Data for Linguistic Purposes je do detailů rozebráno, v čem jsou slabiny komerčního vyhledávacího enginu Google (skloňování apod.), pokud je použit pro lingvistické účely. Stačí, když se do toho trochu začtete. To, že jsou např. pro potřeby informatiky (automatické opravy v editorech apod.) používány výhradně tyto výdobytky korpusové lingvistiky, je fakt tak triviální, že ho tu nepotřebuji dokazovat. Přeneseno do prostředí české Wikipedie mi přijde naprosto v pořádku, aby se právě zde používaly ty nejlepší nástroje a metody. Pokud je např. na dewiki problém exonym řešen pomocí korpusu, určitě to není proto, že by nebyli tak chytří jako někteří čeští wikipedisté, kteří v této citlivé otázce argumentují tím, co za pět minut vygůglovali.--Eleiodromos (diskuse) 5. 12. 2018, 15:09 (CET)Odpovědět
Šíp je od roku 2009 týdeník. ...cílem však není zachycení nějaké politické ideologie, ale standardizované češtiny v žánru publicistiky... - jestli z nebulvárních a polobulvárních deníků považují za "hlavní" všechny kromě jediného opozičního, tak to zvenku vypadá, že jejich pojetí standardizované češtiny má výrazné ideologické rysy, a že váš názor (..zachycení nějaké politické ideologie a utlumení jiné mezi jejich cíle nepatří..) je v rozporu s jejich činy. Omezené zdroje a organizační forma s tím naprosto nesouvisí, ty mohou ovlivnit pouze velikost tvořeného souboru, množství přepisovaných textů, nikoliv jejich výběr (ledaže by "správný" výběr ovlivňoval výši dostupných finančních prostředků). --Jann (diskuse) 30. 11. 2018, 19:37 (CET)Odpovědět
Předseda komise pro informační zdroje ČNK mi dnes na dotaz, proč nejsou do excerpce zařazeny Haló noviny, odpověděl takto: „nejsem si jistý, jak je to konkrétně u Haló novin, ale obecně se to má tak, že potřebujeme souhlas vydavatele daného periodika se zařazením jeho produkce do ČNK. Bohužel se poměrně často stává, že souhlas nezískáme a musíme tak řadu titulů oželet, i když bychom je jinak -- kvůli dokumentaci jazyka v nich -- rádi měli.“--Eleiodromos (diskuse) 5. 12. 2018, 12:55 (CET)Odpovědět
Zajímavé, cením si vaší snahy. Nicméně oni píší "hlavní deníky" nikoliv "deníky, jejichž vydavatelé dali souhlas". Takže sdělení se týká jiných médií... Mimochodem, vaše Inteligentní lidský výběr od každého trochu je právě podle přesných metodik zakomponován do ČNK se tak trochu tluče se sdělením, že vybíráno je pouze z těch médií, u kterých mají souhlas vydavatele... google naopak prohledává celý web, ne? --Jann (diskuse) 5. 12. 2018, 14:54 (CET)Odpovědět
Google prohledává pouze nejnovější povrch webu. Články z důležitých deníků, jako jsou např. Hospodářské noviny, nejsou pro neplatící čtenáře přístupné. Starší články z období posledních dvaceti let jsou často nedostupné. Z odborné literatury je stále digitalizován jen zlomek, u kterého není problém s autorským právem. Vzniká tedy převaha literatury starší a neaktuální. V ČNK naproti tomu naleznete prokomponovanou směs publicistiky od roku 2000, ale také část odborných textů a krásné literatury. Nechybí ani takové záležitosti, jako jsou např. Parlamentní listy. To, že tzv. Google test měří pouze počet momentálně dostupných výskytů na povrchu webu a nikoliv relativní frekvenci (pravidlem Wikipedie požadovanou "zažitost jako Londýn, Vídeň, Řezno"), snad nemusím připomínat.--Eleiodromos (diskuse) 5. 12. 2018, 15:24 (CET)Odpovědět
Já nějak nechápu, proč se tu pořád hádáme o tom jestli ČNK nebo Google test. Jsou to dvě metody na udělání si obrázku, ani jedna není stoprocentně spolehlivá, každá má svoje mouchy a hlavně - obě ukazují, že Cvikov je zažité české exonymum. Tak proč tu sáhodlouze donekonečna rozebíráme, jestli ČNK je nebo není suprovější než Google test? Připomínám, že začátek této debaty se vedl o přejmenování článku na Cvikov. --Palu (diskuse) 6. 12. 2018, 19:22 (CET)Odpovědět
ČNK nic takového neukazuje.--Eleiodromos (diskuse) 6. 12. 2018, 19:54 (CET)Odpovědět
Co to povídáte? Korpus Cvikov zná. --Palu (diskuse) 6. 12. 2018, 20:17 (CET)Odpovědět
To vaše srovnání má stejnou logiku jako srovnání lidového léčitelství a medicíny. To, že se v ČNK ojediněle vyskytuje německý či saský Cvikov, nic nemění na tom, že jeho relativní frekvence je pouze 0,02.--Eleiodromos (diskuse) 6. 12. 2018, 20:21 (CET)Odpovědět
Jenže to není to, co nás v této debatě zajímá. Obecně máte pravdu a články na Wikipedii se pojmenovávají na základě relativní frekvence (i když dosud jsme řešili její určení výhradně Google testem, nikoliv ryze lingvistickým ČNK nezkoumajícím jakékoliv další reálie a navíc s méně reprezentativním výběrem textů než má Google). Města mají ale z tohoto pravidla (WP:Očekávatelnost) výjimku (WP:Města a obce) a pojmenovávají se tak, že pakliže má město zažité české exonymum, použije se to. Takže pro tuto debatu není relativní frekvence relevantním ukazatelem. --Palu (diskuse) 6. 12. 2018, 20:30 (CET)Odpovědět
Abych byl pochopen, uvedu to na příkladu. Cvikov má podle vašich zjištění na ČNK relativní frekvenci 0,02, což znamená 2 výskyty ve 100 milionech slov. Zwickau má 0,31, což znamená 3 výskyty v 10 milionech slov. Podle toho lze určit, že Zwickau je 15x častější variantou než Cvikov. Nelze ale podle toho určit, jestli je to slovo zažité. To lze určit jedině otrockou analýzou zdrojů co do rozsahu, kvality a i relativní četnosti, ale v rámci reprezentativního vzorku. (a další věc pak je, že mi není jasná metodika, jak bylo garantováno, že nedošlo k záměně Zwickau a Cvikov v Čechách) --Palu (diskuse) 6. 12. 2018, 20:41 (CET)Odpovědět
O reprezentativnosti vzorku, který vyhledá Google, mám vážné pochybnosti. Pokud vás zajímají další informace, představu si můžete udělat v článku Měnící se svět webového vyhledávání. Pokud jde o váš osobní výklad pravidla zažitosti, v tom se asi neshodneme, protože v ČNK jistě najdete např. i slovo čistonosoplena. Pravidlo mluví o "zažitosti jako Londýn, Vídeň, Řezno". Poměřeno relativní frekvencí je to: Londýn (66,15), Vídeň (40,3), Řezno (0,84). Průměrně tedy 35,76. To je podle mého názoru "zažitost", o jaké mluví toto pravidlo, nikoliv 0,02.--Eleiodromos (diskuse) 6. 12. 2018, 20:47 (CET)Odpovědět
Reprezentativnost vzorku Google je taková, jak si ji nastavíme a Google je rozhodně kompletnější než ČNK, což už tu bylo probíráno. Pokud si myslíte, že 15x méně je automaticky nezažité, pak nechápu na základě čeho si to myslíte. Věřím, že snad ještě horší výsledek získáte u záchod vs. klozet (nebo auto vs. vozidlo, letadlo vs. aeroplán, zip vs. zdrhovadlo, ...) a přesto to neznamená, že klozet není zažité slovo. Je to poměření frekvence, nikoliv zažitosti - nelze mezi to klást rovnítko. Možná má čistonosoplena taky 0,02, i když si to nemyslím (a vy máte v moci na rozdíl ode mě to prozkoumat; možná, že je skutečně tak citovaná jako příklad absurdity obrozenecké slovotvorby, že vylítne ještě výš než Zwickau), ale i kdyby, tak to skutečně nevypovídá nic o její zažitosti. --Palu (diskuse) 6. 12. 2018, 20:58 (CET)Odpovědět
Určení zažitosti je pro intuici nedostupné a nerealizovatelné. Zapomeňte na svůj individuální jazykový cit poplatný vašemu původu a věku a seznamte se s tvrdými daty. Google je dobrý jen pro první nástřel, nikoliv pro zjištění přesné hodnoty relativní frekvence daného slova.--Eleiodromos (diskuse) 6. 12. 2018, 21:12 (CET)Odpovědět
I analýza výskytu v rámci typů a rozsahu zdrojů patří mezi tvrdá data, ČNK skutečně není jediným zdrojem tvrdých dat, vzlášť když je nekompletní. Musím trvat na tom, že relativní frekvence slova nijak nesouvisí se zažitostí. Tento ukazatel neumí prokazatelně ukázat ani že slovo je zažité (citování absurdního slova pro pobavení zvýší jeho četnost bez vlivu na jeho nezažitost) ani že je nezažité (nízká frekvence některých slov může být způsobená například užíváním pouze ve spisovné vrstvě jazyka apod.). Už vůbec nemůžete mluvit o nezažitosti na základě patnáctinásobného rozdílu. Musel by být v řádu stovek či tisíců, aby tam byl alespoň nepřímý náznak. --Palu (diskuse) 6. 12. 2018, 21:19 (CET)Odpovědět
Pokud má exonymum frekvenci 0,02, nezbývá než dát šanci originálnímu názvu. Věřte tomu, že čeština tím neutrpí a přežije to stejně jako současnou nadvládu stupidních anglicismů. Pokud výsledky gůglování považujete za "tvrdá data", potom nechápu, oč se ta korpusová lingvistika vlastně snaží, když je to přece tak jednoduché.--Eleiodromos (diskuse) 6. 12. 2018, 21:26 (CET)Odpovědět
Ovšem tato vaše odpověď postrádá jakýkoliv odkaz na tvrdá data nebo místní pravidla a prostě jen hrnuje váš osobní postoj. Věřím tomu, že korpusoví lingvisté dokáží ČNK využívat relevantním způsobem a že je korpus velmi důležitým nástrojem pro sledování vývoje jazyka. Věřím, že na základě určité studie, která zahrne také, ale ne jenom výsledky relativních četností, lze stanovit, že nějaké slovo už je nezažité a nepoužívané. Nelze to ale usoudit pouze na základě relativní frekvence, která je sama o sobě jen jedním údajem z mnoha. Je to, jako byste chtěl z frekvence prodeje jídel ve fastfoodu určit, které jídlo není ve společnosti známé. Že se prodá některé jídlo jednou za týden a jiné jednou za minutu ještě neznamená, že to jednou za týden je neznámé. Znamenat to může to, že 1) není chutné, 2) není zdravé, 3) není dostupné, ... atd. A nebo samozřejmě i že není známé, to je vlastně také jedna z těchto mnoha možností. --Palu (diskuse) 6. 12. 2018, 21:37 (CET)Odpovědět
Bohužel, jediná kvantifikovatelná "zažitost" je relativní frekvence. Nic lepšího není k dispozici. Dál už tuto diskusi není třeba rozmělňovat.--Eleiodromos (diskuse) 6. 12. 2018, 21:45 (CET)Odpovědět
Ano, tento argument opakujete velmi často, vlastně v každé vaší odpovědi. Jeho mylnost dokazuje třeba i rozpor vašeho závěru o nezažitosti Cvikova například s bakalářskou prací Vývoj a současný stav české exonymie TUL ("více frekventovaná a známá jména") nebo s článkem Cizí zeměpisná jména v českém kontextu v Naší řeči citující vznikající publikaci názvoslovné komise Českého úřadu geografického a kartografického ("exonymum běžně užívané v českém kontextu"). Dále Cvikov běžně použila práce Standardizace jmen sídelních a nesídelních geografických objektů z území mimo Českou republiku ČÚZK, a je tu další spousta použití v soudobé spisovné češtině, jako třeba v tomto sborníku apod. Zkrátka z jednoho údaje ČNK evidentně nejde vypozorovat to, co tvrdíte, že jde. Nebo leda že by byli všichni ostatní letadlo. --Palu (diskuse) 6. 12. 2018, 22:19 (CET)Odpovědět
Prosimvás, nějaká bakalářka z oboru "Český jazyk a literatura" na TULU, nebo článek z Naší řeči z roku nebreč vám dává zase jen pouhé 3 výskyty, nikoliv "zažitost" a už vůbec ne relativní frekvenci.--Eleiodromos (diskuse) 6. 12. 2018, 22:30 (CET)Odpovědět
Já tam vidím hodnocení, ne jen výskyty: "více frekventovaná a známá jména", "exonymum běžně užívané v českém kontextu". Myslím, že autorita těchto dvou zdrojů je větší, než vaše interpretace ČNK, která nehledí ani na váhu obsažených zdrojů, ani na četnost v rámci určitých okruhů, zkrátka prostě jen vezmete jedno číslo a to sem s odpuštěním "prdnete" jako že dokládá všechno. Bez jakékoliv hlubší interpretace, bez porozumění, co vlastně to číslo dokládá a ukazuje. --Palu (diskuse) 6. 12. 2018, 22:46 (CET)Odpovědět
S činností a cíli ČNK, na nichž se nepodílejí bc.-češtináři, ale absolventi matfyz, jste se evidentně ani neseznámil. Proto se s vámi pro dnešek loučím se svým oblíbeným Q.E.D..--Eleiodromos (diskuse) 6. 12. 2018, 22:56 (CET)Odpovědět
Ono ztotožňovat autoritu ČNK a autoritu toho, kdo z něj získává a interpretuje údaje, je kardinální chybou. O autoritě ČNK jsem neřekl nic špatného. Tvrdím jen, že váš výklad není správný, protože nelze ČNK aplikovat takovým způsobem, jak jej aplikujete. --Palu (diskuse) 6. 12. 2018, 22:59 (CET)Odpovědět
Jestli to dobře chápu, zpochybnil jste můj test v úvodu této kapitoly. Můžete tedy čísla opravit tak, aby byla podle vás v pořádku? --Palu (diskuse) 25. 11. 2018, 10:41 (CET)Odpovědět
JoChrzwzcz (diskuse) 25. 11. 2018, 10:57 (CET)Odpovědět
iDNES.cz     10600:4390
iHNed.cz       114: 404  
Lidovky.cz     313: 128 
Česká televize 219:  98
Novinky.cz     100: 140  
Ceskenoviny.cz  81:  26 
Aktuálně.cz    300: 275
Bez odkazů nepoznám, co bylo na mojí metodě špatně. Jestli to dobře chápu, tak jsem nesprávně odečítal to číslo a měl jsem ho odečítat už na první stránce. Nicméně když kliknu třeba na ten Ojvín výše, tak žádné číslo nevidím, dokud se neproklikám právě na ten konec. --Palu (diskuse) 25. 11. 2018, 11:09 (CET)Odpovědět
Když kliknete na Ojvín, vidíte řádek Vše Obrázky .... Nastavení Nástroje. Přičemž tlačítko Nástroje je zvýrazněné. Pod ním je řádek Nástrojů: Stránky pouze česky Bez časového omezení... Řádek Nástrojů je vidět, protože jsem tam zaškrtl "Stránky pouze česky". Když kliknete na "Nástroje", tak vám tenhle nástrojový řádek zmizí a na jeho místě se objeví obvyklé "Přibližný počet výsledků: 6 390 (0,37 s) " a to je číslo o které nám jde - googlovský odhad počtu Ojvínů na internetech. Oybinů google odhaduje 111 tisíc [29]. --Jann (diskuse) 25. 11. 2018, 11:50 (CET)Odpovědět
Do těchto odkazů se evidentně zrcadlí českolipský Cvikov.--Eleiodromos (diskuse) 25. 11. 2018, 12:40 (CET)Odpovědět
Díky tedy za vysvětlení, tohle jsem neznal. --Palu (diskuse) 25. 11. 2018, 12:59 (CET)Odpovědět
Rádo se stalo. Po zopakování google testu touto lepší metodou dostaneme například na Aktuálně.cz pro cvikov německo -českolipsko odhad googlu 198, pro zwickau německo -českolipsko 236, což se liší od vašeho výsledku 130 ku 107. Imo to pořád dokazuje zažitost Cvikova v redakci Aktuálně, ale ty poměry už jsou jiné a u jiných webů mohou být dramaticky jiné. Obecně dotaz cvikov německo -českolipsko prohrává s zwickau německo -českolipsko v poměru 378 000 ku 16 500 000. Čiliže, v kontrastu k redakci Aktuálně, na českých internetech Cvikov jasně prohrává. Kupodivu u knih známých googlu je poměr 3300 ku 951 ve prospěch Cvikova. --Jann (diskuse) 30. 11. 2018, 19:37 (CET)Odpovědět
Tak z pohledu zažitosti nám je celkem jedno, které synonymum prohrává. Jde o to, jestli je to české zažité, tj. jestli je v paměti. --Palu (diskuse) 30. 11. 2018, 19:47 (CET)Odpovědět
V paměti je, v tom smyslu, že významná část Čechů ho zná. Nicméně ohledně zažitosti se lišíme - myslím, že zažitostí pravidlo nemíní zda exonymum je v paměti, ale zda je používané. --Jann (diskuse) 30. 11. 2018, 19:59 (CET)Odpovědět
To se nelišíme. Pokud je v paměti, tak je i používané. Je ale irelevantní, jestli je nejpoužívanější. --Palu (diskuse) 30. 11. 2018, 20:07 (CET)Odpovědět
To jméno živé je, třeba ve smyslu že jej i noviny v posledním roce používají a ve srovnatelném počtu k originálu. A ani Google se nebojí dát Cvikov na své mapy v češtině... Ne že by nešlo zpochybňovat Googlemapy, můžeme ale třeba porovnat, jak moc se Wikipedie od Googlu liší u jiných exonym. Chrzwzcz (diskuse) 30. 11. 2018, 22:21 (CET) PS: Proklikal jsem si asi 30 českých exonym pro německá toponyma a rozdíl jsem zaznamenal jen u Zwickau, všude jinde jsou Googlemapy a Wiki stejně "odvážné", až se vkrádala otázka jestli to Google prachsprostě neokopíroval z wikipedie, ale vypadá to že tenhle článek se nikdy nejmenoval Cvikov... Chrzwzcz (diskuse) 30. 11. 2018, 22:39 (CET)Odpovědět
@Chrzwzcz: Článek byl jako Cvikov založen, stačí umět hledat Cvikov (Zwickau), a jinak zde poznamenám, jestli mě na wiki něco nebaví, tak tato diskuze na toto téma, ale mám názor, že by se německá města měla jmenovat německy.Mirek256 1. 12. 2018, 09:04 (CET)Odpovědět
Google přecházel na české názvy letos, sotva kopíroval jak byl článek založen před lety. Německá města by se pochopitelně na wikipedii měla jmenovat tak, jak je běžné v českých zdrojích a ne jak si někdo direktivně vymyslí protože má úžasnou myšlenku jak jazyk zpravidelnit a zavedenou češtinu zpitvořit Berliny, Dresdeny a Kölny. Chrzwzcz (diskuse) 1. 12. 2018, 10:09 (CET)Odpovědět
Se mi nevěřilo, tady máte zdroj: důkazChrzwzcz (diskuse) 1. 12. 2018, 11:09 (CET)Odpovědět

Ale hned diskuze Pracuji ve spedici a vůbec se nám to nelíbí. Velká města s českými názvy budiž. Ale komu co řekne německá Olešnice nad Halštrovem (jinak Olešnic v ČR je okolo padesáti), Cáchy, maďarský Ráb, a mnoho dalších měst. Jenom to komplikuje vyhledávání, Google měl nechat původní názvy Oelsnitz/Vogtland, Györ, Aachen. A ještě lepší je Cvikov (Zwickau) a Cvikov v severních Čechách a v článku zmiňované Benátky. Protože se opravdu může stát to, co píše autor článku, „že si zadáte do navigace například Benátky, a na hranici města vás přivítá cedule Venezia. Pokud tedy nedorazíte do Benátek nad Jizerou.“ -:)))Mirek256 1. 12. 2018, 11:19 (CET)Odpovědět

No jo, v diskuzi může být kdecos, nespokojenci a rýpalové forever. Pokud české zdroje znají jen Olešnici nad Halštrovem, ať se to naučí i česká navigace a ne naopak. Nebo pokud to Google s počešťováním přehnal a vytáhl zapomenuté vykopávky, dají se nahlásit opravy. Chrzwzcz (diskuse) 1. 12. 2018, 11:23 (CET)Odpovědět
Aplikace Google nemůže být kritériem v diskusi o českém jazyce. Od toho je Ústav pro jazyk český Akademie věd České republiky a Ústav Českého národního korpusu.--Eleiodromos (diskuse) 1. 12. 2018, 11:46 (CET)Odpovědět
No a kdo říká, že o tom Google rozhoduje? Říkám jenom, že pokud se Wikipedie rozhodne pro Cvikov, což je stále živé jméno (milý ÚJČ vám to jistě ukáže, ve výsledcích třeba za poslední rok nebo pětiletku), tak v tom nebude osamocena a nemá se za co stydět. Tu vysmívanou Olešnici nad Halštrovem tu máme na wikině taky. Ale jinak nemáte pravdu, na wikipedii se úplně bněžneě výsledky hledají na googlu a váží se, nejede jen na prostý počet výskytů, ale zkouší odhadnout, jaký má tento výskyt dosah. Že v nějakých lokálních novinách napsali 1000x Zwickau je pěkná věc, ale 1 Cvikov v celostátním médiu to klidně převálcuje. A váš drahý korpus by nám hlásil 1000násobnou převahu Zwickau, ne?Chrzwzcz (diskuse) 1. 12. 2018, 12:01 (CET)Odpovědět

Jsem proti přesunu, podle mne je německý název očekávaný, viz také názvy ostatních měst v zemském okrese...--OISV (diskuse) 12. 12. 2018, 08:33 (CET)Odpovědět

Tím myslíte v zemském okresu Cvikov? U určování zažitosti exonym určitě nehraje roli nějaké posuzování po skupinkách. :) Chrzwzcz (diskuse) 12. 12. 2018, 08:44 (CET)Odpovědět

Rekapitulace

Jelikož už je diskuse celkem dlouhá a není jednoduché se v ní vyznat, rád bych zrekapituloval podklady, které máme:

Pro zažitost Cvikova
  1. Google test 1 (problémy Google testu jsou známé)
  2. Google test 2 (problémy Google testu jsou známé)
  3. Výskyt v ČNK a analýza váhy zahrnutých výskytů
  4. Výčet výskytů a rozsah typu užití ve zdrojích (včetně publikací) dostupných na internetu
  5. Hodnocení lingvistickými a geografickými zdroji a uvedení v seznamu exonym Českého úřadu geografického a kartografického
Proti zažitosti Cvikova
  1. 15x nižší relativní frekvence v ČNK než u endonymní varianty Zwickau (relevance tohoto ukazatele pro prokázání zažitosti je napadena např. zde či zde)

Případně pokud jsem něco přehlédl, klidně doplňte. --Palu (diskuse) 6. 12. 2018, 23:36 (CET)Odpovědět

No rozhodně se korpusu přisuzují vlastnosti, které nemá, nebo takové nebyly prezentovány - v kterých letech jsou tam ty výskyty (není tedy název na ústupu?), v jakých rozdílných zdrojích se tam vyskytoval (nejsou všechny ty výskyty nakonec třeba jen z jedné jediné publikace 100 let staré nebo všechno jeden autor nefandíci českému názvu? :)) Nevíme a ještě jsem v diskuzích o přejmenování neviděl, že by se s korpusem čarovalo, takže proto ta velká zdženlivost a zrovna u Zwickau stanovovat nějaký precedent.. Já jsem navrhoval definovat "zažitost" tak, že se podíváme na jiné teoreticky problematické případy které jsou usazené a u nich si zkusíme googlit (třeba i korpusit) a uvidíme, že české jméno na wiki drží, nikdo nezpochybňuje, i když na Googlu je to 1:10 a v korpusu prohrává na celé čáře víc než Cvikov a co - nic - české jméno máme. Teda taky by z toho mohla nastat přejmenovávací mánie i u těch dalších příkladů ;) Ale reakce na svůj návrh jsou nasnadě, jeden zase zopakuje že jedině korpus je to kol čeho se Země točí a druhý zas že jeden výskyt na Googlu za posledních 10 let ukazuje, že název je živý a zažitý :D Mně je Cvikov/Zwickau v zásadě ukradený, ale právě takovým způsobem, že by se kvůli němu neměla vymýšlet nějaká výjimka, ať se s ním nakládá stejně jako s jemu podobnými případy Chrzwzcz (diskuse) 7. 12. 2018, 23:31 (CET)Odpovědět
Zažitost lze zjistit průzkumem zdrojů. Pokud se běžně užívá, je zažitý. Porovnávat to s čímkoliv, co už tu je, by nebylo správné. To, co tu je, musí odpovídat tomu, co je venku. Takhle bychom do toho vnášeli chybu našich omylů. --Palu (diskuse) 8. 12. 2018, 10:46 (CET)Odpovědět
Co si Wikipedie představuje pod slovem "zažitý" v případě tohoto pravidla lze zjistit jen studiem Wikipedie. Slovník vám zrovna matematicky přesně neřekne, jaký podíl výskytů je zažitost. Chrzwzcz (diskuse) 8. 12. 2018, 11:35 (CET)Odpovědět
Zažitý je ten, který byl zažit. Tj. ten, který je obecně známý. Myslím, že tu máme dost podkladů k tomu se rozhodnout, jestli Cvikov je obecně známý. Dokonce si myslím, že je těch podkladů tolik, že je to skoro stejné, jako bychom tu vedli tuto 100kB diskusi o Cáchách nebo Řezně. --Palu (diskuse) 8. 12. 2018, 12:15 (CET)Odpovědět
No ta diskuze je tak dlouhá, protože nehodlá slevit ani ten jeden ani ten druhý. To je vaše interpretace té věty z doporučení, jiný zas může namítnout že je to takové upřesnění bez kterého by se to celé obešlo, že pořád platí - použijte název pod kterým to nejspíše bude čtenář hledat. Jen tak pro zajímavost, jaké je takové nezažité české exonymum, ať to máme k porovnání! Chrzwzcz (diskuse) 8. 12. 2018, 12:50 (CET)Odpovědět
Výsledkem diskuze ale nutně musí být nějaká změna. Buď se přejmenuje článek na Cvikov, nebo se kategorie přejmenuje na Města v zemském okrese Zwickau, současná roztříštěnost rozhodně není žádoucí. Chrzwzcz (diskuse) 9. 12. 2018, 09:33 (CET)Odpovědět
Pro města platí specializované pravidlo, takže nemůže platit obecnější pravidlo. Aspoň podle obecných zásad normotvorby. Čili podle mě neplatí obecné "použijte název, pod kterým bude čtenář hledat", ale specializované "Pokud má město zažité exonymum, použijte jej". Nezažité exonymum je podle mě třeba Solnohrad, Karlovský Bělehrad, Chudoba, Videm ad. --Palu (diskuse) 9. 12. 2018, 20:16 (CET)Odpovědět
.@Palu: A tom rozhodujete Vy? A navíc pro mě, a nejen pro jste důvodem, proč se zde nezúčastnuji diskuzí, pro mě nemají smysl, i když nemáte pravdu. Člověk lidem jako jste vy ustupuje, ale podle mě by neměl, ale na druhé straně i mě je lhostejné, když zde bude Olešnice, Donín a Halštrovy.Mirek256 10. 12. 2018, 05:59 (CET)Odpovědět
Nerozumím - o čem bych měl rozhodovat? Zásady normotvorby já neurčuju, stejně jako neurčuju pravidla Wikipedie a ano neurčuju jestli lidé používají dané exonymum nebo ne. --Palu (diskuse) 10. 12. 2018, 08:08 (CET)Odpovědět
Chtete rozhodovat o českých názvech německých měst, jestli jsou zažité, a mě připadá, být po vašem, německá města mají české názvy. A obecně česká jména německých měst nejsou žádaná, viz např. spedice, navigace znají jen úřední jména měst, či jaká jsou na ceduli před městem - ale tím nechci napsat, že Mnichov se nemá jmennovat mnichov atd. a možná ješt+ deset německých měst má mí český název, tím to ale končí.Mirek256 10. 12. 2018, 08:55 (CET)Odpovědět
Exonyma nejsou problém ouřední či spediční, ale problém českého jazyka. Ten by však neměl být řešen pouhým blafováním.--Eleiodromos (diskuse) 10. 12. 2018, 09:07 (CET)Odpovědět
Já bych to rád rozhodl kolektivně, a to na základě jasné objektivní logiky. Ta byla kdysi nějak nastíněna v našem doporučení, nějak byla praktikována a teď se zdá, že právě děláme její revizi na základě nově navržené metody poměřit vše jen na základě ČNK. Za mě je správný způsob, jak se to dělalo doteď - průzkum zdrojů v rámci více ucelených celků (google, odborná literatura, ČNK, ...). Co se týče spedičních problémů, ty můžou řešit k tomu určené mapy a cedule u silnic, ale nemůže je řešit to, že si z jazyka odstraníme exonyma. --Palu (diskuse) 10. 12. 2018, 11:54 (CET)Odpovědět
Problémy spediční do toho, prosím, nepleťte. To bychom nakonec skončili u toho, že Kolín nad Rýnem by se měl jmenovat Cologne, protože světovým jazykem je angličtina a tím by to měli spedičníci snazší :-/.--Tchoř (diskuse) 10. 12. 2018, 13:07 (CET)Odpovědět
ad Palu a pravidla:obecné pravidlo "použijte název, pod kterým bude čtenář hledat" platí i pro města (a řeky a pohoří a další), protože je-li exonymum zažité, je tím názvem, pod kterým bude čtenář hledat. Proto nestačí existence exonyma, ale je nutná jeho používanost, to jest zažitost. --Jann (diskuse) 10. 12. 2018, 18:56 (CET)Odpovědět
No, to se točí dokolečka dokola a nakonec máme tři možnosti 1) najít toho kdo to psal a schválil, co naprosto přesně tou větou myslel a čo si predstavuje pod takým slovom zažitý 2) na základě analýzy jiných exonym na wikipedii vydedukovat, jaký je praktický dopad této věty na nerozporované případy, neboli kde tak zhruba ta zažitost začíná a končí (proč jako Olešnice, Donín a Halštrovy nemají nárok?) 3) na větu se vykašlat, protože se nejedná o specializovanou výjimku z obecného pravidla, ale jen aplikaci obecného pravidla při pojmovávání měst: Ano u měst je na výběr z několika názvů, volte to co by čtenář nejspíše čekal (... no a TO ZNAMENÁ zažité exonymum).Chrzwzcz (diskuse) 10. 12. 2018, 19:14 (CET)Odpovědět
Pravidlo stanovuje "zažitost jako Londýn, Vídeň, Řezno". To lze vyčíslit takto: Londýn (66,15), Vídeň (40,3), Řezno (0,84). Průměrná relativní frekvence "zažitého exonyma" by tedy podle tohoto pravidla byla 35,76 (odhad pravděpodobnosti výskytu jevu v jazyce krát 1 milion).--Eleiodromos (diskuse) 10. 12. 2018, 20:14 (CET)Odpovědět
Rozumím tomu dobře, že to vykládáte tak, že Řezno nemá zažitost jako například „Londýn, Vídeň, Řezno“? --Tchoř (diskuse) 10. 12. 2018, 20:53 (CET)Odpovědět
Tak vychází čistý průměr. Není však problém stanovit 0,84 Řezna jako minimální hranici pro české exonymum. Lobava (0), Ojvín (0,01) a Cvikov (0,02) by to stejně s jistotou nedaly.--Eleiodromos (diskuse) 10. 12. 2018, 20:59 (CET)Odpovědět
Hm a Zwickau s 0,31 by to taky "nedal". Takže smazat článek, korpus nedostatečně píše o Cvikově nebo Zwickau, takže je neencyklopedický. Parádní rozřešení :) Chrzwzcz (diskuse) 10. 12. 2018, 21:13 (CET)Odpovědět
Pak má samozřejmě bez pardonu přednost originální název. Je to prosté. Pro srovnání připojuji relativní frekvenci exonyma, které Palu označil za "nezažité": Solnohrad (0,03).--Eleiodromos (diskuse) 10. 12. 2018, 21:17 (CET)Odpovědět
No, jenže tak si to vykládáte vy aby to ladilo s předvymyšleným závěrem. A vnášíte nám do toho korpus a vymýšlíte mu zázračné schopnosti které nemá. Ato bych se opakoval, viz výše někde. Chrzwzcz (diskuse) 10. 12. 2018, 21:29 (CET)Odpovědět
Vadí mi, že se tu v těchto sporech praktikuje amatérismus a tmářství, což vede k nekonečně dlouhým diskusím. Z tohoto důvodu nabízím možné řešení, které již úspěšně funguje na dewiki. Encyklopedie by podle mého názoru neměla realitu měnit, stačí když o této realitě poskytuje dobře podložené informace.--Eleiodromos (diskuse) 10. 12. 2018, 21:37 (CET)Odpovědět
I kdyby nějaké české exonymum mělo frekvenci 67 (víc než Londýn), stejně to nemůže mít automaticky přednost, když originální varianta z původního jazyka bude mít frekvenci 1000, prostě ne. Tím myslím porovnávat varianty mezi sebou! Exaktní tabulky na to nemáme tak se pak takhle přetahujeme článek od článku. Korpus je jistě pěkná věc, ale 90 % Solnohradů jste tam nasbíral v nějakých prastarých textech, ne? Nebo z článků typu "zaniklá česká exonyma" :) To se musí umět omezit, vyfiltrovat, nedávat každé zmínce stejnou váhu. Ani milión Zwickauů z nějakého místního plátku nepřebije jeden výskyt v celostátním deníku, ale to už zas opakuju dokolalalalala. Chrzwzcz (diskuse) 10. 12. 2018, 21:57 (CET)Odpovědět
Němci můžou mít lepší korpus nebo v tom dělají jiný Ordnung a něco si na wikipedii nařizují a stanovují. Česká wikipedie radši souzní, i když jsou tu co chvíli nápady na nějaké direktivní pravopisy a la cswiki... 10. 12. 2018, 21:59 (CET)
Víte co? Zkuste si jednotlivé odkazy "Solnohradu" na https://kontext.korpus.cz (po registraci) schválně prohlédnout sám. Jsou to většinou texty vzniklé po roce 2000. Zatím s tím totiž evidentně žádnou zkušenost nemáte. Německý korpus umožňuje běžné měření relativní frekvence výskytu jevu v jazyce podle zcela stejných standardů a metod jako je tomu u ČNK.--Eleiodromos (diskuse) 10. 12. 2018, 22:11 (CET)Odpovědět
Myslím, že už tu bylo dostatečně několika způsoby zdůvodněno, proč je nesmysl vytrhávat z kontextu údaj relativní frekvence z ČNK a přisuzovat mu moc rozhodnout, jestli je exonymum zažité. Korpus svede posoudit leda jestli je zažitější, nedovede ale určit bez analýzy obsažených dat (tedy nikoliv na základě relativní frekvence), jestli je nějaké jméno zažité. Mohli bychom se posunout v této debatě dál? --Palu (diskuse) 10. 12. 2018, 22:36 (CET)Odpovědět
Ten údaj relativní frekvence vůbec nemusí být v nějakém kontextu, nepotřebuje dokonce ani žádnou interpretaci. Je to totéž jako říci, že něco je vysoké 1 m nebo dlouhé 1 km. To vaše "dál" už je jen čirá spekulace.--Eleiodromos (diskuse) 10. 12. 2018, 22:45 (CET)Odpovědět
Porovnat relativní frekvenci s výškou asi nelze. Jedná se o statistický údaj, takže to můžeme porovnat třeba s relativní četností. Z relativní četnosti pak lze vyvodit, jak je něco četné. Nelze z toho ale vyvodit, jestli je to používané v nezanedbatelné míře. To pak musíme začít rozebírat kdo to používá, kdy, za jakých okolností apod. Relativní frekvence je pro tuto debatu bezcenným číslem. --Palu (diskuse) 10. 12. 2018, 22:46 (CET)Odpovědět
No měl jste šanci to tady představit, to naše tmářství a amatérizmus nějaká z nebe spadlá čísla jako 66,15 nevyřeší, zvlášť pokud pochybuju/eme že je to opravdu nějaký zajímavější údaj než jen mechanické sčítání ze zahrnutých textů. A pokud neznáme dopad, který by to mělo na jiné články, asi by pak mělo smysl přehodnotit i jiné názvy a ne to otevřít poprvé a naposledy zde. Já se s tím přece teď nezačnu učit abych potvrdil, že je to supernástroj, já jsem s tím sem nepřišel, já si vystačím jako celá wikipedie s Googlem ;p Chrzwzcz (diskuse) 10. 12. 2018, 22:42 (CET)Odpovědět
V tom případě se tady vyjadřujete k něčemu, o čem nemáte ani páru.--Eleiodromos (diskuse) 10. 12. 2018, 22:47 (CET)Odpovědět
No jestli to vážně vyplivne jen jedno číslo a konec, tak asi ani páru nechci a důvěru v to mít nebudu. Registrovat se, abych to zjistil jestli to je lepší, nebudu ;)Chrzwzcz (diskuse) 10. 12. 2018, 23:08 (CET)Odpovědět
V tom případě se tady vyjadřujete k něčemu, o čem nemáte ani páru.--Eleiodromos (diskuse) 10. 12. 2018, 22:47 (CET)Odpovědět
Eleiodromos: Mám dojem, že vám pořád uniká nějaká celkem podstatná souvislost. Relativní frekvence v rámci Korpusu je jen číslo a samo o sobě neobsahuje žádné informace o vzorku, z kterého vyplývá. Relativní frekvenci má smysl sledovat, ale na konkrétně vybraném vzorku a především to není jediný údaj, který sledujeme - musíme zhodnotit také kvalitu zdrojů, rozsah typů textů, dosah, atd. Zkrátka nemůžete zjednodušit komplexní analýzu na jediné číslo. --Palu (diskuse) 11. 12. 2018, 00:03 (CET)Odpovědět
Ta vaše "komplexní analýza" je jen vznešené označení pro amatérskou šmakuládu, která by vám umožnila prznit Wikipedii Lobavami, Ojvíny a spol. Vaše intuitivní tipování "zažitosti" mě neoslovuje, raději dám v této otázce přednost osvědčené korpusové lingvistice.--Eleiodromos (diskuse) 11. 12. 2018, 00:20 (CET)Odpovědět
Musím ocenit, že jste skutečně konzistentní přes veškeré zpochybnění Korpusu pro tento účel z několika stran. Nicméně už to omílání jednoho a téhož několikrát překonaného argumentu začíná být zdlouhavé. Klidně navrhněte nějakou spolehlivější metodu, než jaká byla aplikována dosud, třeba klidně založenou mj. na údajích o relativní frekvenci. Třeba přesvědčíte kolegium o tom, že je to dobrá metoda. Prosté poměřování relativních frekvencí je ale zkrátka nesmysl. Troufám si tvrdit, že kdyby nebylo, tak by s ním za 16 let existence Wikipedie už někdo přišel. --Palu (diskuse) 11. 12. 2018, 00:34 (CET)Odpovědět
Zpochybnění laiky a osobami, které ČNK ani neviděly a z principu nechtějí vidět, nemá vůbec žádnou hodnotu. Nevím, proč bych měl navrhovat nějakou jinou měkčí metodu, když existuje spolehlivá vyzkoušená metoda měření relativní frekvence. Vím, že vy nepatříte k lidem, kteří by někdy byli schopni uznat svůj omyl. Když je nejhůř, tak argumentujete ad personam, zabrousíte do pohádky nebo prostě beze slova opustíte diskusi. Oháníte se "objektivní logikou" a "komplexní analýzou", ale nic naplat, zatím nemáte jediný pádný důkaz pro "zažitost" saského Cvikova.--Eleiodromos (diskuse) 11. 12. 2018, 00:50 (CET)Odpovědět
Těch důkazů je tu předloženo skutečně hodně a argumentace ad hominem do slušné diskuse nepatří. Buď máte argumenty a nebo máte jeden, na kterým budete donekonečna trvat přesto, že je nesmyslný. Dovoláváte se tím ale falešné autority. Mám za to, že tahle diskuse už od začátku nikam nevede, protože jste se rozhodl, že nám vnutíte ČNK hlava nehlava a že budete zcela ignorovat další argumentaci. Takovýto nepřístupný rozhovor je jen ztrátou času. --Palu (diskuse) 11. 12. 2018, 08:53 (CET)Odpovědět
Navrhovatelem a iniciátorem přejmenování jste vy. Já vám pouze oponuji, protože, jak jsem uvedl, zatím nemáte jediný pádný důkaz pro "zažitost" saského Cvikova.--Eleiodromos (diskuse) 11. 12. 2018, 09:38 (CET)Odpovědět
Důkazy jsou předloženy. Pokud je chcete zpochybnit, udělejte to. Prosté "jedině ČNK" ale nestačí. --Palu (diskuse) 11. 12. 2018, 10:22 (CET)Odpovědět
Doložená "nezažitost" saského Cvikova je jediný skutečný důkaz v této diskusi. Ojedinělé výskyty dokazují pouze existenci tohoto exonyma, kterou nikdo nezpochybňuje.--Eleiodromos (diskuse) 11. 12. 2018, 10:49 (CET)Odpovědět
Vždyť o pár řádků výše máte opakované průzkumy, které dokládají, že je exonymum používané napříč obory a odborníky považované za běžné. Chcete se s korpusem v ruce stavět proti nim a vytvářet z něj bibli svatou, když se běžně používá ke zcela jiným účelům? --Palu (diskuse) 11. 12. 2018, 12:14 (CET)Odpovědět
To nejsou žádné průzkumy, ale pouhé blafování. ČNK se nejčastěji používá právě k určení frekvence jevu v jazyce. To ale vy nevíte, protože vaříte z vody jako vždy.--Eleiodromos (diskuse) 11. 12. 2018, 12:29 (CET)Odpovědět
Nevím, co myslíte tím "jako vždy" - skoro vás neznám. Nicméně můžete nějak vysvětlit, proč by mělo jít o blafování? --Palu (diskuse) 11. 12. 2018, 12:58 (CET)Odpovědět
Myslím "vždy" v těchto vámi iniciovaných otravných diskusích na Wikipedii. Vršení odkazů na jednotlivé výskyty "zažitost" v žádném případě nedokazuje.--Eleiodromos (diskuse) 11. 12. 2018, 13:03 (CET)Odpovědět
Jednomu číslu přisuzovat kouzelnou moc přece nelze. Jo kdybyste mi poskytl něco takového včetně ujištění, že to umí řešit filtrování dle odborných nebo jakých kritérií zdroje pro své statistiky, pak si popovídáme. 11. 12. 2018, 19:26 (CET)
Ngram Viewer jsem již v diskusi výše zmiňoval, bohužel ale nemá českou verzi, takže je pro tento problém nepoužitelný. Mimochodem je to diachronní korpus. Více se dočtete zde.[1]--Eleiodromos (diskuse) 11. 12. 2018, 19:32 (CET)Odpovědět
  1. FRIGINAL, Eric; WALKER, Marsha; RANDALL, Janet Beth. Exploring mega-corpora:Google Ngram Viewer and the Corpus of Historical American English [online]. 2014 [cit. 2018-05-24]. Dostupné online. (anglicky) 
Tak nám najděte ještě frekvenci pro: Olešnice nad Halštrovem, Bělostok, Bílsko-Bělá, Desava a Vratislav. Ať víme kde jsme.Chrzwzcz (diskuse) 11. 12. 2018, 22:29 (CET)Odpovědět
Olešnice nad Halštrovem (0), Bělostok (0), Bílsko-Bělá (0), Desava (0,05). Vratislav (10,4; ve výsledcích je ale zahrnuto také osobní jméno "Vratislav").--Eleiodromos (diskuse) 11. 12. 2018, 22:55 (CET)Odpovědět
Díky. Olešnice nad Halštrovem (0 - na wiki česky), Bělostok (0 - na wiki originál), Bílsko-Bělá (0 - na wiki česky), Desava (0,05 - na wiki originál kromě odvozeného Bitva u Desavy). Vratislav (10,4; ve výsledcích je ale zahrnuto také osobní jméno "Vratislav" - tak to je škoda že se nepozná kontext! na wiki česky ale v minulosti s obrovskými problémy prosadit). Co z toho jde vydedukovat? Že na současné pojmenování nemá relativní frekvence v korpusu vliv a asi nemá cenu si s ním hrát jen v jednom případě. Chrzwzcz (diskuse) 12. 12. 2018, 07:54 (CET)Odpovědět
To, že stav některých názvů sídel na Wikipedii neodpovídá tomu, jak se česky mluví a píše, bych viděl spíše jako nedostatek než přednost. Realita je důležitější než současná nahodilá praxe na Wikipedii.--Eleiodromos (diskuse) 12. 12. 2018, 08:19 (CET)Odpovědět
Problém je, že vaše interpretace korpusu nemá s realitou nic společného. --Palu (diskuse) 12. 12. 2018, 11:33 (CET)Odpovědět
Žádnou interpretaci jsem zde nepodal, uvádím pouze údaje relativní frekvence v ČNK, které si může ověřit každý.--Eleiodromos (diskuse) 12. 12. 2018, 11:55 (CET)Odpovědět
A přisuzujete tomuto údaji čarovnou moc. --Palu (diskuse) 12. 12. 2018, 12:26 (CET)Odpovědět
Nic takového jsem neřekl. Jen mě zajímá, jak se název ve skutečnosti používá. I bc. práce, kterou jste vygůgloval, v anketě zjišťuje, že více mluvčích používá název Zwickau a podstatná část z nich český název města nezná.--Eleiodromos (diskuse) 12. 12. 2018, 12:44 (CET)Odpovědět
Což ovšem není předmětem tohoto sporu. My máme zvážit, jestli je české exonymum zažité, nikoliv jestli je používanější než německé endonymum. --Palu (diskuse) 12. 12. 2018, 15:53 (CET)Odpovědět
Tak předložte důkaz, že je zažité a můžeme to tu rozpustit.--Eleiodromos (diskuse) 12. 12. 2018, 15:55 (CET)Odpovědět

Vidím, že diskuse začíná opět nabírat poměrně značný rozsah, nyní 134 tisíc bajtů, což je ve vztahu k vlastnímu článku (necelých 6 tisíc bajtů) zase krásný výsledek. Jen tak dále, opravdu obdivuji a říkám si, proč článek vylepšovat, třeba aby on sám měl přes sto tisíc bajtů, když stačí plodná diskuse o názvu. Nicméně, chtěl bych upozornit, že návrh na přejmenování na název „Cvikov“ není šťastný, tento odkaz již totiž vede na existující článek. --Vlout (diskuse) 12. 12. 2018, 13:04 (CET) Opravuji, až nyní vidím, že návrh vlastně směřuje na stav, kdy německé město Zwickau bychom měli mít pod názvem „Cvikov“, zatímco české město Cvikov pod názvem „Cvikov (Česko)“. To je opravdu originální řešení, smekám. --Vlout (diskuse) 12. 12. 2018, 13:10 (CET)Odpovědět
PS: Co na to kolegové JAn Dudík, Petr Kinšt nebo Harold, kteří se věnují českým obcím? --Vlout (diskuse) 12. 12. 2018, 13:14 (CET)Odpovědět

Nenaparujte se. Kdybyste tu diskuzi četl tak víte, že se tu už ani tak nediskutuje o Cvikově, ale obecně o problematice jestli zapojovat korpus do rozhodnutí, když se to doposud nedělalo. Nebo jak si vyložit doporučení. To je přínos nehledě na uštěpačné poznámky, v ideálním případě to zkrátí diskuze u dalších exonymových návrhů na přesun. V případě, že by se seznal německý Cvikov důležitější, měl by český článek POCHOPITELNĚ název Cvikov (okres Česká Lípa) - viz např. Mnichov (rozcestník).Chrzwzcz (diskuse) 12. 12. 2018, 13:17 (CET)Odpovědět
Jak jste na to přišel, že se „naparuji“ (holedbám či kasám)? :-) I tak ovšem gratuluji k dalšímu podnětnému rozšíření diskuse. Přeji v ní všem zúčastněným hodně radosti :-) --Vlout (diskuse) 12. 12. 2018, 13:25 (CET)Odpovědět
Naznačuje se tu, že jakmile velikost diskuze přesáhne velikost článku, je to pro diskutující ostudné a měli by se radši nahnat do editace článků, protože to je IYHO přínosnější. Otázku rozlišovače jste sem vnesl vy, tak se nepodivujte, když někdo roztáhne diskuzi o odpověď. Chrzwzcz (diskuse) 12. 12. 2018, 13:37 (CET)Odpovědět
Nyní není vůbec ve hře se opovažovat zvolit, jestli bude hlavní Cvikov ten český nebo ten německý a nebo jestli to bude symetrický rozcestník. Teď se vede diskuse o tom, jestli je Cvikov zažité české exonymum a evidentně i o tom, jaká metoda je nejspolehlivější pro toto určení. Eleiodromos přišel s originálním nápadem využít ČNK, což tu bylo zpochybněno. Naopak Eleiodromos najmítá, že průzkum zdrojů na vlastní pěst je "neodborné blafování". Čili soud, že je návrh nevhodný kvůli tomu že něco někam vede je teď skutečně ukvapený. Nejprve je potřeba rozhodnout, jak se bude článek jmenovat a pak teprve organizační uspořádání rozcestníky a rozlišovači. Oba problémy spolu nesouvisí. --Palu (diskuse) 12. 12. 2018, 15:59 (CET)Odpovědět
Žádné relevantní zdroje jste neprozkoumal, neotevřel jste jedinou knihu, pouze jste trošku gůgloval. Na každý další návrh na přejmenování byste se měl připravit mnohem lépe. Když nemáte důkaz, nechápu, proč se do takových operací vůbec pouštíte.--Eleiodromos (diskuse) 12. 12. 2018, 16:07 (CET)Odpovědět
Vzhledem k tomu, že se tyhle diskuze o zažitosti (nebo jak moc protežovat česká jména i když nemají nadpoloviční zásah) vedou prakticky u každého ne zcela notoricky známého exonyma (však ale taky u ne zcela notoricky známých měst, vsí, řek a moří) vždycky od nuly, nebylo by od věci je prodiskutovat někde stranou společně a stanovit autority, které budou respektované. Automaticky vyplivnuté číslo z korpusu sotva, jedna zeměpisná knížka asi taky ne, na ČÚZK se taky kouká spatra jak na nějaké snílkovské obrozence, ale nějaká kombinace těchto, to už by dohromady něco vypovědělo. Jen proboha ne špeditéry, to sem netahejte, to je argument jak noha. Chrzwzcz (diskuse) 12. 12. 2018, 20:39 (CET)Odpovědět
Pokud tu vy, kolegové Palu, Tchoř či Hnetubud skutečně prokážete, že přejmenování je na základě těch a těch důkazů nezbytné, nebude jistě nikdo nic namítat.--Eleiodromos (diskuse) 12. 12. 2018, 20:53 (CET)Odpovědět
No nevím, proč bych ale měl bojovat proti korpusu, když nikdy nebyl brán v potaz, to je vámi uměle vymyšlená překážka zrovna u tohohle návrhu na přesun. Já bych zas mohl říct, že ČÚZK jasně stanovil a nedá se s tím nic dělat, ČÚZK určuje normy, a ne to, jak moc je české zdroje dodržují a s jakou relativní četností. Zvlášť pokud nám korpus nic neřekne o trendech, ale jen součet výskytů napříč historií. Opakuji, nemám nic proti Zwickau nebo Cvikovu, ale nelíbí se mi vytahování nových podmínek nikdy neotestovaných a nepsaných, a nekonzistentní postup zkoumání "zažitosti" u jednotlivých případů. Chrzwzcz (diskuse) 12. 12.
Já teď vůbec nemluvím o korpusu, mluvím o tom, že návrh by měl být podložen jednoznačným důkazem zažitosti nebo alespoň něčím, co o Zwickau stanovil ÚJČ nebo ČÚZK. Navrhovatel přejmenování by měl něco s touto důkazní silou předložit. Hezké by také bylo, kdyby pak někdo z vás udělal o tomto městě kvalitní článek.--Eleiodromos (diskuse) 12. 12. 2018, 21:56 (CET)Odpovědět
Ale já přece nemám problém s tím, kdyby hranice používanosti končila někde u Řezna (a to už jen pocitově, nemusím hned vytahovat nějaké číselné konstanty). Mně by bylo docela jedno kdyby z celého Německa bylo česky nanejvýš 10 nejpoužívanějších. Ale přijde mi uhozené tu hranici stanovovat v diskuzi u Cvikova a pak ji aplikovat jen na Cvikov. Nač takové jednorázové diskuze a pravidla. O městě psát nebudu, když ani neznáme jeho název ;P Chrzwzcz (diskuse) 12. 12. 2018, 22:07 (CET)Odpovědět
Jen za tento rok tu proběhl spor o název Löbau, Oybin, Zwickau atd. Je to pořád dokola, často se tu argumentuje individuálním jazykovým citem a gůglováním. Až bude skutečný důkaz typu vyjádření ÚJČ či ĆÚZK, jsem ochoten s přejmenováním souhlasit, i když jsem toho názoru, že exonymum Cvikov se již příliš nepoužívá. Takový důkaz tu však zatím nepadl.--Eleiodromos (diskuse) 12. 12. 2018, 22:25 (CET)Odpovědět
Třeba tady u Zwickau žádný jazykový cit nepadl, zato padla celkem rozsáhlá analýza zdrojů s výsledkem, že české exonymum se běžně používá, byť asi ne častěji než endonymum, což ale není podstatné. --Palu (diskuse) 12. 12. 2018, 22:28 (CET)Odpovědět
Předložte důkaz s vyjádřením ÚJČ nebo ČÚZK, pak budu s přejmenováním souhlasit.--Eleiodromos (diskuse) 12. 12. 2018, 22:45 (CET)Odpovědět
Úkolem ÚJČ je zkoumat český jazyk a kodifikovat ho. Smyslem a určením je regulace. Jedinou preskriptivní kodifikační příručkou jsou Pravidla českého pravopisu. Všechno ostatní je jen sledování a popisování skutečnosti. V případě, že ÚJČ přinese nějaké odborné stanovisko, je to velmi silným argumentem, protože bývá velmi kvalitně podloženo. My tady takové stanovisko ÚJČ nemáme, máme však doložena jiná odborná stanoviska (bakalářskou práci Vývoj a současný stav české exonymie nebo článek Cizí zeměpisná jména v českém kontextu v odborném časopise Naše řeč), jejichž váhu nelze smést prostým "já věřím jenom ÚJČ", protože ÚJČ není jedinou a výlučnou jazykovou autoritou. Teprve pokud by byly tyto autority v rozporu, pak bychom mohli vést diskusi, která z autorit má větší váhu, a dost pravděpodobně by vyhrálo ÚJČ. My tu ale žádný rozpor nemáme. Co se týče zeměměřičů, pak ti nemají jako hlavní úlohu kodifikovat česká exonyma a v tomto pouze spolupracují s ÚJČ. Čili pravděpodobně nebudou v rozporu. Ohledně Cvikova už jsem citoval knihu Standardizace jmen sídelních a nesídelních geografických objektů z území mimo Českou republiku, kterou vydal ČÚZK. Ta Cvikov používá. --Palu (diskuse) 12. 12. 2018, 23:47 (CET)Odpovědět

ROFL

Teď by mě už jenom zajímalo, jak přejmenujete článek Cvikovští proroci, ale on nám národní korpus jistě něco pěkného vypočítá. Zwickovští proroci? Zwickauští proroci? Zwickauerští proroci? Nebo snad Cvokovští proroci, což by úrovni této debaty odpovídalo asi nejlépe?--Hnetubud (diskuse) 11. 12. 2018, 14:26 (CET)Odpovědět

Ten se pochopitelně vůbec přejmenovávat nemusí, protože označuje historické téma ze starší vrstvy jazyka. Nebo snad chcete, aby existence termínů "světlík solnohradský" (Euphrasia salisburgensis) nebo "solnohradský řízek" byla důvodem pro přejmenování hesla Salzburg na "Solnohrad"? Připomínám, že toto slovo s frekvencí 0,03 zde označil za nezažité i kolega Palu.--Eleiodromos (diskuse) 11. 12. 2018, 14:37 (CET)Odpovědět
Což dokazuje, že relativní frekvence je sama o sobě bezcenným údajem. --Palu (diskuse) 11. 12. 2018, 21:48 (CET)Odpovědět
Souhlasím s tím, že můžeme mít jméno města cizojazyčné a přitom mít exonyma trvale konzervovaná v odvozených pojmech. Na druhou stranu existence exonym v odvozených pojmech patří mezi argumenty pro použití exonyma a byť sama o sobě jako argument vystačí jen těžko, v kombinaci s jinými argumenty může být v důsledku i rozhodující.--Tchoř (diskuse) 12. 12. 2018, 05:29 (CET)Odpovědět
Vzpomínám na Dessau a Bitva u Desavy. Jinak Zwickau-zwickauský a obyvatel je zřejmě Zwickan?Chrzwzcz (diskuse) 12. 12. 2018, 07:55 (CET)Odpovědět
Souhlasím s předřečníky. Zažitost a aktuálnost termínů vlašský salát či vlašský ořech dle mého názoru ještě není pádným důvodem k tomu, abychom článek Itálie v zájmu konzistence přesunuli na Vlachy nebo je naopak přejmenovali na italský salát a italské ořechy, i když vlašskou renesanci nám už potichu nahradila italská renesance a na někdejší vlašské neboli české hodiny jsme za pár století po převzetí německých už skoro zapomněli a i v našem článku už je nazýváme prvně italskými. Nicméně Desavu, Žitavu či Cvikov bych ještě nebral jako úplně mrtvé a propadlé do historie. --ŠJů (diskuse) 24. 12. 2018, 16:05 (CET)Odpovědět
Inu, chtěl jsem jemně naznačit, že exonyma nevznikají jen tak samoúčelně, ale mají pro flektivní jazyky jako čeština dost podstatnou výhodu: snadno se od nich tvoří různé odvozeniny (o existenci adjektiva „italský“ jsem samozřejmě informován, ale zkuste si vygůglit „zwickauský“). Každopádně nemám žádný osobní zájem na vítězství ani jedné strany, jenom se bavím absurditou zdejších debat.--Hnetubud (diskuse) 2. 1. 2019, 17:39 (CET)Odpovědět

Index českých exonym: standardizované podoby, varianty

Po prostudování publikace ČÚZK z roku 2011 (BERÁNEK, Tomáš a kol. Index českých exonym: standardizované podoby, varianty = List of Czech exonyms: standardized forms, variants. 2., rozš. a aktualiz. vyd. Praha: Český úřad zeměměřický a katastrální, 2011. 133 s. Geografické názvoslovné seznamy OSN - ČR. ISBN 978-80-86918-64-8.), kde je uvedeno, že exonymum Cvikov je standardizovanou podobou českého exonyma pro město Zwickau, kterou ČÚZK čtenářům doporučuje k užívání, jsem ochoten se v případě Zwickau zdržet hlasování. Podklady pro toto doporučení jsou sice získány z třicet let staré nepublikované diplomové práce (Laurich, P., Česká exonyma z německé jazykové oblasti, Diplomová práce na FF UK Praha, 1988, rukopis), ale budiž. V indexu je ovšem také uvedeno, že domácí podoby cizích zeměpisných jmen: Bílsko (Polsko), Bílsko-Bělá, Černovice (Ukrajina), Hlubčice, Hlucholazy, Nový Brunšvik, Slovinský Hradec, Soča, Špandava a Špýr patří mezi exonyma zastaralá, málo užívaná a/nebo regionální, která proto nejsou tímto indexem standardizována. Další možnosti pro vytěžení tohoto zdroje jsou limitovány, neboť poslední aktuální vydání obsahuje jen 2625 hesel a řada názvů tu chybí. V návrzích na přejmenovávání výše uvedených hesel se angažovat nebudu, protože v tom zde nespatřuji hlavní oblast svého zájmu.--Eleiodromos (diskuse) 13. 12. 2018, 16:04 (CET)Odpovědět

Děkuji vám. Spíše než o hlasování jde o hledání konsensu. Nemyslím, že by vámi citovaná publikace měla tak určující váhu (standardizace ČÚZK není preskriptivní), nicméně určitě nějakou, nemalou váhu má. Můžeme tedy uzavřít kapitolu Zwickau? Má někdo námitky proti přesunu? --Palu (diskuse) 13. 12. 2018, 17:20 (CET)Odpovědět
Neboli jak to provedem? Když to je v seznamu ČÚZK doporučováno, tak použít, když je v seznamu odrazováno, nepoužít, a když to v seznamu chybí... tak je to na další debatu a hledání v jiných zdrojích? Chrzwzcz (diskuse) 13. 12. 2018, 19:43 (CET)Odpovědět
Na to bych otevřel ŽoK, kde by se měly na čisto zrekapitulovat argumenty a možnosti a pak se můžeme vyjádřit. Tuhle debatu už nechme pro Zwickau. --Palu (diskuse) 14. 12. 2018, 07:56 (CET)Odpovědět

Mezní případ

Dle mého názoru je to typický mezní příklad, kde jsou zhruba stejně přijatelné obě varianty. Pokud nedojdeme ke konsenzu, jakou metodou variantu názvu u podobných článků volit, tak bych se přidržel zásady, že ve sporných a mezních případech článku zůstane ten název, pod kterým byl založen. Samozřejmě z druhé varianty názvu musí vždy existovat přesměrování, případně rozcestník.

Cvikov je nepochybně zažité české exonymum (či spíše zažitá česká varianta názvu, protože ta "cizost" je v místech s nehomogenním národnostním složením nebo se složitější národnostní historií velmi relativní - v českých Sudetech jsou leckdy původně exonymy spíše ty české názvy a v Lužicích zase ty německé), stejně tak je ovšem pravda, že zejména u menších měst či sídel je používání zažitých exonym celkově na ústupu. Obě tato fakta jsou podle mého názoru celkem zjevná a není snad nutno ani jedno z nich dokazovat. Nanejvýš bychom mohli do článku na základě zdrojů doplnit, kam v historickém kontextu zařadit alternativní exonymum Zvíkov.

Je nepochybné, že starší a tradičnější zdroje či slovní spojení a termíny staršího původu budou zpravidla vycházet z české varianty názvu, zatímco v modernějších zdrojích typu map, jízdních řádů či rejstříků se používají takřka výhradně místní názvy, dnes už většinou i pro velká města (Drážďany, Paříž), která v běžném jazyce stále ještě nazýváme exonymy. Mezi těmi dvěma krajnostmi je kontinuum: převaha té či oné varianty se bude lišit podle spousty faktorů, žánru, kontextu, podle vzdělání, věku, původu a jazykové vybavenosti mluvčích atd. Ovšem ani Google vyhledávání, ani ten či onen jazykový korpus, ani ten či onen odborný rejstřík či manuál není sám o sobě reprezentativní pro všechny žánry a jazykové vrstvy.

Ostatně i kdybychom se shodli na nějakém kritériu, podle kterého určovat, ke které variantě názvu se přiklonit, tak vždycky nám zůstanou případy, které budou hodně blízko takto určené hranici a tedy zůstanou sporné. To bychom vyloučili pouze v případě, že bychom jako hlavní kritérium určili pouze jediný zdroj, a to by zase kolidovalo se zásadou NPOV. I když samozřejmě je věcí našeho konsensu, jakou váhu a prioritu budeme přikládat konkrétním publikacím či databázím ČÚZK, Ústavu pro jazyk český atd. K hodnocení jazykového úzu či archaické stylové příznačnosti budou kompetentní spíš lingvisté než geografové, což ovšem neznamená, že každá lingvistická instituce nebo publikace je kvalitní a musí být brána za direktivní hlas shůry. Na druhou stranu, pokud respektujeme odborné unifikační autority v biologii, geologii či hydrogeografii, můžeme jim přiznat váhu i v administrativní a sídelní geografii.

Doporučuji přihlédnout i k praxi německé Wikipedie, která pro články o českých obcích a sídlech v rámci "politické korektnosti" používá české názvy i v mnoha případech, kde zažité německé varianty názvů nepochybně existují. Kupříkladu Prahu, Brno, Plzeň, Olomouc a Karlovy Vary má německá Wikipedie na německých názvech, ale Liberec, Cheb, Ústí nad Labem, Děčín či Opavu na českých. Zde se asi uplatňuje zásada, že čím je název politicky citlivější, tím větší je tendence přiklánět se k oficiálnímu názvu. --ŠJů (diskuse) 24. 12. 2018, 15:52 (CET)Odpovědět

Nemyslím si, že by Němci dbali na politickou citlivost u německých názvů českých měst. Spíš mám za to, že mají buď jinak nastaveny kritéria (ne zažitost, ale například pouze očekávatelnost, tj. nadpoloviční většina) a nebo mají tato kritéria omezena na současnou mluvu. Obojí by pravděpodobně vedlo k jevu, který popisujete, a je to podle mě jednodušší vysvětlení. Zde na Wikipedii máme ale pravidlo, že zažitá exonyma mají přednost před endonymy a vy na jednu stranu píšete, že Cvikov je hraniční, na druhou píšete, že je zažitý. Pokud to tedy chápu správně, tj. že považujete onu zažitost za hraniční, pak příliš nerozumím k tomu, jakým způsobem lze hraničnost zažití vypozorovat :) Podle mě buď signifikantní menšina exonymum zná a používá, potom je zažité, a nebo zná maximálně okrajově a nepoužívá a potom je zastaralé. --Palu (diskuse) 27. 12. 2018, 18:09 (CET)Odpovědět
Němci možná mají jednoznačnější systém, ale kdo říká, že lepší, prostě si ho tam odhlasovali a zde by to často zase ohýbalo očekávaností, pokud by třeba zbyl jen Berlín, Drážďany a Mnichov. Jak píšete, v některých oblastech Wikipedie respektuje odborné autority, třeba by mohla (trochu víc) i zde. Jako nejhorší způsob řešení mezních případů považuju "kdo dřív přijde ten dřív mele" aneb "jak to bylo založeno před xy lety na Wikipedii tak nechť to i zůstane", protože není ani tak systematický jako spíš náhodný a pro čtenáře hází exonyma bez ladu a skladu. Chrzwzcz (diskuse) 29. 12. 2018, 16:58 (CET)Odpovědět
Po čase koukám na tuto diskusi a jen zírám, kolik zde těmito dohady bylo promarněno času, který bylo možno využít určitě mnohem smysluplněji. Množství onoho času sice nedovedu vyčíslit, ale myslím, že by z něj postačil pouhý zlomek, aby se někdo z debatérů - hlavně z těch nejaktivnějších - podíval na obsah aspoň jednoho z článků, o jejichž názvech se zde diskutovalo. Například český Cvikov obsahoval řadu pravopisných i věcných chyb - a vůbec nikomu to nevadilo (opraveno před chvílí)! Jinak se dívám na nové názvy článků o Cvikově a Zwickau, "vyšperkované" rozlišovači a, upřímně řečeno, žádné vylepšení zde nevidím, spíše naopak...--Dirillo (diskuse) 2. 1. 2019, 04:33 (CET)Odpovědět
P. S. - Ale pořád lepší Cvikov (okres Česká Lípa) než "Cvikov (Česko)"! Možná i to Zwickau by vypadalo aspoň malinko přijatelněji, kdyby tam místo "Cvikov (Německo)" bylo aspoň "Cvikov (Sasko)".--Dirillo (diskuse) 2. 1. 2019, 04:54 (CET)Odpovědět
@Dirillo:Cvikov (Německo) je pro mne vyhovující. Nemohu přijít na to, proč je Cvikov (Sasko) přijatelnější, jak píšete zde, či přesnější, jak píšete v komentáři k přesunu. Stejný rozlišovač v obdobném případě Chotěbuz (Německo) je akceptován.--Tomas62 (diskuse) 28. 3. 2019, 15:38 (CET)Odpovědět
Souhlas. Tisíckrát mohlo zvítězit nějaké doporučení o přejmenování článku, zdravý rozum ovšem prohrál. Čtenář neaktivní na Wikipedii jistě bude nejdříve zadávat na Gůglu Cvikov (Německo) a bude rád, že našel článek o 5,6 kB a k němu diskuzi o 157 kB. Hlavně že jsme bohatší o dva rozcestníky, mimochodem s chybným počtem obyvatel. Deset tisíc duší navíc přece nevadí, hlavně že jsme to přejmenovali. Gumideck (diskuse) 2. 1. 2019, 08:15 (CET)Odpovědět
Můžu se zeptat, jak a čemu na druhou stranu pomohly tyhle komentáře a jak se liší od proběhlé diskuse? --Palu (diskuse) 2. 1. 2019, 09:26 (CET)Odpovědět
Třeba apelem na princip Wikipedie, která je encyklopedií. Pokud se vytvoří takové množství diskuzního textu a na samotný článek se nesáhne, čili encyklopedické práce nula, je to ostuda. A pokud někdo pouze diskutuje, encyklopedii nevytváří a ještě si pak hrdě připíchne do svého portfolia odkazy na rozcestníky, které byly kvůli tomuhle cirkusu vytvořené, je to prostě trapas. Můžu tisíckrát předpokládat dobrou vůli, ale tady šlo jen o to udělat dobře svému egu. Wikipedie potřebuje lidi přidávající kvalitní encyklopedický obsah, ne vytvářející nekonečné diskuze. Aspoň opravte v tom rozcestníku stotisícové město, když v červnu 2018 neměl Cvikov (Německo) ani 90 tisíc. Sice Wikipedii může editovat každý, ale taky musí být nutně způsobilý. Toť na vysvětlenou, dál diskuzi prodlužovat nebudu, beztak je to házení hrachu na zeď. Gumideck (diskuse) 2. 1. 2019, 11:21 (CET)Odpovědět
Tak jestli wikidoporučení ohledně rozlišovačů odporuje zdravému rozumu, tak se rozhořčujte u těch doporučení a ne u jejich aplikace. Samozřejmě někdo považuje za kvalitní tvorbu wikipedie jen nová kvanta textu bez ohledu na to, že článek se jmenuje hloupě a nečekaně (ať už to je případ Zwickau nebo ne), ale ať ten někdo nevnucuje jiným svůj pohled. A může to fungovat paralelně, někdo bude spíš tvořit, jiný zase systematizovat a dohromady lepší dílo. Chrzwzcz (diskuse) 2. 1. 2019, 19:17 (CET)Odpovědět

Přejmenování na Cvikov (Sasko)

K novému návrhu Dirilla na přejmenování: V současnosti, pokud se nemýlím, je úzus pojmenovávat podle států, nikoliv podle menších jednotek. Proto nejsem přesvědčen, že by bylo lepší Cvikov (Sasko) než Cvikov (Německo). --Palu (diskuse) 2. 1. 2019, 09:28 (CET)Odpovědět

Souhlas, Cvikov (Sasko) je nestandardní postup (a to přesto že je město nalezitelné pod pojmem S/saský Cvikov). Chrzwzcz (diskuse) 2. 1. 2019, 19:19 (CET)Odpovědět
Obecně je snaha mít rozlišovače co nejobecnější. Cvikov (Sasko) by bylo na místě, kdyby ještě existoval třeba Cvikov (Bavorsko). Pokud žádný takový není, tak ať to, co hledajícímu čtenáři nabídne našeptávač, je nápověda Německo, protože v danou chvíli pravděpodobně značná část čtenářů netuší, zda ten hledaný Cvikov je saský nebo třeba durynský ... a byť se nakonec rozhodnou jistě správně, je to zbytečná intelektuální aktivita navíc. Rozlišovač Německo je v tomto smyslu očekávanější. --Tchoř (diskuse) 3. 1. 2019, 06:23 (CET)Odpovědět

Přesun

Já už jsem možná úplně blbej, ale v kterém vesmíru se taková sáhodlouhá diskuse vyhodnocuje jako „neoponovaný návrh“?--Hnetubud (diskuse) 2. 1. 2019, 17:39 (CET) (Sice bych osobně byl spíš pro český název - viz výše - ale v životě bych si nedovolil zatížit systém takovým množstvím editací, aniž bych k tomu měl výslovný souhlas komunity)Odpovědět

Ale tam je že od 13.12.2018 neponovaný návrh. Asi nejhlasitějšího protivníka se podařilo přesvědčit ČÚZKem. A ostatní jen připojují odsudky o tom, jak je taková diskuze pod jejich úroveň a že se má spíš tvořit obsah. Ne že bych se tím nějak přesunovače zastával, ale zas kritizovat spravedlivě ;) Chrzwzcz (diskuse) 2. 1. 2019, 19:22 (CET)Odpovědět
No já vidím jen o kousek výš názor ze 24. 12. 2018, kde se píše: „ve sporných a mezních případech článku zůstane ten název, pod kterým byl založen“ (to mi jako podpora přesunu fakt nepřipadá). Myslím si ostatně totéž – opravujme věci, které jsou opravdu objektivně chybné a dělají wikipedii ostudu, je jich bohužel pořád dost. Hádky o synonyma nic nepřinášejí, jenom otravují atmosféru.--Hnetubud (diskuse) 3. 1. 2019, 23:04 (CET)Odpovědět
Tak nadhoďte některé ty objektivně prioritnější chybné a ostudné věci, vrhneme se na ně... Ale že chybí v nějakých článek obsah, takové editory asi v diskuzích o přesunech a systematizaci nenajdete ;) Chrzwzcz (diskuse) 3. 1. 2019, 23:45 (CET)Odpovědět
Chcete-li skutečně něco konkrétního, pak třeba pravopis: sice každý wikipedista vystupuje v diskusích jako ohromná autorita v oboru lingvistiky, ale články jsou plné chyb, jako by je psala děcka z kašičky. Jinak nic proti systematizaci, pokud se komunita shodne na její potřebnosti. Tím si ale bohužel u řady vašich akcí nejsem jist, viz https://cs.wikipedia.org/wiki/Wikipedie:Pod_l%C3%ADpou_(u_krbu)#%22%C4%8CR%22_v_infoboxech.--Hnetubud (diskuse) 7. 1. 2019, 21:24 (CET)Odpovědět
To mi připadá jako nadávání pro nadávání a kopnutí pro kopnutí, zanadávat si a hotovo. Prostě jsou na Wikipedii faktické chyby v náhodných článcích na náhodných místech, to není něco, co by se dalo řešit nějak systematicky hromadně změnou doporučení nebo něco. Něco pravopisně pochybného třeba i opravím jestli bude chuť. Chrzwzcz (diskuse) 7. 1. 2019, 21:36 (CET)Odpovědět

Databáze Národní autority ČR

Přestože jsem se zařekl, že už nikdy-nikdy, napadla mě jedna kacířská myšlenka. Proč by podobné spory na Wikipedii nemohly být rozhodovány pomocí báze národních autorit, která je vytvářena NKČR a která obsahuje rozsáhlý soubor geografických autorit? To, o co se zde pouze více či méně laicky snažíme, je v Národní knihovně supervizováno osmi placenými zaměstnanci. Katalog SKC, jmenné autority a odkazy do katalogu jsou navíc již do Wikipedie implementovány. Na rozdíl od ČNK je to při tom opravdu jednoduché a každý si na této adrese může ověřit jakýkoliv termín.--Eleiodromos (diskuse) 3. 1. 2019, 03:06 (CET)Odpovědět

Wikipedie má zrcadlit vnější realitu. Jedna část reality je regulace češtiny, která má nepochybně přednost před druhou částí, jíž je úzus - to je jak obecně uživatelé jazyka s jazykem pracují. Obě části jsou ale jinak rovnocenné. Pokud je mi známo, exonyma nejsou součástí nějaké snahy o regulaci češtiny ve smyslu, že by je vyloženě doporučoval nebo nařizoval ÚJČ (regulátor češtiny) k užívání. Pomocí slovníků ale samozřejmě ÚJČ může mapovat stav užívání exonym, což pro nás může být také zdrojem informace k posouzení zažitosti. Vzhledem k tomu, že ale neexistuje ucelená preskriptivní regulace ÚJČ (tak jako neexistuje ucelená preskriptivní regulace synonym apod. - čeština je živý, nikoliv zakonzervovaný jazyk), musíme vždy hledat kontext s reálným světem (tj. "jak to píší v novinách, v knihách, v televizích?").
V předchozí debatě jste navrhoval přijmout jako výsadní autoritu ČÚZK. Pokud ČÚZK reguluje exonyma, pak pro účely odborné geografické literatury apod., nikoliv proto, aby nařídil lidu užívat to či ono exonymum - ČÚZK to nemá ve svých kompetencích a má pouze ambici ovlivňovat odborné práce kvůli výhodám standardizace ve vědních oborech. V opačném případě by existovalo stanovisko regulátora češtiny (ÚJČ), že exonyma reguluje ČÚZK. Proto sám za sebe můžu říct, že s přístupem přijmutí stanovisek ČÚZK za výhradní autoritu nesouhlasím. Opět ale stanovisko ČÚZK může představovat jeden z více argumentů při posuzování vnější reality.
K návrhu použít jako výhradní autoritu rejstřík Národní knihovny musím uvést podobnou argumentaci, a sice že Národní knihovna nemá ambici regulovat jazyk a vydávat stanoviska o tom, jaká exonyma jsou přípustná a jaká méně. Rejstřík má opět jiné určení a účel než podávat veřejnosti informaci o zažitosti exonym. Navíc ani není jasné, jakým principem by mělo dotazování rejstříku a tedy i rozhodování o zažitosti podle tohoto rejstříku fungovat. --Palu (diskuse) 3. 1. 2019, 09:55 (CET)Odpovědět
Vzhledem k tomu, že jste do této debaty nevnesl nic než několik vygůglovaných výskytů exonyma Cvikov, pokoušel jsem se zjistit, jaká je frekvence tohoto exonyma podle ČNK. Po té jsem hledal názory autorit a předložil jsem stanovisko ČÚZK opírající se o nepublikovanou diplomovou práci z roku 1988. Nyní předkládám možnost vyzkoušet si práci s vyhledáváním českých geografických termínů v rámci databáze Národní autority ČR. Toť vše.--Eleiodromos (diskuse) 3. 1. 2019, 16:45 (CET)Odpovědět
Podobné spory o název článku vznikají kvůli různosti názorů diskutujících na to, který název je pro čtenáře nejspíš očenávanější. No a jak by tato databáze měla pomoci? (navíc dosti omezená, chybí i milionová města jako Urumči, Mukden, Cicikar...) --Jann (diskuse) 3. 1. 2019, 22:21 (CET)Odpovědět
Pokud zde nepanuje shoda o tom, že zažitost není nic jiného než relativní frekvence, jak to chápou např. v dewiki, nezbývá než se obrátit k autoritám v oblasti jazyka, geografie nebo geografické terminologie (UJČ, ČÚZK, NKČR). Nahodilým gůglováním nebo argumentací osobním jazykovým citem se takový spor rozhodnout nedá. Báze NKČR, která vzniká od konce 90. let, zpracovává především knižní dary a povinné výtisky z ČR a sousedních zemí. Až přijdou knihy z Urumči, bude samozřejmě doplněna o další údaje.--Eleiodromos (diskuse) 3. 1. 2019, 23:28 (CET)Odpovědět
Omyl této myšlenky spočívá v tom, že si myslíte, že UJČ, ČÚZK, NKČR jsou autority pro určování zažitosti exonym. Ve skutečnosti je ale regulátorem češtiny UJČ a ten exonyma nereguluje ani tím nikoho nepověřil. Obracíte se tak na falešné autority. To už jsem ale psal výše.
Dosud se ověřovala zažitost sice pracným, nicméně spolehlivým průzkumem relevantních zdrojů. Buď současné zdroje používají dané exonymum v nezanedbatelné míře a pak jde o zažité exonymum, které máme podle pravidla upřednostnit, nebo tomu tak není a ani my ho nemáme upřednostnit. V pravidlech nic o autoritách není, protože exonyma žádné autority nemají. Výjimkou je ČÚZK, který se stará o standardizaci v odborné sféře, nikoliv v obecných encyklopediích, na které nemá žádný vliv.
Chápu, že se snažíte vymyslet nějaký objektivní způsob poměřování, ale zároveň nerozumím tomu, proč vám přijde dosavadní způsob průzkumu zdrojů neobjektivní a nedostatečný a vhodný k nahrazení. Wikipedie má být odraz reality a ten se dá zjistit právě především průzkumem reality, tj. průzkumem relevantních věrohodných zdrojů. Můžou nastat situace, kde existuje preskriptivní autorita, tak tam je to pasé, ale tahle situace mezi ně nepatří. --Palu (diskuse) 4. 1. 2019, 15:45 (CET)Odpovědět
Jediným dosažitelným údajem o zažitosti nějakého jevu v jazyce je jeho frekvence v jazykovém korpusu. Vaše nahodilé výskyty jsou pouze svědectvím o tom, že jste pět minut gůgloval. Výsledkem takového postupu by byly další Lobavy, Ojvíny a spol., které sice odpovídají vaší soukromé představě o tom, jak se česky mluví a píše, s realitou však nemají nic společného.--Eleiodromos (diskuse) 4. 1. 2019, 16:00 (CET)Odpovědět
Jestli se chcete vrátit na začátek této 150kB debaty a začít tvrdit zase tuto převratnou teorii, tak prosím aspoň doložte, z čeho vychází. Jinak je to stále jen vaše soukromá teorie. --Palu (diskuse) 4. 1. 2019, 16:07 (CET)Odpovědět
To už tu bylo řečeno vícekrát: „Jelikož je frekvence intuitivně a introspektivně nedostupná, jsou korpusy hlavním zdrojem informací o ní. Zároveň je frekvence v rámci korpusové lingvistiky považována za základní ukazatel, který má rozhodující vliv na popis jazyka a posouzení povahy, resp. i důležitosti studované formy či jevu.“ [30]. Nevím, proč bych tu měl dokazovat něco, co už je dávno dokázáno. Zažitost neroste na stromě, ani na webu, musí se změřit.--Eleiodromos (diskuse) 4. 1. 2019, 16:14 (CET)Odpovědět
OK, problém je, že tohle já nezpochybňuji. Zpochybňuji pouze to, z čeho se má ta frekvence počítat. Když to srovnám s metodou, která byla dosud užívána (manuální průzkum zdrojů), pak vlastně došlo k tomu, po čem voláte, a zjišťovali jsme relativní frekvenci. Jen s tím rozdílem, že jsme si vybrali pouze relevantní vzorek, tedy ten, kde se skutečně o Cvikovu píše. V korpusu toho spousta chybí, zato je tam zase navíc zcela nerelevantní balast v podobě kuchařek nebo romantické prózy, kde prostě Cvikov nenajdete, a to vše zkresluje výsledek. Jde tedy o to kvalitně připravit vzorek a pak teprve zjišťovat frekvenci. Čili frekvence ano, korpus ne. --Palu (diskuse) 4. 1. 2019, 16:39 (CET)Odpovědět
Relativní frekvence je matematicky definovaná veličina, vaše gůglování na aktuálním povrchu webu s tím nemá vůbec co dělat. Pokud se chcete dozvědět, co v korpusech je či není a jestli je relativní frekvence myslitelná bez použití korpusu či ne, viz informace a odkazy výše. Čili zažitost bez korpusu nemáte a mít nemůžete, viz informace výše. To je pro dnešek ode mě vše, rozhovor s vámi je pro mě ztrátou času.--Eleiodromos (diskuse) 4. 1. 2019, 16:51 (CET)Odpovědět
Přestaňte prosím do debaty vkládat osobní urážky, nejsem na to zvědavý a ani to sem nepatří. Vlastně to nepatří do žádné kultivované debaty, nejenom tady na Wikipedii. Korpusem poměřovat exonyma nelze, protože na ně není zaměřen. Obsahuje z pohledu exonym většinou zcela nerelevantní texty. S pozdravem, --Palu (diskuse) 4. 1. 2019, 16:56 (CET)Odpovědět
No, že korpus obsahuje vesměs texty irelevantní k nějakému konkrétníku problému není argument proti korpusu; soubor textů, který prohledává gůgl obsahuje relativně mnohem více irelevantního (prostě proto, že gůgl má k dispozici mnohem větší objem textů). A to (malý rozsah proti googlu) by mohl být argument proti korpusu, případně je tu otázka reprezentativnosti... --Jann (diskuse) 4. 1. 2019, 20:25 (CET)Odpovědět
Já to myslel trochu jinak. Když omezím hledání například na noviny a knihy, najdu reprezentativnější vzorek, protože v novinách a knihách se občas o Cvikovu píše. Mimoto lze se vzrokem pracovat operativně a vznášet otázky jako "jak široce se exonymum používá? Není to věc jen nějaké nahodilosti, nějakého konkrétního oboru nebo nějaké konkrétní vrstvy jazyka?". Tohle všechno lze zjistit, když budu používat google test nebo manuální prohlídku knih jako způsob jak definovat vzorek. Získám tak velmi vypovídající data. V korpusu takhle nelze omezit vzorek, pokud vím. Navíc korpus, jak už bylo řečeno, spoustu relevantních materiálů postrádá. --Palu (diskuse) 4. 1. 2019, 20:49 (CET)Odpovědět
(Reakce na Eleiodromos 4. 1. 2019, 16:00) No, tvrzení, že výskyty nalezené gůglem jsou nahodilé, kdežto výskyty nalezené hledáním v korpusu nahodilé nejsou, mi přijde velmi odvážné. Rovněž tvrzení, že pro posouzení rozšířenosti nějakého jevu je prohledávání a analýza relativně malého korpusu (navíc, jak vyplynulo z diskuze, sestaveného pouze z textů jejichž majitelé je pro korpus uvolnili) vhodnější než prohledávání a analýza mnohem většího souboru který má k dispozici gůgl (anebo jiné vyhledavače) je tvrzením netriviálním, jehož pravdivost není zřejmá. Lze to formulovat i takto: není zřejmé, proč by korpus textů zpracovávaných gůglem měl být méněcenný ve srovnání s korpusem textů zpracovávaným ČNK. --Jann (diskuse) 4. 1. 2019, 20:25 (CET)Odpovědět
Nahodilé je účelové tvrzení, že nějakých 36 webových výskytů nějakého exonyma dokazuje jeho frekvenci čili to, jak lidé jazyk reálně používají. Relativní frekvence vypovídá o realitě tím nenahodilým způsobem, že přesně poměřuje absolutní frekvenci s velikostí korpusu. Zjistit frekvenci jevu v jazyce nějak jinak v současné době nelze. Pokud zde však z nějakého důvodu převládne názor, že frekvence/zažitost měřena nebude a že bude upřednostněn doložený názor autorit, neznamená to ještě to, že gůglováním je možné skutečné měření frekvence nahradit. Google totiž tuto frekvenci změřit nedokáže.--Eleiodromos (diskuse) 4. 1. 2019, 21:24 (CET)Odpovědět
Asi nerozumím. Máte nějaký vzorek, třeba 20 textů. Jsou to řekněme veškeré texty dostupné v novinách. V tom vzorku třeba 2 texty použijí exonymum A, 7 textů exonymum B a 11 textů endonymum. Z toho vyplývá, že exonymum A není v novinách zažité, exonymum B je zažité a endonymum je zcela běžně známé. Podobně můžeme udělat průzkum v encyklopediích nebo na Google Books. Získáme tak několik dat, na základě jejich analýzy lze usoudit, jestli je exonymum zažité, tj. dostatečně známé k tomu, abychom ho použili dle našeho pravidla. Nechápu, proč pořád trváte na tom, abychom měli poměřovat cokoliv na korpusu, který obsahuje tisíce zcela irelevantních textů a naopak postrádá spoustu relevantních textů. Už vůbec pak nechápu, na základě čeho dáváte rovnítko mezi zažitost a frekvence, když frekvence je ukazatel něčeho (z kterého lze za určitých okolností usuzovat na zažitost), zatímco zažitost je stav něčeho. --Palu (diskuse) 4. 1. 2019, 21:44 (CET)Odpovědět
Relativní frekvence vypovídá o realitě tím nenahodilým způsobem, že přesně poměřuje absolutní frekvenci s velikostí korpusu. Zjistit frekvenci jevu v jazyce nějak jinak v současné době nelze. - akorát že tímto způsobem nezjistíte frekvenci jevu v jazyce, ale pouze frekvenci jevu v tom konkrétním korpusu textů. Za druhé, v souvislosti se spory o "název článku nejspíše očekávaný čtenáři" vlastně nepotřebujeme znát hodnoty frekvencí jevů v jazyce, ale potřebuje srovnání velikostí těchto hodnot. A to lze provést i s jiným korpusem - totiž s "korpusem textů prohledávaných googlem". Zjistit, kolikrát vyšší relativní frekvenci má název A než název B v korpusu textů prohledávaných googlem může každý během pár vteřin. A tento korpus je mnohonásobně obsáhlejší než korpusy ČNK. --Jann (diskuse) 5. 1. 2019, 19:41 (CET)Odpovědět
Ano, frekvenci výskytu jevu v jazyce skutečně nelze stanovit jinak než pomocí korpusu. Současná lingvistika prostě lepší metodu nemá. Pokud jde o momentální údaje uložené na povrchu webu (viz např. Měnící se svět webového vyhledávání), ty nelze v žádném slova smyslu považovat za jazykový korpus. Seznamte se prosím s fakty a pak lze případně dál diskutovat.--Eleiodromos (diskuse) 5. 1. 2019, 20:08 (CET)Odpovědět
(Reakce na Eleiodromos 3. 1. 2019, 23:28) Ano, a jak konkrétně nám má databáze Národní autority ČR pomoci? Soudě podle předložených odkazů v databázi nějaký geografický název buď je nebo není. Jak nám to pomůže ve výběru názvu nejspíše očekávaného čtenáři? Jak pomůže databáze geografických názvů, která neobsahuje milionová města? --Jann (diskuse) 4. 1. 2019, 20:25 (CET)Odpovědět
Tato databáze je vhodným prostředkem k validaci osobních i zeměpisných jmen. Dokonalejší a větší databáze českých geografických termínů (počítaje v to i Geobibline.cz PřF UK) dosud neexistuje, což samozřejmě neznamená, že je dělána špatně.--Eleiodromos (diskuse) 4. 1. 2019, 21:24 (CET)Odpovědět
Validaci osobních i zeměpisných jmen? No, zopakuji, databáze zeměpisných jmen, která neobsahuje ani jména několikamilionových měst a celků, je pro validaci nanic. Když bude jméno obsahovat, bude to jen dokazovat, že si to jméno wikipedisté nevymysleli, ale nic neřekne o vhodnosti jeho použití. Když nebude jméno obsahovat, nebude nikdo vědět proč, jestli kvůli neúplnosti databáze, kvůli neexistenci jména nebo kvůli něčemu jinému. Tak či onak, nepomůže rozhodnout žádný spor. --Jann (diskuse) 5. 1. 2019, 19:41 (CET)Odpovědět
Mluvíme zde o exonymech, jichž je jen omezené množství a jež se týkají v drtivé většině sousedních a nepříliš vzdálených zemí. Ty jsou však zpracovány profesionály a podle stanovených metodik. Rád se ale seznámím s případnou alternativou v oblasti českých terminologických databází, pokud tedy máte lepší návrh.--Eleiodromos (diskuse) 5. 1. 2019, 20:08 (CET)Odpovědět


Obecná diskuse o názvech článků tady vůbec nemá co dělat. Pokud nebudou námitky, přesunul bych ji někam, kam patří spíš. Zatím mne napadá Diskuse k Wikipedii:Název článku. --Tchoř (diskuse) 5. 1. 2019, 20:55 (CET)Odpovědět