Diskuse:Cvikov (Německo): Porovnání verzí
Chotěbuz ve Slezsku je vzdálenější? |
|||
Řádek 370: | Řádek 370: | ||
::Po čase koukám na tuto diskusi a jen zírám, kolik zde těmito dohady bylo promarněno času, který bylo možno využít určitě mnohem smysluplněji. Množství onoho času sice nedovedu vyčíslit, ale myslím, že by z něj postačil pouhý zlomek, aby se někdo z debatérů - hlavně z těch nejaktivnějších - podíval na obsah aspoň jednoho z článků, o jejichž názvech se zde diskutovalo. Například český Cvikov obsahoval řadu pravopisných i věcných chyb - a vůbec nikomu to nevadilo (opraveno před chvílí)! Jinak se dívám na nové názvy článků o Cvikově a Zwickau, "vyšperkované" rozlišovači a, upřímně řečeno, žádné vylepšení zde nevidím, spíše naopak...--[[Wikipedista:Dirillo|Dirillo]] ([[Diskuse s wikipedistou:Dirillo|diskuse]]) 2. 1. 2019, 04:33 (CET) |
::Po čase koukám na tuto diskusi a jen zírám, kolik zde těmito dohady bylo promarněno času, který bylo možno využít určitě mnohem smysluplněji. Množství onoho času sice nedovedu vyčíslit, ale myslím, že by z něj postačil pouhý zlomek, aby se někdo z debatérů - hlavně z těch nejaktivnějších - podíval na obsah aspoň jednoho z článků, o jejichž názvech se zde diskutovalo. Například český Cvikov obsahoval řadu pravopisných i věcných chyb - a vůbec nikomu to nevadilo (opraveno před chvílí)! Jinak se dívám na nové názvy článků o Cvikově a Zwickau, "vyšperkované" rozlišovači a, upřímně řečeno, žádné vylepšení zde nevidím, spíše naopak...--[[Wikipedista:Dirillo|Dirillo]] ([[Diskuse s wikipedistou:Dirillo|diskuse]]) 2. 1. 2019, 04:33 (CET) |
||
::P. S. - Ale pořád lepší [[Cvikov (okres Česká Lípa)]] než "Cvikov (Česko)"! Možná i to Zwickau by vypadalo aspoň malinko přijatelněji, kdyby tam místo "Cvikov (Německo)" bylo aspoň "Cvikov (Sasko)".--[[Wikipedista:Dirillo|Dirillo]] ([[Diskuse s wikipedistou:Dirillo|diskuse]]) 2. 1. 2019, 04:54 (CET) |
::P. S. - Ale pořád lepší [[Cvikov (okres Česká Lípa)]] než "Cvikov (Česko)"! Možná i to Zwickau by vypadalo aspoň malinko přijatelněji, kdyby tam místo "Cvikov (Německo)" bylo aspoň "Cvikov (Sasko)".--[[Wikipedista:Dirillo|Dirillo]] ([[Diskuse s wikipedistou:Dirillo|diskuse]]) 2. 1. 2019, 04:54 (CET) |
||
::::{{Re|Dirillo|skrýt=ano}}Cvikov (Německo) je pro mne vyhovující. Nemohu přijít na to, proč je Cvikov (Sasko) přijatelnější, jak píšete zde, či přesnější, jak píšete v komentáři k přesunu. Stejný rozlišovač v obdobném případě Chotěbuz (Německo) je akceptován.--[[Wikipedista:Tomas62|Tomas62]] ([[Diskuse s wikipedistou:Tomas62|diskuse]]) 28. 3. 2019, 15:38 (CET) |
|||
:::Souhlas. Tisíckrát mohlo zvítězit nějaké doporučení o přejmenování článku, zdravý rozum ovšem prohrál. Čtenář neaktivní na Wikipedii jistě bude nejdříve zadávat na Gůglu ''Cvikov (Německo)'' a bude rád, že našel článek o 5,6 kB a k němu diskuzi o 157 kB. Hlavně že jsme bohatší o dva rozcestníky, mimochodem s chybným počtem obyvatel. Deset tisíc duší navíc přece nevadí, hlavně že jsme to přejmenovali. [[Wikipedista:Gumideck|Gumideck]] ([[Diskuse s wikipedistou:Gumideck|diskuse]]) 2. 1. 2019, 08:15 (CET) |
:::Souhlas. Tisíckrát mohlo zvítězit nějaké doporučení o přejmenování článku, zdravý rozum ovšem prohrál. Čtenář neaktivní na Wikipedii jistě bude nejdříve zadávat na Gůglu ''Cvikov (Německo)'' a bude rád, že našel článek o 5,6 kB a k němu diskuzi o 157 kB. Hlavně že jsme bohatší o dva rozcestníky, mimochodem s chybným počtem obyvatel. Deset tisíc duší navíc přece nevadí, hlavně že jsme to přejmenovali. [[Wikipedista:Gumideck|Gumideck]] ([[Diskuse s wikipedistou:Gumideck|diskuse]]) 2. 1. 2019, 08:15 (CET) |
||
::::Můžu se zeptat, jak a čemu na druhou stranu pomohly tyhle komentáře a jak se liší od proběhlé diskuse? --[[Wikipedista:Palu|Palu]] ([[Diskuse s wikipedistou:Palu|diskuse]]) 2. 1. 2019, 09:26 (CET) |
::::Můžu se zeptat, jak a čemu na druhou stranu pomohly tyhle komentáře a jak se liší od proběhlé diskuse? --[[Wikipedista:Palu|Palu]] ([[Diskuse s wikipedistou:Palu|diskuse]]) 2. 1. 2019, 09:26 (CET) |
Verze z 28. 3. 2019, 16:38
Návrh na přesun na české exonymum
Podle zásady „Pokud cizí město má zažitý český ekvivalent (české exonymum), použijte ten“ navrhují článek k přesunu na běžné české exonymum Cvikov. U českého, méně známého Cvikova, navrhuji použít rozlišovač. --Palu (diskuse) 15. 11. 2018, 12:20 (CET)
- S návrhem nesouhlasím, v českém povědomí je jako "Cvikov" znám rozhodně spíš ten Cvikov v severních Čechách (a méně známý je zřejmě jak pro koho). Označit německé město, které se tak oficiálně jmenuje, jako "Zwickau" je podle mě dostatečné rozlišení. Především tady vyvstává otázka, co to je "zažitý ekvivalent" - a Zwickau přece jen není Mnichov nebo Vídeň... Vůbec ty opakované snahy o předělávky německých názvů měst (navíc běžně používaných i obyvatelstvem sousedních Čech) nepovažuji v řadě případů za smysluplné - lepší by bylo, kdybychom čas ztracený v takových debatách raději věnovali tvorbě nových článků o obcích a městech v sousedních zemích či jejich vylepšování (pravda, bývá to pracnější, než tyto diskuse) . A podobně jako Němci u svých verzí článků o českých či polských městech (včetně těch původně německých) respektují jejich česká/polská jména, měli bychom my zachovat stejný respekt i v opačném gardu.--Dirillo (diskuse) 15. 11. 2018, 12:46 (CET)
- Musím namítnout, že přednost má jednoznačně WP:Název článku před WP:Rozlišovač. Rozlišení názvů nemůže být argument pro neužití exonyma. Lze to řešit například doložením, že český Cvikov je frekventovanější a rozlišovač tedy má mít německý Cvikov. Co se pak týče vašich názorů na to jak to má chodit, tak to patří spíše k debatě o případnou změnu pravidla WP:Města a obce, nikoliv sem. -- (diskuse) 15. 11. 2018, 13:09 (CET)
- Možná by bylo lepší, kdyby jste naopak vy jako navrhovatel této změny prokázal, že označení "Cvikov" se v češtině všeobecně ujalo jako název pro saské město Zwickau. Podle ČNK to tak rozhodně nevypadá.--Eleiodromos (diskuse) 15. 11. 2018, 13:23 (CET)
- Nejsem si jist, z čeho pramení, že to tak nevypadá. Korpus.cz Cvikov zná: 1. Hospodářské noviny, 2012; 2. MF Dnes 2011; 3. Nepokojná léta 2000; 4. MF Dnes 2011; 5. AutoProfi 2014.
- Další výskyty jsou běžně na internetu: [1]; [2]; [3]; [4]; [5]; [6]; [7]; [8]; [9]; [10]; [11]; [12]; [13]; [14]; [15]; [16]; [17]; [18]; [19]; [20]; [21]; [22]; [23]; [24]; [25]; [26]; [27]; ad.
- Máte zde přes 30 různorodých zdrojů od knih přes články až po užití v reálném životě.
- Ostatně proč mám dokládat, že se označení Cvikov v češtině všeobecně ujalo? Máte dojem, že ne? To mě popravdě u vás jako v tématu zběhlého člověka překvapuje. Chápu, že můžete mít jiný názor u hraničních případů, ale tady podle mě nemůže být o hraničním případě řeč a Cvikov je už po prvním zadání do Google jednoznačně používané exonymum. --Palu (diskuse) 15. 11. 2018, 14:39 (CET)
- Naprosto souhlasím s kolegou Palu, že by bylo vhodné otevřít diskusi o změně pravidla WP:Města a obce. Někdy je situace až trapně komická - viz třeba polské Glucholazy, které jsou takto (lehce počeštěně, bez polského "ł") uvedeny dokonce i v [jízdních řádech ČD] a v regionálních zdrojích, ale na cswiki zatvrzele máme "Hlucholazy", které nikdo nepoužívá. Taková změna pravidel by měla být primární - přece jen už trochu pokročila doba od chvíle, kdy se v naší kotlině vše apriori počešťovalo.--Dirillo (diskuse) 15. 11. 2018, 15:15 (CET)
- Jak už jsem napsal, tohle do téhle debaty nepatří. Zkuste otevřít diskusi u příslušného pravidla nebo na jiném vhodném místě. --Palu (diskuse) 15. 11. 2018, 16:30 (CET)
- @Palu:Zatím jste prokázal pouze to, že české exonymum existuje. O tom není sporu. Na Českém národním korpusu je ale možné použít pokročilejší funkce, např. formát CQL dotazu, který odfiltruje frekventovaný český Cvikov a najde pouze výskyt, kdy po sobě následují lemmata "německý" a "Cvikov" ve všech pádech těchto slov. Relativní frekvence (odhad pravděpodobnosti výskytu jevu v jazyce krát 1 milion) u toho slovního spojení v největším korpusu ČNK "syn v6" je pouze 0.02. U spojení "saský" a "Cvikov" potom 0.01. Název Zwickau má tamtéž relativní frekvenci 0.31.--Eleiodromos (diskuse) 15. 11. 2018, 15:29 (CET)
- Jsem přesvědčen o tom, že jsem prokázal to, že je exonymum užívané celkem běžně napříč různými typy užití a že nejde o okrajové nebo zastaralé exonymum (= jde o zažité exonymum). --Palu (diskuse) 15. 11. 2018, 16:29 (CET)
- Mě jste nepřesvědčil. Pořád tady šermujete s poněkud vágním pojmem "zažitost", ale co je tato zažitost jiného než právě přesně definovatelná relativní frekvence.--Eleiodromos (diskuse) 15. 11. 2018, 16:41 (CET)
- Mám za to, že zažitý je "ten, co byl zažit", tj. "ten, ze vešel v užívání". Relativní frekvence tohle nevypoví. Relativní frekvence vypoví jedině to, které synonymum je nejpoužívanější, nikoliv které je nebo není zažité. Mimo to jazykový korpus nedovede přesně definovat relativní frekvenci, jelikož nikdy neobsahuje veškeré texty lidstva, nýbrž pouze jejich výběr. Například ze mnou citovaných 32 zdrojů obsahuje pravděpodobně jen 5. --Palu (diskuse) 15. 11. 2018, 18:02 (CET)
- Děkuji za poučení. Když má něco zanedbatelnou frekvenci výskytu v jazyce, tak to zcela určitě nemůže být "zažité". Zažitá je malá násobilka, kterou umí člověk zpaměti. Korpus definuje přesnou relativní frekvenci (tj. absolutní frekvenci poměřovanou celkovou délkou korpusu). Jiný způsob, jak relativní frekvenci výskytu jevu v jazyce měřit, zatím neexistuje. Čili to, že je název Cvikov pro saský Zwickau zažitější/frekventovanější než originální název, jste neprokázal.--Eleiodromos (diskuse) 15. 11. 2018, 18:28 (CET)
- Prokazovat něco podobného nebylo mým cílem. Mým cílem bylo doložit zažitost, nikoliv poměřit zažitost vůči jiným synonymům. O tom pravidlo nic neříká. To by pak nemusela existovat tato specializovaná výjimka z pravidla "očekávatelnost". --Palu (diskuse) 15. 11. 2018, 18:44 (CET)
- Vaše osobní filozofie "zažitosti" a "očekávatelnosti" do toho asi moc světla nevnese. Pro mě jste prostě nedoložil ani frekventovanost, ani zažitost. Říkejte tomu, jak chcete.--Eleiodromos (diskuse) 15. 11. 2018, 19:08 (CET)
- Pravidlo o očekávatelnosti mluví o tom, co popisujete vy - zvolit ten název, který je frekventovanější. Z něj existuje výjimka pro města, která říká, že pokud má město zažitý český ekvivalent, použijme ten. Město Zwickau má zažitý český ekvivalent, což dokládá jeho rozšířené užívání. Máte nějaké jiné vnímání pravidla? --Palu (diskuse) 15. 11. 2018, 19:13 (CET)
- U pravidla očekávatelnosti není ani zmínka o tom, že by „zažitost“ byla nějakou výjimkou, spíše snad aplikací tohoto pravidla na speciální případy.--Eleiodromos (diskuse) 15. 11. 2018, 19:44 (CET)
- Kdyby byl váš výklad správný, pak by tam nemusela být ta aplikace toho pravidla vůbec popsána, protože by nepřinášela žádný rozdíl oproti základnímu pravidlu. Pravda? --Palu (diskuse) 15. 11. 2018, 20:10 (CET)
- V každém případě tam není o nějaké výjimce ani zmínky. To, že tím vzniká nějaký rozdíl (např. okrajový název se může stát základem pro pojmenování článku apod.), je pouze vaše zcestná interpretace.--Eleiodromos (diskuse) 15. 11. 2018, 20:14 (CET)
- Kdyby byl váš výklad správný, pak by tam nemusela být ta aplikace toho pravidla vůbec popsána, protože by nepřinášela žádný rozdíl oproti základnímu pravidlu. Pravda? --Palu (diskuse) 15. 11. 2018, 20:10 (CET)
- U pravidla očekávatelnosti není ani zmínka o tom, že by „zažitost“ byla nějakou výjimkou, spíše snad aplikací tohoto pravidla na speciální případy.--Eleiodromos (diskuse) 15. 11. 2018, 19:44 (CET)
- Pravidlo o očekávatelnosti mluví o tom, co popisujete vy - zvolit ten název, který je frekventovanější. Z něj existuje výjimka pro města, která říká, že pokud má město zažitý český ekvivalent, použijme ten. Město Zwickau má zažitý český ekvivalent, což dokládá jeho rozšířené užívání. Máte nějaké jiné vnímání pravidla? --Palu (diskuse) 15. 11. 2018, 19:13 (CET)
- Vaše osobní filozofie "zažitosti" a "očekávatelnosti" do toho asi moc světla nevnese. Pro mě jste prostě nedoložil ani frekventovanost, ani zažitost. Říkejte tomu, jak chcete.--Eleiodromos (diskuse) 15. 11. 2018, 19:08 (CET)
- Prokazovat něco podobného nebylo mým cílem. Mým cílem bylo doložit zažitost, nikoliv poměřit zažitost vůči jiným synonymům. O tom pravidlo nic neříká. To by pak nemusela existovat tato specializovaná výjimka z pravidla "očekávatelnost". --Palu (diskuse) 15. 11. 2018, 18:44 (CET)
- Děkuji za poučení. Když má něco zanedbatelnou frekvenci výskytu v jazyce, tak to zcela určitě nemůže být "zažité". Zažitá je malá násobilka, kterou umí člověk zpaměti. Korpus definuje přesnou relativní frekvenci (tj. absolutní frekvenci poměřovanou celkovou délkou korpusu). Jiný způsob, jak relativní frekvenci výskytu jevu v jazyce měřit, zatím neexistuje. Čili to, že je název Cvikov pro saský Zwickau zažitější/frekventovanější než originální název, jste neprokázal.--Eleiodromos (diskuse) 15. 11. 2018, 18:28 (CET)
- Mám za to, že zažitý je "ten, co byl zažit", tj. "ten, ze vešel v užívání". Relativní frekvence tohle nevypoví. Relativní frekvence vypoví jedině to, které synonymum je nejpoužívanější, nikoliv které je nebo není zažité. Mimo to jazykový korpus nedovede přesně definovat relativní frekvenci, jelikož nikdy neobsahuje veškeré texty lidstva, nýbrž pouze jejich výběr. Například ze mnou citovaných 32 zdrojů obsahuje pravděpodobně jen 5. --Palu (diskuse) 15. 11. 2018, 18:02 (CET)
- Mě jste nepřesvědčil. Pořád tady šermujete s poněkud vágním pojmem "zažitost", ale co je tato zažitost jiného než právě přesně definovatelná relativní frekvence.--Eleiodromos (diskuse) 15. 11. 2018, 16:41 (CET)
- Jsem přesvědčen o tom, že jsem prokázal to, že je exonymum užívané celkem běžně napříč různými typy užití a že nejde o okrajové nebo zastaralé exonymum (= jde o zažité exonymum). --Palu (diskuse) 15. 11. 2018, 16:29 (CET)
- Možná by bylo lepší, kdyby jste naopak vy jako navrhovatel této změny prokázal, že označení "Cvikov" se v češtině všeobecně ujalo jako název pro saské město Zwickau. Podle ČNK to tak rozhodně nevypadá.--Eleiodromos (diskuse) 15. 11. 2018, 13:23 (CET)
- Musím namítnout, že přednost má jednoznačně WP:Název článku před WP:Rozlišovač. Rozlišení názvů nemůže být argument pro neužití exonyma. Lze to řešit například doložením, že český Cvikov je frekventovanější a rozlišovač tedy má mít německý Cvikov. Co se pak týče vašich názorů na to jak to má chodit, tak to patří spíše k debatě o případnou změnu pravidla WP:Města a obce, nikoliv sem. -- (diskuse) 15. 11. 2018, 13:09 (CET)
┌─────────────────────────────────────┘OK, přeformuluju to. Jedná se o specializované pravidlo v rámci obecného pravidla, kterým vzniká určitý rozdíl. Čili má přednost před obecným pravidlem. Města se tedy řídí obecným pravidlem (jméno se volí podle očekávatelnosti, tj. obvykle podle největší frekvence), ale pokud mají zažitý český ekvivalent, pak má tento ekvivalent přednost. Je taková formulace blíže shodě s vaším pojetím? --Palu (diskuse) 15. 11. 2018, 20:36 (CET)
- Zažitý název, ať už to interpretujete jakkoliv, nemůže mít zanedebatelnou frekvenci výskytu. Pak prostě není zažitý. "Londýn, Vídeň, Řezno" mají frekvenci vysokou, což lze doložit, Lobava, Ojvín a německý Cvikov ji mají zanebatelnou, což lze doložit.--Eleiodromos (diskuse) 15. 11. 2018, 21:03 (CET)
- Skutečně má Cvikov zanedbatelnou frekvenci? Podle čeho tak usuzujete? Právě jsem vám dal 32 užití v nejrůznějších okruzích textů. Jak přesně určujete tu "zandebatelnost"? Protože pravidlo je vystavěno evidentně jinak, než co tady prosazujete - má to na něj nějakou návaznost? --Palu (diskuse) 15. 11. 2018, 21:38 (CET)
- 32 jednotlivých výskytů (nezřídka v literatuře starší) vůbec nic nemění na prokazatelně nízké relativní frekvenci tohoto názvu v ČNK. Názvy měst jsou problematika čistě lingvistická, jediným přesným ukazatelem zažitosti/frekvence daného názvu je jeho výskyt v jazykovém korpusu.--Eleiodromos (diskuse) 15. 11. 2018, 21:55 (CET)
- Jazykový korpus je neúplný a nemůže zahrnovat veškeré texty, většinu ze zmíněných 32 textů jich ani neobsahuje. S vaší poslední větou tedy nesouhlasím. Kvůli několika starším textům, které jsem záměrně také zahrnul, abych ukázal, že exonymum je běžné už drahnou dobu, nelze smést ze stolu jednoznačně prokázané současné užívání doložené ostatními refy. Myslím, že dál se nepohneme a budeme muset počkat, jestli nepřijdou další kolegové s nějakým novým pohledem nebo argumenty. Zatím díky za diskusi. --Palu (diskuse) 15. 11. 2018, 22:07 (CET)
- Jazykový korpus neobsahuje všechny české texty, ale je podle lingvistických měřítek dostatečně velký a reprezentativní. Stejným způsobem byste mohl najít třeba 32 jednotlivých výskytů slova čistonosoplena nebo jakéhokoliv jiného slova. Teď tedy záleží na tom, koho jste (kromě sebe) přesvědčil o tom, že heslo Zwickau je nutné přejmenovat. Mě tedy rozhodně ne. Pěkný večer.--Eleiodromos (diskuse) 15. 11. 2018, 22:24 (CET)
- To by mě zajímalo, kolik lidí v roce 2005 přemluvil Kyknos, když přesouval z názvu Cvikov na Zwickau. Nevidím ani pokus a jím uvedený argument šel řešit rozcestníky. Srovnávat čistonosoplenu s Cvikovem je argumentační faul, běžné užívání Cvikova jsem doložil, o okrajovosti názvu nejsou jiné známky než vaše tvrzení. Dokonce i vámi zmíněný korpus Cvikov zná v rozličném užití (3x noviny, 1x časopis, 1x kniha, vše současné). --Palu (diskuse) 15. 11. 2018, 22:36 (CET)
- Vy se prostě neumíte rozloučit. Nízkou frekvenci výskytu označení "Cvikov" pro ono saské město dokládá ČNK. Můžete si to klidně přeměřit. Počet několika jednotlivých výskytů v žádném případě není ukazatelem zažitosti/frekvence. Tu jste měl prokázat a přesvědčit auditorium. A to jste tady podle mě nepředvedl.--Eleiodromos (diskuse) 15. 11. 2018, 22:44 (CET)
- Zažitost lze doložit dostatečně rozšířeným užitím. To jsem splnil. Nikde není psána podmínka, že to lze splnit pouze korpusem a dosud se tak ani běžně nedělo. Vždy většinou otrockým průzkumem zdrojů. --Palu (diskuse) 15. 11. 2018, 22:46 (CET)
- Což právě vedlo k mnoha zbytečným sporům a k situaci, kdy byla a je řada měst pojmenována archaickými názvy. 32 jednotlivých výskytů nic neprokazuje.--Eleiodromos (diskuse) 15. 11. 2018, 22:51 (CET)
- Tohle ale není ten příklad. Jak jsem ukázal, použití exonyma Cvikov je zcela současné, je dostatečně široké a má i tradici. Jen není jeho použití nejširší ze všech, jak pořád dokola poukazujete. To ale není předmětem pravidla. Pravidlo říká "pokud existuje zažité české exonymum, použijte jej". Váš pohled by byl relevantní v případě, kdy by toto speciální pravidlo neexistovalo a platilo by pouze pravidlo o očekávatelnosti. Pak bychom řešili, které ze synonym je nejzažitější. Doufám, že se mi už podařilo ten rozdíl vysvětlit. --Palu (diskuse) 15. 11. 2018, 22:56 (CET)
- Ano, a právě tohle exonymum prokazatelně zažité není.--Eleiodromos (diskuse) 15. 11. 2018, 22:58 (CET)
- Právě, že jsem prokázal, že zažité je. Prokázal jsem to 32 užitími (včetně korpusu) v rozličných zdrojích od oficiálních stránek německých úřadů, přes české současné noviny, současné knihy, motoristické časopisy, až po historickou literaturu nebo literaturu o historii. Je to zcela běžně používané jméno a to je podstata toho pojmu zažitost. Takže znovu prosím, nepleťte si to se soutěží co je zažitější. --Palu (diskuse) 15. 11. 2018, 23:04 (CET)
- 32 výskytů jakéhokoliv slova nedokazuje, že to slovo je zažité. To lze přesně zjistit jedině v jazykovém korpusu. Nedokázal jste vůbec nic.--Eleiodromos (diskuse) 15. 11. 2018, 23:07 (CET)
- Právě, že jsem prokázal, že zažité je. Prokázal jsem to 32 užitími (včetně korpusu) v rozličných zdrojích od oficiálních stránek německých úřadů, přes české současné noviny, současné knihy, motoristické časopisy, až po historickou literaturu nebo literaturu o historii. Je to zcela běžně používané jméno a to je podstata toho pojmu zažitost. Takže znovu prosím, nepleťte si to se soutěží co je zažitější. --Palu (diskuse) 15. 11. 2018, 23:04 (CET)
- Ano, a právě tohle exonymum prokazatelně zažité není.--Eleiodromos (diskuse) 15. 11. 2018, 22:58 (CET)
- Tohle ale není ten příklad. Jak jsem ukázal, použití exonyma Cvikov je zcela současné, je dostatečně široké a má i tradici. Jen není jeho použití nejširší ze všech, jak pořád dokola poukazujete. To ale není předmětem pravidla. Pravidlo říká "pokud existuje zažité české exonymum, použijte jej". Váš pohled by byl relevantní v případě, kdy by toto speciální pravidlo neexistovalo a platilo by pouze pravidlo o očekávatelnosti. Pak bychom řešili, které ze synonym je nejzažitější. Doufám, že se mi už podařilo ten rozdíl vysvětlit. --Palu (diskuse) 15. 11. 2018, 22:56 (CET)
- Což právě vedlo k mnoha zbytečným sporům a k situaci, kdy byla a je řada měst pojmenována archaickými názvy. 32 jednotlivých výskytů nic neprokazuje.--Eleiodromos (diskuse) 15. 11. 2018, 22:51 (CET)
- Zažitost lze doložit dostatečně rozšířeným užitím. To jsem splnil. Nikde není psána podmínka, že to lze splnit pouze korpusem a dosud se tak ani běžně nedělo. Vždy většinou otrockým průzkumem zdrojů. --Palu (diskuse) 15. 11. 2018, 22:46 (CET)
- Vy se prostě neumíte rozloučit. Nízkou frekvenci výskytu označení "Cvikov" pro ono saské město dokládá ČNK. Můžete si to klidně přeměřit. Počet několika jednotlivých výskytů v žádném případě není ukazatelem zažitosti/frekvence. Tu jste měl prokázat a přesvědčit auditorium. A to jste tady podle mě nepředvedl.--Eleiodromos (diskuse) 15. 11. 2018, 22:44 (CET)
- To by mě zajímalo, kolik lidí v roce 2005 přemluvil Kyknos, když přesouval z názvu Cvikov na Zwickau. Nevidím ani pokus a jím uvedený argument šel řešit rozcestníky. Srovnávat čistonosoplenu s Cvikovem je argumentační faul, běžné užívání Cvikova jsem doložil, o okrajovosti názvu nejsou jiné známky než vaše tvrzení. Dokonce i vámi zmíněný korpus Cvikov zná v rozličném užití (3x noviny, 1x časopis, 1x kniha, vše současné). --Palu (diskuse) 15. 11. 2018, 22:36 (CET)
- Jazykový korpus neobsahuje všechny české texty, ale je podle lingvistických měřítek dostatečně velký a reprezentativní. Stejným způsobem byste mohl najít třeba 32 jednotlivých výskytů slova čistonosoplena nebo jakéhokoliv jiného slova. Teď tedy záleží na tom, koho jste (kromě sebe) přesvědčil o tom, že heslo Zwickau je nutné přejmenovat. Mě tedy rozhodně ne. Pěkný večer.--Eleiodromos (diskuse) 15. 11. 2018, 22:24 (CET)
- Jazykový korpus je neúplný a nemůže zahrnovat veškeré texty, většinu ze zmíněných 32 textů jich ani neobsahuje. S vaší poslední větou tedy nesouhlasím. Kvůli několika starším textům, které jsem záměrně také zahrnul, abych ukázal, že exonymum je běžné už drahnou dobu, nelze smést ze stolu jednoznačně prokázané současné užívání doložené ostatními refy. Myslím, že dál se nepohneme a budeme muset počkat, jestli nepřijdou další kolegové s nějakým novým pohledem nebo argumenty. Zatím díky za diskusi. --Palu (diskuse) 15. 11. 2018, 22:07 (CET)
- 32 jednotlivých výskytů (nezřídka v literatuře starší) vůbec nic nemění na prokazatelně nízké relativní frekvenci tohoto názvu v ČNK. Názvy měst jsou problematika čistě lingvistická, jediným přesným ukazatelem zažitosti/frekvence daného názvu je jeho výskyt v jazykovém korpusu.--Eleiodromos (diskuse) 15. 11. 2018, 21:55 (CET)
- Skutečně má Cvikov zanedbatelnou frekvenci? Podle čeho tak usuzujete? Právě jsem vám dal 32 užití v nejrůznějších okruzích textů. Jak přesně určujete tu "zandebatelnost"? Protože pravidlo je vystavěno evidentně jinak, než co tady prosazujete - má to na něj nějakou návaznost? --Palu (diskuse) 15. 11. 2018, 21:38 (CET)
┌───────────────────────────────────┘To by byla pravda jedině pokud by byl korpus všeobjímající. Korpus všeobjímající není, stejně jako není všeobjímající můj vzorek. Můj vzorek ale dokládá, že se Cvikov používá v rozličných typech textů v běžném jazyce. Nedokládá to tím, že vyčítá, že se používá hodně, v kvantech. Dokládá to tak, že tu ten výskyt je. Je to podobné, jako když děláte průzkum mezi lidmi, jestli by volili Babiše. Taky nemusíte vyzpovídat 10 milionů lidí, abyste to zjistil. Stačí pár a už budete mít představu. A myslím, že na mém vzorku není důležité ani tolik číslo 32, jako celkem přesvědčivá šířka záběru co do typu textů. --Palu (diskuse) 15. 11. 2018, 23:12 (CET)
- Dokázal jste, že to exonymum existuje, to je jasné. Proč ale nepoužít daleko přesnější metodu měření frekvence výskytu slova v jazyce? Když máme výsledek voleb, proč důvěřovat neaktuálnímu předvolebnímu průzkumu?--Eleiodromos (diskuse) 15. 11. 2018, 23:21 (CET)
- Právě, že o výsledek voleb nejde ani v případě korpus.cz. To by musel obsahovat i zdroje, které dosud neobsahuje. Ale i kdyby obsahoval všechny zdroje, to, co byste doložil není, že "Cvikov není zažitý", ale že "existují zažitější synonyma než Cvikov". A to není to, co v tomhle případě potřebujeme dokládat. --Palu (diskuse) 15. 11. 2018, 23:26 (CET)
- Metoda jazykového korpusu je v souladu se současnými poznatky matematické lingvistiky. Metoda: "mám 32 výskytů, pojďme přejmenovávat" je spíše smutným specifikem diskusí na české Wikipedii.--Eleiodromos (diskuse) 15. 11. 2018, 23:33 (CET)
- Pro určité účely je to ten nejsofistikovanější nástroj. Pokud bychom poměřovali co je nejfrekventovanější, určitě by nám dobře pomohl. Pokud ale hledáme všechny frekventované v dostatečně širokém záběru typů textů, pak nám moc nepomůže, protože 1. nemá záběr do všech typů textů a 2. prosté automatické poměřování čísel nedokáže nahradit lidský výběr typu "od každého trochu". My zde nepotřebujeme poměřit kvantitu (= nejočekávatelnější), ale šířku záběru (= existuje české exonymum, které není mrtvé nebo neskomírá?) a k tomu nám korpus nemůže posloužit. --Palu (diskuse) 15. 11. 2018, 23:45 (CET)
- To se právě fatálně mýlite. Inteligentní lidský výběr od každého trochu je právě podle přesných metodik zakomponován do ČNK. Vaše pokroucená argumentace, která se snaží dokázat, že málo zažitým/frekventovaným názvem je možné v encyklopedii pojmenovávat města, je absolutně mimo. V pravidle se o žádné výjimce, ani rozdílu nemluví. Šířku záběru jste svými 32 výskyty rozhodně nepoměřil.--Eleiodromos (diskuse) 15. 11. 2018, 23:55 (CET)
- V pravidle o městech se hovoří o tom, že pokud existuje zažité české exonymum, máme ho použít. Tím se vymyká od ostatních témat, kde se rozhodujeme pouze na základě frekvence tak, jak říkáte. Čili tato debata není o tom, jestli je něco frekventovanějšího než Cvikov, ale o tom, jestli je Cvikov živé exonymum. Živost exonyma samozřejmě lze poměřit frekvencí - pokud bude nejfrekventovanější, pak je nepochybně živé. Neznamená to ale, že pokud nebude nejfrekventovanější, živé nebude. Toto je příklad, kdy možná není nejfrekventovanější (a já jsem se tohle ani nepokoušel studovat, takže to mám jen z vašeho tvrzení o korpusu, ale například napříč novinovými servery jsem si průzkum nedělal), ale podařilo se mi prokázat, že je živé a není okrajové. --Palu (diskuse) 16. 11. 2018, 00:02 (CET)
- Ano a právě exonymum Cvikov použité pro výše zmíněné saské město zažité NENÍ.--Eleiodromos (diskuse) 16. 11. 2018, 00:10 (CET)
- V pravidle o městech se hovoří o tom, že pokud existuje zažité české exonymum, máme ho použít. Tím se vymyká od ostatních témat, kde se rozhodujeme pouze na základě frekvence tak, jak říkáte. Čili tato debata není o tom, jestli je něco frekventovanějšího než Cvikov, ale o tom, jestli je Cvikov živé exonymum. Živost exonyma samozřejmě lze poměřit frekvencí - pokud bude nejfrekventovanější, pak je nepochybně živé. Neznamená to ale, že pokud nebude nejfrekventovanější, živé nebude. Toto je příklad, kdy možná není nejfrekventovanější (a já jsem se tohle ani nepokoušel studovat, takže to mám jen z vašeho tvrzení o korpusu, ale například napříč novinovými servery jsem si průzkum nedělal), ale podařilo se mi prokázat, že je živé a není okrajové. --Palu (diskuse) 16. 11. 2018, 00:02 (CET)
- To se právě fatálně mýlite. Inteligentní lidský výběr od každého trochu je právě podle přesných metodik zakomponován do ČNK. Vaše pokroucená argumentace, která se snaží dokázat, že málo zažitým/frekventovaným názvem je možné v encyklopedii pojmenovávat města, je absolutně mimo. V pravidle se o žádné výjimce, ani rozdílu nemluví. Šířku záběru jste svými 32 výskyty rozhodně nepoměřil.--Eleiodromos (diskuse) 15. 11. 2018, 23:55 (CET)
- Pro určité účely je to ten nejsofistikovanější nástroj. Pokud bychom poměřovali co je nejfrekventovanější, určitě by nám dobře pomohl. Pokud ale hledáme všechny frekventované v dostatečně širokém záběru typů textů, pak nám moc nepomůže, protože 1. nemá záběr do všech typů textů a 2. prosté automatické poměřování čísel nedokáže nahradit lidský výběr typu "od každého trochu". My zde nepotřebujeme poměřit kvantitu (= nejočekávatelnější), ale šířku záběru (= existuje české exonymum, které není mrtvé nebo neskomírá?) a k tomu nám korpus nemůže posloužit. --Palu (diskuse) 15. 11. 2018, 23:45 (CET)
- Metoda jazykového korpusu je v souladu se současnými poznatky matematické lingvistiky. Metoda: "mám 32 výskytů, pojďme přejmenovávat" je spíše smutným specifikem diskusí na české Wikipedii.--Eleiodromos (diskuse) 15. 11. 2018, 23:33 (CET)
- Právě, že o výsledek voleb nejde ani v případě korpus.cz. To by musel obsahovat i zdroje, které dosud neobsahuje. Ale i kdyby obsahoval všechny zdroje, to, co byste doložil není, že "Cvikov není zažitý", ale že "existují zažitější synonyma než Cvikov". A to není to, co v tomhle případě potřebujeme dokládat. --Palu (diskuse) 15. 11. 2018, 23:26 (CET)
Cituji: „U českého, méně známého Cvikova, navrhuji použít rozlišovač“. Na to jste přišel kde? Nějaký důkaz pro tvrzení „méně známého“? Lze toto tvrzení doložit nějakými zdroji, články o malé známosti Cvikova, nebo je to jen váš pocit? --Jan KovářBK (diskuse) 15. 11. 2018, 23:09 (CET)
- OK, beru zpět. Co ze dvou měst bude mít rozlišovač, nechám na další bod debaty po rozhodnutí, jestli použít české exonymum. Přiznám se, že tohle byl skutečně jen můj pocit. --Palu (diskuse) 15. 11. 2018, 23:12 (CET)
- Díky za vysvětlení. Jinak Zwickau znám jako Zwickau i Cvikov, takže na použití českého exonyma nemám zcela jasný názor. --Jan KovářBK (diskuse) 15. 11. 2018, 23:21 (CET)
- Já samozřejmě znám také oba názvy. Nicméně u měst, která mají zažitá česká exonyma, bychom podle pravidla měli preferovat právě ty. To je důvod, proč jsem navrhl tento přesun. --Palu (diskuse) 15. 11. 2018, 23:27 (CET)
- Jsem proti přesunu, mám stejný názor jako Dirillo, a německá jmena bych vrátil na mnohem více exonym. Jinak je stále komunita rozdělená, a divím se, že to Palua stále baví. Města mají také úřední název, a tím v Německu česká exonyma nejsou, bohužel.Mirek256 16. 11. 2018, 06:07 (CET)
- Tak na dohadování musí být víc lidí. Já jsem zase spíš příznivec exonym a úřední jména pokládám za méně významná, takže v osobním životě budu užívat spíš Cvikov, protože se mi s ním lépe pracuje. Což tedy automaticky neznamená, že jsem pro přesun - Wikipedie nemá být nástrojem jazykové revoluce.--Tchoř (diskuse) 16. 11. 2018, 07:10 (CET)
- Jsem proti přesunu, mám stejný názor jako Dirillo, a německá jmena bych vrátil na mnohem více exonym. Jinak je stále komunita rozdělená, a divím se, že to Palua stále baví. Města mají také úřední název, a tím v Německu česká exonyma nejsou, bohužel.Mirek256 16. 11. 2018, 06:07 (CET)
- Já samozřejmě znám také oba názvy. Nicméně u měst, která mají zažitá česká exonyma, bychom podle pravidla měli preferovat právě ty. To je důvod, proč jsem navrhl tento přesun. --Palu (diskuse) 15. 11. 2018, 23:27 (CET)
- Díky za vysvětlení. Jinak Zwickau znám jako Zwickau i Cvikov, takže na použití českého exonyma nemám zcela jasný názor. --Jan KovářBK (diskuse) 15. 11. 2018, 23:21 (CET)
Musím uznat, že znění doporučení pro názvy měst a obcí chápu spíše stejně jako Palu. Nechci do toho promítat můj osobní názor na používání endonym nebo exonym, ale pro zajímavost bych chtěl poznamenat, že Cvikov je pro mě mnohem srozumitelnější, než Řezno. Ona ta zažitost nebude všude v Česku stejná, ale bude se jistě lišit lokálně, takže sporům o pohraniční města se asi hned tak nevyhneme... --YjM | dp 16. 11. 2018, 08:39 (CET)
Jakožto člověk, který přes oba Cvikovy má sem tam cestu: Pokud už přejmenovávat Zwickau na Cvikov, pak ale rozlišovač by měly dostat německé město nebo obě města s rozcestníkem. Stále mi to však přijde tisíckrát krkolomnější než nechat to jak to je (+ do úvodní věty článku o německém městě vysvětlit, že se tomu městu říká Cvikov, a do článku o českém městě zase Možná hledáte). --Dvorapa (diskuse) 16. 11. 2018, 10:21 (CET)
Bohužel co se týče nějakého předešlého systému, kterým bychom se mohli řídit: na první pohled žádný moc není. Štětín, Svídnice (Polsko), Žitava vs. Valbřich, Chudoba, Jelení Hora. --Dvorapa (diskuse) 16. 11. 2018, 10:30 (CET)
Pozn.: beru zpět svůj čechocentrismus, obě města jsou si významem dost podobná. (upraveno 16. 11. 2018, 20:45 (CET) wikipedistou Dvorapa (diskuse))
- No ta krkolomnost podle mě není dobrý argument. Řešení typu "Různé významy" + rozlišovač mi nepřijde nějak krkolomné. Nebo myslíte, že je lepší mít Mnichov a München místo Mnichov (okres Cheb) a Mnichov? Tím chci říct, že standardní řešení doteď žádnou krkolomnost nevykazovalo a může tak jít jen o dojem plynoucí z toho, že není lehké si situaci představit. Zkuste se tedy podívat na mnou zmíněný citovaný případ (Mnichov vs. Mnichov (okres Cheb)) a říct, jestli vám přijde krkolomný (jen se prosím neupínejte na to, že bude hlavním významem německé město a vedlejším české, to je totiž jiný, podružný bod). Tedy jestli jsme správně pochopil co má být na tom řešení krkolomné. --Palu (diskuse) 16. 11. 2018, 11:41 (CET)
- Ono je na tom nejvíce krkolomné, že těch případů, kde to je pokaždé jinak bychom mohli nacházet stovky. Zde se přeme o dvě města, vy jste vyjmenoval nyní další dvě obce, já vyjmenoval výše dalších šest a pokud bych z těchto desíti obcí chtěl učinit nějaký závěr, jak se to běžně dělá, tak to nejde, prostě si to každý dělá jak chce. Proto by nemělo být podstatné, co se líbí mně nebo vám, ale co očekávají čtenáři a ideálně to standardizovat napříč Wikipedií. Řešení Mnichova rozhodně zakládá na dominanci 1,5 mil. města proti 400 obyvatelům vesnice. Jenže u Cvikova tak jasně dominanci rozhodnout nelze, obě města jsou spádová pro přilehlé vesnice, rozdíl ve velikosti sice je, ale co do významu už tak moc ne. Proto pokud přejmenovat, tak ale přidělit rozlišovač oběma. V tom případě ale přejmenovat i Jelení Horu, Chudobu nebo Valbřich. Anebo to ponechat jak to je. Ovšem poté by bylo vhodné přejmenovat i Štětín, Svídnici, Žitavu nebo oba Mnichovy. Jednoznačně si myslím, že to není problém jen těchto dvou měst, bylo by dobré už tento stále problematický jev konečně globálně vyřešit a poté se jasným a přesným zněním pravidla/konsensu ohánět jak bičem. --Dvorapa (diskuse) 16. 11. 2018, 20:45 (CET)
- Stávající pravidlo stanovuje "zažitost jako Londýn, Vídeň, Řezno". Není problém s pomocí Českého národního korpusu stanovit průměrnou relativní frekvenci z těchto tří měst, tu případně snížit na polovinu, aby nebyla favorizována větší města, případně, aby se vyšlo vstříc těm, kteří zde dávají přednost českým exonymům. Takto stanovená relativní frekvence v ČNK by potom mohla sloužit k rozhodování podobných sporů o názvy obcí. Co by bylo pod tuto hranici, to by zůstalo pod originálním názvem v němčině, polštině atd.--Eleiodromos (diskuse) 16. 11. 2018, 21:09 (CET)
- To je příliš složité na běžného českého wikipedistu. Navíc je potřeba u podobných korpusových výpočtů zahrnout i aktuálnost zdroje (těžko budeme město na Wikipedii nazývat Nový Bezděz, když název v 15. století postupně nahradil název nový a od té doby se původní nepoužívá) a ani si nemyslím, že bychom měli kdy šanci se na jednotném vzorci shodnout. Asi bych volil nějaký jednodušší přístup, který bude moci použít i „každý blbec“. Třeba pomocí zdrojů, pokud v posledních x letech existují 2NNVZ uvádějící český název zahraniční obce, pak použít ten. --Dvorapa (diskuse) 17. 11. 2018, 11:23 (CET)
- Jestli tomu správně rozumím, je potřeba vyjasnit dvě věci: za jakých podmínek použít český název (viz výše) a pokud je použit český název, pak jak to udělat s rozlišovači v případě shody. Pro druhý bod navrhuji použít rozlišovače u obou obcí, pokud se jedná o města podobného významu (Cvikovy), a pouze u významější obce, pokud se jedná o propastný rozdíl mezi významem obou obcí (Mnichov). --Dvorapa (diskuse) 17. 11. 2018, 11:23 (CET)
- Tento systém jsem si nevymyslel já. Používá se úspěšně na dewiki a předchází se tak zbytečným sporům. Každý má svůj individuální jazykový cit, nebo zkušenost s místními názvy v rámci regionu. Tohle je ale spravedlivý způsob, jak řešit stávající chaos. Jak jsem již uvedl, když někdo najde 32 výskytů "saského Cvikova" v českých textech, není problém najít stejných 32 výskytů "saského Zwickau" v českých textech. Je to tedy opět patová situace. Texty v jazykovém korpusu "Syn verze 6" pocházejí z let 2010–2016. Odrážejí tedy současnou podobu české publicistiky. "Zažitost", o které mluví pravidlo, tak lze číselně vyjádřit a v případě sporu porovnat.--Eleiodromos (diskuse) 17. 11. 2018, 11:48 (CET)
- Jak už jsem řekl, příliš složité na běžného wikipedistu. 2NNVZ z nedávné doby zmiňující český název by mohla být mnohem jednodušší a přesto efektivní a nesporná možnost. --Dvorapa (diskuse) 17. 11. 2018, 11:58 (CET)
- 2NNVZ mohou bez problémů dodat obě strany sporu. Následkem by byla záplava absurdních archaismů, které by zdejší slavjanofilská lobby mohla hravě a bez jakékoliv míry prosazovat. Např. Seina by mohla být tímto způsobem přejmenována na staročeský název Sekvana apod. Tyto mrtvé názvy by pak byly ve zjevném rozporu s pravidlem očekávatelnosti.--Eleiodromos (diskuse) 17. 11. 2018, 12:21 (CET)
- Nemohou, když říkám, že musí být z nedávné doby. A také nevím, proč by protistrana sporu chtěla dodávat 2NNVZ vyvracející svůj názor (PS: přečtěte si pořádně, co říkám, zdá se mi, že mi vůbec nerozumíte). --Dvorapa (diskuse) 17. 11. 2018, 12:24 (CET)
- Z nedávné doby mohou pocházet 2NNVZ, které jedné straně ("saský Cvikov") dodají argumenty. Jiné 2NNVZ z nedávné doby však mohou dodat také jejich názoroví oponenti ("saský Zwickau"). Proč by měla být favorizována první skupina, když "saský Zwickau" má v českých textech větší frekvenci? Takový postup by o skutečném užívání obou názvů v reálném světě nic nevypovídal a vedl by k následkům, které jsem uvedl výše.--Eleiodromos (diskuse) 17. 11. 2018, 12:55 (CET)
- K jakým by mohlo dojít následkům? Proč by měla být favorizována první skupina? Ono u těch textů hlavně záleží, kdo je jejich autor. A často se setkávám s tím, že místní/Češi žijící v pohraničí říkají obci česky (viz Cvikov, Chudoba, Kladsko, Jelení Hora), zatímco drtivá většina Čechů mimo východočeský kraj tomu budou říkat cizojazyčně (Zwickau, Kudowa, Klłodzko, Jelenia Góra). Jenže v takovou chvíli váš systém selhává, protože přestože se obci říká běžně Česky, lidé z druhé strany republiky o tom neví. --Dvorapa (diskuse) 17. 11. 2018, 13:10 (CET)
- Přesně to by použití korpusu řešilo. Jsou zde totiž významně zastoupeny regionální deníky, které odrážejí místní specifika publicistického stylu. Když má být ovšem podle pravidla něco "zažité jako Londýn, Vídeň, Řezno", tak by tomu měli rozumět čtenáři ze všech koutů ČR. Originálním názvem se potom nic nezkazí.--Eleiodromos (diskuse) 17. 11. 2018, 13:26 (CET)
- To ano, ale pokud bychom na korpus aplikovali nějaký vzorec, tak ale stejně ty výskyty v reqionálních denících mohou být oproti ostatním, např. celonárodním v menšině ne? Procentuálně by tedy místní v pohraničí stále utřeli. Nebo pořád nerozumím, jak byste to tedy dle korpusu vybíral, aby to bylo dostatečně fér. Řekněme to konkrétně (omlouvám se, použiji příklad ze svého regionu): tři regionální deníky z Orlických hor (třeba i jen obecní/reqionální zpravodaje) napíší zprávu, že v Kladsku na polské straně hor zítra začnou vánoční trhy, ovšem když se poté nedejbože v Kladsku stane teroristický útok a někdo najede do lidí, 30 českých velkých deníků hned napíše, že se stala hrůza v Kłodzku. A je to nepoměr 30:3 ne? (zrovna v tomhle případě Kladska a Cvikova jsou oba snad dostatečně zažité i u velkých deníků, berte to spíš jen jako příklad, ale u jiných názvů, třeba u Chudoby nebo Jelení Hory už si myslím že by takový problém nastat mohl).
- A zpátky k těm 2NNVZ: Pokud by přišel wikipedista a dodal 2NNVZ, konkrétně třeba jednu zprávu z nějakého Orlickohorského deníku, že v Kladsku začínají vánoční trhy, a druhou třeba z Náchodského zpravodaje, že Kladští zastupitelé rozhodli o dokončení cyklostezky Kladsko–Náchod, asi bych neměl problém mu to uznat spíš než nějaký výsledek vzorce z korpusu, který by mi 30:3 říkal, že mám článek pojmenovat Kłodzko. --Dvorapa (diskuse) 17. 11. 2018, 18:54 (CET)
- Na Český národní korpus není třeba aplikovat nějaký vzorec, metoda zjištění relativní frekvence výskytu jevu v jazyce je stejně intuitivní jako používání Google. Šlo by jen o tu případnou hranici, kdy název je nebo není zažitý. Pokud jde o zastoupení regionálních deníků, tak vězte, že v korpusu "syn verze 6" zaujímají deníky Bohemia a Moravia polovinu z celkového množství, viz graf. Jazyk encyklopedie by měl odpovídat publicistickým standardům, nikoliv nějakému místnímu nespisovnému nářečí. Kladsko má v "syn verze 6" relativní frekvenci 0.43 (Kłodzko 0.02), to je řádově výše než 0,02 "saského Cvikova".--Eleiodromos (diskuse) 17. 11. 2018, 19:12 (CET)
- On je právě nespisovný třeba jenom proto, že ÚJČ o daném názvu třeba ani moc neví a přitom se třebas používá v celém východočeském kraji. Nicméně já bych právě dal přednost místnímu názvu než tomu, co nějací pražáci píšící do celonárodních novin vyčetli z Google map a myslí si, že to tak má být. Krom toho také záleží, jak v tom korpusu hledáte, zkoušel jsem si nyní vyhledat Kudowa-Zdrój x Lázně Chudoba a dospěl jsem k závěru 0,01 x 0. Ovšem pod slovem Chudoba jsou stovky různých jmen lidí a rostlin a produktů a kdovíčeho, čili kdo ví, jak to vlastně je (nemám čas projít všech 6000 výskytů slova Chudoba)? Stejně tak by mě zajímalo, jak jste procházel všech 7000 výskytů slova Cvikov a polemizoval, zda daný text pojednává o saském nebo lužickém městě. Jen z prvních 20, které mi to dalo, to je cca půl na půl. A to není jen problém korpusu, to i problém Google testu a myslím si, že tyto metody nám bohužel u takovýchto případů nepomohou. Já věřím, že ty pokročilé funkce korpusu to umí vyfiltrovat a také věřím, že existují lidé, kteří to umí perfektně ovládat a dokáží mně, neznalému člověku rychle vypsat, jak to s těmi Cvikovy nebo Chudobou vlastně je. Ovšem běžný pisatel Wikipedie tyto složité vyhledávací mechanismy nezná a na první dobrou dopadne jako já s mými pokusy. Z mého pohledu to je, jako kdybyste na základní škole doporučoval dětem vypočítat hmotnost kuličky pomocí kvantové fyziky (trochu přeháním). Jistěže to funguje spolehlivě, ale v testu vám ty děcka dosvědčí, že kvantovce nemají šanci moc rozumět. Raději bych tedy opravdu apeloval na nějaký jednodušší přístup s tím, že pokud bude název navíc doložený šikovně vyhledanými klíčovými slovy v korpusu, pak jen lépe. (myslím, že už se oba opakujeme, tak toho prozatím nechme a počkejme ještě, co si myslí/co vymyslí ostatní). --Dvorapa (diskuse) 17. 11. 2018, 19:57 (CET)
- Pro plnohodnotné používání ČNK je třeba se do něj nejprve zaregistrovat. Je to totiž projekt chráněný autorskými právy. Pro stanovení výskytu "německý Cvikov" a "saský Cvikov" jsem použil pokročilejší vyhledávání vzhledem k tomu, že Cvikovy jsou dva. Návod najdete zde. Tzv. gůgltest je naprosto něco jiného, Google stavěný pro angličtinu např. neumí zahrnout skloňované tvary daného slova. Cílem Google navíc není výzkum jazyka, ale byznys. Běžný pisatel Wikipedie musí zvládnout např. kód. Myslím, že není důvod dělat z wikipedistů hlupáky. Kdo chce prosadit přejmenování nějakého města, může se na wiki ČNK dozvědět vše potřebné.--Eleiodromos (diskuse) 17. 11. 2018, 20:16 (CET)
- Wikipedisté však pro prosazení přejmenování v první řadě vůbec nebudou zkoušet korpus, ale právě Google test. Máme to na Wikipedii i v pravidlech a doporučeních. Umí skloňování slov velmi dobře. A také dokáže dát alespoň trochu pohled na věc, i když zahrnuje i výsledky z nedůvěryhodných zdrojů a výsledky z osobních blogísků apod. Tady však nejde o to, že by chtěl někdo prosadit jedno přejmenování, tady jde o hledání plošného konsensu, kterým by se řídili všichni u všech obcí bez rozdílu a většina z nás smrtelníků vážně nebude tápat, jak sepsat dotaz na korpus, než vytvoří článek. Každé dítě ze základní školy by mělo být schopné na základě jednoduchého pravidla říct, zda se bude článek na Wikipedii jmenovat tak či onak. Teď mi řekněte, kolik lidí by před napsáním článku chtělo pročítat wiki korpusu a přemýšlet, jak zadat do korpusu dotaz. Nikdo. Máte-li nějaký jiný nápad než mnou navržené 2NNVZ, protože nic lepšího zatím v diskusi asi nepadlo (i když je fakt, že jsem ji neměl čas číst celou), sem s ním. --Dvorapa (diskuse) 17. 11. 2018, 20:45 (CET)
- Exonyma jsou problematikou lingvistickou. S tím skloňováním mimochodem nemáte pravdu. Lingvisté zdůrazňují, že vyhledávání v Google má zcela jiné parametry.[1] Obecně uznávaný je diachronní korpus vytvořený z Googlebooks: Google Ngram Viewer, který ovšem dosud nemá českou verzi.[2] Chorvatská lingvistka Pavlina Krešimir se ve svém článku Using Google Search Engine for Word Frequency Analysis pokouší porovnat výsledky běžného vyhledávání chorvatských slov ve vyhledávači Google s hledáním v chorvatských korpusech. Dochází při tom k závěru, že mezi výsledky existuje určitá korelace.[3] Nic víc. Metoda korpusu je tedy podle názoru současné lingvistiky tím nejlepším řešením.--Eleiodromos (diskuse) 17. 11. 2018, 21:00 (CET)
- Úplně z jiného pohledu: Nutnost se někde zaregistrovat mi přijde ohrožením anonymity / pseudonymity editorů a z tohohle hlediska by se mi pravidlo něco takového vyžadující pro plnohodnotnou účast na diskusi hodně nelíbilo.--Tchoř (diskuse) 17. 11. 2018, 21:19 (CET)
- Žijeme v době, kdy na nás Google a Facebook vědí vše a kdy je možné kohokoliv odpálit raketou na základě údajů z chytrého telefonu. Projevovat v takové situaci krajní nedůvěru aplikaci Ústavu Českého národního korpusu mi přijde přehnané. Registrace je soukromou věcí každého případného uživatele, jsem přesvědčen, že ČNK nikoho nepráskne.--Eleiodromos (diskuse) 17. 11. 2018, 21:34 (CET)
- Problém je, že jako Wikipedie nemůžeme uživatele nutit se zaregistrovat do korpusu, jen kvůli našim pravidlům (dobrý poznatek Tchoři). --Dvorapa (diskuse) 17. 11. 2018, 22:45 (CET)
- Ale k tomu, abych se registroval u Facebooku či Googlu mne naštěstí Wikipedie nijak nenutí. A já vykládám poměrně značné úsilí na to, aby o mne věděli co nejméně. Nehledě k tomu, že tradičně je pro člověka problém narušení soukromí spíš lidmi geograficky bližšími, kteří jej mohou potkat i v jiné roli, než někým vzdáleným.--Tchoř (diskuse) 17. 11. 2018, 22:46 (CET)
- Přirovnal bych to asi k tomu, že Wikipedie nemůže nutit wikipedisty, aby se zaregistrovali v nejrůznějších knihovnách. Jenže z pouhého gůglení (které se Vás samozřejmě netýká) se encyklopedie dělat nedá.--Eleiodromos (diskuse) 17. 11. 2018, 22:52 (CET)
- @Tchoř: Nutno zdůraznit, že registrace kdekoliv jinde, ať už jde o sociální síť nebo o aplikaci ČNK, nijak nenarušuje anonymitu či pseudonymitu wikipedisty, jenžto mezi těmito účty není žádné propojení. --YjM | dp 18. 11. 2018, 18:57 (CET)
- Registrace minimálně, ovšem využití podstatně. V situaci, kdy na základě diskuse na Wikipedii začne zčistajasna deset uživatelů veřejně debatovat ve Wikipedii nad nějakým exonymem a zároveň hledat v korpusu všechny jeho možné varianty, přičemž sedm z nich se se svým občanským jménem na Wikipedii netají, takže lze jejich účty spárovat okamžitě, tak těm zbylým třem už moc té anonymity nezbyde.--Tchoř (diskuse) 19. 11. 2018, 04:38 (CET)
- Žijeme v době, kdy na nás Google a Facebook vědí vše a kdy je možné kohokoliv odpálit raketou na základě údajů z chytrého telefonu. Projevovat v takové situaci krajní nedůvěru aplikaci Ústavu Českého národního korpusu mi přijde přehnané. Registrace je soukromou věcí každého případného uživatele, jsem přesvědčen, že ČNK nikoho nepráskne.--Eleiodromos (diskuse) 17. 11. 2018, 21:34 (CET)
- Úplně z jiného pohledu: Nutnost se někde zaregistrovat mi přijde ohrožením anonymity / pseudonymity editorů a z tohohle hlediska by se mi pravidlo něco takového vyžadující pro plnohodnotnou účast na diskusi hodně nelíbilo.--Tchoř (diskuse) 17. 11. 2018, 21:19 (CET)
- Exonyma jsou problematikou lingvistickou. S tím skloňováním mimochodem nemáte pravdu. Lingvisté zdůrazňují, že vyhledávání v Google má zcela jiné parametry.[1] Obecně uznávaný je diachronní korpus vytvořený z Googlebooks: Google Ngram Viewer, který ovšem dosud nemá českou verzi.[2] Chorvatská lingvistka Pavlina Krešimir se ve svém článku Using Google Search Engine for Word Frequency Analysis pokouší porovnat výsledky běžného vyhledávání chorvatských slov ve vyhledávači Google s hledáním v chorvatských korpusech. Dochází při tom k závěru, že mezi výsledky existuje určitá korelace.[3] Nic víc. Metoda korpusu je tedy podle názoru současné lingvistiky tím nejlepším řešením.--Eleiodromos (diskuse) 17. 11. 2018, 21:00 (CET)
- Wikipedisté však pro prosazení přejmenování v první řadě vůbec nebudou zkoušet korpus, ale právě Google test. Máme to na Wikipedii i v pravidlech a doporučeních. Umí skloňování slov velmi dobře. A také dokáže dát alespoň trochu pohled na věc, i když zahrnuje i výsledky z nedůvěryhodných zdrojů a výsledky z osobních blogísků apod. Tady však nejde o to, že by chtěl někdo prosadit jedno přejmenování, tady jde o hledání plošného konsensu, kterým by se řídili všichni u všech obcí bez rozdílu a většina z nás smrtelníků vážně nebude tápat, jak sepsat dotaz na korpus, než vytvoří článek. Každé dítě ze základní školy by mělo být schopné na základě jednoduchého pravidla říct, zda se bude článek na Wikipedii jmenovat tak či onak. Teď mi řekněte, kolik lidí by před napsáním článku chtělo pročítat wiki korpusu a přemýšlet, jak zadat do korpusu dotaz. Nikdo. Máte-li nějaký jiný nápad než mnou navržené 2NNVZ, protože nic lepšího zatím v diskusi asi nepadlo (i když je fakt, že jsem ji neměl čas číst celou), sem s ním. --Dvorapa (diskuse) 17. 11. 2018, 20:45 (CET)
- Pro plnohodnotné používání ČNK je třeba se do něj nejprve zaregistrovat. Je to totiž projekt chráněný autorskými právy. Pro stanovení výskytu "německý Cvikov" a "saský Cvikov" jsem použil pokročilejší vyhledávání vzhledem k tomu, že Cvikovy jsou dva. Návod najdete zde. Tzv. gůgltest je naprosto něco jiného, Google stavěný pro angličtinu např. neumí zahrnout skloňované tvary daného slova. Cílem Google navíc není výzkum jazyka, ale byznys. Běžný pisatel Wikipedie musí zvládnout např. kód. Myslím, že není důvod dělat z wikipedistů hlupáky. Kdo chce prosadit přejmenování nějakého města, může se na wiki ČNK dozvědět vše potřebné.--Eleiodromos (diskuse) 17. 11. 2018, 20:16 (CET)
- On je právě nespisovný třeba jenom proto, že ÚJČ o daném názvu třeba ani moc neví a přitom se třebas používá v celém východočeském kraji. Nicméně já bych právě dal přednost místnímu názvu než tomu, co nějací pražáci píšící do celonárodních novin vyčetli z Google map a myslí si, že to tak má být. Krom toho také záleží, jak v tom korpusu hledáte, zkoušel jsem si nyní vyhledat Kudowa-Zdrój x Lázně Chudoba a dospěl jsem k závěru 0,01 x 0. Ovšem pod slovem Chudoba jsou stovky různých jmen lidí a rostlin a produktů a kdovíčeho, čili kdo ví, jak to vlastně je (nemám čas projít všech 6000 výskytů slova Chudoba)? Stejně tak by mě zajímalo, jak jste procházel všech 7000 výskytů slova Cvikov a polemizoval, zda daný text pojednává o saském nebo lužickém městě. Jen z prvních 20, které mi to dalo, to je cca půl na půl. A to není jen problém korpusu, to i problém Google testu a myslím si, že tyto metody nám bohužel u takovýchto případů nepomohou. Já věřím, že ty pokročilé funkce korpusu to umí vyfiltrovat a také věřím, že existují lidé, kteří to umí perfektně ovládat a dokáží mně, neznalému člověku rychle vypsat, jak to s těmi Cvikovy nebo Chudobou vlastně je. Ovšem běžný pisatel Wikipedie tyto složité vyhledávací mechanismy nezná a na první dobrou dopadne jako já s mými pokusy. Z mého pohledu to je, jako kdybyste na základní škole doporučoval dětem vypočítat hmotnost kuličky pomocí kvantové fyziky (trochu přeháním). Jistěže to funguje spolehlivě, ale v testu vám ty děcka dosvědčí, že kvantovce nemají šanci moc rozumět. Raději bych tedy opravdu apeloval na nějaký jednodušší přístup s tím, že pokud bude název navíc doložený šikovně vyhledanými klíčovými slovy v korpusu, pak jen lépe. (myslím, že už se oba opakujeme, tak toho prozatím nechme a počkejme ještě, co si myslí/co vymyslí ostatní). --Dvorapa (diskuse) 17. 11. 2018, 19:57 (CET)
- Na Český národní korpus není třeba aplikovat nějaký vzorec, metoda zjištění relativní frekvence výskytu jevu v jazyce je stejně intuitivní jako používání Google. Šlo by jen o tu případnou hranici, kdy název je nebo není zažitý. Pokud jde o zastoupení regionálních deníků, tak vězte, že v korpusu "syn verze 6" zaujímají deníky Bohemia a Moravia polovinu z celkového množství, viz graf. Jazyk encyklopedie by měl odpovídat publicistickým standardům, nikoliv nějakému místnímu nespisovnému nářečí. Kladsko má v "syn verze 6" relativní frekvenci 0.43 (Kłodzko 0.02), to je řádově výše než 0,02 "saského Cvikova".--Eleiodromos (diskuse) 17. 11. 2018, 19:12 (CET)
- Přesně to by použití korpusu řešilo. Jsou zde totiž významně zastoupeny regionální deníky, které odrážejí místní specifika publicistického stylu. Když má být ovšem podle pravidla něco "zažité jako Londýn, Vídeň, Řezno", tak by tomu měli rozumět čtenáři ze všech koutů ČR. Originálním názvem se potom nic nezkazí.--Eleiodromos (diskuse) 17. 11. 2018, 13:26 (CET)
- K jakým by mohlo dojít následkům? Proč by měla být favorizována první skupina? Ono u těch textů hlavně záleží, kdo je jejich autor. A často se setkávám s tím, že místní/Češi žijící v pohraničí říkají obci česky (viz Cvikov, Chudoba, Kladsko, Jelení Hora), zatímco drtivá většina Čechů mimo východočeský kraj tomu budou říkat cizojazyčně (Zwickau, Kudowa, Klłodzko, Jelenia Góra). Jenže v takovou chvíli váš systém selhává, protože přestože se obci říká běžně Česky, lidé z druhé strany republiky o tom neví. --Dvorapa (diskuse) 17. 11. 2018, 13:10 (CET)
- Z nedávné doby mohou pocházet 2NNVZ, které jedné straně ("saský Cvikov") dodají argumenty. Jiné 2NNVZ z nedávné doby však mohou dodat také jejich názoroví oponenti ("saský Zwickau"). Proč by měla být favorizována první skupina, když "saský Zwickau" má v českých textech větší frekvenci? Takový postup by o skutečném užívání obou názvů v reálném světě nic nevypovídal a vedl by k následkům, které jsem uvedl výše.--Eleiodromos (diskuse) 17. 11. 2018, 12:55 (CET)
- Nemohou, když říkám, že musí být z nedávné doby. A také nevím, proč by protistrana sporu chtěla dodávat 2NNVZ vyvracející svůj názor (PS: přečtěte si pořádně, co říkám, zdá se mi, že mi vůbec nerozumíte). --Dvorapa (diskuse) 17. 11. 2018, 12:24 (CET)
- 2NNVZ mohou bez problémů dodat obě strany sporu. Následkem by byla záplava absurdních archaismů, které by zdejší slavjanofilská lobby mohla hravě a bez jakékoliv míry prosazovat. Např. Seina by mohla být tímto způsobem přejmenována na staročeský název Sekvana apod. Tyto mrtvé názvy by pak byly ve zjevném rozporu s pravidlem očekávatelnosti.--Eleiodromos (diskuse) 17. 11. 2018, 12:21 (CET)
- Jak už jsem řekl, příliš složité na běžného wikipedistu. 2NNVZ z nedávné doby zmiňující český název by mohla být mnohem jednodušší a přesto efektivní a nesporná možnost. --Dvorapa (diskuse) 17. 11. 2018, 11:58 (CET)
- Tento systém jsem si nevymyslel já. Používá se úspěšně na dewiki a předchází se tak zbytečným sporům. Každý má svůj individuální jazykový cit, nebo zkušenost s místními názvy v rámci regionu. Tohle je ale spravedlivý způsob, jak řešit stávající chaos. Jak jsem již uvedl, když někdo najde 32 výskytů "saského Cvikova" v českých textech, není problém najít stejných 32 výskytů "saského Zwickau" v českých textech. Je to tedy opět patová situace. Texty v jazykovém korpusu "Syn verze 6" pocházejí z let 2010–2016. Odrážejí tedy současnou podobu české publicistiky. "Zažitost", o které mluví pravidlo, tak lze číselně vyjádřit a v případě sporu porovnat.--Eleiodromos (diskuse) 17. 11. 2018, 11:48 (CET)
- @Dvorapa: Nechci posuzovat, zda je registrace a vyhledávání v ČNK „příliš složité na běžného českého wikipedistu“, ale troufám si tvrdit, že běžný český wikipedista by ani potenciálním zavedením nového pravidla nic takové nepotřeboval – českých exonym totiž existuje konečně mnoho a už samotný Seznam českých exonym naznačuje, že nejde o nějaké ohromné číslo. Validitu všech českých exonym proti tomuto pravidlu by stačilo poměřit pouze jednou (resp. periodicky při vydání nové verze korpusu), hromadně. Nehledě na to, že velká část článků, kterých se problém týká, je již pod nějakým názvem založených. Tj. wikipedista, který by chtěl založit nový článek o městě s „problematickým“ názvem už tolik možností nemá. --YjM | dp 18. 11. 2018, 18:57 (CET)
- Pokud to stačí provést jen jednou (za čas), pak bych doporučil místo dlouhých nesmyslných hádek zde tuto věc provést a vypsat někam třeba pod lípu seznam článků, které se jmenují počeštěně a asi by neměly + seznam článků, které se počeštěně nejmenují a asi by měly. Projdeme to, zjistíme konkrétně, jak moc se dá výsledkům z korpusu/sče věřit (věřím, že by bylo na první pohled zřejmé, že to je dobrá věc nebo to produkuje blbosti) a provedeme přejmenování (případně vymyslíme strategii přejmenování, pokud bude konflikt jako u Cvikovů). --Dvorapa (diskuse) 18. 11. 2018, 19:40 (CET)
- Kvalitní myšlenka, všema deseti pro. Chrzwzcz (diskuse) 18. 11. 2018, 19:56 (CET)
- Pořád nějak nechápu, proč bychom měli místo standardních testů v tématických zdrojích + google testu zavádět test korpusem. Korpus obsahuje jen výběr textů, například co se týče textů zmiňujících německé pohraničí nebude obsahovat pravděpodobně ani desetinu existujících textů. To z něj dělá pro tento účel naprosto nevypovídající zdroj. Tak proč se vám tak líbí? Jen proto, že je teoreticky nejobsáhlejším zdrojem, abychom si zjednodušili analýzu a prostě mrkli na jeden zdroj místo projíždění mnoha článků? Jenže tím se naprosto vzdálíme od reality do nějakého absurdního teoretického abstraktna. Uvědomte si, že ze 32 skutečných reálných zdrojů, které píší o Cvikově, jich korpus obsahuje pouze 5. Je to statisticky zcela nedostatečné. --Palu (diskuse) 18. 11. 2018, 21:00 (CET)
- Pokud to stačí provést jen jednou (za čas), pak bych doporučil místo dlouhých nesmyslných hádek zde tuto věc provést a vypsat někam třeba pod lípu seznam článků, které se jmenují počeštěně a asi by neměly + seznam článků, které se počeštěně nejmenují a asi by měly. Projdeme to, zjistíme konkrétně, jak moc se dá výsledkům z korpusu/sče věřit (věřím, že by bylo na první pohled zřejmé, že to je dobrá věc nebo to produkuje blbosti) a provedeme přejmenování (případně vymyslíme strategii přejmenování, pokud bude konflikt jako u Cvikovů). --Dvorapa (diskuse) 18. 11. 2018, 19:40 (CET)
- Stávající pravidlo stanovuje "zažitost jako Londýn, Vídeň, Řezno". Není problém s pomocí Českého národního korpusu stanovit průměrnou relativní frekvenci z těchto tří měst, tu případně snížit na polovinu, aby nebyla favorizována větší města, případně, aby se vyšlo vstříc těm, kteří zde dávají přednost českým exonymům. Takto stanovená relativní frekvence v ČNK by potom mohla sloužit k rozhodování podobných sporů o názvy obcí. Co by bylo pod tuto hranici, to by zůstalo pod originálním názvem v němčině, polštině atd.--Eleiodromos (diskuse) 16. 11. 2018, 21:09 (CET)
- Ono je na tom nejvíce krkolomné, že těch případů, kde to je pokaždé jinak bychom mohli nacházet stovky. Zde se přeme o dvě města, vy jste vyjmenoval nyní další dvě obce, já vyjmenoval výše dalších šest a pokud bych z těchto desíti obcí chtěl učinit nějaký závěr, jak se to běžně dělá, tak to nejde, prostě si to každý dělá jak chce. Proto by nemělo být podstatné, co se líbí mně nebo vám, ale co očekávají čtenáři a ideálně to standardizovat napříč Wikipedií. Řešení Mnichova rozhodně zakládá na dominanci 1,5 mil. města proti 400 obyvatelům vesnice. Jenže u Cvikova tak jasně dominanci rozhodnout nelze, obě města jsou spádová pro přilehlé vesnice, rozdíl ve velikosti sice je, ale co do významu už tak moc ne. Proto pokud přejmenovat, tak ale přidělit rozlišovač oběma. V tom případě ale přejmenovat i Jelení Horu, Chudobu nebo Valbřich. Anebo to ponechat jak to je. Ovšem poté by bylo vhodné přejmenovat i Štětín, Svídnici, Žitavu nebo oba Mnichovy. Jednoznačně si myslím, že to není problém jen těchto dvou měst, bylo by dobré už tento stále problematický jev konečně globálně vyřešit a poté se jasným a přesným zněním pravidla/konsensu ohánět jak bičem. --Dvorapa (diskuse) 16. 11. 2018, 20:45 (CET)
Je směšné, že tady chce jazykovou revoluci dělat někdo, kdo ani neovládá české skloňování řeckých jmen.--Eleiodromos (diskuse) 16. 11. 2018, 12:26 (CET)
- „Nebuďte jedovatí – pokud to bezprostředně nesouvisí s probíraným tématem, nevyčítejte svému názorovému odpůrci například formální úpravu jeho diskusního příspěvku či jiné, pro spor nepodstatné věci.“ To jenom cituju Wikipedie:Wikietiketa, jestli článek přejmenujete nebo ne, to je mi samozřejmě úplně egál.--Hnetubud (diskuse) 16. 11. 2018, 13:38 (CET)
Seznam českých exonym pro německá toponyma, Seznam českých exonym - zkuste si z toho vydedukovat, jak to tedy je teď a jak to ladí s pravidlem. Jsou tam tři typy - jména historická už nepoužívaná (jméno české je kurzívou, původní jméno je modré), jména sice současná ale ne tak moc užívaná (jméno české je normálně, původní jméno je modré), a jména používaná a wikipedií podporovaná (jméno české je modré, původní je normální). Za mě: Ne že by se česká jména měla úplně upřednostňovat stůj co stůj, ale zas bych po nich nevyžadoval více než 50%, to si vykládám pod "zažité". Z článků snad bude vidět, co je a není zažitost. Chrzwzcz (diskuse) 16. 11. 2018, 19:08 (CET)
- 50 % čeho?--Eleiodromos (diskuse) 16. 11. 2018, 19:19 (CET)
- 100 * Cvikov / (Cvikov + Zwickau). V korpusu nebo jakkoliv jinak chcete měřit.Chrzwzcz (diskuse)
- Nechápu. Když někdo najde 32 výskytů "saského Cvikova", není problém najít v českých publicistických textech stejných 32 výskytů "saského města Zwickau".--Eleiodromos (diskuse) 16. 11. 2018, 22:12 (CET)
- Nechápu co nechápete, jednoznačněji než matematickým vzorcem to snad už napsat nejde. Cvikov = počet výskytů Cvikova, Zwickau = počet výskytů Zwickauů. Vyřízeno. 32 tam nikde nevystupuje, nemotat ji tam. Chrzwzcz (diskuse) 16. 11. 2018, 22:18 (CET)
- Absolutní frekvenci/počet obou názvů v reálném světě změřit nelze. Měřit se dá pouze v korpusu, přičemž rozhodující není počet jednotlivých výskytů, ale relativní frekvence. Není mi jasné, čeho se tím Vaším vzorcem lze dopočítat. Podle mého názoru nemá smysl vymýšlet tady něco, co už je matematickými lingvisty dávno vymyšleno.--Eleiodromos (diskuse) 16. 11. 2018, 22:38 (CET)
- Bojuje proti sobě Zwickau a Cvikov. Můj vzorec (a těžko si budu dávat copyright na vzorec pro poměr) vypočítá třeba že z 51 % používají zdroje Cvikov (a nepřekvapivě 49 % Zwickau). Pak není co řešit. A já tvrdím, že českým názvům by se přece jen mohlo trochu nadržovat i když jsou někde nehluboko pod 50 %. Chrzwzcz (diskuse) 16. 11. 2018, 22:59 (CET)
- Jak ale chcete všechny ty jednotlivé výskyty napočítat? To je zhola nemožné. I já jsem českým exonymům ochoten nadržovat slevením relativní frekvence (průměr z relativní frekvence názvů "Londýn, Vídeň, Řezno") na polovic. Viz výše. Navrhuji tak něco, co se dá měřením v Českém národním korpusu snadno realizovat. Vy chcete patrně spočítat všechny výskyty v reálném světě, což nelze.--Eleiodromos (diskuse) 16. 11. 2018, 23:28 (CET)
- Co navrhuje Chrzwzcz je vzít si třeba Mladou Frontu a porovnat výskyty. Nebo to udělat s encyklopediemi o Německu apod. V podstatě přijímá vaší teorii o frekvenčním poměřování s tím, že pro Cvikov nemusí být nadpoloviční většina, abychom ho použili. Jen se neomezuje na korpus.cz, který je sestaven jen z některých textů a jehož výběr tak není dostatečně reprezentativní. Místo toho chce prozkoumat reálné prostředí, kde se o Cvikovu píše. --Palu (diskuse) 17. 11. 2018, 07:58 (CET)
- Vy si tomu říkejte poloviční relativní frekvence, já tomu budu říkat poměr 33:66 a půjde o totéž. V odkazech výše by se dalo zkoumat, jestli Wikipedie už teď nenadržuje českým exonymům ještě víc. Chrzwzcz (diskuse) 17. 11. 2018, 08:01 (CET)
- O totéž právě vůbec nejde. Nejprve je třeba si ujasnit, zda počítat jablka nebo hrušky.--Eleiodromos (diskuse) 17. 11. 2018, 10:21 (CET)
- Korpus "SYN verze 6", který navrhuji použít jako nástroj měření, zahrnuje korpusy SYN2000, SYN2005, SYN2006PUB, SYN2009PUB, SYN2010, SYN2013PUB a SYN2015; kromě nich se skládá také z publicistiky z let 2010–2015, která je již součástí korpusů SYN verze 4 a verze 5, a také z dosud nezveřejněné publicistiky z roku 2016 v objemu téměř 200 mil. slov. O složení jeho publicistické části si můžete udělat představu zde.--Eleiodromos (diskuse) 17. 11. 2018, 08:49 (CET)
- Jak ale chcete všechny ty jednotlivé výskyty napočítat? To je zhola nemožné. I já jsem českým exonymům ochoten nadržovat slevením relativní frekvence (průměr z relativní frekvence názvů "Londýn, Vídeň, Řezno") na polovic. Viz výše. Navrhuji tak něco, co se dá měřením v Českém národním korpusu snadno realizovat. Vy chcete patrně spočítat všechny výskyty v reálném světě, což nelze.--Eleiodromos (diskuse) 16. 11. 2018, 23:28 (CET)
- Bojuje proti sobě Zwickau a Cvikov. Můj vzorec (a těžko si budu dávat copyright na vzorec pro poměr) vypočítá třeba že z 51 % používají zdroje Cvikov (a nepřekvapivě 49 % Zwickau). Pak není co řešit. A já tvrdím, že českým názvům by se přece jen mohlo trochu nadržovat i když jsou někde nehluboko pod 50 %. Chrzwzcz (diskuse) 16. 11. 2018, 22:59 (CET)
- Absolutní frekvenci/počet obou názvů v reálném světě změřit nelze. Měřit se dá pouze v korpusu, přičemž rozhodující není počet jednotlivých výskytů, ale relativní frekvence. Není mi jasné, čeho se tím Vaším vzorcem lze dopočítat. Podle mého názoru nemá smysl vymýšlet tady něco, co už je matematickými lingvisty dávno vymyšleno.--Eleiodromos (diskuse) 16. 11. 2018, 22:38 (CET)
- Nechápu co nechápete, jednoznačněji než matematickým vzorcem to snad už napsat nejde. Cvikov = počet výskytů Cvikova, Zwickau = počet výskytů Zwickauů. Vyřízeno. 32 tam nikde nevystupuje, nemotat ji tam. Chrzwzcz (diskuse) 16. 11. 2018, 22:18 (CET)
- Nechápu. Když někdo najde 32 výskytů "saského Cvikova", není problém najít v českých publicistických textech stejných 32 výskytů "saského města Zwickau".--Eleiodromos (diskuse) 16. 11. 2018, 22:12 (CET)
- 100 * Cvikov / (Cvikov + Zwickau). V korpusu nebo jakkoliv jinak chcete měřit.Chrzwzcz (diskuse)
Ad debata Chrzwzcz-Eleiodromos, pro Eleiodromose: Chrzwzcz říká, že při výběru ze dvou možností máme zjistit, jak často se užívají, a české exonymum užít, pokud je používané aspoň dejmetomu cca ve 40 procentech případů. Obvykle se používanost zjišťuje google testem, vy navrhujete použít korpus, v tom není problém. Postup vyhovující vám oběma by pak zněl: České exonymum se použije, pokud jeho relativní četnost v korpusu není výrazně nižší než relativní četnost cizojazyčného názvu. Například je-li relativní četnost originálního jména 0.31, pak by české exonymum mělo nárok na použití pouze pokud by jeho relativní četnost byla 0.20 a výše. (Což asi Cvikov nedá. I když jestli jsem pochopil způsob jakým jste pracoval s korpusem, tak jste našel výskyty typu "německý Cvikov" ve všech pádech; ale nikoliv případy typu "Cvikov (Německo)" ani případy kde jsou "Cvikov" a "německý" od sebe více vzdálené.) (Pro pochopení použité matematiky: je-li relativní četnost cizího jména 0.30/0.60/3/12, má české exonymum být použito, má-li relativní četnost aspoň 0.20/0.40/2/8.) --Jann (diskuse) 17. 11. 2018, 22:20 (CET)
- Já samozřejmě nejsem proti tomu, aby byl název, který se v české publicistice moc neobjevuje vzhledem ke své okrajovosti, např. Lubáň, upřednostněn proti téměř stejně frekventovanému názvu Lubań. V tom jsem dal Paluovi za pravdu a proti přesunu jsem jako hlavní autor tohoto článku nic nenamítal. Je to jen otázka nastavení určité hranice relativní frekvence, popř. porovnání obou názvů. Máte pravdu v tom, že jsem při testování "německého či saského Cvikova" nezohlednil výskyt typu "Cvikov AND Německo". Zatím jsem totiž nenašel způsob, jak tento problém řešit, protože na ČNK fungují operátory AND a OR mnohem přesněji. To ale není problém podle situace lépe vychytat. Ve Vašem vysvětlení mi není jasné, k čemu se vztahují jednotlivé hodnoty za lomítky, ale jak jsem řekl, hranice "zažitosti", která by byla k českým názvům vstřícná, může být předmětem další diskuse.--Eleiodromos (diskuse) 17. 11. 2018, 22:38 (CET)
- Spíš říkám: najděte si na stránkách Seznam českých exonym pro německá toponyma, Seznam českých exonym taková 2 3 4 česká exonyma, na jejichž užití byste si ani netipli a přesto se na české Wiki nezpochybněně drží. U nich přeměřte procenta, nebo i váhu zdrojů, a třeba to bude hluboko pod 40 %. Pokud bude Cvikov vykazovat podobných čísel jako ten výběr nečekaných názvů, má právo na Wiki být (druhý přístup je přejmenovat na původní názvy ty 2 3 4 neuvěřitelné případy :)) Chrzwzcz (diskuse) 18. 11. 2018, 14:47 (CET)
- Stránky na Wikipedii by neměly být kriteriem pro debatu o exonymech. To je čistě lingvistická problematika a záležitost zdrojů samotných. To, co navrhujete, připomíná věštění z kávové sedliny. Pokud jde o poměřování, jak říkáte "váhy zdrojů", to by bylo ještě spornější.--Eleiodromos (diskuse) 18. 11. 2018, 15:10 (CET)
- Jaké věštění, co to zase píšete? Wikipedie má pravidlo o tom, že se mají používat česká exonyma pokud jsou zažitá. Prohlédnutím stránek s nejméně očekávanými exonymy se jendoduše ukáže, co si pod "zažítá exonyma" česká wikipedie ještě představuje jako absolutní minimum. Váhování zdrojů je naprostý wikistandard, takže to asi nebudu ani dál pokračovat...Chrzwzcz (diskuse) 18. 11. 2018, 16:05 (CET)
- Stránky na Wikipedii by neměly být kriteriem pro debatu o exonymech. To je čistě lingvistická problematika a záležitost zdrojů samotných. To, co navrhujete, připomíná věštění z kávové sedliny. Pokud jde o poměřování, jak říkáte "váhy zdrojů", to by bylo ještě spornější.--Eleiodromos (diskuse) 18. 11. 2018, 15:10 (CET)
Ad Palu: 32 výskytů v různých zdrojích je zažitost, pokud se alternativa vyskytuje také cca v desítkách kusů. Pokud se jméno v českých textech vyskytuje orientačně v desítkách a stovkách tisíc výskytů ([28]) musí alternativa mít k prokázání zažitosti řádově stejnou početnost. Odlišit český a německý Cvikov v googlu i korpusu je ovšem problém, nicméně googl ukazuje že například "německý Cvikov" dost zaostává za "německé Zwickau". PS. A samozřejmě, navrhujete změnu z pokojného stavu, věc není na první pohled jasná, tudíž důkazní břemeno je na vás. --Jann (diskuse) 17. 11. 2018, 22:20 (CET)
- Já jsem v diskusi nepopíral, že Zwickau je požívaný časěji. Mluvil jsem o tom, že název Cvikov je zažitý a měli bychom tedy použít jej dle našeho pravidla. Není to nějaký obskurní staromilecký relikt, nýbrž známé, srozumitelné slovo. Předmětem pravidla není prokazovat, že je nejčetnější, ale to, že je zažité. A to reprezentuje právě široké použítí napříč různými tématy i typy textů, jaké jsou v oněch 32 zdrojích. Mnoho jich je z článků novin, mnoho z knih, snad nejvíce z atomobilových časopisů (ve Cvikově se vyráběly Trabanty a dnes VW) a abych ilustroval, že to není ani nějaký nový výmysl, uvedl jsem i starou literaturu nebo literaturu o historii. Rozhodně nebylo mým cílem dokládat, že je toto exonymum používanější nebo stejně používané (nebo používané ze 40 procent) než endonymum. Je to totiž úplně jiné kritérium než kritérium obsažené v pravidle Města a obce. --Palu (diskuse) 18. 11. 2018, 14:00 (CET)
- "Mnoho, mnoho, nejvíce", ale na přejmenování málo.--Eleiodromos (diskuse) 18. 11. 2018, 14:22 (CET)
- Dobře, můžeme hledat dál. Korpus je k tomu ale nevhodný. Hledejme v reálných encyklopediích, článcích, knihách, poměřujme výskyty. V korpusu ale určitě nehledejte texty o německém příhraničí. Pro studium exonym korpus použít nelze (pakliže nebude sestaven přímo za tímto účelem, což ten vámi citovaný není). --Palu (diskuse) 18. 11. 2018, 15:09 (CET)
- To je pouze váš momentální subjektivní názor, že jazykový korpus je k řešení jazykových problémů nevhodný. Měl byste ho doložit citací lingvistických zdrojů.--Eleiodromos (diskuse) 18. 11. 2018, 15:16 (CET)
- Nikdy jsem nenapsal, že jazykový korpus není vhodný k řešení jazykových problémů. Je to podsouvání absurdního názoru, abyste zpochybnil můj postoj. V této diskusi už asi třetí logický klam. Chcete vyhrát ve při nebo najít pravdu? --Palu (diskuse) 18. 11. 2018, 15:22 (CET)
- Jinými slovy jste řekl totéž: "korpus je k tomu nevhodný", "pro studium exonym korpus použít nelze". To je z hlediska jazykovědy absurdní. Je směšné, že zrovna vy mi po vší té demagogii výše podsouváte, že se tu dopuštím nějakých logických klamů.--Eleiodromos (diskuse) 18. 11. 2018, 15:27 (CET)
- Proč přesně dáváte rovnítko mezi "jazykové problémy" a "studium exonym"? --Palu (diskuse) 18. 11. 2018, 15:30 (CET)
- Exonyma jsou samozřejmě jazykový problém. Ke studiu jazykových problémů se pak používá jazykový korpus.--Eleiodromos (diskuse) 18. 11. 2018, 15:32 (CET)
- Jazykových problémů je mnohem více, než jenom exonyma. K některým lze použít korpus a k jiným ne. Já jsem napsal, proč si myslím, že pro exonyma je korpus nevhodný - neobsahuje vhodný soubor textů. Stejně tak lze těžko pomocí korpusu poměřit přechylovanou anepřechylovanou podobu příjmení, protože zkrátka korpus takové texty neobsahuje. Jestli chcete můj názor zpochybnit nějak inteligentně, doložte, že korpus obsahuje obsáhlou sbírku českých textů o německém pohraničí. Jinak prosím, přečtěte si tuto stránku. --Palu (diskuse) 18. 11. 2018, 15:36 (CET)
- V korpusu "syn verze 6" zaujímají deníky Bohemia a Moravia (tedy včetně pohraničních regionů) polovinu z celkového množství, viz graf. Řekl bych, že se už točíme v kruhu. Vaše momentální subjektivní názory na ČNK mě nezajímají. Půjdu se asi věnovat něčemu smysluplnějšímu...--Eleiodromos (diskuse) 18. 11. 2018, 15:41 (CET)
- Musím říct, že podobné vedení diskuse (váš názor mě nezajímá, je to demagogie, je to subjektivní, apod.) je až nepříjemně agresívní a neumožňuje příliš dobrat se konce debaty, spíše to výsledek blokuje. Poud bych se vrátil k věcné rovině, pak deníky Bohemia a Moravia možná píšou i o německém pohraničí (což ale osobně trochu pochybuju), ale určitě to není reprezentativní vzorek, z kterého můžete seskládat celkový přehled co do šířky typů textů (encyklopedie, noviny, časopisy, běžný web, ...). Skutečně nám pomůže v naší debatě vědět, jestli deníky Bohemia a Moravia používají více Cvikov nebo Zwickau? Já myslím, že pro určení zažitosti tyto deníky nestačí a vzorek je naprosto nevypovídající. --Palu (diskuse) 18. 11. 2018, 15:47 (CET)
- V korpusu "syn verze 6" zaujímají deníky Bohemia a Moravia (tedy včetně pohraničních regionů) polovinu z celkového množství, viz graf. Řekl bych, že se už točíme v kruhu. Vaše momentální subjektivní názory na ČNK mě nezajímají. Půjdu se asi věnovat něčemu smysluplnějšímu...--Eleiodromos (diskuse) 18. 11. 2018, 15:41 (CET)
- Jazykových problémů je mnohem více, než jenom exonyma. K některým lze použít korpus a k jiným ne. Já jsem napsal, proč si myslím, že pro exonyma je korpus nevhodný - neobsahuje vhodný soubor textů. Stejně tak lze těžko pomocí korpusu poměřit přechylovanou anepřechylovanou podobu příjmení, protože zkrátka korpus takové texty neobsahuje. Jestli chcete můj názor zpochybnit nějak inteligentně, doložte, že korpus obsahuje obsáhlou sbírku českých textů o německém pohraničí. Jinak prosím, přečtěte si tuto stránku. --Palu (diskuse) 18. 11. 2018, 15:36 (CET)
- Exonyma jsou samozřejmě jazykový problém. Ke studiu jazykových problémů se pak používá jazykový korpus.--Eleiodromos (diskuse) 18. 11. 2018, 15:32 (CET)
- Proč přesně dáváte rovnítko mezi "jazykové problémy" a "studium exonym"? --Palu (diskuse) 18. 11. 2018, 15:30 (CET)
- Jinými slovy jste řekl totéž: "korpus je k tomu nevhodný", "pro studium exonym korpus použít nelze". To je z hlediska jazykovědy absurdní. Je směšné, že zrovna vy mi po vší té demagogii výše podsouváte, že se tu dopuštím nějakých logických klamů.--Eleiodromos (diskuse) 18. 11. 2018, 15:27 (CET)
- Nikdy jsem nenapsal, že jazykový korpus není vhodný k řešení jazykových problémů. Je to podsouvání absurdního názoru, abyste zpochybnil můj postoj. V této diskusi už asi třetí logický klam. Chcete vyhrát ve při nebo najít pravdu? --Palu (diskuse) 18. 11. 2018, 15:22 (CET)
- To je pouze váš momentální subjektivní názor, že jazykový korpus je k řešení jazykových problémů nevhodný. Měl byste ho doložit citací lingvistických zdrojů.--Eleiodromos (diskuse) 18. 11. 2018, 15:16 (CET)
- Co tak každému diskutujícímui kb a slova vynásobit deseti, a v tomto rozhasu přidat obsah do článků?Komunita se zde neshodne, tak proto zde mlčím.Mirek256
- Dobře, můžeme hledat dál. Korpus je k tomu ale nevhodný. Hledejme v reálných encyklopediích, článcích, knihách, poměřujme výskyty. V korpusu ale určitě nehledejte texty o německém příhraničí. Pro studium exonym korpus použít nelze (pakliže nebude sestaven přímo za tímto účelem, což ten vámi citovaný není). --Palu (diskuse) 18. 11. 2018, 15:09 (CET)
- "Mnoho, mnoho, nejvíce", ale na přejmenování málo.--Eleiodromos (diskuse) 18. 11. 2018, 14:22 (CET)
- ↑ LÜDELING, Anke; EVERT, Stefan; BARONI, Marco. Using Web Data for Linguistic Purposes [online]. 2007 [cit. 2018-05-24]. Dostupné online. (anglicky)
- ↑ FRIGINAL, Eric; WALKER, Marsha; RANDALL, Janet Beth. Exploring mega-corpora:Google Ngram Viewer and the Corpus of Historical American English [online]. 2014 [cit. 2018-05-24]. Dostupné online. (anglicky)
- ↑ KREŠIMIR, Pavlina. Using Google Search Engine for Word Frequency Analysis. Information Technology Interfaces (ITI), Proceedings of the ITI 2012 34th International Conference on. 2012, s. 393-396. ISSN 1334-2762. (anglicky)
Průzkum periodik - Google test
Parametry hledání \ Periodikum |
Cvikov Německo -českolipsko |
Zwickau Německo -českolipsko |
% Cvikov | % Zwickau |
---|---|---|---|---|
iDNES.cz | 308 výskytů | 250 výskytů | 55 % | 45 % |
iHNed.cz | 85 výskytů | 285 výskytů | 23 % | 77 % |
Lidovky.cz | 109 výskytů | 73 výskytů | 60 % | 40 % |
Česká televize | 87 výskytů | 74 výskytů | 54 % | 46 % |
Novinky.cz | 69 výskytů | 67 výskytů | 51 % | 49 % |
Ceskenoviny.cz | 31 výskytů | 13 výskytů | 70 % | 30 % |
Aktuálně.cz | 130 výskytů | 107 výskytů | 55 % | 45 % |
Celkem | 53 % | 47 % |
Eleiodromos opřel shození Cvikova ze stolu tvrzením "Relativní frekvence (odhad pravděpodobnosti výskytu jevu v jazyce krát 1 milion) u toho slovního spojení v největším korpusu ČNK "syn v6" je pouze 0.02.", přitom ale nenapsal, kolik je tento ukazatel relativní frekvence u Zwickau. Logicky předpokládám, že je nepoměrně větší, což bylo důvodem, proč Eleiodromos Cvikov zamítl. Vzhledem k reálným výskytům výše, které dokazují, že Cvikov je nejen zažitý, ale dokonce i používaný častěji než endonymum, lze říct, že Eleiodromosova metoda dokládání exonym/endonym pomocí korpusu je naprosto neprůkazná a nepoužitelná. Snad jsem svá tvrzení z diskuse výše o nesmyslnosti užití korpusu pro tento typ problému na tomto průzkumu dostatečně vysvětlil. Ovšem, google test má také své ohromné problémy, především ve výběru funkčních parametrů pro vyhledávání, ale i tak si troufám tvrdit, že je o mnoho přesnější, jelikož vybíráme ty texty, které se tématu věnují, nikoliv texty "já o voze, ty o koze". --Palu (diskuse) 20. 11. 2018, 19:27 (CET)
- Dík za google test, tak se má argumentovat. Ncméně: Zaprvé Eleiodromos napsal frekvenci Zwickau (.. Název Zwickau má tamtéž relativní frekvenci 0.31.--Eleiodromos (diskuse) 15. 11. 2018, 15:29 (CET) ..). Za druhé, část Cvikovů ve vaší tabulce je český Cvikov - např. u Českých novin jde o 6 případů z těch 31. --Jann (diskuse) 21. 11. 2018, 15:30 (CET)
- Ano, to asi ano. Stejně tak může být teoreticky mezi Zwickau český Cvikov, protože jeho německá varianta je totožná. Nicméně z pohledu zažitosti ztráta pár procent pro Cvikov příliš nezmění. Možná tak z pohledu očekávatelnosti, kde by třeba Cvikov spadl pod 50 procent. Ale ta není u exonym to, co chceme sledovat - konsensem je nadržovat českým exonymům, pakliže nejsou obskurní (jeden z důvodu je kultivovaný jazyk Wikipedie). Jinak druhé relativní frekvence jsem se nevšiml, takže se omlouvám. --Palu (diskuse) 21. 11. 2018, 22:57 (CET)
- Jen připomínám, že v diskusi Oybin byly provedeny testy validity tzv. Google testu, které dopadly následovně:
Toponymum | |
---|---|
Chomutov | 290 |
Chotumov | 90 |
Chomuvot | 10 |
Chovutom | 2 |
(Eleiodromos)
Toponymum | |
---|---|
Praha | 290 |
Prag | 311 |
(Lubor Ferenc)
Název Prag je tedy podle tzv. Google testu na českém internetu používanější než název Praha.--Eleiodromos (diskuse) 21. 11. 2018, 19:41 (CET)
- Ano, Google test má své potíže, je potřeba jednotlivé výsledky kriticky posoudit. Přesto je ale vzhledem k uvedenému nepoměrně přesnější a vhodnější než test korpusem. --Palu (diskuse) 21. 11. 2018, 22:59 (CET)
- Samozřejmě je to nějak divně naklikaný googletest. Přece si nebudeme myslet že na českém internetu se najde jen 290 zmínek o Praze :D Chrzwzcz (diskuse) 22. 11. 2018, 19:08 (CET)
- Přesně tímhle způsobem se v podobných diskusích na české Wikipedii běžně argumentuje.--Eleiodromos (diskuse) 22. 11. 2018, 19:15 (CET)
- Jakým zas? Chrzwzcz (diskuse)
- Apelováním na racionální argumenty, zdravý rozum a elementární logiku, které teoreticky u rozumných lidí přebíjí předsudky. V podobných diskusích nejen na Wikipedii však často předsudky vyhrávají. Myslím však, že by jste se neměl přestat snažit o vedení debaty "přesně tímhle způsobem". --Jann (diskuse) 24. 11. 2018, 22:48 (CET)
- Jakým zas? Chrzwzcz (diskuse)
- Přesně tímhle způsobem se v podobných diskusích na české Wikipedii běžně argumentuje.--Eleiodromos (diskuse) 22. 11. 2018, 19:15 (CET)
Ke google testům: třeba s Prahou - google dá rozumné výsledky takto: Praha (do vyhledávače postě napsat Praha + zaškrtnout volbu "stránky pouze česky") a Prag s poměrem 249 : 7,7 ve prospěch Prahy. Palu dělá tu chybu, že si navíc prokliká až na poslední stránku kterou mu google ukáže, a protože google ukáže vždy jen pár desítek stránek (při deseti heslech na stránce tedy u Prahy/Prag to bylo 29 a 31 stránek výsledků - viz výše) tak mu vždy vyjde číslo kolem dvou tří stovek které jen slabě závisí na reálném počtu použití slova v prostorách internetu. Paluova metoda je jakžtakž použitelná pro slova vyskytující se na internetech v desítkách případů, ale pro města, o kterých se píše tisíckát nebo milionkrát vydává nesmysly. U Prahy evidentní, u Oybinu je však zkreslení také výrazné - srovnejte Ojvín a řádově více Oybin s Paluovými tabulkami. Čili google test použitelný je, avšak musí se současně používat i hlava :-) PS. Korpus má zase jiné problémy, jeho tvůrci evidentně dávají před neutrální vědou přednost vědě politicky a ideologicky angažované, bohužel... --Jann (diskuse) 24. 11. 2018, 22:48 (CET)
- Smím se zeptat, čím máte podložené to smělé tvrzení o politickém a ideologickém profilu ČNK?--Eleiodromos (diskuse) 24. 11. 2018, 22:59 (CET)
- Tvrzením na wiki.korpus.cz: Složení publicistické části korpusu SYN verze 5 pokrývá produkci hlavních celostátních deníků (Mladá fronta DNES, Lidové noviny, Právo, Hospodářské noviny, Blesk, Sport), - pánové zahrnuli mezi "hlavní" všechny celostátní deníky kromě jednoho, všechny kromě jednoho, lišícího se opoziční politickou orientací. Ten je "ne-hlavní". Čím jiným než ideopředsudky tohle rozdělení vysvětlit? Navíc následuje úžasné tvrzení, že deníky s jednotnou celostátní částí doplněnou krajskou regionální přílohou jsou "celostátní deníky", kdežto deníky s jednotnou celostátní částí doplněnou okresní regionální přílohou (Deníky Bohemia) jsou "regionální deníky". Jako sranda dobrý, ale brát takovéhle "vědce" vážně je fakt odvaha. -- Tento příspěvek přidal Jann (diskuse • příspěvky) 25. listopadu 2018, 10.51 (CE(S)T)
- Z celostátních českých deníků chybí AHA!, Šíp a Haló noviny. Jen připomínám, že Ústav Českého národního korpusu je příspěvkovou organizací s omezenými finančními možnostmi. Bylo by např. zajímavé studovat jazyk bulvárních novin. Hlavním cílem ČNK však není zachycení nějaké politické ideologie, ale standardizované češtiny v žánru publicistiky. Vyhledávací managery aplikace KonText, které na rozdíl od Google nejsou určeny pro komerční účely, bych z nějaké politicko-ideologické podjatosti rovněž nepodezíral.--Eleiodromos (diskuse) 25. 11. 2018, 12:28 (CET)
- Podle mě je úplně jedno proč je ČNK nekompletní. Zkrátka nekompletní je. Google test naproti tomu kompletní je alespoň v oblasti digitalizovaných zdrojů dostupných na internetu. --Palu (diskuse) 25. 11. 2018, 12:59 (CET)
- "Alespoň v oblasti digitalizovaných zdrojů dostupných na internetu" je značné a citelné omezení. Český národní korpus, který tak jako každý jiný korpus kdekoli na světě neobsahuje všechny texty daného jazyka, zahrnuje rovněž určitý podíl české odborné literatury. Práce s ním však vyžaduje více pozornosti než pět minut gůglování.--Eleiodromos (diskuse) 25. 11. 2018, 13:12 (CET)
- Proto je vhodné doplnit google test o průzkum dalších relevantních zdrojů v knihovně, pokud je ta šance. Máte pak kompletní přehled na internetu + kompletní přehled ve vámi vybraném souhrnu knih o dané problematice. Použitím ČNK máte přehled z nekompletního souhrnu rozličného typu textů. Taky připomínám, že i google test zahrnuje mnoho tištěné literatury dostupné například na Google knihách, webarchive, apod. --Palu (diskuse) 25. 11. 2018, 13:19 (CET)
- To je jako stavět dům z vepřovek a pak to na ušlapané hlíně zachraňovat betonovou podlahou. Já bych ten dům přece jen raději stavěl z lepšího materiálu.--Eleiodromos (diskuse) 25. 11. 2018, 13:28 (CET)
- V této debatě nám může pomoct jedině objektivní argumentace. Při subjektivním "mě se to zdá nekvalitní" nevím na co vlastně odpovědět. Pokud máte takový pocit, podpořte ho nějakým porovnáním, analýzou, logickým tokem, apod. --Palu (diskuse) 25. 11. 2018, 13:47 (CET)
- Viz literatura,[1][2][3] kterou jsem tu opakovaně argumentoval.--Eleiodromos (diskuse) 25. 11. 2018, 13:52 (CET)
- V této debatě nám může pomoct jedině objektivní argumentace. Při subjektivním "mě se to zdá nekvalitní" nevím na co vlastně odpovědět. Pokud máte takový pocit, podpořte ho nějakým porovnáním, analýzou, logickým tokem, apod. --Palu (diskuse) 25. 11. 2018, 13:47 (CET)
- To je jako stavět dům z vepřovek a pak to na ušlapané hlíně zachraňovat betonovou podlahou. Já bych ten dům přece jen raději stavěl z lepšího materiálu.--Eleiodromos (diskuse) 25. 11. 2018, 13:28 (CET)
- Proto je vhodné doplnit google test o průzkum dalších relevantních zdrojů v knihovně, pokud je ta šance. Máte pak kompletní přehled na internetu + kompletní přehled ve vámi vybraném souhrnu knih o dané problematice. Použitím ČNK máte přehled z nekompletního souhrnu rozličného typu textů. Taky připomínám, že i google test zahrnuje mnoho tištěné literatury dostupné například na Google knihách, webarchive, apod. --Palu (diskuse) 25. 11. 2018, 13:19 (CET)
- "Alespoň v oblasti digitalizovaných zdrojů dostupných na internetu" je značné a citelné omezení. Český národní korpus, který tak jako každý jiný korpus kdekoli na světě neobsahuje všechny texty daného jazyka, zahrnuje rovněž určitý podíl české odborné literatury. Práce s ním však vyžaduje více pozornosti než pět minut gůglování.--Eleiodromos (diskuse) 25. 11. 2018, 13:12 (CET)
- Podle mě je úplně jedno proč je ČNK nekompletní. Zkrátka nekompletní je. Google test naproti tomu kompletní je alespoň v oblasti digitalizovaných zdrojů dostupných na internetu. --Palu (diskuse) 25. 11. 2018, 12:59 (CET)
- Z celostátních českých deníků chybí AHA!, Šíp a Haló noviny. Jen připomínám, že Ústav Českého národního korpusu je příspěvkovou organizací s omezenými finančními možnostmi. Bylo by např. zajímavé studovat jazyk bulvárních novin. Hlavním cílem ČNK však není zachycení nějaké politické ideologie, ale standardizované češtiny v žánru publicistiky. Vyhledávací managery aplikace KonText, které na rozdíl od Google nejsou určeny pro komerční účely, bych z nějaké politicko-ideologické podjatosti rovněž nepodezíral.--Eleiodromos (diskuse) 25. 11. 2018, 12:28 (CET)
- Tvrzením na wiki.korpus.cz: Složení publicistické části korpusu SYN verze 5 pokrývá produkci hlavních celostátních deníků (Mladá fronta DNES, Lidové noviny, Právo, Hospodářské noviny, Blesk, Sport), - pánové zahrnuli mezi "hlavní" všechny celostátní deníky kromě jednoho, všechny kromě jednoho, lišícího se opoziční politickou orientací. Ten je "ne-hlavní". Čím jiným než ideopředsudky tohle rozdělení vysvětlit? Navíc následuje úžasné tvrzení, že deníky s jednotnou celostátní částí doplněnou krajskou regionální přílohou jsou "celostátní deníky", kdežto deníky s jednotnou celostátní částí doplněnou okresní regionální přílohou (Deníky Bohemia) jsou "regionální deníky". Jako sranda dobrý, ale brát takovéhle "vědce" vážně je fakt odvaha. -- Tento příspěvek přidal Jann (diskuse • příspěvky) 25. listopadu 2018, 10.51 (CE(S)T)
- ↑ LÜDELING, Anke; EVERT, Stefan; BARONI, Marco. Using Web Data for Linguistic Purposes [online]. 2007 [cit. 2018-05-24]. Dostupné online. (anglicky)
- ↑ FRIGINAL, Eric; WALKER, Marsha; RANDALL, Janet Beth. Exploring mega-corpora:Google Ngram Viewer and the Corpus of Historical American English [online]. 2014 [cit. 2018-05-24]. Dostupné online. (anglicky)
- ↑ KREŠIMIR, Pavlina. Using Google Search Engine for Word Frequency Analysis. Information Technology Interfaces (ITI), Proceedings of the ITI 2012 34th International Conference on. 2012, s. 393-396. ISSN 1334-2762. (anglicky)
- A kde a čím ta literatura dokazuje, že pro naše účely je google test nepoužitelný, nebo i jen horší než prohledání korpusu? --Jann (diskuse) 5. 12. 2018, 14:54 (CET)
- Ve studii Using Web Data for Linguistic Purposes je do detailů rozebráno, v čem jsou slabiny komerčního vyhledávacího enginu Google (skloňování apod.), pokud je použit pro lingvistické účely. Stačí, když se do toho trochu začtete. To, že jsou např. pro potřeby informatiky (automatické opravy v editorech apod.) používány výhradně tyto výdobytky korpusové lingvistiky, je fakt tak triviální, že ho tu nepotřebuji dokazovat. Přeneseno do prostředí české Wikipedie mi přijde naprosto v pořádku, aby se právě zde používaly ty nejlepší nástroje a metody. Pokud je např. na dewiki problém exonym řešen pomocí korpusu, určitě to není proto, že by nebyli tak chytří jako někteří čeští wikipedisté, kteří v této citlivé otázce argumentují tím, co za pět minut vygůglovali.--Eleiodromos (diskuse) 5. 12. 2018, 15:09 (CET)
- A kde a čím ta literatura dokazuje, že pro naše účely je google test nepoužitelný, nebo i jen horší než prohledání korpusu? --Jann (diskuse) 5. 12. 2018, 14:54 (CET)
- Šíp je od roku 2009 týdeník. ...cílem však není zachycení nějaké politické ideologie, ale standardizované češtiny v žánru publicistiky... - jestli z nebulvárních a polobulvárních deníků považují za "hlavní" všechny kromě jediného opozičního, tak to zvenku vypadá, že jejich pojetí standardizované češtiny má výrazné ideologické rysy, a že váš názor (..zachycení nějaké politické ideologie a utlumení jiné mezi jejich cíle nepatří..) je v rozporu s jejich činy. Omezené zdroje a organizační forma s tím naprosto nesouvisí, ty mohou ovlivnit pouze velikost tvořeného souboru, množství přepisovaných textů, nikoliv jejich výběr (ledaže by "správný" výběr ovlivňoval výši dostupných finančních prostředků). --Jann (diskuse) 30. 11. 2018, 19:37 (CET)
- Předseda komise pro informační zdroje ČNK mi dnes na dotaz, proč nejsou do excerpce zařazeny Haló noviny, odpověděl takto: „nejsem si jistý, jak je to konkrétně u Haló novin, ale obecně se to má tak, že potřebujeme souhlas vydavatele daného periodika se zařazením jeho produkce do ČNK. Bohužel se poměrně často stává, že souhlas nezískáme a musíme tak řadu titulů oželet, i když bychom je jinak -- kvůli dokumentaci jazyka v nich -- rádi měli.“--Eleiodromos (diskuse) 5. 12. 2018, 12:55 (CET)
- Zajímavé, cením si vaší snahy. Nicméně oni píší "hlavní deníky" nikoliv "deníky, jejichž vydavatelé dali souhlas". Takže sdělení se týká jiných médií... Mimochodem, vaše Inteligentní lidský výběr od každého trochu je právě podle přesných metodik zakomponován do ČNK se tak trochu tluče se sdělením, že vybíráno je pouze z těch médií, u kterých mají souhlas vydavatele... google naopak prohledává celý web, ne? --Jann (diskuse) 5. 12. 2018, 14:54 (CET)
- Google prohledává pouze nejnovější povrch webu. Články z důležitých deníků, jako jsou např. Hospodářské noviny, nejsou pro neplatící čtenáře přístupné. Starší články z období posledních dvaceti let jsou často nedostupné. Z odborné literatury je stále digitalizován jen zlomek, u kterého není problém s autorským právem. Vzniká tedy převaha literatury starší a neaktuální. V ČNK naproti tomu naleznete prokomponovanou směs publicistiky od roku 2000, ale také část odborných textů a krásné literatury. Nechybí ani takové záležitosti, jako jsou např. Parlamentní listy. To, že tzv. Google test měří pouze počet momentálně dostupných výskytů na povrchu webu a nikoliv relativní frekvenci (pravidlem Wikipedie požadovanou "zažitost jako Londýn, Vídeň, Řezno"), snad nemusím připomínat.--Eleiodromos (diskuse) 5. 12. 2018, 15:24 (CET)
- Já nějak nechápu, proč se tu pořád hádáme o tom jestli ČNK nebo Google test. Jsou to dvě metody na udělání si obrázku, ani jedna není stoprocentně spolehlivá, každá má svoje mouchy a hlavně - obě ukazují, že Cvikov je zažité české exonymum. Tak proč tu sáhodlouze donekonečna rozebíráme, jestli ČNK je nebo není suprovější než Google test? Připomínám, že začátek této debaty se vedl o přejmenování článku na Cvikov. --Palu (diskuse) 6. 12. 2018, 19:22 (CET)
- ČNK nic takového neukazuje.--Eleiodromos (diskuse) 6. 12. 2018, 19:54 (CET)
- Co to povídáte? Korpus Cvikov zná. --Palu (diskuse) 6. 12. 2018, 20:17 (CET)
- To vaše srovnání má stejnou logiku jako srovnání lidového léčitelství a medicíny. To, že se v ČNK ojediněle vyskytuje německý či saský Cvikov, nic nemění na tom, že jeho relativní frekvence je pouze 0,02.--Eleiodromos (diskuse) 6. 12. 2018, 20:21 (CET)
- Jenže to není to, co nás v této debatě zajímá. Obecně máte pravdu a články na Wikipedii se pojmenovávají na základě relativní frekvence (i když dosud jsme řešili její určení výhradně Google testem, nikoliv ryze lingvistickým ČNK nezkoumajícím jakékoliv další reálie a navíc s méně reprezentativním výběrem textů než má Google). Města mají ale z tohoto pravidla (WP:Očekávatelnost) výjimku (WP:Města a obce) a pojmenovávají se tak, že pakliže má město zažité české exonymum, použije se to. Takže pro tuto debatu není relativní frekvence relevantním ukazatelem. --Palu (diskuse) 6. 12. 2018, 20:30 (CET)
- Abych byl pochopen, uvedu to na příkladu. Cvikov má podle vašich zjištění na ČNK relativní frekvenci 0,02, což znamená 2 výskyty ve 100 milionech slov. Zwickau má 0,31, což znamená 3 výskyty v 10 milionech slov. Podle toho lze určit, že Zwickau je 15x častější variantou než Cvikov. Nelze ale podle toho určit, jestli je to slovo zažité. To lze určit jedině otrockou analýzou zdrojů co do rozsahu, kvality a i relativní četnosti, ale v rámci reprezentativního vzorku. (a další věc pak je, že mi není jasná metodika, jak bylo garantováno, že nedošlo k záměně Zwickau a Cvikov v Čechách) --Palu (diskuse) 6. 12. 2018, 20:41 (CET)
- O reprezentativnosti vzorku, který vyhledá Google, mám vážné pochybnosti. Pokud vás zajímají další informace, představu si můžete udělat v článku Měnící se svět webového vyhledávání. Pokud jde o váš osobní výklad pravidla zažitosti, v tom se asi neshodneme, protože v ČNK jistě najdete např. i slovo čistonosoplena. Pravidlo mluví o "zažitosti jako Londýn, Vídeň, Řezno". Poměřeno relativní frekvencí je to: Londýn (66,15), Vídeň (40,3), Řezno (0,84). Průměrně tedy 35,76. To je podle mého názoru "zažitost", o jaké mluví toto pravidlo, nikoliv 0,02.--Eleiodromos (diskuse) 6. 12. 2018, 20:47 (CET)
- Reprezentativnost vzorku Google je taková, jak si ji nastavíme a Google je rozhodně kompletnější než ČNK, což už tu bylo probíráno. Pokud si myslíte, že 15x méně je automaticky nezažité, pak nechápu na základě čeho si to myslíte. Věřím, že snad ještě horší výsledek získáte u záchod vs. klozet (nebo auto vs. vozidlo, letadlo vs. aeroplán, zip vs. zdrhovadlo, ...) a přesto to neznamená, že klozet není zažité slovo. Je to poměření frekvence, nikoliv zažitosti - nelze mezi to klást rovnítko. Možná má čistonosoplena taky 0,02, i když si to nemyslím (a vy máte v moci na rozdíl ode mě to prozkoumat; možná, že je skutečně tak citovaná jako příklad absurdity obrozenecké slovotvorby, že vylítne ještě výš než Zwickau), ale i kdyby, tak to skutečně nevypovídá nic o její zažitosti. --Palu (diskuse) 6. 12. 2018, 20:58 (CET)
- Určení zažitosti je pro intuici nedostupné a nerealizovatelné. Zapomeňte na svůj individuální jazykový cit poplatný vašemu původu a věku a seznamte se s tvrdými daty. Google je dobrý jen pro první nástřel, nikoliv pro zjištění přesné hodnoty relativní frekvence daného slova.--Eleiodromos (diskuse) 6. 12. 2018, 21:12 (CET)
- I analýza výskytu v rámci typů a rozsahu zdrojů patří mezi tvrdá data, ČNK skutečně není jediným zdrojem tvrdých dat, vzlášť když je nekompletní. Musím trvat na tom, že relativní frekvence slova nijak nesouvisí se zažitostí. Tento ukazatel neumí prokazatelně ukázat ani že slovo je zažité (citování absurdního slova pro pobavení zvýší jeho četnost bez vlivu na jeho nezažitost) ani že je nezažité (nízká frekvence některých slov může být způsobená například užíváním pouze ve spisovné vrstvě jazyka apod.). Už vůbec nemůžete mluvit o nezažitosti na základě patnáctinásobného rozdílu. Musel by být v řádu stovek či tisíců, aby tam byl alespoň nepřímý náznak. --Palu (diskuse) 6. 12. 2018, 21:19 (CET)
- Pokud má exonymum frekvenci 0,02, nezbývá než dát šanci originálnímu názvu. Věřte tomu, že čeština tím neutrpí a přežije to stejně jako současnou nadvládu stupidních anglicismů. Pokud výsledky gůglování považujete za "tvrdá data", potom nechápu, oč se ta korpusová lingvistika vlastně snaží, když je to přece tak jednoduché.--Eleiodromos (diskuse) 6. 12. 2018, 21:26 (CET)
- Ovšem tato vaše odpověď postrádá jakýkoliv odkaz na tvrdá data nebo místní pravidla a prostě jen hrnuje váš osobní postoj. Věřím tomu, že korpusoví lingvisté dokáží ČNK využívat relevantním způsobem a že je korpus velmi důležitým nástrojem pro sledování vývoje jazyka. Věřím, že na základě určité studie, která zahrne také, ale ne jenom výsledky relativních četností, lze stanovit, že nějaké slovo už je nezažité a nepoužívané. Nelze to ale usoudit pouze na základě relativní frekvence, která je sama o sobě jen jedním údajem z mnoha. Je to, jako byste chtěl z frekvence prodeje jídel ve fastfoodu určit, které jídlo není ve společnosti známé. Že se prodá některé jídlo jednou za týden a jiné jednou za minutu ještě neznamená, že to jednou za týden je neznámé. Znamenat to může to, že 1) není chutné, 2) není zdravé, 3) není dostupné, ... atd. A nebo samozřejmě i že není známé, to je vlastně také jedna z těchto mnoha možností. --Palu (diskuse) 6. 12. 2018, 21:37 (CET)
- Bohužel, jediná kvantifikovatelná "zažitost" je relativní frekvence. Nic lepšího není k dispozici. Dál už tuto diskusi není třeba rozmělňovat.--Eleiodromos (diskuse) 6. 12. 2018, 21:45 (CET)
- Ano, tento argument opakujete velmi často, vlastně v každé vaší odpovědi. Jeho mylnost dokazuje třeba i rozpor vašeho závěru o nezažitosti Cvikova například s bakalářskou prací Vývoj a současný stav české exonymie TUL ("více frekventovaná a známá jména") nebo s článkem Cizí zeměpisná jména v českém kontextu v Naší řeči citující vznikající publikaci názvoslovné komise Českého úřadu geografického a kartografického ("exonymum běžně užívané v českém kontextu"). Dále Cvikov běžně použila práce Standardizace jmen sídelních a nesídelních geografických objektů z území mimo Českou republiku ČÚZK, a je tu další spousta použití v soudobé spisovné češtině, jako třeba v tomto sborníku apod. Zkrátka z jednoho údaje ČNK evidentně nejde vypozorovat to, co tvrdíte, že jde. Nebo leda že by byli všichni ostatní letadlo. --Palu (diskuse) 6. 12. 2018, 22:19 (CET)
- Prosimvás, nějaká bakalářka z oboru "Český jazyk a literatura" na TULU, nebo článek z Naší řeči z roku nebreč vám dává zase jen pouhé 3 výskyty, nikoliv "zažitost" a už vůbec ne relativní frekvenci.--Eleiodromos (diskuse) 6. 12. 2018, 22:30 (CET)
- Já tam vidím hodnocení, ne jen výskyty: "více frekventovaná a známá jména", "exonymum běžně užívané v českém kontextu". Myslím, že autorita těchto dvou zdrojů je větší, než vaše interpretace ČNK, která nehledí ani na váhu obsažených zdrojů, ani na četnost v rámci určitých okruhů, zkrátka prostě jen vezmete jedno číslo a to sem s odpuštěním "prdnete" jako že dokládá všechno. Bez jakékoliv hlubší interpretace, bez porozumění, co vlastně to číslo dokládá a ukazuje. --Palu (diskuse) 6. 12. 2018, 22:46 (CET)
- S činností a cíli ČNK, na nichž se nepodílejí bc.-češtináři, ale absolventi matfyz, jste se evidentně ani neseznámil. Proto se s vámi pro dnešek loučím se svým oblíbeným Q.E.D..--Eleiodromos (diskuse) 6. 12. 2018, 22:56 (CET)
- Ono ztotožňovat autoritu ČNK a autoritu toho, kdo z něj získává a interpretuje údaje, je kardinální chybou. O autoritě ČNK jsem neřekl nic špatného. Tvrdím jen, že váš výklad není správný, protože nelze ČNK aplikovat takovým způsobem, jak jej aplikujete. --Palu (diskuse) 6. 12. 2018, 22:59 (CET)
- S činností a cíli ČNK, na nichž se nepodílejí bc.-češtináři, ale absolventi matfyz, jste se evidentně ani neseznámil. Proto se s vámi pro dnešek loučím se svým oblíbeným Q.E.D..--Eleiodromos (diskuse) 6. 12. 2018, 22:56 (CET)
- Já tam vidím hodnocení, ne jen výskyty: "více frekventovaná a známá jména", "exonymum běžně užívané v českém kontextu". Myslím, že autorita těchto dvou zdrojů je větší, než vaše interpretace ČNK, která nehledí ani na váhu obsažených zdrojů, ani na četnost v rámci určitých okruhů, zkrátka prostě jen vezmete jedno číslo a to sem s odpuštěním "prdnete" jako že dokládá všechno. Bez jakékoliv hlubší interpretace, bez porozumění, co vlastně to číslo dokládá a ukazuje. --Palu (diskuse) 6. 12. 2018, 22:46 (CET)
- Prosimvás, nějaká bakalářka z oboru "Český jazyk a literatura" na TULU, nebo článek z Naší řeči z roku nebreč vám dává zase jen pouhé 3 výskyty, nikoliv "zažitost" a už vůbec ne relativní frekvenci.--Eleiodromos (diskuse) 6. 12. 2018, 22:30 (CET)
- Ano, tento argument opakujete velmi často, vlastně v každé vaší odpovědi. Jeho mylnost dokazuje třeba i rozpor vašeho závěru o nezažitosti Cvikova například s bakalářskou prací Vývoj a současný stav české exonymie TUL ("více frekventovaná a známá jména") nebo s článkem Cizí zeměpisná jména v českém kontextu v Naší řeči citující vznikající publikaci názvoslovné komise Českého úřadu geografického a kartografického ("exonymum běžně užívané v českém kontextu"). Dále Cvikov běžně použila práce Standardizace jmen sídelních a nesídelních geografických objektů z území mimo Českou republiku ČÚZK, a je tu další spousta použití v soudobé spisovné češtině, jako třeba v tomto sborníku apod. Zkrátka z jednoho údaje ČNK evidentně nejde vypozorovat to, co tvrdíte, že jde. Nebo leda že by byli všichni ostatní letadlo. --Palu (diskuse) 6. 12. 2018, 22:19 (CET)
- Bohužel, jediná kvantifikovatelná "zažitost" je relativní frekvence. Nic lepšího není k dispozici. Dál už tuto diskusi není třeba rozmělňovat.--Eleiodromos (diskuse) 6. 12. 2018, 21:45 (CET)
- Ovšem tato vaše odpověď postrádá jakýkoliv odkaz na tvrdá data nebo místní pravidla a prostě jen hrnuje váš osobní postoj. Věřím tomu, že korpusoví lingvisté dokáží ČNK využívat relevantním způsobem a že je korpus velmi důležitým nástrojem pro sledování vývoje jazyka. Věřím, že na základě určité studie, která zahrne také, ale ne jenom výsledky relativních četností, lze stanovit, že nějaké slovo už je nezažité a nepoužívané. Nelze to ale usoudit pouze na základě relativní frekvence, která je sama o sobě jen jedním údajem z mnoha. Je to, jako byste chtěl z frekvence prodeje jídel ve fastfoodu určit, které jídlo není ve společnosti známé. Že se prodá některé jídlo jednou za týden a jiné jednou za minutu ještě neznamená, že to jednou za týden je neznámé. Znamenat to může to, že 1) není chutné, 2) není zdravé, 3) není dostupné, ... atd. A nebo samozřejmě i že není známé, to je vlastně také jedna z těchto mnoha možností. --Palu (diskuse) 6. 12. 2018, 21:37 (CET)
- Pokud má exonymum frekvenci 0,02, nezbývá než dát šanci originálnímu názvu. Věřte tomu, že čeština tím neutrpí a přežije to stejně jako současnou nadvládu stupidních anglicismů. Pokud výsledky gůglování považujete za "tvrdá data", potom nechápu, oč se ta korpusová lingvistika vlastně snaží, když je to přece tak jednoduché.--Eleiodromos (diskuse) 6. 12. 2018, 21:26 (CET)
- I analýza výskytu v rámci typů a rozsahu zdrojů patří mezi tvrdá data, ČNK skutečně není jediným zdrojem tvrdých dat, vzlášť když je nekompletní. Musím trvat na tom, že relativní frekvence slova nijak nesouvisí se zažitostí. Tento ukazatel neumí prokazatelně ukázat ani že slovo je zažité (citování absurdního slova pro pobavení zvýší jeho četnost bez vlivu na jeho nezažitost) ani že je nezažité (nízká frekvence některých slov může být způsobená například užíváním pouze ve spisovné vrstvě jazyka apod.). Už vůbec nemůžete mluvit o nezažitosti na základě patnáctinásobného rozdílu. Musel by být v řádu stovek či tisíců, aby tam byl alespoň nepřímý náznak. --Palu (diskuse) 6. 12. 2018, 21:19 (CET)
- Určení zažitosti je pro intuici nedostupné a nerealizovatelné. Zapomeňte na svůj individuální jazykový cit poplatný vašemu původu a věku a seznamte se s tvrdými daty. Google je dobrý jen pro první nástřel, nikoliv pro zjištění přesné hodnoty relativní frekvence daného slova.--Eleiodromos (diskuse) 6. 12. 2018, 21:12 (CET)
- Reprezentativnost vzorku Google je taková, jak si ji nastavíme a Google je rozhodně kompletnější než ČNK, což už tu bylo probíráno. Pokud si myslíte, že 15x méně je automaticky nezažité, pak nechápu na základě čeho si to myslíte. Věřím, že snad ještě horší výsledek získáte u záchod vs. klozet (nebo auto vs. vozidlo, letadlo vs. aeroplán, zip vs. zdrhovadlo, ...) a přesto to neznamená, že klozet není zažité slovo. Je to poměření frekvence, nikoliv zažitosti - nelze mezi to klást rovnítko. Možná má čistonosoplena taky 0,02, i když si to nemyslím (a vy máte v moci na rozdíl ode mě to prozkoumat; možná, že je skutečně tak citovaná jako příklad absurdity obrozenecké slovotvorby, že vylítne ještě výš než Zwickau), ale i kdyby, tak to skutečně nevypovídá nic o její zažitosti. --Palu (diskuse) 6. 12. 2018, 20:58 (CET)
- O reprezentativnosti vzorku, který vyhledá Google, mám vážné pochybnosti. Pokud vás zajímají další informace, představu si můžete udělat v článku Měnící se svět webového vyhledávání. Pokud jde o váš osobní výklad pravidla zažitosti, v tom se asi neshodneme, protože v ČNK jistě najdete např. i slovo čistonosoplena. Pravidlo mluví o "zažitosti jako Londýn, Vídeň, Řezno". Poměřeno relativní frekvencí je to: Londýn (66,15), Vídeň (40,3), Řezno (0,84). Průměrně tedy 35,76. To je podle mého názoru "zažitost", o jaké mluví toto pravidlo, nikoliv 0,02.--Eleiodromos (diskuse) 6. 12. 2018, 20:47 (CET)
- To vaše srovnání má stejnou logiku jako srovnání lidového léčitelství a medicíny. To, že se v ČNK ojediněle vyskytuje německý či saský Cvikov, nic nemění na tom, že jeho relativní frekvence je pouze 0,02.--Eleiodromos (diskuse) 6. 12. 2018, 20:21 (CET)
- Co to povídáte? Korpus Cvikov zná. --Palu (diskuse) 6. 12. 2018, 20:17 (CET)
- ČNK nic takového neukazuje.--Eleiodromos (diskuse) 6. 12. 2018, 19:54 (CET)
- Já nějak nechápu, proč se tu pořád hádáme o tom jestli ČNK nebo Google test. Jsou to dvě metody na udělání si obrázku, ani jedna není stoprocentně spolehlivá, každá má svoje mouchy a hlavně - obě ukazují, že Cvikov je zažité české exonymum. Tak proč tu sáhodlouze donekonečna rozebíráme, jestli ČNK je nebo není suprovější než Google test? Připomínám, že začátek této debaty se vedl o přejmenování článku na Cvikov. --Palu (diskuse) 6. 12. 2018, 19:22 (CET)
- Google prohledává pouze nejnovější povrch webu. Články z důležitých deníků, jako jsou např. Hospodářské noviny, nejsou pro neplatící čtenáře přístupné. Starší články z období posledních dvaceti let jsou často nedostupné. Z odborné literatury je stále digitalizován jen zlomek, u kterého není problém s autorským právem. Vzniká tedy převaha literatury starší a neaktuální. V ČNK naproti tomu naleznete prokomponovanou směs publicistiky od roku 2000, ale také část odborných textů a krásné literatury. Nechybí ani takové záležitosti, jako jsou např. Parlamentní listy. To, že tzv. Google test měří pouze počet momentálně dostupných výskytů na povrchu webu a nikoliv relativní frekvenci (pravidlem Wikipedie požadovanou "zažitost jako Londýn, Vídeň, Řezno"), snad nemusím připomínat.--Eleiodromos (diskuse) 5. 12. 2018, 15:24 (CET)
- Zajímavé, cením si vaší snahy. Nicméně oni píší "hlavní deníky" nikoliv "deníky, jejichž vydavatelé dali souhlas". Takže sdělení se týká jiných médií... Mimochodem, vaše Inteligentní lidský výběr od každého trochu je právě podle přesných metodik zakomponován do ČNK se tak trochu tluče se sdělením, že vybíráno je pouze z těch médií, u kterých mají souhlas vydavatele... google naopak prohledává celý web, ne? --Jann (diskuse) 5. 12. 2018, 14:54 (CET)
- Předseda komise pro informační zdroje ČNK mi dnes na dotaz, proč nejsou do excerpce zařazeny Haló noviny, odpověděl takto: „nejsem si jistý, jak je to konkrétně u Haló novin, ale obecně se to má tak, že potřebujeme souhlas vydavatele daného periodika se zařazením jeho produkce do ČNK. Bohužel se poměrně často stává, že souhlas nezískáme a musíme tak řadu titulů oželet, i když bychom je jinak -- kvůli dokumentaci jazyka v nich -- rádi měli.“--Eleiodromos (diskuse) 5. 12. 2018, 12:55 (CET)
- Jestli to dobře chápu, zpochybnil jste můj test v úvodu této kapitoly. Můžete tedy čísla opravit tak, aby byla podle vás v pořádku? --Palu (diskuse) 25. 11. 2018, 10:41 (CET)
iDNES.cz 10600:4390 iHNed.cz 114: 404 Lidovky.cz 313: 128 Česká televize 219: 98 Novinky.cz 100: 140 Ceskenoviny.cz 81: 26 Aktuálně.cz 300: 275
- Bez odkazů nepoznám, co bylo na mojí metodě špatně. Jestli to dobře chápu, tak jsem nesprávně odečítal to číslo a měl jsem ho odečítat už na první stránce. Nicméně když kliknu třeba na ten Ojvín výše, tak žádné číslo nevidím, dokud se neproklikám právě na ten konec. --Palu (diskuse) 25. 11. 2018, 11:09 (CET)
- Když kliknete na Ojvín, vidíte řádek Vše Obrázky .... Nastavení Nástroje. Přičemž tlačítko Nástroje je zvýrazněné. Pod ním je řádek Nástrojů: Stránky pouze česky Bez časového omezení... Řádek Nástrojů je vidět, protože jsem tam zaškrtl "Stránky pouze česky". Když kliknete na "Nástroje", tak vám tenhle nástrojový řádek zmizí a na jeho místě se objeví obvyklé "Přibližný počet výsledků: 6 390 (0,37 s) " a to je číslo o které nám jde - googlovský odhad počtu Ojvínů na internetech. Oybinů google odhaduje 111 tisíc [29]. --Jann (diskuse) 25. 11. 2018, 11:50 (CET)
- Do těchto odkazů se evidentně zrcadlí českolipský Cvikov.--Eleiodromos (diskuse) 25. 11. 2018, 12:40 (CET)
- Díky tedy za vysvětlení, tohle jsem neznal. --Palu (diskuse) 25. 11. 2018, 12:59 (CET)
- Rádo se stalo. Po zopakování google testu touto lepší metodou dostaneme například na Aktuálně.cz pro cvikov německo -českolipsko odhad googlu 198, pro zwickau německo -českolipsko 236, což se liší od vašeho výsledku 130 ku 107. Imo to pořád dokazuje zažitost Cvikova v redakci Aktuálně, ale ty poměry už jsou jiné a u jiných webů mohou být dramaticky jiné. Obecně dotaz cvikov německo -českolipsko prohrává s zwickau německo -českolipsko v poměru 378 000 ku 16 500 000. Čiliže, v kontrastu k redakci Aktuálně, na českých internetech Cvikov jasně prohrává. Kupodivu u knih známých googlu je poměr 3300 ku 951 ve prospěch Cvikova. --Jann (diskuse) 30. 11. 2018, 19:37 (CET)
- Tak z pohledu zažitosti nám je celkem jedno, které synonymum prohrává. Jde o to, jestli je to české zažité, tj. jestli je v paměti. --Palu (diskuse) 30. 11. 2018, 19:47 (CET)
- V paměti je, v tom smyslu, že významná část Čechů ho zná. Nicméně ohledně zažitosti se lišíme - myslím, že zažitostí pravidlo nemíní zda exonymum je v paměti, ale zda je používané. --Jann (diskuse) 30. 11. 2018, 19:59 (CET)
- To se nelišíme. Pokud je v paměti, tak je i používané. Je ale irelevantní, jestli je nejpoužívanější. --Palu (diskuse) 30. 11. 2018, 20:07 (CET)
- To jméno živé je, třeba ve smyslu že jej i noviny v posledním roce používají a ve srovnatelném počtu k originálu. A ani Google se nebojí dát Cvikov na své mapy v češtině... Ne že by nešlo zpochybňovat Googlemapy, můžeme ale třeba porovnat, jak moc se Wikipedie od Googlu liší u jiných exonym. Chrzwzcz (diskuse) 30. 11. 2018, 22:21 (CET) PS: Proklikal jsem si asi 30 českých exonym pro německá toponyma a rozdíl jsem zaznamenal jen u Zwickau, všude jinde jsou Googlemapy a Wiki stejně "odvážné", až se vkrádala otázka jestli to Google prachsprostě neokopíroval z wikipedie, ale vypadá to že tenhle článek se nikdy nejmenoval Cvikov... Chrzwzcz (diskuse) 30. 11. 2018, 22:39 (CET)
- @Chrzwzcz: Článek byl jako Cvikov založen, stačí umět hledat Cvikov (Zwickau), a jinak zde poznamenám, jestli mě na wiki něco nebaví, tak tato diskuze na toto téma, ale mám názor, že by se německá města měla jmenovat německy.Mirek256 1. 12. 2018, 09:04 (CET)
- Google přecházel na české názvy letos, sotva kopíroval jak byl článek založen před lety. Německá města by se pochopitelně na wikipedii měla jmenovat tak, jak je běžné v českých zdrojích a ne jak si někdo direktivně vymyslí protože má úžasnou myšlenku jak jazyk zpravidelnit a zavedenou češtinu zpitvořit Berliny, Dresdeny a Kölny. Chrzwzcz (diskuse) 1. 12. 2018, 10:09 (CET)
- Se mi nevěřilo, tady máte zdroj: důkazChrzwzcz (diskuse) 1. 12. 2018, 11:09 (CET)
- @Chrzwzcz: Článek byl jako Cvikov založen, stačí umět hledat Cvikov (Zwickau), a jinak zde poznamenám, jestli mě na wiki něco nebaví, tak tato diskuze na toto téma, ale mám názor, že by se německá města měla jmenovat německy.Mirek256 1. 12. 2018, 09:04 (CET)
- V paměti je, v tom smyslu, že významná část Čechů ho zná. Nicméně ohledně zažitosti se lišíme - myslím, že zažitostí pravidlo nemíní zda exonymum je v paměti, ale zda je používané. --Jann (diskuse) 30. 11. 2018, 19:59 (CET)
- Tak z pohledu zažitosti nám je celkem jedno, které synonymum prohrává. Jde o to, jestli je to české zažité, tj. jestli je v paměti. --Palu (diskuse) 30. 11. 2018, 19:47 (CET)
- Rádo se stalo. Po zopakování google testu touto lepší metodou dostaneme například na Aktuálně.cz pro cvikov německo -českolipsko odhad googlu 198, pro zwickau německo -českolipsko 236, což se liší od vašeho výsledku 130 ku 107. Imo to pořád dokazuje zažitost Cvikova v redakci Aktuálně, ale ty poměry už jsou jiné a u jiných webů mohou být dramaticky jiné. Obecně dotaz cvikov německo -českolipsko prohrává s zwickau německo -českolipsko v poměru 378 000 ku 16 500 000. Čiliže, v kontrastu k redakci Aktuálně, na českých internetech Cvikov jasně prohrává. Kupodivu u knih známých googlu je poměr 3300 ku 951 ve prospěch Cvikova. --Jann (diskuse) 30. 11. 2018, 19:37 (CET)
- Když kliknete na Ojvín, vidíte řádek Vše Obrázky .... Nastavení Nástroje. Přičemž tlačítko Nástroje je zvýrazněné. Pod ním je řádek Nástrojů: Stránky pouze česky Bez časového omezení... Řádek Nástrojů je vidět, protože jsem tam zaškrtl "Stránky pouze česky". Když kliknete na "Nástroje", tak vám tenhle nástrojový řádek zmizí a na jeho místě se objeví obvyklé "Přibližný počet výsledků: 6 390 (0,37 s) " a to je číslo o které nám jde - googlovský odhad počtu Ojvínů na internetech. Oybinů google odhaduje 111 tisíc [29]. --Jann (diskuse) 25. 11. 2018, 11:50 (CET)
- Bez odkazů nepoznám, co bylo na mojí metodě špatně. Jestli to dobře chápu, tak jsem nesprávně odečítal to číslo a měl jsem ho odečítat už na první stránce. Nicméně když kliknu třeba na ten Ojvín výše, tak žádné číslo nevidím, dokud se neproklikám právě na ten konec. --Palu (diskuse) 25. 11. 2018, 11:09 (CET)
Ale hned diskuze Pracuji ve spedici a vůbec se nám to nelíbí. Velká města s českými názvy budiž. Ale komu co řekne německá Olešnice nad Halštrovem (jinak Olešnic v ČR je okolo padesáti), Cáchy, maďarský Ráb, a mnoho dalších měst. Jenom to komplikuje vyhledávání, Google měl nechat původní názvy Oelsnitz/Vogtland, Györ, Aachen. A ještě lepší je Cvikov (Zwickau) a Cvikov v severních Čechách a v článku zmiňované Benátky. Protože se opravdu může stát to, co píše autor článku, „že si zadáte do navigace například Benátky, a na hranici města vás přivítá cedule Venezia. Pokud tedy nedorazíte do Benátek nad Jizerou.“ -:)))Mirek256 1. 12. 2018, 11:19 (CET)
- No jo, v diskuzi může být kdecos, nespokojenci a rýpalové forever. Pokud české zdroje znají jen Olešnici nad Halštrovem, ať se to naučí i česká navigace a ne naopak. Nebo pokud to Google s počešťováním přehnal a vytáhl zapomenuté vykopávky, dají se nahlásit opravy. Chrzwzcz (diskuse) 1. 12. 2018, 11:23 (CET)
- Aplikace Google nemůže být kritériem v diskusi o českém jazyce. Od toho je Ústav pro jazyk český Akademie věd České republiky a Ústav Českého národního korpusu.--Eleiodromos (diskuse) 1. 12. 2018, 11:46 (CET)
- No a kdo říká, že o tom Google rozhoduje? Říkám jenom, že pokud se Wikipedie rozhodne pro Cvikov, což je stále živé jméno (milý ÚJČ vám to jistě ukáže, ve výsledcích třeba za poslední rok nebo pětiletku), tak v tom nebude osamocena a nemá se za co stydět. Tu vysmívanou Olešnici nad Halštrovem tu máme na wikině taky. Ale jinak nemáte pravdu, na wikipedii se úplně bněžneě výsledky hledají na googlu a váží se, nejede jen na prostý počet výskytů, ale zkouší odhadnout, jaký má tento výskyt dosah. Že v nějakých lokálních novinách napsali 1000x Zwickau je pěkná věc, ale 1 Cvikov v celostátním médiu to klidně převálcuje. A váš drahý korpus by nám hlásil 1000násobnou převahu Zwickau, ne?Chrzwzcz (diskuse) 1. 12. 2018, 12:01 (CET)
- Aplikace Google nemůže být kritériem v diskusi o českém jazyce. Od toho je Ústav pro jazyk český Akademie věd České republiky a Ústav Českého národního korpusu.--Eleiodromos (diskuse) 1. 12. 2018, 11:46 (CET)
Jsem proti přesunu, podle mne je německý název očekávaný, viz také názvy ostatních měst v zemském okrese...--OISV (diskuse) 12. 12. 2018, 08:33 (CET)
- Tím myslíte v zemském okresu Cvikov? U určování zažitosti exonym určitě nehraje roli nějaké posuzování po skupinkách. :) Chrzwzcz (diskuse) 12. 12. 2018, 08:44 (CET)
Rekapitulace
Jelikož už je diskuse celkem dlouhá a není jednoduché se v ní vyznat, rád bych zrekapituloval podklady, které máme:
|
|
Případně pokud jsem něco přehlédl, klidně doplňte. --Palu (diskuse) 6. 12. 2018, 23:36 (CET)
- No rozhodně se korpusu přisuzují vlastnosti, které nemá, nebo takové nebyly prezentovány - v kterých letech jsou tam ty výskyty (není tedy název na ústupu?), v jakých rozdílných zdrojích se tam vyskytoval (nejsou všechny ty výskyty nakonec třeba jen z jedné jediné publikace 100 let staré nebo všechno jeden autor nefandíci českému názvu? :)) Nevíme a ještě jsem v diskuzích o přejmenování neviděl, že by se s korpusem čarovalo, takže proto ta velká zdženlivost a zrovna u Zwickau stanovovat nějaký precedent.. Já jsem navrhoval definovat "zažitost" tak, že se podíváme na jiné teoreticky problematické případy které jsou usazené a u nich si zkusíme googlit (třeba i korpusit) a uvidíme, že české jméno na wiki drží, nikdo nezpochybňuje, i když na Googlu je to 1:10 a v korpusu prohrává na celé čáře víc než Cvikov a co - nic - české jméno máme. Teda taky by z toho mohla nastat přejmenovávací mánie i u těch dalších příkladů ;) Ale reakce na svůj návrh jsou nasnadě, jeden zase zopakuje že jedině korpus je to kol čeho se Země točí a druhý zas že jeden výskyt na Googlu za posledních 10 let ukazuje, že název je živý a zažitý :D Mně je Cvikov/Zwickau v zásadě ukradený, ale právě takovým způsobem, že by se kvůli němu neměla vymýšlet nějaká výjimka, ať se s ním nakládá stejně jako s jemu podobnými případy Chrzwzcz (diskuse) 7. 12. 2018, 23:31 (CET)
- Zažitost lze zjistit průzkumem zdrojů. Pokud se běžně užívá, je zažitý. Porovnávat to s čímkoliv, co už tu je, by nebylo správné. To, co tu je, musí odpovídat tomu, co je venku. Takhle bychom do toho vnášeli chybu našich omylů. --Palu (diskuse) 8. 12. 2018, 10:46 (CET)
- Co si Wikipedie představuje pod slovem "zažitý" v případě tohoto pravidla lze zjistit jen studiem Wikipedie. Slovník vám zrovna matematicky přesně neřekne, jaký podíl výskytů je zažitost. Chrzwzcz (diskuse) 8. 12. 2018, 11:35 (CET)
- Zažitý je ten, který byl zažit. Tj. ten, který je obecně známý. Myslím, že tu máme dost podkladů k tomu se rozhodnout, jestli Cvikov je obecně známý. Dokonce si myslím, že je těch podkladů tolik, že je to skoro stejné, jako bychom tu vedli tuto 100kB diskusi o Cáchách nebo Řezně. --Palu (diskuse) 8. 12. 2018, 12:15 (CET)
- No ta diskuze je tak dlouhá, protože nehodlá slevit ani ten jeden ani ten druhý. To je vaše interpretace té věty z doporučení, jiný zas může namítnout že je to takové upřesnění bez kterého by se to celé obešlo, že pořád platí - použijte název pod kterým to nejspíše bude čtenář hledat. Jen tak pro zajímavost, jaké je takové nezažité české exonymum, ať to máme k porovnání! Chrzwzcz (diskuse) 8. 12. 2018, 12:50 (CET)
- Výsledkem diskuze ale nutně musí být nějaká změna. Buď se přejmenuje článek na Cvikov, nebo se kategorie přejmenuje na Města v zemském okrese Zwickau, současná roztříštěnost rozhodně není žádoucí. Chrzwzcz (diskuse) 9. 12. 2018, 09:33 (CET)
- Pro města platí specializované pravidlo, takže nemůže platit obecnější pravidlo. Aspoň podle obecných zásad normotvorby. Čili podle mě neplatí obecné "použijte název, pod kterým bude čtenář hledat", ale specializované "Pokud má město zažité exonymum, použijte jej". Nezažité exonymum je podle mě třeba Solnohrad, Karlovský Bělehrad, Chudoba, Videm ad. --Palu (diskuse) 9. 12. 2018, 20:16 (CET)
- .@Palu: A tom rozhodujete Vy? A navíc pro mě, a nejen pro jste důvodem, proč se zde nezúčastnuji diskuzí, pro mě nemají smysl, i když nemáte pravdu. Člověk lidem jako jste vy ustupuje, ale podle mě by neměl, ale na druhé straně i mě je lhostejné, když zde bude Olešnice, Donín a Halštrovy.Mirek256 10. 12. 2018, 05:59 (CET)
- Nerozumím - o čem bych měl rozhodovat? Zásady normotvorby já neurčuju, stejně jako neurčuju pravidla Wikipedie a ano neurčuju jestli lidé používají dané exonymum nebo ne. --Palu (diskuse) 10. 12. 2018, 08:08 (CET)
- Chtete rozhodovat o českých názvech německých měst, jestli jsou zažité, a mě připadá, být po vašem, německá města mají české názvy. A obecně česká jména německých měst nejsou žádaná, viz např. spedice, navigace znají jen úřední jména měst, či jaká jsou na ceduli před městem - ale tím nechci napsat, že Mnichov se nemá jmennovat mnichov atd. a možná ješt+ deset německých měst má mí český název, tím to ale končí.Mirek256 10. 12. 2018, 08:55 (CET)
- Exonyma nejsou problém ouřední či spediční, ale problém českého jazyka. Ten by však neměl být řešen pouhým blafováním.--Eleiodromos (diskuse) 10. 12. 2018, 09:07 (CET)
- Já bych to rád rozhodl kolektivně, a to na základě jasné objektivní logiky. Ta byla kdysi nějak nastíněna v našem doporučení, nějak byla praktikována a teď se zdá, že právě děláme její revizi na základě nově navržené metody poměřit vše jen na základě ČNK. Za mě je správný způsob, jak se to dělalo doteď - průzkum zdrojů v rámci více ucelených celků (google, odborná literatura, ČNK, ...). Co se týče spedičních problémů, ty můžou řešit k tomu určené mapy a cedule u silnic, ale nemůže je řešit to, že si z jazyka odstraníme exonyma. --Palu (diskuse) 10. 12. 2018, 11:54 (CET)
- Problémy spediční do toho, prosím, nepleťte. To bychom nakonec skončili u toho, že Kolín nad Rýnem by se měl jmenovat Cologne, protože světovým jazykem je angličtina a tím by to měli spedičníci snazší :-/.--Tchoř (diskuse) 10. 12. 2018, 13:07 (CET)
- Chtete rozhodovat o českých názvech německých měst, jestli jsou zažité, a mě připadá, být po vašem, německá města mají české názvy. A obecně česká jména německých měst nejsou žádaná, viz např. spedice, navigace znají jen úřední jména měst, či jaká jsou na ceduli před městem - ale tím nechci napsat, že Mnichov se nemá jmennovat mnichov atd. a možná ješt+ deset německých měst má mí český název, tím to ale končí.Mirek256 10. 12. 2018, 08:55 (CET)
- Nerozumím - o čem bych měl rozhodovat? Zásady normotvorby já neurčuju, stejně jako neurčuju pravidla Wikipedie a ano neurčuju jestli lidé používají dané exonymum nebo ne. --Palu (diskuse) 10. 12. 2018, 08:08 (CET)
- ad Palu a pravidla:obecné pravidlo "použijte název, pod kterým bude čtenář hledat" platí i pro města (a řeky a pohoří a další), protože je-li exonymum zažité, je tím názvem, pod kterým bude čtenář hledat. Proto nestačí existence exonyma, ale je nutná jeho používanost, to jest zažitost. --Jann (diskuse) 10. 12. 2018, 18:56 (CET)
- No, to se točí dokolečka dokola a nakonec máme tři možnosti 1) najít toho kdo to psal a schválil, co naprosto přesně tou větou myslel a čo si predstavuje pod takým slovom zažitý 2) na základě analýzy jiných exonym na wikipedii vydedukovat, jaký je praktický dopad této věty na nerozporované případy, neboli kde tak zhruba ta zažitost začíná a končí (proč jako Olešnice, Donín a Halštrovy nemají nárok?) 3) na větu se vykašlat, protože se nejedná o specializovanou výjimku z obecného pravidla, ale jen aplikaci obecného pravidla při pojmovávání měst: Ano u měst je na výběr z několika názvů, volte to co by čtenář nejspíše čekal (... no a TO ZNAMENÁ zažité exonymum).Chrzwzcz (diskuse) 10. 12. 2018, 19:14 (CET)
- Pravidlo stanovuje "zažitost jako Londýn, Vídeň, Řezno". To lze vyčíslit takto: Londýn (66,15), Vídeň (40,3), Řezno (0,84). Průměrná relativní frekvence "zažitého exonyma" by tedy podle tohoto pravidla byla 35,76 (odhad pravděpodobnosti výskytu jevu v jazyce krát 1 milion).--Eleiodromos (diskuse) 10. 12. 2018, 20:14 (CET)
- Rozumím tomu dobře, že to vykládáte tak, že Řezno nemá zažitost jako například „Londýn, Vídeň, Řezno“? --Tchoř (diskuse) 10. 12. 2018, 20:53 (CET)
- Tak vychází čistý průměr. Není však problém stanovit 0,84 Řezna jako minimální hranici pro české exonymum. Lobava (0), Ojvín (0,01) a Cvikov (0,02) by to stejně s jistotou nedaly.--Eleiodromos (diskuse) 10. 12. 2018, 20:59 (CET)
- Hm a Zwickau s 0,31 by to taky "nedal". Takže smazat článek, korpus nedostatečně píše o Cvikově nebo Zwickau, takže je neencyklopedický. Parádní rozřešení :) Chrzwzcz (diskuse) 10. 12. 2018, 21:13 (CET)
- Pak má samozřejmě bez pardonu přednost originální název. Je to prosté. Pro srovnání připojuji relativní frekvenci exonyma, které Palu označil za "nezažité": Solnohrad (0,03).--Eleiodromos (diskuse) 10. 12. 2018, 21:17 (CET)
- No, jenže tak si to vykládáte vy aby to ladilo s předvymyšleným závěrem. A vnášíte nám do toho korpus a vymýšlíte mu zázračné schopnosti které nemá. Ato bych se opakoval, viz výše někde. Chrzwzcz (diskuse) 10. 12. 2018, 21:29 (CET)
- Vadí mi, že se tu v těchto sporech praktikuje amatérismus a tmářství, což vede k nekonečně dlouhým diskusím. Z tohoto důvodu nabízím možné řešení, které již úspěšně funguje na dewiki. Encyklopedie by podle mého názoru neměla realitu měnit, stačí když o této realitě poskytuje dobře podložené informace.--Eleiodromos (diskuse) 10. 12. 2018, 21:37 (CET)
- I kdyby nějaké české exonymum mělo frekvenci 67 (víc než Londýn), stejně to nemůže mít automaticky přednost, když originální varianta z původního jazyka bude mít frekvenci 1000, prostě ne. Tím myslím porovnávat varianty mezi sebou! Exaktní tabulky na to nemáme tak se pak takhle přetahujeme článek od článku. Korpus je jistě pěkná věc, ale 90 % Solnohradů jste tam nasbíral v nějakých prastarých textech, ne? Nebo z článků typu "zaniklá česká exonyma" :) To se musí umět omezit, vyfiltrovat, nedávat každé zmínce stejnou váhu. Ani milión Zwickauů z nějakého místního plátku nepřebije jeden výskyt v celostátním deníku, ale to už zas opakuju dokolalalalala. Chrzwzcz (diskuse) 10. 12. 2018, 21:57 (CET)
- Němci můžou mít lepší korpus nebo v tom dělají jiný Ordnung a něco si na wikipedii nařizují a stanovují. Česká wikipedie radši souzní, i když jsou tu co chvíli nápady na nějaké direktivní pravopisy a la cswiki... 10. 12. 2018, 21:59 (CET)
- Víte co? Zkuste si jednotlivé odkazy "Solnohradu" na https://kontext.korpus.cz (po registraci) schválně prohlédnout sám. Jsou to většinou texty vzniklé po roce 2000. Zatím s tím totiž evidentně žádnou zkušenost nemáte. Německý korpus umožňuje běžné měření relativní frekvence výskytu jevu v jazyce podle zcela stejných standardů a metod jako je tomu u ČNK.--Eleiodromos (diskuse) 10. 12. 2018, 22:11 (CET)
- Myslím, že už tu bylo dostatečně několika způsoby zdůvodněno, proč je nesmysl vytrhávat z kontextu údaj relativní frekvence z ČNK a přisuzovat mu moc rozhodnout, jestli je exonymum zažité. Korpus svede posoudit leda jestli je zažitější, nedovede ale určit bez analýzy obsažených dat (tedy nikoliv na základě relativní frekvence), jestli je nějaké jméno zažité. Mohli bychom se posunout v této debatě dál? --Palu (diskuse) 10. 12. 2018, 22:36 (CET)
- Ten údaj relativní frekvence vůbec nemusí být v nějakém kontextu, nepotřebuje dokonce ani žádnou interpretaci. Je to totéž jako říci, že něco je vysoké 1 m nebo dlouhé 1 km. To vaše "dál" už je jen čirá spekulace.--Eleiodromos (diskuse) 10. 12. 2018, 22:45 (CET)
- Porovnat relativní frekvenci s výškou asi nelze. Jedná se o statistický údaj, takže to můžeme porovnat třeba s relativní četností. Z relativní četnosti pak lze vyvodit, jak je něco četné. Nelze z toho ale vyvodit, jestli je to používané v nezanedbatelné míře. To pak musíme začít rozebírat kdo to používá, kdy, za jakých okolností apod. Relativní frekvence je pro tuto debatu bezcenným číslem. --Palu (diskuse) 10. 12. 2018, 22:46 (CET)
- Ten údaj relativní frekvence vůbec nemusí být v nějakém kontextu, nepotřebuje dokonce ani žádnou interpretaci. Je to totéž jako říci, že něco je vysoké 1 m nebo dlouhé 1 km. To vaše "dál" už je jen čirá spekulace.--Eleiodromos (diskuse) 10. 12. 2018, 22:45 (CET)
- Myslím, že už tu bylo dostatečně několika způsoby zdůvodněno, proč je nesmysl vytrhávat z kontextu údaj relativní frekvence z ČNK a přisuzovat mu moc rozhodnout, jestli je exonymum zažité. Korpus svede posoudit leda jestli je zažitější, nedovede ale určit bez analýzy obsažených dat (tedy nikoliv na základě relativní frekvence), jestli je nějaké jméno zažité. Mohli bychom se posunout v této debatě dál? --Palu (diskuse) 10. 12. 2018, 22:36 (CET)
- Víte co? Zkuste si jednotlivé odkazy "Solnohradu" na https://kontext.korpus.cz (po registraci) schválně prohlédnout sám. Jsou to většinou texty vzniklé po roce 2000. Zatím s tím totiž evidentně žádnou zkušenost nemáte. Německý korpus umožňuje běžné měření relativní frekvence výskytu jevu v jazyce podle zcela stejných standardů a metod jako je tomu u ČNK.--Eleiodromos (diskuse) 10. 12. 2018, 22:11 (CET)
- Vadí mi, že se tu v těchto sporech praktikuje amatérismus a tmářství, což vede k nekonečně dlouhým diskusím. Z tohoto důvodu nabízím možné řešení, které již úspěšně funguje na dewiki. Encyklopedie by podle mého názoru neměla realitu měnit, stačí když o této realitě poskytuje dobře podložené informace.--Eleiodromos (diskuse) 10. 12. 2018, 21:37 (CET)
- No, jenže tak si to vykládáte vy aby to ladilo s předvymyšleným závěrem. A vnášíte nám do toho korpus a vymýšlíte mu zázračné schopnosti které nemá. Ato bych se opakoval, viz výše někde. Chrzwzcz (diskuse) 10. 12. 2018, 21:29 (CET)
- Pak má samozřejmě bez pardonu přednost originální název. Je to prosté. Pro srovnání připojuji relativní frekvenci exonyma, které Palu označil za "nezažité": Solnohrad (0,03).--Eleiodromos (diskuse) 10. 12. 2018, 21:17 (CET)
- Hm a Zwickau s 0,31 by to taky "nedal". Takže smazat článek, korpus nedostatečně píše o Cvikově nebo Zwickau, takže je neencyklopedický. Parádní rozřešení :) Chrzwzcz (diskuse) 10. 12. 2018, 21:13 (CET)
- Tak vychází čistý průměr. Není však problém stanovit 0,84 Řezna jako minimální hranici pro české exonymum. Lobava (0), Ojvín (0,01) a Cvikov (0,02) by to stejně s jistotou nedaly.--Eleiodromos (diskuse) 10. 12. 2018, 20:59 (CET)
- Rozumím tomu dobře, že to vykládáte tak, že Řezno nemá zažitost jako například „Londýn, Vídeň, Řezno“? --Tchoř (diskuse) 10. 12. 2018, 20:53 (CET)
- Pravidlo stanovuje "zažitost jako Londýn, Vídeň, Řezno". To lze vyčíslit takto: Londýn (66,15), Vídeň (40,3), Řezno (0,84). Průměrná relativní frekvence "zažitého exonyma" by tedy podle tohoto pravidla byla 35,76 (odhad pravděpodobnosti výskytu jevu v jazyce krát 1 milion).--Eleiodromos (diskuse) 10. 12. 2018, 20:14 (CET)
- No, to se točí dokolečka dokola a nakonec máme tři možnosti 1) najít toho kdo to psal a schválil, co naprosto přesně tou větou myslel a čo si predstavuje pod takým slovom zažitý 2) na základě analýzy jiných exonym na wikipedii vydedukovat, jaký je praktický dopad této věty na nerozporované případy, neboli kde tak zhruba ta zažitost začíná a končí (proč jako Olešnice, Donín a Halštrovy nemají nárok?) 3) na větu se vykašlat, protože se nejedná o specializovanou výjimku z obecného pravidla, ale jen aplikaci obecného pravidla při pojmovávání měst: Ano u měst je na výběr z několika názvů, volte to co by čtenář nejspíše čekal (... no a TO ZNAMENÁ zažité exonymum).Chrzwzcz (diskuse) 10. 12. 2018, 19:14 (CET)
- .@Palu: A tom rozhodujete Vy? A navíc pro mě, a nejen pro jste důvodem, proč se zde nezúčastnuji diskuzí, pro mě nemají smysl, i když nemáte pravdu. Člověk lidem jako jste vy ustupuje, ale podle mě by neměl, ale na druhé straně i mě je lhostejné, když zde bude Olešnice, Donín a Halštrovy.Mirek256 10. 12. 2018, 05:59 (CET)
- Pro města platí specializované pravidlo, takže nemůže platit obecnější pravidlo. Aspoň podle obecných zásad normotvorby. Čili podle mě neplatí obecné "použijte název, pod kterým bude čtenář hledat", ale specializované "Pokud má město zažité exonymum, použijte jej". Nezažité exonymum je podle mě třeba Solnohrad, Karlovský Bělehrad, Chudoba, Videm ad. --Palu (diskuse) 9. 12. 2018, 20:16 (CET)
- Zažitý je ten, který byl zažit. Tj. ten, který je obecně známý. Myslím, že tu máme dost podkladů k tomu se rozhodnout, jestli Cvikov je obecně známý. Dokonce si myslím, že je těch podkladů tolik, že je to skoro stejné, jako bychom tu vedli tuto 100kB diskusi o Cáchách nebo Řezně. --Palu (diskuse) 8. 12. 2018, 12:15 (CET)
- Co si Wikipedie představuje pod slovem "zažitý" v případě tohoto pravidla lze zjistit jen studiem Wikipedie. Slovník vám zrovna matematicky přesně neřekne, jaký podíl výskytů je zažitost. Chrzwzcz (diskuse) 8. 12. 2018, 11:35 (CET)
- Zažitost lze zjistit průzkumem zdrojů. Pokud se běžně užívá, je zažitý. Porovnávat to s čímkoliv, co už tu je, by nebylo správné. To, co tu je, musí odpovídat tomu, co je venku. Takhle bychom do toho vnášeli chybu našich omylů. --Palu (diskuse) 8. 12. 2018, 10:46 (CET)
- No měl jste šanci to tady představit, to naše tmářství a amatérizmus nějaká z nebe spadlá čísla jako 66,15 nevyřeší, zvlášť pokud pochybuju/eme že je to opravdu nějaký zajímavější údaj než jen mechanické sčítání ze zahrnutých textů. A pokud neznáme dopad, který by to mělo na jiné články, asi by pak mělo smysl přehodnotit i jiné názvy a ne to otevřít poprvé a naposledy zde. Já se s tím přece teď nezačnu učit abych potvrdil, že je to supernástroj, já jsem s tím sem nepřišel, já si vystačím jako celá wikipedie s Googlem ;p Chrzwzcz (diskuse) 10. 12. 2018, 22:42 (CET)
- V tom případě se tady vyjadřujete k něčemu, o čem nemáte ani páru.--Eleiodromos (diskuse) 10. 12. 2018, 22:47 (CET)
- No jestli to vážně vyplivne jen jedno číslo a konec, tak asi ani páru nechci a důvěru v to mít nebudu. Registrovat se, abych to zjistil jestli to je lepší, nebudu ;)Chrzwzcz (diskuse) 10. 12. 2018, 23:08 (CET)
- V tom případě se tady vyjadřujete k něčemu, o čem nemáte ani páru.--Eleiodromos (diskuse) 10. 12. 2018, 22:47 (CET)
- Eleiodromos: Mám dojem, že vám pořád uniká nějaká celkem podstatná souvislost. Relativní frekvence v rámci Korpusu je jen číslo a samo o sobě neobsahuje žádné informace o vzorku, z kterého vyplývá. Relativní frekvenci má smysl sledovat, ale na konkrétně vybraném vzorku a především to není jediný údaj, který sledujeme - musíme zhodnotit také kvalitu zdrojů, rozsah typů textů, dosah, atd. Zkrátka nemůžete zjednodušit komplexní analýzu na jediné číslo. --Palu (diskuse) 11. 12. 2018, 00:03 (CET)
- Ta vaše "komplexní analýza" je jen vznešené označení pro amatérskou šmakuládu, která by vám umožnila prznit Wikipedii Lobavami, Ojvíny a spol. Vaše intuitivní tipování "zažitosti" mě neoslovuje, raději dám v této otázce přednost osvědčené korpusové lingvistice.--Eleiodromos (diskuse) 11. 12. 2018, 00:20 (CET)
- Musím ocenit, že jste skutečně konzistentní přes veškeré zpochybnění Korpusu pro tento účel z několika stran. Nicméně už to omílání jednoho a téhož několikrát překonaného argumentu začíná být zdlouhavé. Klidně navrhněte nějakou spolehlivější metodu, než jaká byla aplikována dosud, třeba klidně založenou mj. na údajích o relativní frekvenci. Třeba přesvědčíte kolegium o tom, že je to dobrá metoda. Prosté poměřování relativních frekvencí je ale zkrátka nesmysl. Troufám si tvrdit, že kdyby nebylo, tak by s ním za 16 let existence Wikipedie už někdo přišel. --Palu (diskuse) 11. 12. 2018, 00:34 (CET)
- Zpochybnění laiky a osobami, které ČNK ani neviděly a z principu nechtějí vidět, nemá vůbec žádnou hodnotu. Nevím, proč bych měl navrhovat nějakou jinou měkčí metodu, když existuje spolehlivá vyzkoušená metoda měření relativní frekvence. Vím, že vy nepatříte k lidem, kteří by někdy byli schopni uznat svůj omyl. Když je nejhůř, tak argumentujete ad personam, zabrousíte do pohádky nebo prostě beze slova opustíte diskusi. Oháníte se "objektivní logikou" a "komplexní analýzou", ale nic naplat, zatím nemáte jediný pádný důkaz pro "zažitost" saského Cvikova.--Eleiodromos (diskuse) 11. 12. 2018, 00:50 (CET)
- Těch důkazů je tu předloženo skutečně hodně a argumentace ad hominem do slušné diskuse nepatří. Buď máte argumenty a nebo máte jeden, na kterým budete donekonečna trvat přesto, že je nesmyslný. Dovoláváte se tím ale falešné autority. Mám za to, že tahle diskuse už od začátku nikam nevede, protože jste se rozhodl, že nám vnutíte ČNK hlava nehlava a že budete zcela ignorovat další argumentaci. Takovýto nepřístupný rozhovor je jen ztrátou času. --Palu (diskuse) 11. 12. 2018, 08:53 (CET)
- Navrhovatelem a iniciátorem přejmenování jste vy. Já vám pouze oponuji, protože, jak jsem uvedl, zatím nemáte jediný pádný důkaz pro "zažitost" saského Cvikova.--Eleiodromos (diskuse) 11. 12. 2018, 09:38 (CET)
- Důkazy jsou předloženy. Pokud je chcete zpochybnit, udělejte to. Prosté "jedině ČNK" ale nestačí. --Palu (diskuse) 11. 12. 2018, 10:22 (CET)
- Doložená "nezažitost" saského Cvikova je jediný skutečný důkaz v této diskusi. Ojedinělé výskyty dokazují pouze existenci tohoto exonyma, kterou nikdo nezpochybňuje.--Eleiodromos (diskuse) 11. 12. 2018, 10:49 (CET)
- Vždyť o pár řádků výše máte opakované průzkumy, které dokládají, že je exonymum používané napříč obory a odborníky považované za běžné. Chcete se s korpusem v ruce stavět proti nim a vytvářet z něj bibli svatou, když se běžně používá ke zcela jiným účelům? --Palu (diskuse) 11. 12. 2018, 12:14 (CET)
- To nejsou žádné průzkumy, ale pouhé blafování. ČNK se nejčastěji používá právě k určení frekvence jevu v jazyce. To ale vy nevíte, protože vaříte z vody jako vždy.--Eleiodromos (diskuse) 11. 12. 2018, 12:29 (CET)
- Nevím, co myslíte tím "jako vždy" - skoro vás neznám. Nicméně můžete nějak vysvětlit, proč by mělo jít o blafování? --Palu (diskuse) 11. 12. 2018, 12:58 (CET)
- Myslím "vždy" v těchto vámi iniciovaných otravných diskusích na Wikipedii. Vršení odkazů na jednotlivé výskyty "zažitost" v žádném případě nedokazuje.--Eleiodromos (diskuse) 11. 12. 2018, 13:03 (CET)
- Jednomu číslu přisuzovat kouzelnou moc přece nelze. Jo kdybyste mi poskytl něco takového včetně ujištění, že to umí řešit filtrování dle odborných nebo jakých kritérií zdroje pro své statistiky, pak si popovídáme. 11. 12. 2018, 19:26 (CET)
- Ngram Viewer jsem již v diskusi výše zmiňoval, bohužel ale nemá českou verzi, takže je pro tento problém nepoužitelný. Mimochodem je to diachronní korpus. Více se dočtete zde.[1]--Eleiodromos (diskuse) 11. 12. 2018, 19:32 (CET)
- Jednomu číslu přisuzovat kouzelnou moc přece nelze. Jo kdybyste mi poskytl něco takového včetně ujištění, že to umí řešit filtrování dle odborných nebo jakých kritérií zdroje pro své statistiky, pak si popovídáme. 11. 12. 2018, 19:26 (CET)
- Myslím "vždy" v těchto vámi iniciovaných otravných diskusích na Wikipedii. Vršení odkazů na jednotlivé výskyty "zažitost" v žádném případě nedokazuje.--Eleiodromos (diskuse) 11. 12. 2018, 13:03 (CET)
- Nevím, co myslíte tím "jako vždy" - skoro vás neznám. Nicméně můžete nějak vysvětlit, proč by mělo jít o blafování? --Palu (diskuse) 11. 12. 2018, 12:58 (CET)
- To nejsou žádné průzkumy, ale pouhé blafování. ČNK se nejčastěji používá právě k určení frekvence jevu v jazyce. To ale vy nevíte, protože vaříte z vody jako vždy.--Eleiodromos (diskuse) 11. 12. 2018, 12:29 (CET)
- Vždyť o pár řádků výše máte opakované průzkumy, které dokládají, že je exonymum používané napříč obory a odborníky považované za běžné. Chcete se s korpusem v ruce stavět proti nim a vytvářet z něj bibli svatou, když se běžně používá ke zcela jiným účelům? --Palu (diskuse) 11. 12. 2018, 12:14 (CET)
- Doložená "nezažitost" saského Cvikova je jediný skutečný důkaz v této diskusi. Ojedinělé výskyty dokazují pouze existenci tohoto exonyma, kterou nikdo nezpochybňuje.--Eleiodromos (diskuse) 11. 12. 2018, 10:49 (CET)
- Důkazy jsou předloženy. Pokud je chcete zpochybnit, udělejte to. Prosté "jedině ČNK" ale nestačí. --Palu (diskuse) 11. 12. 2018, 10:22 (CET)
- Navrhovatelem a iniciátorem přejmenování jste vy. Já vám pouze oponuji, protože, jak jsem uvedl, zatím nemáte jediný pádný důkaz pro "zažitost" saského Cvikova.--Eleiodromos (diskuse) 11. 12. 2018, 09:38 (CET)
- Těch důkazů je tu předloženo skutečně hodně a argumentace ad hominem do slušné diskuse nepatří. Buď máte argumenty a nebo máte jeden, na kterým budete donekonečna trvat přesto, že je nesmyslný. Dovoláváte se tím ale falešné autority. Mám za to, že tahle diskuse už od začátku nikam nevede, protože jste se rozhodl, že nám vnutíte ČNK hlava nehlava a že budete zcela ignorovat další argumentaci. Takovýto nepřístupný rozhovor je jen ztrátou času. --Palu (diskuse) 11. 12. 2018, 08:53 (CET)
- Zpochybnění laiky a osobami, které ČNK ani neviděly a z principu nechtějí vidět, nemá vůbec žádnou hodnotu. Nevím, proč bych měl navrhovat nějakou jinou měkčí metodu, když existuje spolehlivá vyzkoušená metoda měření relativní frekvence. Vím, že vy nepatříte k lidem, kteří by někdy byli schopni uznat svůj omyl. Když je nejhůř, tak argumentujete ad personam, zabrousíte do pohádky nebo prostě beze slova opustíte diskusi. Oháníte se "objektivní logikou" a "komplexní analýzou", ale nic naplat, zatím nemáte jediný pádný důkaz pro "zažitost" saského Cvikova.--Eleiodromos (diskuse) 11. 12. 2018, 00:50 (CET)
- Musím ocenit, že jste skutečně konzistentní přes veškeré zpochybnění Korpusu pro tento účel z několika stran. Nicméně už to omílání jednoho a téhož několikrát překonaného argumentu začíná být zdlouhavé. Klidně navrhněte nějakou spolehlivější metodu, než jaká byla aplikována dosud, třeba klidně založenou mj. na údajích o relativní frekvenci. Třeba přesvědčíte kolegium o tom, že je to dobrá metoda. Prosté poměřování relativních frekvencí je ale zkrátka nesmysl. Troufám si tvrdit, že kdyby nebylo, tak by s ním za 16 let existence Wikipedie už někdo přišel. --Palu (diskuse) 11. 12. 2018, 00:34 (CET)
- Ta vaše "komplexní analýza" je jen vznešené označení pro amatérskou šmakuládu, která by vám umožnila prznit Wikipedii Lobavami, Ojvíny a spol. Vaše intuitivní tipování "zažitosti" mě neoslovuje, raději dám v této otázce přednost osvědčené korpusové lingvistice.--Eleiodromos (diskuse) 11. 12. 2018, 00:20 (CET)
- Eleiodromos: Mám dojem, že vám pořád uniká nějaká celkem podstatná souvislost. Relativní frekvence v rámci Korpusu je jen číslo a samo o sobě neobsahuje žádné informace o vzorku, z kterého vyplývá. Relativní frekvenci má smysl sledovat, ale na konkrétně vybraném vzorku a především to není jediný údaj, který sledujeme - musíme zhodnotit také kvalitu zdrojů, rozsah typů textů, dosah, atd. Zkrátka nemůžete zjednodušit komplexní analýzu na jediné číslo. --Palu (diskuse) 11. 12. 2018, 00:03 (CET)
- V tom případě se tady vyjadřujete k něčemu, o čem nemáte ani páru.--Eleiodromos (diskuse) 10. 12. 2018, 22:47 (CET)
- No měl jste šanci to tady představit, to naše tmářství a amatérizmus nějaká z nebe spadlá čísla jako 66,15 nevyřeší, zvlášť pokud pochybuju/eme že je to opravdu nějaký zajímavější údaj než jen mechanické sčítání ze zahrnutých textů. A pokud neznáme dopad, který by to mělo na jiné články, asi by pak mělo smysl přehodnotit i jiné názvy a ne to otevřít poprvé a naposledy zde. Já se s tím přece teď nezačnu učit abych potvrdil, že je to supernástroj, já jsem s tím sem nepřišel, já si vystačím jako celá wikipedie s Googlem ;p Chrzwzcz (diskuse) 10. 12. 2018, 22:42 (CET)
- ↑ FRIGINAL, Eric; WALKER, Marsha; RANDALL, Janet Beth. Exploring mega-corpora:Google Ngram Viewer and the Corpus of Historical American English [online]. 2014 [cit. 2018-05-24]. Dostupné online. (anglicky)
- Tak nám najděte ještě frekvenci pro: Olešnice nad Halštrovem, Bělostok, Bílsko-Bělá, Desava a Vratislav. Ať víme kde jsme.Chrzwzcz (diskuse) 11. 12. 2018, 22:29 (CET)
- Olešnice nad Halštrovem (0), Bělostok (0), Bílsko-Bělá (0), Desava (0,05). Vratislav (10,4; ve výsledcích je ale zahrnuto také osobní jméno "Vratislav").--Eleiodromos (diskuse) 11. 12. 2018, 22:55 (CET)
- Díky. Olešnice nad Halštrovem (0 - na wiki česky), Bělostok (0 - na wiki originál), Bílsko-Bělá (0 - na wiki česky), Desava (0,05 - na wiki originál kromě odvozeného Bitva u Desavy). Vratislav (10,4; ve výsledcích je ale zahrnuto také osobní jméno "Vratislav" - tak to je škoda že se nepozná kontext! na wiki česky ale v minulosti s obrovskými problémy prosadit). Co z toho jde vydedukovat? Že na současné pojmenování nemá relativní frekvence v korpusu vliv a asi nemá cenu si s ním hrát jen v jednom případě. Chrzwzcz (diskuse) 12. 12. 2018, 07:54 (CET)
- To, že stav některých názvů sídel na Wikipedii neodpovídá tomu, jak se česky mluví a píše, bych viděl spíše jako nedostatek než přednost. Realita je důležitější než současná nahodilá praxe na Wikipedii.--Eleiodromos (diskuse) 12. 12. 2018, 08:19 (CET)
- Problém je, že vaše interpretace korpusu nemá s realitou nic společného. --Palu (diskuse) 12. 12. 2018, 11:33 (CET)
- Žádnou interpretaci jsem zde nepodal, uvádím pouze údaje relativní frekvence v ČNK, které si může ověřit každý.--Eleiodromos (diskuse) 12. 12. 2018, 11:55 (CET)
- A přisuzujete tomuto údaji čarovnou moc. --Palu (diskuse) 12. 12. 2018, 12:26 (CET)
- Nic takového jsem neřekl. Jen mě zajímá, jak se název ve skutečnosti používá. I bc. práce, kterou jste vygůgloval, v anketě zjišťuje, že více mluvčích používá název Zwickau a podstatná část z nich český název města nezná.--Eleiodromos (diskuse) 12. 12. 2018, 12:44 (CET)
- Což ovšem není předmětem tohoto sporu. My máme zvážit, jestli je české exonymum zažité, nikoliv jestli je používanější než německé endonymum. --Palu (diskuse) 12. 12. 2018, 15:53 (CET)
- Tak předložte důkaz, že je zažité a můžeme to tu rozpustit.--Eleiodromos (diskuse) 12. 12. 2018, 15:55 (CET)
- Což ovšem není předmětem tohoto sporu. My máme zvážit, jestli je české exonymum zažité, nikoliv jestli je používanější než německé endonymum. --Palu (diskuse) 12. 12. 2018, 15:53 (CET)
- Nic takového jsem neřekl. Jen mě zajímá, jak se název ve skutečnosti používá. I bc. práce, kterou jste vygůgloval, v anketě zjišťuje, že více mluvčích používá název Zwickau a podstatná část z nich český název města nezná.--Eleiodromos (diskuse) 12. 12. 2018, 12:44 (CET)
- A přisuzujete tomuto údaji čarovnou moc. --Palu (diskuse) 12. 12. 2018, 12:26 (CET)
- Žádnou interpretaci jsem zde nepodal, uvádím pouze údaje relativní frekvence v ČNK, které si může ověřit každý.--Eleiodromos (diskuse) 12. 12. 2018, 11:55 (CET)
- Problém je, že vaše interpretace korpusu nemá s realitou nic společného. --Palu (diskuse) 12. 12. 2018, 11:33 (CET)
- To, že stav některých názvů sídel na Wikipedii neodpovídá tomu, jak se česky mluví a píše, bych viděl spíše jako nedostatek než přednost. Realita je důležitější než současná nahodilá praxe na Wikipedii.--Eleiodromos (diskuse) 12. 12. 2018, 08:19 (CET)
- Díky. Olešnice nad Halštrovem (0 - na wiki česky), Bělostok (0 - na wiki originál), Bílsko-Bělá (0 - na wiki česky), Desava (0,05 - na wiki originál kromě odvozeného Bitva u Desavy). Vratislav (10,4; ve výsledcích je ale zahrnuto také osobní jméno "Vratislav" - tak to je škoda že se nepozná kontext! na wiki česky ale v minulosti s obrovskými problémy prosadit). Co z toho jde vydedukovat? Že na současné pojmenování nemá relativní frekvence v korpusu vliv a asi nemá cenu si s ním hrát jen v jednom případě. Chrzwzcz (diskuse) 12. 12. 2018, 07:54 (CET)
- Olešnice nad Halštrovem (0), Bělostok (0), Bílsko-Bělá (0), Desava (0,05). Vratislav (10,4; ve výsledcích je ale zahrnuto také osobní jméno "Vratislav").--Eleiodromos (diskuse) 11. 12. 2018, 22:55 (CET)
- Tak nám najděte ještě frekvenci pro: Olešnice nad Halštrovem, Bělostok, Bílsko-Bělá, Desava a Vratislav. Ať víme kde jsme.Chrzwzcz (diskuse) 11. 12. 2018, 22:29 (CET)
Vidím, že diskuse začíná opět nabírat poměrně značný rozsah, nyní 134 tisíc bajtů, což je ve vztahu k vlastnímu článku (necelých 6 tisíc bajtů) zase krásný výsledek. Jen tak dále, opravdu obdivuji a říkám si, proč článek vylepšovat, třeba aby on sám měl přes sto tisíc bajtů, když stačí plodná diskuse o názvu. Nicméně, chtěl bych upozornit, že návrh na přejmenování na název „Cvikov“ není šťastný, tento odkaz již totiž vede na existující článek. --Vlout (diskuse) 12. 12. 2018, 13:04 (CET) Opravuji, až nyní vidím, že návrh vlastně směřuje na stav, kdy německé město Zwickau bychom měli mít pod názvem „Cvikov“, zatímco české město Cvikov pod názvem „Cvikov (Česko)“. To je opravdu originální řešení, smekám. --Vlout (diskuse) 12. 12. 2018, 13:10 (CET)
PS: Co na to kolegové JAn Dudík, Petr Kinšt nebo Harold, kteří se věnují českým obcím? --Vlout (diskuse) 12. 12. 2018, 13:14 (CET)
- Nenaparujte se. Kdybyste tu diskuzi četl tak víte, že se tu už ani tak nediskutuje o Cvikově, ale obecně o problematice jestli zapojovat korpus do rozhodnutí, když se to doposud nedělalo. Nebo jak si vyložit doporučení. To je přínos nehledě na uštěpačné poznámky, v ideálním případě to zkrátí diskuze u dalších exonymových návrhů na přesun. V případě, že by se seznal německý Cvikov důležitější, měl by český článek POCHOPITELNĚ název Cvikov (okres Česká Lípa) - viz např. Mnichov (rozcestník).Chrzwzcz (diskuse) 12. 12. 2018, 13:17 (CET)
- Jak jste na to přišel, že se „naparuji“ (holedbám či kasám)? :-) I tak ovšem gratuluji k dalšímu podnětnému rozšíření diskuse. Přeji v ní všem zúčastněným hodně radosti :-) --Vlout (diskuse) 12. 12. 2018, 13:25 (CET)
- Naznačuje se tu, že jakmile velikost diskuze přesáhne velikost článku, je to pro diskutující ostudné a měli by se radši nahnat do editace článků, protože to je IYHO přínosnější. Otázku rozlišovače jste sem vnesl vy, tak se nepodivujte, když někdo roztáhne diskuzi o odpověď. Chrzwzcz (diskuse) 12. 12. 2018, 13:37 (CET)
- Jak jste na to přišel, že se „naparuji“ (holedbám či kasám)? :-) I tak ovšem gratuluji k dalšímu podnětnému rozšíření diskuse. Přeji v ní všem zúčastněným hodně radosti :-) --Vlout (diskuse) 12. 12. 2018, 13:25 (CET)
- Nyní není vůbec ve hře se opovažovat zvolit, jestli bude hlavní Cvikov ten český nebo ten německý a nebo jestli to bude symetrický rozcestník. Teď se vede diskuse o tom, jestli je Cvikov zažité české exonymum a evidentně i o tom, jaká metoda je nejspolehlivější pro toto určení. Eleiodromos přišel s originálním nápadem využít ČNK, což tu bylo zpochybněno. Naopak Eleiodromos najmítá, že průzkum zdrojů na vlastní pěst je "neodborné blafování". Čili soud, že je návrh nevhodný kvůli tomu že něco někam vede je teď skutečně ukvapený. Nejprve je potřeba rozhodnout, jak se bude článek jmenovat a pak teprve organizační uspořádání rozcestníky a rozlišovači. Oba problémy spolu nesouvisí. --Palu (diskuse) 12. 12. 2018, 15:59 (CET)
- Žádné relevantní zdroje jste neprozkoumal, neotevřel jste jedinou knihu, pouze jste trošku gůgloval. Na každý další návrh na přejmenování byste se měl připravit mnohem lépe. Když nemáte důkaz, nechápu, proč se do takových operací vůbec pouštíte.--Eleiodromos (diskuse) 12. 12. 2018, 16:07 (CET)
- Vzhledem k tomu, že se tyhle diskuze o zažitosti (nebo jak moc protežovat česká jména i když nemají nadpoloviční zásah) vedou prakticky u každého ne zcela notoricky známého exonyma (však ale taky u ne zcela notoricky známých měst, vsí, řek a moří) vždycky od nuly, nebylo by od věci je prodiskutovat někde stranou společně a stanovit autority, které budou respektované. Automaticky vyplivnuté číslo z korpusu sotva, jedna zeměpisná knížka asi taky ne, na ČÚZK se taky kouká spatra jak na nějaké snílkovské obrozence, ale nějaká kombinace těchto, to už by dohromady něco vypovědělo. Jen proboha ne špeditéry, to sem netahejte, to je argument jak noha. Chrzwzcz (diskuse) 12. 12. 2018, 20:39 (CET)
- Pokud tu vy, kolegové Palu, Tchoř či Hnetubud skutečně prokážete, že přejmenování je na základě těch a těch důkazů nezbytné, nebude jistě nikdo nic namítat.--Eleiodromos (diskuse) 12. 12. 2018, 20:53 (CET)
- No nevím, proč bych ale měl bojovat proti korpusu, když nikdy nebyl brán v potaz, to je vámi uměle vymyšlená překážka zrovna u tohohle návrhu na přesun. Já bych zas mohl říct, že ČÚZK jasně stanovil a nedá se s tím nic dělat, ČÚZK určuje normy, a ne to, jak moc je české zdroje dodržují a s jakou relativní četností. Zvlášť pokud nám korpus nic neřekne o trendech, ale jen součet výskytů napříč historií. Opakuji, nemám nic proti Zwickau nebo Cvikovu, ale nelíbí se mi vytahování nových podmínek nikdy neotestovaných a nepsaných, a nekonzistentní postup zkoumání "zažitosti" u jednotlivých případů. Chrzwzcz (diskuse) 12. 12.
- Já teď vůbec nemluvím o korpusu, mluvím o tom, že návrh by měl být podložen jednoznačným důkazem zažitosti nebo alespoň něčím, co o Zwickau stanovil ÚJČ nebo ČÚZK. Navrhovatel přejmenování by měl něco s touto důkazní silou předložit. Hezké by také bylo, kdyby pak někdo z vás udělal o tomto městě kvalitní článek.--Eleiodromos (diskuse) 12. 12. 2018, 21:56 (CET)
- Ale já přece nemám problém s tím, kdyby hranice používanosti končila někde u Řezna (a to už jen pocitově, nemusím hned vytahovat nějaké číselné konstanty). Mně by bylo docela jedno kdyby z celého Německa bylo česky nanejvýš 10 nejpoužívanějších. Ale přijde mi uhozené tu hranici stanovovat v diskuzi u Cvikova a pak ji aplikovat jen na Cvikov. Nač takové jednorázové diskuze a pravidla. O městě psát nebudu, když ani neznáme jeho název ;P Chrzwzcz (diskuse) 12. 12. 2018, 22:07 (CET)
- Jen za tento rok tu proběhl spor o název Löbau, Oybin, Zwickau atd. Je to pořád dokola, často se tu argumentuje individuálním jazykovým citem a gůglováním. Až bude skutečný důkaz typu vyjádření ÚJČ či ĆÚZK, jsem ochoten s přejmenováním souhlasit, i když jsem toho názoru, že exonymum Cvikov se již příliš nepoužívá. Takový důkaz tu však zatím nepadl.--Eleiodromos (diskuse) 12. 12. 2018, 22:25 (CET)
- Třeba tady u Zwickau žádný jazykový cit nepadl, zato padla celkem rozsáhlá analýza zdrojů s výsledkem, že české exonymum se běžně používá, byť asi ne častěji než endonymum, což ale není podstatné. --Palu (diskuse) 12. 12. 2018, 22:28 (CET)
- Předložte důkaz s vyjádřením ÚJČ nebo ČÚZK, pak budu s přejmenováním souhlasit.--Eleiodromos (diskuse) 12. 12. 2018, 22:45 (CET)
- Úkolem ÚJČ je zkoumat český jazyk a kodifikovat ho. Smyslem a určením je regulace. Jedinou preskriptivní kodifikační příručkou jsou Pravidla českého pravopisu. Všechno ostatní je jen sledování a popisování skutečnosti. V případě, že ÚJČ přinese nějaké odborné stanovisko, je to velmi silným argumentem, protože bývá velmi kvalitně podloženo. My tady takové stanovisko ÚJČ nemáme, máme však doložena jiná odborná stanoviska (bakalářskou práci Vývoj a současný stav české exonymie nebo článek Cizí zeměpisná jména v českém kontextu v odborném časopise Naše řeč), jejichž váhu nelze smést prostým "já věřím jenom ÚJČ", protože ÚJČ není jedinou a výlučnou jazykovou autoritou. Teprve pokud by byly tyto autority v rozporu, pak bychom mohli vést diskusi, která z autorit má větší váhu, a dost pravděpodobně by vyhrálo ÚJČ. My tu ale žádný rozpor nemáme. Co se týče zeměměřičů, pak ti nemají jako hlavní úlohu kodifikovat česká exonyma a v tomto pouze spolupracují s ÚJČ. Čili pravděpodobně nebudou v rozporu. Ohledně Cvikova už jsem citoval knihu Standardizace jmen sídelních a nesídelních geografických objektů z území mimo Českou republiku, kterou vydal ČÚZK. Ta Cvikov používá. --Palu (diskuse) 12. 12. 2018, 23:47 (CET)
- Předložte důkaz s vyjádřením ÚJČ nebo ČÚZK, pak budu s přejmenováním souhlasit.--Eleiodromos (diskuse) 12. 12. 2018, 22:45 (CET)
- Třeba tady u Zwickau žádný jazykový cit nepadl, zato padla celkem rozsáhlá analýza zdrojů s výsledkem, že české exonymum se běžně používá, byť asi ne častěji než endonymum, což ale není podstatné. --Palu (diskuse) 12. 12. 2018, 22:28 (CET)
- Jen za tento rok tu proběhl spor o název Löbau, Oybin, Zwickau atd. Je to pořád dokola, často se tu argumentuje individuálním jazykovým citem a gůglováním. Až bude skutečný důkaz typu vyjádření ÚJČ či ĆÚZK, jsem ochoten s přejmenováním souhlasit, i když jsem toho názoru, že exonymum Cvikov se již příliš nepoužívá. Takový důkaz tu však zatím nepadl.--Eleiodromos (diskuse) 12. 12. 2018, 22:25 (CET)
- Ale já přece nemám problém s tím, kdyby hranice používanosti končila někde u Řezna (a to už jen pocitově, nemusím hned vytahovat nějaké číselné konstanty). Mně by bylo docela jedno kdyby z celého Německa bylo česky nanejvýš 10 nejpoužívanějších. Ale přijde mi uhozené tu hranici stanovovat v diskuzi u Cvikova a pak ji aplikovat jen na Cvikov. Nač takové jednorázové diskuze a pravidla. O městě psát nebudu, když ani neznáme jeho název ;P Chrzwzcz (diskuse) 12. 12. 2018, 22:07 (CET)
- Já teď vůbec nemluvím o korpusu, mluvím o tom, že návrh by měl být podložen jednoznačným důkazem zažitosti nebo alespoň něčím, co o Zwickau stanovil ÚJČ nebo ČÚZK. Navrhovatel přejmenování by měl něco s touto důkazní silou předložit. Hezké by také bylo, kdyby pak někdo z vás udělal o tomto městě kvalitní článek.--Eleiodromos (diskuse) 12. 12. 2018, 21:56 (CET)
- No nevím, proč bych ale měl bojovat proti korpusu, když nikdy nebyl brán v potaz, to je vámi uměle vymyšlená překážka zrovna u tohohle návrhu na přesun. Já bych zas mohl říct, že ČÚZK jasně stanovil a nedá se s tím nic dělat, ČÚZK určuje normy, a ne to, jak moc je české zdroje dodržují a s jakou relativní četností. Zvlášť pokud nám korpus nic neřekne o trendech, ale jen součet výskytů napříč historií. Opakuji, nemám nic proti Zwickau nebo Cvikovu, ale nelíbí se mi vytahování nových podmínek nikdy neotestovaných a nepsaných, a nekonzistentní postup zkoumání "zažitosti" u jednotlivých případů. Chrzwzcz (diskuse) 12. 12.
- Pokud tu vy, kolegové Palu, Tchoř či Hnetubud skutečně prokážete, že přejmenování je na základě těch a těch důkazů nezbytné, nebude jistě nikdo nic namítat.--Eleiodromos (diskuse) 12. 12. 2018, 20:53 (CET)
- Vzhledem k tomu, že se tyhle diskuze o zažitosti (nebo jak moc protežovat česká jména i když nemají nadpoloviční zásah) vedou prakticky u každého ne zcela notoricky známého exonyma (však ale taky u ne zcela notoricky známých měst, vsí, řek a moří) vždycky od nuly, nebylo by od věci je prodiskutovat někde stranou společně a stanovit autority, které budou respektované. Automaticky vyplivnuté číslo z korpusu sotva, jedna zeměpisná knížka asi taky ne, na ČÚZK se taky kouká spatra jak na nějaké snílkovské obrozence, ale nějaká kombinace těchto, to už by dohromady něco vypovědělo. Jen proboha ne špeditéry, to sem netahejte, to je argument jak noha. Chrzwzcz (diskuse) 12. 12. 2018, 20:39 (CET)
- Žádné relevantní zdroje jste neprozkoumal, neotevřel jste jedinou knihu, pouze jste trošku gůgloval. Na každý další návrh na přejmenování byste se měl připravit mnohem lépe. Když nemáte důkaz, nechápu, proč se do takových operací vůbec pouštíte.--Eleiodromos (diskuse) 12. 12. 2018, 16:07 (CET)
ROFL
Teď by mě už jenom zajímalo, jak přejmenujete článek Cvikovští proroci, ale on nám národní korpus jistě něco pěkného vypočítá. Zwickovští proroci? Zwickauští proroci? Zwickauerští proroci? Nebo snad Cvokovští proroci, což by úrovni této debaty odpovídalo asi nejlépe?--Hnetubud (diskuse) 11. 12. 2018, 14:26 (CET)
- Ten se pochopitelně vůbec přejmenovávat nemusí, protože označuje historické téma ze starší vrstvy jazyka. Nebo snad chcete, aby existence termínů "světlík solnohradský" (Euphrasia salisburgensis) nebo "solnohradský řízek" byla důvodem pro přejmenování hesla Salzburg na "Solnohrad"? Připomínám, že toto slovo s frekvencí 0,03 zde označil za nezažité i kolega Palu.--Eleiodromos (diskuse) 11. 12. 2018, 14:37 (CET)
- Což dokazuje, že relativní frekvence je sama o sobě bezcenným údajem. --Palu (diskuse) 11. 12. 2018, 21:48 (CET)
- Souhlasím s tím, že můžeme mít jméno města cizojazyčné a přitom mít exonyma trvale konzervovaná v odvozených pojmech. Na druhou stranu existence exonym v odvozených pojmech patří mezi argumenty pro použití exonyma a byť sama o sobě jako argument vystačí jen těžko, v kombinaci s jinými argumenty může být v důsledku i rozhodující.--Tchoř (diskuse) 12. 12. 2018, 05:29 (CET)
- Vzpomínám na Dessau a Bitva u Desavy. Jinak Zwickau-zwickauský a obyvatel je zřejmě Zwickan?Chrzwzcz (diskuse) 12. 12. 2018, 07:55 (CET)
- Souhlasím s předřečníky. Zažitost a aktuálnost termínů vlašský salát či vlašský ořech dle mého názoru ještě není pádným důvodem k tomu, abychom článek Itálie v zájmu konzistence přesunuli na Vlachy nebo je naopak přejmenovali na italský salát a italské ořechy, i když vlašskou renesanci nám už potichu nahradila italská renesance a na někdejší vlašské neboli české hodiny jsme za pár století po převzetí německých už skoro zapomněli a i v našem článku už je nazýváme prvně italskými. Nicméně Desavu, Žitavu či Cvikov bych ještě nebral jako úplně mrtvé a propadlé do historie. --ŠJů (diskuse) 24. 12. 2018, 16:05 (CET)
- Inu, chtěl jsem jemně naznačit, že exonyma nevznikají jen tak samoúčelně, ale mají pro flektivní jazyky jako čeština dost podstatnou výhodu: snadno se od nich tvoří různé odvozeniny (o existenci adjektiva „italský“ jsem samozřejmě informován, ale zkuste si vygůglit „zwickauský“). Každopádně nemám žádný osobní zájem na vítězství ani jedné strany, jenom se bavím absurditou zdejších debat.--Hnetubud (diskuse) 2. 1. 2019, 17:39 (CET)
- Souhlasím s předřečníky. Zažitost a aktuálnost termínů vlašský salát či vlašský ořech dle mého názoru ještě není pádným důvodem k tomu, abychom článek Itálie v zájmu konzistence přesunuli na Vlachy nebo je naopak přejmenovali na italský salát a italské ořechy, i když vlašskou renesanci nám už potichu nahradila italská renesance a na někdejší vlašské neboli české hodiny jsme za pár století po převzetí německých už skoro zapomněli a i v našem článku už je nazýváme prvně italskými. Nicméně Desavu, Žitavu či Cvikov bych ještě nebral jako úplně mrtvé a propadlé do historie. --ŠJů (diskuse) 24. 12. 2018, 16:05 (CET)
Index českých exonym: standardizované podoby, varianty
Po prostudování publikace ČÚZK z roku 2011 (BERÁNEK, Tomáš a kol. Index českých exonym: standardizované podoby, varianty = List of Czech exonyms: standardized forms, variants. 2., rozš. a aktualiz. vyd. Praha: Český úřad zeměměřický a katastrální, 2011. 133 s. Geografické názvoslovné seznamy OSN - ČR. ISBN 978-80-86918-64-8.), kde je uvedeno, že exonymum Cvikov je standardizovanou podobou českého exonyma pro město Zwickau, kterou ČÚZK čtenářům doporučuje k užívání, jsem ochoten se v případě Zwickau zdržet hlasování. Podklady pro toto doporučení jsou sice získány z třicet let staré nepublikované diplomové práce (Laurich, P., Česká exonyma z německé jazykové oblasti, Diplomová práce na FF UK Praha, 1988, rukopis), ale budiž. V indexu je ovšem také uvedeno, že domácí podoby cizích zeměpisných jmen: Bílsko (Polsko), Bílsko-Bělá, Černovice (Ukrajina), Hlubčice, Hlucholazy, Nový Brunšvik, Slovinský Hradec, Soča, Špandava a Špýr patří mezi exonyma zastaralá, málo užívaná a/nebo regionální, která proto nejsou tímto indexem standardizována. Další možnosti pro vytěžení tohoto zdroje jsou limitovány, neboť poslední aktuální vydání obsahuje jen 2625 hesel a řada názvů tu chybí. V návrzích na přejmenovávání výše uvedených hesel se angažovat nebudu, protože v tom zde nespatřuji hlavní oblast svého zájmu.--Eleiodromos (diskuse) 13. 12. 2018, 16:04 (CET)
- Děkuji vám. Spíše než o hlasování jde o hledání konsensu. Nemyslím, že by vámi citovaná publikace měla tak určující váhu (standardizace ČÚZK není preskriptivní), nicméně určitě nějakou, nemalou váhu má. Můžeme tedy uzavřít kapitolu Zwickau? Má někdo námitky proti přesunu? --Palu (diskuse) 13. 12. 2018, 17:20 (CET)
- Neboli jak to provedem? Když to je v seznamu ČÚZK doporučováno, tak použít, když je v seznamu odrazováno, nepoužít, a když to v seznamu chybí... tak je to na další debatu a hledání v jiných zdrojích? Chrzwzcz (diskuse) 13. 12. 2018, 19:43 (CET)
- Na to bych otevřel ŽoK, kde by se měly na čisto zrekapitulovat argumenty a možnosti a pak se můžeme vyjádřit. Tuhle debatu už nechme pro Zwickau. --Palu (diskuse) 14. 12. 2018, 07:56 (CET)
- Neboli jak to provedem? Když to je v seznamu ČÚZK doporučováno, tak použít, když je v seznamu odrazováno, nepoužít, a když to v seznamu chybí... tak je to na další debatu a hledání v jiných zdrojích? Chrzwzcz (diskuse) 13. 12. 2018, 19:43 (CET)
Mezní případ
Dle mého názoru je to typický mezní příklad, kde jsou zhruba stejně přijatelné obě varianty. Pokud nedojdeme ke konsenzu, jakou metodou variantu názvu u podobných článků volit, tak bych se přidržel zásady, že ve sporných a mezních případech článku zůstane ten název, pod kterým byl založen. Samozřejmě z druhé varianty názvu musí vždy existovat přesměrování, případně rozcestník.
Cvikov je nepochybně zažité české exonymum (či spíše zažitá česká varianta názvu, protože ta "cizost" je v místech s nehomogenním národnostním složením nebo se složitější národnostní historií velmi relativní - v českých Sudetech jsou leckdy původně exonymy spíše ty české názvy a v Lužicích zase ty německé), stejně tak je ovšem pravda, že zejména u menších měst či sídel je používání zažitých exonym celkově na ústupu. Obě tato fakta jsou podle mého názoru celkem zjevná a není snad nutno ani jedno z nich dokazovat. Nanejvýš bychom mohli do článku na základě zdrojů doplnit, kam v historickém kontextu zařadit alternativní exonymum Zvíkov.
Je nepochybné, že starší a tradičnější zdroje či slovní spojení a termíny staršího původu budou zpravidla vycházet z české varianty názvu, zatímco v modernějších zdrojích typu map, jízdních řádů či rejstříků se používají takřka výhradně místní názvy, dnes už většinou i pro velká města (Drážďany, Paříž), která v běžném jazyce stále ještě nazýváme exonymy. Mezi těmi dvěma krajnostmi je kontinuum: převaha té či oné varianty se bude lišit podle spousty faktorů, žánru, kontextu, podle vzdělání, věku, původu a jazykové vybavenosti mluvčích atd. Ovšem ani Google vyhledávání, ani ten či onen jazykový korpus, ani ten či onen odborný rejstřík či manuál není sám o sobě reprezentativní pro všechny žánry a jazykové vrstvy.
Ostatně i kdybychom se shodli na nějakém kritériu, podle kterého určovat, ke které variantě názvu se přiklonit, tak vždycky nám zůstanou případy, které budou hodně blízko takto určené hranici a tedy zůstanou sporné. To bychom vyloučili pouze v případě, že bychom jako hlavní kritérium určili pouze jediný zdroj, a to by zase kolidovalo se zásadou NPOV. I když samozřejmě je věcí našeho konsensu, jakou váhu a prioritu budeme přikládat konkrétním publikacím či databázím ČÚZK, Ústavu pro jazyk český atd. K hodnocení jazykového úzu či archaické stylové příznačnosti budou kompetentní spíš lingvisté než geografové, což ovšem neznamená, že každá lingvistická instituce nebo publikace je kvalitní a musí být brána za direktivní hlas shůry. Na druhou stranu, pokud respektujeme odborné unifikační autority v biologii, geologii či hydrogeografii, můžeme jim přiznat váhu i v administrativní a sídelní geografii.
Doporučuji přihlédnout i k praxi německé Wikipedie, která pro články o českých obcích a sídlech v rámci "politické korektnosti" používá české názvy i v mnoha případech, kde zažité německé varianty názvů nepochybně existují. Kupříkladu Prahu, Brno, Plzeň, Olomouc a Karlovy Vary má německá Wikipedie na německých názvech, ale Liberec, Cheb, Ústí nad Labem, Děčín či Opavu na českých. Zde se asi uplatňuje zásada, že čím je název politicky citlivější, tím větší je tendence přiklánět se k oficiálnímu názvu. --ŠJů (diskuse) 24. 12. 2018, 15:52 (CET)
- Nemyslím si, že by Němci dbali na politickou citlivost u německých názvů českých měst. Spíš mám za to, že mají buď jinak nastaveny kritéria (ne zažitost, ale například pouze očekávatelnost, tj. nadpoloviční většina) a nebo mají tato kritéria omezena na současnou mluvu. Obojí by pravděpodobně vedlo k jevu, který popisujete, a je to podle mě jednodušší vysvětlení. Zde na Wikipedii máme ale pravidlo, že zažitá exonyma mají přednost před endonymy a vy na jednu stranu píšete, že Cvikov je hraniční, na druhou píšete, že je zažitý. Pokud to tedy chápu správně, tj. že považujete onu zažitost za hraniční, pak příliš nerozumím k tomu, jakým způsobem lze hraničnost zažití vypozorovat :) Podle mě buď signifikantní menšina exonymum zná a používá, potom je zažité, a nebo zná maximálně okrajově a nepoužívá a potom je zastaralé. --Palu (diskuse) 27. 12. 2018, 18:09 (CET)
- Němci možná mají jednoznačnější systém, ale kdo říká, že lepší, prostě si ho tam odhlasovali a zde by to často zase ohýbalo očekávaností, pokud by třeba zbyl jen Berlín, Drážďany a Mnichov. Jak píšete, v některých oblastech Wikipedie respektuje odborné autority, třeba by mohla (trochu víc) i zde. Jako nejhorší způsob řešení mezních případů považuju "kdo dřív přijde ten dřív mele" aneb "jak to bylo založeno před xy lety na Wikipedii tak nechť to i zůstane", protože není ani tak systematický jako spíš náhodný a pro čtenáře hází exonyma bez ladu a skladu. Chrzwzcz (diskuse) 29. 12. 2018, 16:58 (CET)
- Po čase koukám na tuto diskusi a jen zírám, kolik zde těmito dohady bylo promarněno času, který bylo možno využít určitě mnohem smysluplněji. Množství onoho času sice nedovedu vyčíslit, ale myslím, že by z něj postačil pouhý zlomek, aby se někdo z debatérů - hlavně z těch nejaktivnějších - podíval na obsah aspoň jednoho z článků, o jejichž názvech se zde diskutovalo. Například český Cvikov obsahoval řadu pravopisných i věcných chyb - a vůbec nikomu to nevadilo (opraveno před chvílí)! Jinak se dívám na nové názvy článků o Cvikově a Zwickau, "vyšperkované" rozlišovači a, upřímně řečeno, žádné vylepšení zde nevidím, spíše naopak...--Dirillo (diskuse) 2. 1. 2019, 04:33 (CET)
- P. S. - Ale pořád lepší Cvikov (okres Česká Lípa) než "Cvikov (Česko)"! Možná i to Zwickau by vypadalo aspoň malinko přijatelněji, kdyby tam místo "Cvikov (Německo)" bylo aspoň "Cvikov (Sasko)".--Dirillo (diskuse) 2. 1. 2019, 04:54 (CET)
- Tomas62 (diskuse) 28. 3. 2019, 15:38 (CET) Cvikov (Německo) je pro mne vyhovující. Nemohu přijít na to, proč je Cvikov (Sasko) přijatelnější, jak píšete zde, či přesnější, jak píšete v komentáři k přesunu. Stejný rozlišovač v obdobném případě Chotěbuz (Německo) je akceptován.--
- Souhlas. Tisíckrát mohlo zvítězit nějaké doporučení o přejmenování článku, zdravý rozum ovšem prohrál. Čtenář neaktivní na Wikipedii jistě bude nejdříve zadávat na Gůglu Cvikov (Německo) a bude rád, že našel článek o 5,6 kB a k němu diskuzi o 157 kB. Hlavně že jsme bohatší o dva rozcestníky, mimochodem s chybným počtem obyvatel. Deset tisíc duší navíc přece nevadí, hlavně že jsme to přejmenovali. Gumideck (diskuse) 2. 1. 2019, 08:15 (CET)
- Můžu se zeptat, jak a čemu na druhou stranu pomohly tyhle komentáře a jak se liší od proběhlé diskuse? --Palu (diskuse) 2. 1. 2019, 09:26 (CET)
- Třeba apelem na princip Wikipedie, která je encyklopedií. Pokud se vytvoří takové množství diskuzního textu a na samotný článek se nesáhne, čili encyklopedické práce nula, je to ostuda. A pokud někdo pouze diskutuje, encyklopedii nevytváří a ještě si pak hrdě připíchne do svého portfolia odkazy na rozcestníky, které byly kvůli tomuhle cirkusu vytvořené, je to prostě trapas. Můžu tisíckrát předpokládat dobrou vůli, ale tady šlo jen o to udělat dobře svému egu. Wikipedie potřebuje lidi přidávající kvalitní encyklopedický obsah, ne vytvářející nekonečné diskuze. Aspoň opravte v tom rozcestníku stotisícové město, když v červnu 2018 neměl Cvikov (Německo) ani 90 tisíc. Sice Wikipedii může editovat každý, ale taky musí být nutně způsobilý. Toť na vysvětlenou, dál diskuzi prodlužovat nebudu, beztak je to házení hrachu na zeď. Gumideck (diskuse) 2. 1. 2019, 11:21 (CET)
- Tak jestli wikidoporučení ohledně rozlišovačů odporuje zdravému rozumu, tak se rozhořčujte u těch doporučení a ne u jejich aplikace. Samozřejmě někdo považuje za kvalitní tvorbu wikipedie jen nová kvanta textu bez ohledu na to, že článek se jmenuje hloupě a nečekaně (ať už to je případ Zwickau nebo ne), ale ať ten někdo nevnucuje jiným svůj pohled. A může to fungovat paralelně, někdo bude spíš tvořit, jiný zase systematizovat a dohromady lepší dílo. Chrzwzcz (diskuse) 2. 1. 2019, 19:17 (CET)
- Třeba apelem na princip Wikipedie, která je encyklopedií. Pokud se vytvoří takové množství diskuzního textu a na samotný článek se nesáhne, čili encyklopedické práce nula, je to ostuda. A pokud někdo pouze diskutuje, encyklopedii nevytváří a ještě si pak hrdě připíchne do svého portfolia odkazy na rozcestníky, které byly kvůli tomuhle cirkusu vytvořené, je to prostě trapas. Můžu tisíckrát předpokládat dobrou vůli, ale tady šlo jen o to udělat dobře svému egu. Wikipedie potřebuje lidi přidávající kvalitní encyklopedický obsah, ne vytvářející nekonečné diskuze. Aspoň opravte v tom rozcestníku stotisícové město, když v červnu 2018 neměl Cvikov (Německo) ani 90 tisíc. Sice Wikipedii může editovat každý, ale taky musí být nutně způsobilý. Toť na vysvětlenou, dál diskuzi prodlužovat nebudu, beztak je to házení hrachu na zeď. Gumideck (diskuse) 2. 1. 2019, 11:21 (CET)
- Můžu se zeptat, jak a čemu na druhou stranu pomohly tyhle komentáře a jak se liší od proběhlé diskuse? --Palu (diskuse) 2. 1. 2019, 09:26 (CET)
Přejmenování na Cvikov (Sasko)
K novému návrhu Dirilla na přejmenování: V současnosti, pokud se nemýlím, je úzus pojmenovávat podle států, nikoliv podle menších jednotek. Proto nejsem přesvědčen, že by bylo lepší Cvikov (Sasko) než Cvikov (Německo). --Palu (diskuse) 2. 1. 2019, 09:28 (CET)
- Souhlas, Cvikov (Sasko) je nestandardní postup (a to přesto že je město nalezitelné pod pojmem S/saský Cvikov). Chrzwzcz (diskuse) 2. 1. 2019, 19:19 (CET)
- Obecně je snaha mít rozlišovače co nejobecnější. Cvikov (Sasko) by bylo na místě, kdyby ještě existoval třeba Cvikov (Bavorsko). Pokud žádný takový není, tak ať to, co hledajícímu čtenáři nabídne našeptávač, je nápověda Německo, protože v danou chvíli pravděpodobně značná část čtenářů netuší, zda ten hledaný Cvikov je saský nebo třeba durynský ... a byť se nakonec rozhodnou jistě správně, je to zbytečná intelektuální aktivita navíc. Rozlišovač Německo je v tomto smyslu očekávanější. --Tchoř (diskuse) 3. 1. 2019, 06:23 (CET)
Přesun
Já už jsem možná úplně blbej, ale v kterém vesmíru se taková sáhodlouhá diskuse vyhodnocuje jako „neoponovaný návrh“?--Hnetubud (diskuse) 2. 1. 2019, 17:39 (CET) (Sice bych osobně byl spíš pro český název - viz výše - ale v životě bych si nedovolil zatížit systém takovým množstvím editací, aniž bych k tomu měl výslovný souhlas komunity)
- Ale tam je že od 13.12.2018 neponovaný návrh. Asi nejhlasitějšího protivníka se podařilo přesvědčit ČÚZKem. A ostatní jen připojují odsudky o tom, jak je taková diskuze pod jejich úroveň a že se má spíš tvořit obsah. Ne že bych se tím nějak přesunovače zastával, ale zas kritizovat spravedlivě ;) Chrzwzcz (diskuse) 2. 1. 2019, 19:22 (CET)
- No já vidím jen o kousek výš názor ze 24. 12. 2018, kde se píše: „ve sporných a mezních případech článku zůstane ten název, pod kterým byl založen“ (to mi jako podpora přesunu fakt nepřipadá). Myslím si ostatně totéž – opravujme věci, které jsou opravdu objektivně chybné a dělají wikipedii ostudu, je jich bohužel pořád dost. Hádky o synonyma nic nepřinášejí, jenom otravují atmosféru.--Hnetubud (diskuse) 3. 1. 2019, 23:04 (CET)
- Tak nadhoďte některé ty objektivně prioritnější chybné a ostudné věci, vrhneme se na ně... Ale že chybí v nějakých článek obsah, takové editory asi v diskuzích o přesunech a systematizaci nenajdete ;) Chrzwzcz (diskuse) 3. 1. 2019, 23:45 (CET)
- Chcete-li skutečně něco konkrétního, pak třeba pravopis: sice každý wikipedista vystupuje v diskusích jako ohromná autorita v oboru lingvistiky, ale články jsou plné chyb, jako by je psala děcka z kašičky. Jinak nic proti systematizaci, pokud se komunita shodne na její potřebnosti. Tím si ale bohužel u řady vašich akcí nejsem jist, viz https://cs.wikipedia.org/wiki/Wikipedie:Pod_l%C3%ADpou_(u_krbu)#%22%C4%8CR%22_v_infoboxech.--Hnetubud (diskuse) 7. 1. 2019, 21:24 (CET)
- To mi připadá jako nadávání pro nadávání a kopnutí pro kopnutí, zanadávat si a hotovo. Prostě jsou na Wikipedii faktické chyby v náhodných článcích na náhodných místech, to není něco, co by se dalo řešit nějak systematicky hromadně změnou doporučení nebo něco. Něco pravopisně pochybného třeba i opravím jestli bude chuť. Chrzwzcz (diskuse) 7. 1. 2019, 21:36 (CET)
- Chcete-li skutečně něco konkrétního, pak třeba pravopis: sice každý wikipedista vystupuje v diskusích jako ohromná autorita v oboru lingvistiky, ale články jsou plné chyb, jako by je psala děcka z kašičky. Jinak nic proti systematizaci, pokud se komunita shodne na její potřebnosti. Tím si ale bohužel u řady vašich akcí nejsem jist, viz https://cs.wikipedia.org/wiki/Wikipedie:Pod_l%C3%ADpou_(u_krbu)#%22%C4%8CR%22_v_infoboxech.--Hnetubud (diskuse) 7. 1. 2019, 21:24 (CET)
- Tak nadhoďte některé ty objektivně prioritnější chybné a ostudné věci, vrhneme se na ně... Ale že chybí v nějakých článek obsah, takové editory asi v diskuzích o přesunech a systematizaci nenajdete ;) Chrzwzcz (diskuse) 3. 1. 2019, 23:45 (CET)
- No já vidím jen o kousek výš názor ze 24. 12. 2018, kde se píše: „ve sporných a mezních případech článku zůstane ten název, pod kterým byl založen“ (to mi jako podpora přesunu fakt nepřipadá). Myslím si ostatně totéž – opravujme věci, které jsou opravdu objektivně chybné a dělají wikipedii ostudu, je jich bohužel pořád dost. Hádky o synonyma nic nepřinášejí, jenom otravují atmosféru.--Hnetubud (diskuse) 3. 1. 2019, 23:04 (CET)
Databáze Národní autority ČR
Přestože jsem se zařekl, že už nikdy-nikdy, napadla mě jedna kacířská myšlenka. Proč by podobné spory na Wikipedii nemohly být rozhodovány pomocí báze národních autorit, která je vytvářena NKČR a která obsahuje rozsáhlý soubor geografických autorit? To, o co se zde pouze více či méně laicky snažíme, je v Národní knihovně supervizováno osmi placenými zaměstnanci. Katalog SKC, jmenné autority a odkazy do katalogu jsou navíc již do Wikipedie implementovány. Na rozdíl od ČNK je to při tom opravdu jednoduché a každý si na této adrese může ověřit jakýkoliv termín.--Eleiodromos (diskuse) 3. 1. 2019, 03:06 (CET)
- Wikipedie má zrcadlit vnější realitu. Jedna část reality je regulace češtiny, která má nepochybně přednost před druhou částí, jíž je úzus - to je jak obecně uživatelé jazyka s jazykem pracují. Obě části jsou ale jinak rovnocenné. Pokud je mi známo, exonyma nejsou součástí nějaké snahy o regulaci češtiny ve smyslu, že by je vyloženě doporučoval nebo nařizoval ÚJČ (regulátor češtiny) k užívání. Pomocí slovníků ale samozřejmě ÚJČ může mapovat stav užívání exonym, což pro nás může být také zdrojem informace k posouzení zažitosti. Vzhledem k tomu, že ale neexistuje ucelená preskriptivní regulace ÚJČ (tak jako neexistuje ucelená preskriptivní regulace synonym apod. - čeština je živý, nikoliv zakonzervovaný jazyk), musíme vždy hledat kontext s reálným světem (tj. "jak to píší v novinách, v knihách, v televizích?").
- V předchozí debatě jste navrhoval přijmout jako výsadní autoritu ČÚZK. Pokud ČÚZK reguluje exonyma, pak pro účely odborné geografické literatury apod., nikoliv proto, aby nařídil lidu užívat to či ono exonymum - ČÚZK to nemá ve svých kompetencích a má pouze ambici ovlivňovat odborné práce kvůli výhodám standardizace ve vědních oborech. V opačném případě by existovalo stanovisko regulátora češtiny (ÚJČ), že exonyma reguluje ČÚZK. Proto sám za sebe můžu říct, že s přístupem přijmutí stanovisek ČÚZK za výhradní autoritu nesouhlasím. Opět ale stanovisko ČÚZK může představovat jeden z více argumentů při posuzování vnější reality.
- K návrhu použít jako výhradní autoritu rejstřík Národní knihovny musím uvést podobnou argumentaci, a sice že Národní knihovna nemá ambici regulovat jazyk a vydávat stanoviska o tom, jaká exonyma jsou přípustná a jaká méně. Rejstřík má opět jiné určení a účel než podávat veřejnosti informaci o zažitosti exonym. Navíc ani není jasné, jakým principem by mělo dotazování rejstříku a tedy i rozhodování o zažitosti podle tohoto rejstříku fungovat. --Palu (diskuse) 3. 1. 2019, 09:55 (CET)
- Vzhledem k tomu, že jste do této debaty nevnesl nic než několik vygůglovaných výskytů exonyma Cvikov, pokoušel jsem se zjistit, jaká je frekvence tohoto exonyma podle ČNK. Po té jsem hledal názory autorit a předložil jsem stanovisko ČÚZK opírající se o nepublikovanou diplomovou práci z roku 1988. Nyní předkládám možnost vyzkoušet si práci s vyhledáváním českých geografických termínů v rámci databáze Národní autority ČR. Toť vše.--Eleiodromos (diskuse) 3. 1. 2019, 16:45 (CET)
- Podobné spory o název článku vznikají kvůli různosti názorů diskutujících na to, který název je pro čtenáře nejspíš očenávanější. No a jak by tato databáze měla pomoci? (navíc dosti omezená, chybí i milionová města jako Urumči, Mukden, Cicikar...) --Jann (diskuse) 3. 1. 2019, 22:21 (CET)
- Pokud zde nepanuje shoda o tom, že zažitost není nic jiného než relativní frekvence, jak to chápou např. v dewiki, nezbývá než se obrátit k autoritám v oblasti jazyka, geografie nebo geografické terminologie (UJČ, ČÚZK, NKČR). Nahodilým gůglováním nebo argumentací osobním jazykovým citem se takový spor rozhodnout nedá. Báze NKČR, která vzniká od konce 90. let, zpracovává především knižní dary a povinné výtisky z ČR a sousedních zemí. Až přijdou knihy z Urumči, bude samozřejmě doplněna o další údaje.--Eleiodromos (diskuse) 3. 1. 2019, 23:28 (CET)
- Omyl této myšlenky spočívá v tom, že si myslíte, že UJČ, ČÚZK, NKČR jsou autority pro určování zažitosti exonym. Ve skutečnosti je ale regulátorem češtiny UJČ a ten exonyma nereguluje ani tím nikoho nepověřil. Obracíte se tak na falešné autority. To už jsem ale psal výše.
- Dosud se ověřovala zažitost sice pracným, nicméně spolehlivým průzkumem relevantních zdrojů. Buď současné zdroje používají dané exonymum v nezanedbatelné míře a pak jde o zažité exonymum, které máme podle pravidla upřednostnit, nebo tomu tak není a ani my ho nemáme upřednostnit. V pravidlech nic o autoritách není, protože exonyma žádné autority nemají. Výjimkou je ČÚZK, který se stará o standardizaci v odborné sféře, nikoliv v obecných encyklopediích, na které nemá žádný vliv.
- Chápu, že se snažíte vymyslet nějaký objektivní způsob poměřování, ale zároveň nerozumím tomu, proč vám přijde dosavadní způsob průzkumu zdrojů neobjektivní a nedostatečný a vhodný k nahrazení. Wikipedie má být odraz reality a ten se dá zjistit právě především průzkumem reality, tj. průzkumem relevantních věrohodných zdrojů. Můžou nastat situace, kde existuje preskriptivní autorita, tak tam je to pasé, ale tahle situace mezi ně nepatří. --Palu (diskuse) 4. 1. 2019, 15:45 (CET)
- Jediným dosažitelným údajem o zažitosti nějakého jevu v jazyce je jeho frekvence v jazykovém korpusu. Vaše nahodilé výskyty jsou pouze svědectvím o tom, že jste pět minut gůgloval. Výsledkem takového postupu by byly další Lobavy, Ojvíny a spol., které sice odpovídají vaší soukromé představě o tom, jak se česky mluví a píše, s realitou však nemají nic společného.--Eleiodromos (diskuse) 4. 1. 2019, 16:00 (CET)
- Jestli se chcete vrátit na začátek této 150kB debaty a začít tvrdit zase tuto převratnou teorii, tak prosím aspoň doložte, z čeho vychází. Jinak je to stále jen vaše soukromá teorie. --Palu (diskuse) 4. 1. 2019, 16:07 (CET)
- To už tu bylo řečeno vícekrát: „Jelikož je frekvence intuitivně a introspektivně nedostupná, jsou korpusy hlavním zdrojem informací o ní. Zároveň je frekvence v rámci korpusové lingvistiky považována za základní ukazatel, který má rozhodující vliv na popis jazyka a posouzení povahy, resp. i důležitosti studované formy či jevu.“ [30]. Nevím, proč bych tu měl dokazovat něco, co už je dávno dokázáno. Zažitost neroste na stromě, ani na webu, musí se změřit.--Eleiodromos (diskuse) 4. 1. 2019, 16:14 (CET)
- OK, problém je, že tohle já nezpochybňuji. Zpochybňuji pouze to, z čeho se má ta frekvence počítat. Když to srovnám s metodou, která byla dosud užívána (manuální průzkum zdrojů), pak vlastně došlo k tomu, po čem voláte, a zjišťovali jsme relativní frekvenci. Jen s tím rozdílem, že jsme si vybrali pouze relevantní vzorek, tedy ten, kde se skutečně o Cvikovu píše. V korpusu toho spousta chybí, zato je tam zase navíc zcela nerelevantní balast v podobě kuchařek nebo romantické prózy, kde prostě Cvikov nenajdete, a to vše zkresluje výsledek. Jde tedy o to kvalitně připravit vzorek a pak teprve zjišťovat frekvenci. Čili frekvence ano, korpus ne. --Palu (diskuse) 4. 1. 2019, 16:39 (CET)
- Relativní frekvence je matematicky definovaná veličina, vaše gůglování na aktuálním povrchu webu s tím nemá vůbec co dělat. Pokud se chcete dozvědět, co v korpusech je či není a jestli je relativní frekvence myslitelná bez použití korpusu či ne, viz informace a odkazy výše. Čili zažitost bez korpusu nemáte a mít nemůžete, viz informace výše. To je pro dnešek ode mě vše, rozhovor s vámi je pro mě ztrátou času.--Eleiodromos (diskuse) 4. 1. 2019, 16:51 (CET)
- Přestaňte prosím do debaty vkládat osobní urážky, nejsem na to zvědavý a ani to sem nepatří. Vlastně to nepatří do žádné kultivované debaty, nejenom tady na Wikipedii. Korpusem poměřovat exonyma nelze, protože na ně není zaměřen. Obsahuje z pohledu exonym většinou zcela nerelevantní texty. S pozdravem, --Palu (diskuse) 4. 1. 2019, 16:56 (CET)
- No, že korpus obsahuje vesměs texty irelevantní k nějakému konkrétníku problému není argument proti korpusu; soubor textů, který prohledává gůgl obsahuje relativně mnohem více irelevantního (prostě proto, že gůgl má k dispozici mnohem větší objem textů). A to (malý rozsah proti googlu) by mohl být argument proti korpusu, případně je tu otázka reprezentativnosti... --Jann (diskuse) 4. 1. 2019, 20:25 (CET)
- Já to myslel trochu jinak. Když omezím hledání například na noviny a knihy, najdu reprezentativnější vzorek, protože v novinách a knihách se občas o Cvikovu píše. Mimoto lze se vzrokem pracovat operativně a vznášet otázky jako "jak široce se exonymum používá? Není to věc jen nějaké nahodilosti, nějakého konkrétního oboru nebo nějaké konkrétní vrstvy jazyka?". Tohle všechno lze zjistit, když budu používat google test nebo manuální prohlídku knih jako způsob jak definovat vzorek. Získám tak velmi vypovídající data. V korpusu takhle nelze omezit vzorek, pokud vím. Navíc korpus, jak už bylo řečeno, spoustu relevantních materiálů postrádá. --Palu (diskuse) 4. 1. 2019, 20:49 (CET)
- No, že korpus obsahuje vesměs texty irelevantní k nějakému konkrétníku problému není argument proti korpusu; soubor textů, který prohledává gůgl obsahuje relativně mnohem více irelevantního (prostě proto, že gůgl má k dispozici mnohem větší objem textů). A to (malý rozsah proti googlu) by mohl být argument proti korpusu, případně je tu otázka reprezentativnosti... --Jann (diskuse) 4. 1. 2019, 20:25 (CET)
- Přestaňte prosím do debaty vkládat osobní urážky, nejsem na to zvědavý a ani to sem nepatří. Vlastně to nepatří do žádné kultivované debaty, nejenom tady na Wikipedii. Korpusem poměřovat exonyma nelze, protože na ně není zaměřen. Obsahuje z pohledu exonym většinou zcela nerelevantní texty. S pozdravem, --Palu (diskuse) 4. 1. 2019, 16:56 (CET)
- Relativní frekvence je matematicky definovaná veličina, vaše gůglování na aktuálním povrchu webu s tím nemá vůbec co dělat. Pokud se chcete dozvědět, co v korpusech je či není a jestli je relativní frekvence myslitelná bez použití korpusu či ne, viz informace a odkazy výše. Čili zažitost bez korpusu nemáte a mít nemůžete, viz informace výše. To je pro dnešek ode mě vše, rozhovor s vámi je pro mě ztrátou času.--Eleiodromos (diskuse) 4. 1. 2019, 16:51 (CET)
- OK, problém je, že tohle já nezpochybňuji. Zpochybňuji pouze to, z čeho se má ta frekvence počítat. Když to srovnám s metodou, která byla dosud užívána (manuální průzkum zdrojů), pak vlastně došlo k tomu, po čem voláte, a zjišťovali jsme relativní frekvenci. Jen s tím rozdílem, že jsme si vybrali pouze relevantní vzorek, tedy ten, kde se skutečně o Cvikovu píše. V korpusu toho spousta chybí, zato je tam zase navíc zcela nerelevantní balast v podobě kuchařek nebo romantické prózy, kde prostě Cvikov nenajdete, a to vše zkresluje výsledek. Jde tedy o to kvalitně připravit vzorek a pak teprve zjišťovat frekvenci. Čili frekvence ano, korpus ne. --Palu (diskuse) 4. 1. 2019, 16:39 (CET)
- To už tu bylo řečeno vícekrát: „Jelikož je frekvence intuitivně a introspektivně nedostupná, jsou korpusy hlavním zdrojem informací o ní. Zároveň je frekvence v rámci korpusové lingvistiky považována za základní ukazatel, který má rozhodující vliv na popis jazyka a posouzení povahy, resp. i důležitosti studované formy či jevu.“ [30]. Nevím, proč bych tu měl dokazovat něco, co už je dávno dokázáno. Zažitost neroste na stromě, ani na webu, musí se změřit.--Eleiodromos (diskuse) 4. 1. 2019, 16:14 (CET)
- (Reakce na Eleiodromos 4. 1. 2019, 16:00) No, tvrzení, že výskyty nalezené gůglem jsou nahodilé, kdežto výskyty nalezené hledáním v korpusu nahodilé nejsou, mi přijde velmi odvážné. Rovněž tvrzení, že pro posouzení rozšířenosti nějakého jevu je prohledávání a analýza relativně malého korpusu (navíc, jak vyplynulo z diskuze, sestaveného pouze z textů jejichž majitelé je pro korpus uvolnili) vhodnější než prohledávání a analýza mnohem většího souboru který má k dispozici gůgl (anebo jiné vyhledavače) je tvrzením netriviálním, jehož pravdivost není zřejmá. Lze to formulovat i takto: není zřejmé, proč by korpus textů zpracovávaných gůglem měl být méněcenný ve srovnání s korpusem textů zpracovávaným ČNK. --Jann (diskuse) 4. 1. 2019, 20:25 (CET)
- Nahodilé je účelové tvrzení, že nějakých 36 webových výskytů nějakého exonyma dokazuje jeho frekvenci čili to, jak lidé jazyk reálně používají. Relativní frekvence vypovídá o realitě tím nenahodilým způsobem, že přesně poměřuje absolutní frekvenci s velikostí korpusu. Zjistit frekvenci jevu v jazyce nějak jinak v současné době nelze. Pokud zde však z nějakého důvodu převládne názor, že frekvence/zažitost měřena nebude a že bude upřednostněn doložený názor autorit, neznamená to ještě to, že gůglováním je možné skutečné měření frekvence nahradit. Google totiž tuto frekvenci změřit nedokáže.--Eleiodromos (diskuse) 4. 1. 2019, 21:24 (CET)
- Asi nerozumím. Máte nějaký vzorek, třeba 20 textů. Jsou to řekněme veškeré texty dostupné v novinách. V tom vzorku třeba 2 texty použijí exonymum A, 7 textů exonymum B a 11 textů endonymum. Z toho vyplývá, že exonymum A není v novinách zažité, exonymum B je zažité a endonymum je zcela běžně známé. Podobně můžeme udělat průzkum v encyklopediích nebo na Google Books. Získáme tak několik dat, na základě jejich analýzy lze usoudit, jestli je exonymum zažité, tj. dostatečně známé k tomu, abychom ho použili dle našeho pravidla. Nechápu, proč pořád trváte na tom, abychom měli poměřovat cokoliv na korpusu, který obsahuje tisíce zcela irelevantních textů a naopak postrádá spoustu relevantních textů. Už vůbec pak nechápu, na základě čeho dáváte rovnítko mezi zažitost a frekvence, když frekvence je ukazatel něčeho (z kterého lze za určitých okolností usuzovat na zažitost), zatímco zažitost je stav něčeho. --Palu (diskuse) 4. 1. 2019, 21:44 (CET)
- Relativní frekvence vypovídá o realitě tím nenahodilým způsobem, že přesně poměřuje absolutní frekvenci s velikostí korpusu. Zjistit frekvenci jevu v jazyce nějak jinak v současné době nelze. - akorát že tímto způsobem nezjistíte frekvenci jevu v jazyce, ale pouze frekvenci jevu v tom konkrétním korpusu textů. Za druhé, v souvislosti se spory o "název článku nejspíše očekávaný čtenáři" vlastně nepotřebujeme znát hodnoty frekvencí jevů v jazyce, ale potřebuje srovnání velikostí těchto hodnot. A to lze provést i s jiným korpusem - totiž s "korpusem textů prohledávaných googlem". Zjistit, kolikrát vyšší relativní frekvenci má název A než název B v korpusu textů prohledávaných googlem může každý během pár vteřin. A tento korpus je mnohonásobně obsáhlejší než korpusy ČNK. --Jann (diskuse) 5. 1. 2019, 19:41 (CET)
- Ano, frekvenci výskytu jevu v jazyce skutečně nelze stanovit jinak než pomocí korpusu. Současná lingvistika prostě lepší metodu nemá. Pokud jde o momentální údaje uložené na povrchu webu (viz např. Měnící se svět webového vyhledávání), ty nelze v žádném slova smyslu považovat za jazykový korpus. Seznamte se prosím s fakty a pak lze případně dál diskutovat.--Eleiodromos (diskuse) 5. 1. 2019, 20:08 (CET)
- Nahodilé je účelové tvrzení, že nějakých 36 webových výskytů nějakého exonyma dokazuje jeho frekvenci čili to, jak lidé jazyk reálně používají. Relativní frekvence vypovídá o realitě tím nenahodilým způsobem, že přesně poměřuje absolutní frekvenci s velikostí korpusu. Zjistit frekvenci jevu v jazyce nějak jinak v současné době nelze. Pokud zde však z nějakého důvodu převládne názor, že frekvence/zažitost měřena nebude a že bude upřednostněn doložený názor autorit, neznamená to ještě to, že gůglováním je možné skutečné měření frekvence nahradit. Google totiž tuto frekvenci změřit nedokáže.--Eleiodromos (diskuse) 4. 1. 2019, 21:24 (CET)
- Jestli se chcete vrátit na začátek této 150kB debaty a začít tvrdit zase tuto převratnou teorii, tak prosím aspoň doložte, z čeho vychází. Jinak je to stále jen vaše soukromá teorie. --Palu (diskuse) 4. 1. 2019, 16:07 (CET)
- Jediným dosažitelným údajem o zažitosti nějakého jevu v jazyce je jeho frekvence v jazykovém korpusu. Vaše nahodilé výskyty jsou pouze svědectvím o tom, že jste pět minut gůgloval. Výsledkem takového postupu by byly další Lobavy, Ojvíny a spol., které sice odpovídají vaší soukromé představě o tom, jak se česky mluví a píše, s realitou však nemají nic společného.--Eleiodromos (diskuse) 4. 1. 2019, 16:00 (CET)
- (Reakce na Eleiodromos 3. 1. 2019, 23:28) Ano, a jak konkrétně nám má databáze Národní autority ČR pomoci? Soudě podle předložených odkazů v databázi nějaký geografický název buď je nebo není. Jak nám to pomůže ve výběru názvu nejspíše očekávaného čtenáři? Jak pomůže databáze geografických názvů, která neobsahuje milionová města? --Jann (diskuse) 4. 1. 2019, 20:25 (CET)
- Tato databáze je vhodným prostředkem k validaci osobních i zeměpisných jmen. Dokonalejší a větší databáze českých geografických termínů (počítaje v to i Geobibline.cz PřF UK) dosud neexistuje, což samozřejmě neznamená, že je dělána špatně.--Eleiodromos (diskuse) 4. 1. 2019, 21:24 (CET)
- Validaci osobních i zeměpisných jmen? No, zopakuji, databáze zeměpisných jmen, která neobsahuje ani jména několikamilionových měst a celků, je pro validaci nanic. Když bude jméno obsahovat, bude to jen dokazovat, že si to jméno wikipedisté nevymysleli, ale nic neřekne o vhodnosti jeho použití. Když nebude jméno obsahovat, nebude nikdo vědět proč, jestli kvůli neúplnosti databáze, kvůli neexistenci jména nebo kvůli něčemu jinému. Tak či onak, nepomůže rozhodnout žádný spor. --Jann (diskuse) 5. 1. 2019, 19:41 (CET)
- Mluvíme zde o exonymech, jichž je jen omezené množství a jež se týkají v drtivé většině sousedních a nepříliš vzdálených zemí. Ty jsou však zpracovány profesionály a podle stanovených metodik. Rád se ale seznámím s případnou alternativou v oblasti českých terminologických databází, pokud tedy máte lepší návrh.--Eleiodromos (diskuse) 5. 1. 2019, 20:08 (CET)
- Validaci osobních i zeměpisných jmen? No, zopakuji, databáze zeměpisných jmen, která neobsahuje ani jména několikamilionových měst a celků, je pro validaci nanic. Když bude jméno obsahovat, bude to jen dokazovat, že si to jméno wikipedisté nevymysleli, ale nic neřekne o vhodnosti jeho použití. Když nebude jméno obsahovat, nebude nikdo vědět proč, jestli kvůli neúplnosti databáze, kvůli neexistenci jména nebo kvůli něčemu jinému. Tak či onak, nepomůže rozhodnout žádný spor. --Jann (diskuse) 5. 1. 2019, 19:41 (CET)
- Tato databáze je vhodným prostředkem k validaci osobních i zeměpisných jmen. Dokonalejší a větší databáze českých geografických termínů (počítaje v to i Geobibline.cz PřF UK) dosud neexistuje, což samozřejmě neznamená, že je dělána špatně.--Eleiodromos (diskuse) 4. 1. 2019, 21:24 (CET)
- Pokud zde nepanuje shoda o tom, že zažitost není nic jiného než relativní frekvence, jak to chápou např. v dewiki, nezbývá než se obrátit k autoritám v oblasti jazyka, geografie nebo geografické terminologie (UJČ, ČÚZK, NKČR). Nahodilým gůglováním nebo argumentací osobním jazykovým citem se takový spor rozhodnout nedá. Báze NKČR, která vzniká od konce 90. let, zpracovává především knižní dary a povinné výtisky z ČR a sousedních zemí. Až přijdou knihy z Urumči, bude samozřejmě doplněna o další údaje.--Eleiodromos (diskuse) 3. 1. 2019, 23:28 (CET)
- Podobné spory o název článku vznikají kvůli různosti názorů diskutujících na to, který název je pro čtenáře nejspíš očenávanější. No a jak by tato databáze měla pomoci? (navíc dosti omezená, chybí i milionová města jako Urumči, Mukden, Cicikar...) --Jann (diskuse) 3. 1. 2019, 22:21 (CET)
- Vzhledem k tomu, že jste do této debaty nevnesl nic než několik vygůglovaných výskytů exonyma Cvikov, pokoušel jsem se zjistit, jaká je frekvence tohoto exonyma podle ČNK. Po té jsem hledal názory autorit a předložil jsem stanovisko ČÚZK opírající se o nepublikovanou diplomovou práci z roku 1988. Nyní předkládám možnost vyzkoušet si práci s vyhledáváním českých geografických termínů v rámci databáze Národní autority ČR. Toť vše.--Eleiodromos (diskuse) 3. 1. 2019, 16:45 (CET)
Obecná diskuse o názvech článků tady vůbec nemá co dělat. Pokud nebudou námitky, přesunul bych ji někam, kam patří spíš. Zatím mne napadá Diskuse k Wikipedii:Název článku. --Tchoř (diskuse) 5. 1. 2019, 20:55 (CET)