Wikipedie:Žádost o komentář/Označení odborných biologických názvů šablonou Cizojazyčně

Z Wikipedie, otevřené encyklopedie
Jump to navigation Jump to search

Popis problému[editovat | editovat zdroj]

Zdravím všechny. Existuje názor, že odborné latinské názvy, typicky například odborné biologické názvy (nebo se to možná týká právě jen nich?), by neměly být označované cizím jazykem. Například tato editace a v ní uvedený odkaz na související nápovědu o šabloně Vjazyce. Sdělení této nápovědy se dá pochopit, protože čeština přejímá tyto latinské názvy a v odborném jazyce je zakomponovává do sebe - je to tedy klasická přejímka a jde tak z tohoto pohledu o (odbornou) češtinu - v kontextu daného textu se nejedná o latinu.

Výslovnost těchto slov ale zůstává originální (tj. v tomto případě latinská), jak už to u přejímek bývá. Jak se řeší výslovnost přejímek u čteček? Jeden typ přejímek se přejímá už v českém zápisu, jako třeba "garáž", tam není potřeba nic řešit. Jiný typ se přejímá v originálním zápisu, jako třeba "software" - u těchto slov nepodléhajícím standardnímu čtení lze spoléhat na vytvoření konkrétní výjimky a není tak vhodné vytvářet obalení do šablony s výslovnostními pravidly (natož s výstupem po přejetí myši s informací o původním jazyku - to by bylo vyloženě na škodu). Něco podobného ale bohužel nelze očekávat u tisíců, desetitisíců nebo i statisíců záznamů ohledně biologických a jiných jmen, takže tady je cestou jedině definice způsobu čtení klasicky po písmenkách a slabikách, nikoliv stanovení konkrétních výjimek celých slov, kterých by bylo nepočitatelně.

Je tedy patrné, že nějakým způsobem je potřeba tato jména na rozdíl od jiných přejímek označit, aby čtečka věděla, že slova nemá číst podle českých pravidel a nepřečetla třeba "californica" místo [kalifornika] nesprávné [californica]. Standardně máme pro tento účel šablonu Cizojazyčně, jenže jak už bylo zmíněno, tady nejde o latinu v pravém slova smyslu, a šablona Cizojazyčně dává čtenářovi výstup po přejetí myši "latina", což sice není vyloženě chybná informace, ale může být pochopena zavádějícím způsobem. Jak bylo řečeno, v daném textu musíme považovat tyto latinské výrazy za odbornou češtinu. Pro někoho by tohle mohl být spíše zanedbatelný problém (jsem tak trochu mezi takovými), ale už zazněly hlasy, že to je důležité a brání to v užití šablony Cizojazyčně s parametrem "la". Je tedy potřeba nějakým vhodným způsobem vypořádat jak požadavek na označení daného textu výslovnostními pravidly, tak aby po přejetí myši nebyl podáván potenciálně zavádějící text.

Řešení obou požadavků bych spatřoval v úpravě šablony Cizojazyčně, která by obsahovala parametr řekněme "lat-bio", a ten by čtečce předal informaci o latinské výslovnosti a v textu by přitom přejetím myši místo "latina" vypsal například "biologické jméno". Nicméně nejsem odborník na programování, takže by bylo potřeba ověřit, jestli je to možné takto udělat.

Děkuji za konstruktivní příspěvky k debatě a co nejvíce nápadů, --Palu (diskuse) 22. 10. 2017, 21:25 (CEST)

Technická stránka věci[editovat | editovat zdroj]

Komentář k technické stránce věci: lze celkem snadno provést úpravu šablony {{Taxobox}} tak, aby položky binomické jméno a trinomické jméno ve všech článcích "balila" například do šablony {{Cizojazyčně}}. Otázka do diskuse samozřejmě je, co by šablona {{Cizojazyčně}} měla vlastně dělat – "číst" odborné jméno latinsky? Jen označit odborné jméno jako "odborné"? Ještě něco jiného? Jinak u jednotlivých taxonomických kategorií by to takto jednoduše nešlo, protože se vkláda najednou vždy český i odborný název (například říše = živočichové (Animalia)). --Vachovec1 (diskuse) 23. 10. 2017, 18:37 (CEST)

Rád bych jenom upřesnil, že tento problém se netýká jen Taxoboxů, ale i výskytů kdekoliv jinde. Co se týče otázky, co vlastně od šablony očekáváme, pak je to především překlad výslovnosti automatické čtečce, aby ta byla schopna slovo správně přečíst - označení po přejetí myši "latina" nebo "odborný název" nebo nic apod. je pak podružná otázka. --Palu (diskuse) 23. 10. 2017, 19:05 (CEST)

Doporučená řešení[editovat | editovat zdroj]

Tchoř[editovat | editovat zdroj]

Zavést do šablony podporu pro zvláštní pseudojazyk pro „mezinárodní“ názvy mi připadá rozumné. S výslovností je to ve skutečnosti ošemetnější (Latina#Výslovnost), ale vhodné označení otevírá v budoucnu možnost snadného řešení a v tuto chvíli bude latinská výslovnost asi nejbližší zamýšlenému, ať už si ta která čtečka pod latinkou výslovností představí cokoliv.--Tchoř (diskuse) 22. 10. 2017, 23:39 (CEST)

OJJ[editovat | editovat zdroj]

@Palu: Sice mi přijde řešit tohle zbytečnost, ale budiž. Používat kód pro latinu tedy určitě ne, kousek může být z latiny, kousem z řečtiny a jiných. Dobře je to vidět ve Vakoplšík létavý: Odborné jméno Acrobates pygmaeus je složené z řeckého ἀκροβάτης, což znamená akrobat, a latinského pygmaeus, trpaslík. Udělat kód pro biologickou hantýrku by bylo zajímavé, ale jak uskutečnitelné? Ručně projít ty tisíce článku by dalo práci na několik let, botem to bude uskutečnitelné těžko. Jak například pozná ve větě Jméno Drosera regia je složeninou ze řeckého droseros, což znamená pokrytá rosou, a latinského regia, znamenající královská., co je řecky, co latinsky, co odborně a co česky? Navíc každá nomenklatura má jinak nastavená pravidla kurzivy, takže například v zoologické nomenklatuře jsou kurzivně zapsány pouze genus a nižší taxony, u botanické i vyšší taxony.

Nabízí se ještě možnost zapsat to mezinárodní fonetickou abecedou, to nicméně bude po technické stránce rovněž komplikované. Co o tom soudí @Dvorapa, Matěj Suchánek, Martin Urbanec:? --OJJ, Diskuse 23. 10. 2017, 09:28 (CEST)

Ten příklad s vakoplšíkem létavým mi přijde zvlášť humorný. Řečtina nemá písmeno c, i když se tak někdy přepisuje dvojice tau-sigma, naopak hojně používá písmeno kappa je přepisované obvykle obyčejným k, takže byť ten prapůvod je třeba řecký, ta inspirace vypadá spíš přes polatinštělou (nebo poangličtěnou?) verzi a latinskou výslovností by se to mělo i číst, tedy c jako k. Naopak pro latinu je y typické asi jako x pro češtinu – tradiční latina jej používala jen u slov přejatých ze starořečtiny tam, kde bylo ve starořečtině ypsilon. Takže z toho pygmaeus čiší při prvním pohledu řečtina daleko víc (ostatně vizte článek pygmejové) než z acrobatese. Latinská výslovnost ale bude fungovat i tam.
Kurzívu bych do toho nepletl, to mi nepřijde související.
Co se týče uskutečnitelnosti – asi by to nešlo ze dne na den. Otázka, zní, zda je nějaký důvod v tom bránit někomu, kdo tím chce trávit čas. Když to bude udělané chytře přes šablonu, tak se to v nejhorším vždycky může při interpretaci pomíjet.--Tchoř (diskuse) 23. 10. 2017, 17:38 (CEST)
@Tchoř: Tak ono je spíše důležité, že ten původ vychází z řečtiny i latiny, je to tedy takový ten mišmaš, který nelze jednoduše označit.
Než něco navrhneme, doporučoval bych právě řešit uskutečnitelnost. Například teprve teď došlo k sjednocení stupňů ohrožení, ale vzniklo z toho tisíce redirů, co by se narovnat měly, ale botem je to zátěž pro servery a ručně s dalšími úpravami neuskutečnitelné, pokud bychom neměli nábor dobrovolníků. Tohle je už krajně neuskutečnitelné, protože se při botovodičství nelze chytit ani té kurzivy, navíc taxonů je mnoho a mnoho je zmíněno i v samotném článku.
Doposud by jinak WP byla jedinou encyklopedií, kde by byla výslovnost odborných jmen uvedena a to už jsem jich viděl dost - jak populárně naučné, tak ty od největších kapacit. OJJ, Diskuse 23. 10. 2017, 18:18 (CEST)

Jan.Kamenicek[editovat | editovat zdroj]

Ruční přidávání takové šablony mi také přijde jako neúnosně náročné s výsledkem neodpovídajícím vloženému úsilí, které bychom měli směrovat jinam. Souhlasím s OJJ, který poukázal na problém odborných názvů, které nemusejí vždy vycházet z latiny. Tchoř navrhuje, že by to šablona mohla případně při interpretaci pomíjet, ale nepochopil jsem z toho, jak ta šablona pozná, kdy má výslovnost interpretovat latinsky a kdy to má pominout. --Jan.Kamenicek (diskuse) 23. 10. 2017, 18:05 (CEST)

Jak poukázal kolega Tchoř, výslovnost se čte latinsky nezávisle na původu slov. Co se týče "mi přijde jako neúnosně náročné s výsledkem neodpovídajícím vloženému úsilí" - výsledek je, že to umí přečíst správně čtečka a to je podle mě adekvátní úsilí - je to stejný princip jako použití šablony Cizojazyčně kdekoliv jinde. --Palu (diskuse) 23. 10. 2017, 19:03 (CEST)
Jak jsem věc pochopil, tak šablona nemá poznávat, kdy se odborná biologická jména čtou latinsky, a kdy nějak zpotvořeně; to si musí rozhodnout čtečka. Šablona má odborná biologická jména nějak specificky označit. Jestli čtečky mají (budou mít) zabudované "extra pravidla výslovnosti odborných biologických jmen", tak podle toho označení poznají, že je mají použít. Jestli čtečky extra pravidla pro odborná biologická jména nemají, tak se šablona nastaví tak, že čtečkám bude říkat "vyslovujte to jako latinu" (protože v průměru pro většinu těch jmen je to nejlepší volba), a až se čtečky zdokonalí, tak se šablona přenastaví. Vtip celé věci je v tom, že když odborné biologické jméno označeno šablonou nebude, čtečka je bude číst česky. A řekl bych, že zpravidla je lepší číst je latinsky, než česky. Co se týče náročnosti označování jmen, tak je jasné, že roboticky by šlo označit jen část výskytů (v boxech, možná v úvodní větě); no a, spoustě věcí trvá dlouho, než se rozšíří stoprocentně. Jsou lidi co je nebaví psát články, ale takové malé editace dělají, tak budou mít příležitost. --Jann (diskuse) 23. 10. 2017, 20:42 (CEST)
Zatím je to všechno takové nějaké hypotetické. Byl by nějaký konkrétní příklad čtečky, která bere naše šablony vážně, a nějaké údaje o jejím rozšíření, abychom mohli posoudit, zda to stojí za to a) úsilí těch, kteří to budou šablonovat a budou chybět na jiné potřebné drobné práce b) úsilí těch ostatních, co se budou prát s dalším zaplevelením čistého textu šablonami?
Je to další krok pryč od zlatého pravidla "Keep it simple". Starým matadorům to nepřijde, protože všem šablonám postupně přivykli, ale kdo si vyzkoušel přednášet psaní Wikipedie na kursu pro veřejnost (nebo dokonce pro seniory), tak ví, o čem mluvím. V některých biologických článcích se ta šablona bude vyskytovat po desítkách či stovkách. V hesle Láčkovka rádža jsem napočítal, že by šablona byla použita asi 76x, a to je ještě štěstí, že název této rostliny má český ekvivalent, jinak by to násobně více. Kdyby někdo přeložil z angličtiny heslo Tyrannosaurus rex, tak by se jenom v úvodu šablona použila asi 40x, takže v celém hesle by to zřejmě bylo mnoho stovek, radši jsem už dál nepočítal. Zaplevelit heslo šablonami je potom trest pro každého dalšího potenciálního přispěvatele, mnohé lidi to pak odrazuje, aby se s takovými texty prali. --Jan.Kamenicek (diskuse) 23. 10. 2017, 23:30 (CEST)
Bohužel, lepší způsob jak čtečku upozornit za změnu pravidel výslovnosti nemáme, zatím máme jen šablonu Cizojazyčně. V rámci přístupnosti se ale tímhle problémem zabývat musíme a nemůžeme říct prostě jenom "seniorům to znepřehledňuje zdroják", protože pak bychom zase měli tvrzení, že "zdroják bez šablon znepřehledňuje nevidomým čtení". Je lepší, aby se trápil senior v orientaci ve zdrojáku, nebo aby nevidomý nepochopil znění článku kvůli nesprávné výslovnosti? Myslím, že je to jasné. --Palu (diskuse) 24. 10. 2017, 06:43 (CEST)
@Palu: Je doposud tahle vymoženost na nějaké jiné Wikipedii nebo si stále jako správní Češi musíme hledat zvláštnosti na přidávání práce s téměř nulovým užitkem bez kterých se ostatní v klidu obejdou a raději píšou články? Je to v jiné encyklopedii? Troufám si říct, že devět desetin lidí vysloví californicus jako kalifornikus. Co bude dál? Z Einsteina uděláme Ajnštajna?! Nechť si soudruzi raději upraví čtečky, které stejně za chvíli budou schopny přečíst vše, takže to budeme dělat zbytečně. OJJ, Diskuse 24. 10. 2017, 06:58 (CEST)
Wikipedie se snaží být přístupnou stránkou pro všechny, čili je nutné zajistit přístupnost i nevidomým, když se ta možnost jasně nabízí. Jestli to mají na jiných mutacích, to netuším, ale i tak to nemůže být argument pro znepřístupnění Wikipedie. Jestli vás tahle problematika moc nebere, tak to zase nemůže být důvod pro to, aby se jí nemohli věnovat jiní. Z vaší argumentace jsem pochopil, že jste přesvědčen o zbytečnosti, ale postrádám jakékoliv objektivní důvody. Já píšu o přístupnosti pro nevidomé a vy o tom, že 9 lidí z 10 čte kalifornikus místo californicus, jako by to nějak souviselo. --Palu (diskuse) 24. 10. 2017, 18:28 (CEST)
@Palu: Doporučuji ji začít překládat pro syrské a ještě k tomu blbé dětičky. :-) Jestli z těch iks set Wikipedií tohle nemají, nevím, proč to máme mít zrovna my. Časem se upraví čtečky a budou to číst, Google translator už to umí teď. OJJ, Diskuse 24. 10. 2017, 18:33 (CEST)
Přirovnávat nevidomé k blbým dětičkám mi už přijde hodně přes čáru a hodně za etickou hranicí této debaty. Co se týče toho, že Google to umí, tam musím souhlasit, že máte částečně pravdu a že skutečně některé výrazy přečte dobře bez nápovědy Cizojazyčně. Jiné ale přečte špatně a nikdy nebude dosahovat stoprocentně na lidskou interpretaci. A ani sám člověk nebude nikdy absolutně stoprocentní. --Palu (diskuse) 24. 10. 2017, 18:38 (CEST)
@Palu: Proto bych se v klidu na editace, co budou zatěžovat servery, historii, zdrojový kód a lidi, co to budou muset dělat. Ukažte mi jeden reálný příklad použití tohoto v praxi. Nelze zpřístupnit Wikipedii všem, tímhle způsobem (to, že to čtečka přečte takhle, každému dojde) a na úkor normálních lidí. OJJ, Diskuse 24. 10. 2017, 18:59 (CEST)
OK, myslím, že máte sociální cítění trochu někde jinde než já, takže se neshodneme. Za mě Wikipedie funguje na rozšiřování obzorů všech na úkor právě normálních lidí, tj. i nevidomých na úkor dobrovolníků, kteří mají chuť tomuto cíli věnovat svůj čas. --Palu (diskuse) 24. 10. 2017, 19:28 (CEST)
Jinak bych rád upozornil, že jsme se odklonili od tématu a z debaty "jak označit odborná jména šablonou Cizojazyčně" máme debatu "má šablona Cizojazyčně smysl?". --Palu (diskuse) 24. 10. 2017, 21:26 (CEST)
Zpět k původnímu tématu. Biologické články používají odborné názvy v takovém množství, že rozšíření funkce této šablony i na označování odborných názvů by Wikipedii touto šablonou zcela zahltilo. Výsledkem by bylo, že editace takto zaplevelených textů by se stala opět zase složitější pro nové a nezkušené editory, a vůbec se to netýká jen seniorů. Složitost editace je přitom hlavní překážkou náboru nových přispěvatelů. Přitom v ruce nemáme žádný důkaz, že existují nějaké čtečky, které tu naši šablonu berou v úvahu, a pokud náhodou ano, tak nakolik jsou rozšířené. Přitom lze předpokládat, že čtečky se to brzy naučí i bez našich šablon, takže ta práce bude zbytečná. Téměř žádné jiné stránky (nebo spíš asi vůbec žádné) na webu totiž odborné názvy nijak čtečkám neoznačují, takže ty čtečky se to prostě budou muset naučit i bez označování. --Jan.Kamenicek (diskuse) 25. 10. 2017, 10:01 (CEST)
Ad v ruce nemáme žádný důkaz, že existují nějaké čtečky, které tu naši šablonu berou v úvahu - šablona dělá to, že označený text obaluje html atributem lang [1]. Takže citovaná věta by se měla správně formulovat v ruce nemáme žádný důkaz, že existují nějaké čtečky, které berou v úvahu html značku pro jazyk. PS. Na enwiki mají stejnou šablonu ve více než půlmilionu článků, a jako jeden z důvodů její existence uvádějí označení jazyka pro čtečky. --Jann (diskuse) 25. 10. 2017, 14:31 (CEST)
Čímž opět narážíme na problém, že nejde o latinu. JAn (diskuse) 25. 10. 2017, 16:09 (CEST)
Když jste zmínil en.wiki, tak tam tu šablonu využívají právě jen na označení jazyka. Takové využití není zase tak masivní, takže se to dá kvůli těm hypotetickým výhodám zkousnout. Palu ale navrhuje šablonou označovat všechny odborné biologické názvy, což by znamenalo, že v některých heslech může být šablona využita i několikasetkrát. Zde už jsou nevýhody více než viditelné a rozhodně nad nepotvrzenými výhodami drtivě převažují.
Obalit to do značky, která bude čtečkám radit (ať už si nějaké nechají radit nebo ne, což stále nevíme), že jde o latinu, také neřeší to, že ve skutečnosti se v češtině velmi mnoho odborných názvů čte počeštěně (Triceratops). Kdesi výše někdo říkal, že my to máme jen obalit a takové detaily už si musí vyřešit ta čtečka. OK, ale zase jsme u toho, jestli známe nějakého výrobce čteček, který to bude řešit. Pokud ne, tak ty nevýhody za to nestojí. --Jan.Kamenicek (diskuse) 25. 10. 2017, 17:41 (CEST)
Abych si rozšířil obzory: V čem spočívá počeštěné čtení triceratopse? Čekal bych, že výslovnost bude odpovídat (české) výslovnosti latiny. --Tchoř (diskuse) 25. 10. 2017, 19:01 (CEST)
Kdyby snad existovala nějaká výjimka, která se čte českou výslovností v rozporu s latinskou, tak co je jednoduššího, než šablonu v takovém případě nepoužít? --Palu (diskuse) 25. 10. 2017, 23:04 (CEST)
Výjimka spočívá v tom, že u běžných latinských výrazů (i v českém textu) si čtenář či programátor čtečky může vybrat, jestli je bude číst klasickou latinskou výslovností nebo tzv. českou, obé je dobře. Týká se to i některých odborných výrazů, např. Coelophysis jsem slyšel v českých dokumentárních pořadech vyslovovat s [ts] i s [k] na začátku. Triceratops je ale počeštěný natolik, že při jeho výskytu v českém textu na výběr není a vyslovuje se zásadně s [ts], takže pokud má čtečka naprogramovanou klasickou latinskou výslovnost, tak to přečte špatně.
@Palu: Vycházel jsem z toho, že ta šablona se podle návrhu má dávat na všechny odborné biologické názvy a kromě informace o výslovnosti má také zobrazovat informaci, že jde o "biologické jméno". Návrh, že u některých biologických názvů se má používat a u jiných nikoliv je nový. Na jednu stranu řeší aspoň ten menší z problémů, na druhou stranu vnáší určitou nesystematičnost. Není také jisté, zda by přispěvatelé šablonu vkládali se znalostí problematiky výslovnosti, nebo zda by ji prostě lepili na každý odborný název, který uvidí. Ale to je stejně podružné, byl to ode mne spíše takový malý dodatek k hlavnímu problému, který vidím jinde, viz výše. --Jan.Kamenicek (diskuse) 26. 10. 2017, 00:34 (CEST)
Nemůžu souhlasit s tím, že by byla dobře česká výslovnost latiny, odporuje to třeba této a této stránce - californice se má část "kalifornika", nikoliv česky "californica". U triceratopse opakuji, že lze v takových případech šablonu Cizojazyčně vynechat (pro definici české výslovnosti) nebo jí nadefinovat jakákoliv jiná výslovnostní pravidla poldle situace. A znovu musím zopakovat, že hlavní funkce šablony má být definice výslovnosti čtečce, nikoliv zobrazovat jazyk výslovnosti nebo "biologické jméno". Ale i kdyby u většiny biologických jmen bylo zobrazeno "biologické jméno", a u výjimek zase ne, myslím, že by nešlo o vážný stylistický problém. Šablona dokonce ani nemusí u biologických jmen zobrazovat vůbec žádný text (třeba parametr "zobrazit=ne"), ale je potřeba se na problém dívat očima "jak by to šlo vyřešit" místo "jak by tomu šlo zamezit" nebo "jak by šlo dokázat, že to je blbost". Myslím, že požadavek na správné přečtení článku pro nevidomé je zatím nade všechny argumenty, které zazněly. --Palu (diskuse) 26. 10. 2017, 07:22 (CEST)

JAn[editovat | editovat zdroj]

Označení těchto názvů je rozhodně v pořádku, ale určitě neoznačovat jako latinu. De facto to není žádný jazyk s kodifikovaným ISO 639-1/3 kódem. Nabízí se buď použít speciální kód dle ISO 639-3 (např. pro lokální použití qtx (jako TaXonomie)), nebo naopak použít jinou šablonu, než je {{Cizojazyčně}}, třeba {{Taxon}} nebo {{Biologická nomenklatura}}. Té by se potom dala jako obezlička nastavit natvrdo latina JAn (diskuse) 23. 10. 2017, 22:44 (CEST)

Ještě mne napadá, že je možné umístit ke každému taxonu na Wikidata IPA (P898) nebo nahrávka výslovnosti (P443). Sice to nepomůže řetězcům v textu, ale je to do budoucna využitelné třeba právě pro čtečky. JAn (diskuse) 24. 10. 2017, 10:44 (CEST)

Nahrávka výslovnosti natvrdo by počítala s napojením čtečky na internet pro stažení daného souboru, navíc by logicky docházelo ke změnám hlasu během čtení, což není příliš přijatelné z estetického hlediska. Co se týče definicí IPou, tam se přiznám, že nevím v čem by byl rozdíl oproti Cizojazyčně, kromě toho, že by to bylo editorsky velmi zatěžující - editor by musel ověřovat existenci výslovnosti na Wikidatech, musel by zbytečně pracovat za čtečku v přepisu slova do čtené podoby, navíc by musel existovat způsob, jak zadat do Wikidat i ohýbané tvary. --Palu (diskuse) 24. 10. 2017, 18:34 (CEST)

Vojtěch Dostál[editovat | editovat zdroj]

Kdyby to šlo, nebránil bych se tvrdému zakódování "jazyka" "taxonomie" do šablony. Stejně to ovšem čtečky zatím patrně neumí číst, "taxonomický jazyk" neznají a při absenci přesně kodifikovaných gramatických pravidel pro čtení odborných jmen se obávám, že ani nikdy umět nebudou. Jenže ono to do šablony Taxobox v této chvíli vložit nelze, protože obsahem parametrů je směs českých a odborných názvů. Přikláním se k odložení tohoto problému, dokud se nenajde řešení, které nevyžaduje vkládání desítek instancí šablon do jednotlivých článků. --Vojtěch Dostál (diskuse) 28. 10. 2017, 15:37 (CEST)