Diskuse:Hindština

Obsah stránky není podporován v jiných jazycích.
Přidat téma
Z Wikipedie, otevřené encyklopedie

Není pravda, že dévanágarí nemá jednotné fonty. Již několik let existují fonty pro (téměř) všechny indické jazyky ve formátu OpenType, jež jsou kódovány podle Unicode. Pokud jde o dévanágarí, ve Windows je nyní font Sanskrit 2003, v Linuxu je např. Chandas, Gargi, Lohit hindi. Dokonce systémový font monospace obsahuje znaky několika indických písem, znaky arabské, cyrilici apod. Je však pravdou, že na internetu se stále vyskytují texty zapsané pomocí fontů s proprietárním kódováním. Fonty jsou na takových stránkách nabízeny ke stažení, ale nepodařilo se mi je nainstalovat ani v Linuxu, ani ve Windows XP. --Icebearsoft 16:05, 25. 1. 2008 (UTC)

Celý ten odstavec o fontech je napsán dost divně a nesrozumitelně. Taky se mi zdá, že se tu slučuje pojem fontu a kódování. Texty na internetu mohou být zakódované nestandardním (což dnes znamená jiným než Unicode) kódováním a poskytovatel může nabízet proprietární fonty, které toto kódování používají také a umožní mi, abych text viděl tak, jak má vypadat. Elektronický text ale nikdy není "zapsán nějakým fontem". Já si přece můžu vytvořit svůj vlastní font a pokud bude používat správné kódování, uvidím text také. Mimochodem já mám ve Windows microsoftí font Arial Unicode MS a většinu indických textů kódovaných v Unicode vidím dobře. Výjimkou je urijské a sinhálské písmo, pro které jsem si musel sehnat fonty jinde. --Dan Zeman 17:37, 5. 2. 2008 (UTC)

Máte pravdu. Dévanágarské písmo mi funguje počínaje Windows 2000, ale i v dostatečně nových Linuxech, aniž bych musel cokoliv speciálního udělat. V minulosti tomu tak nebylo. Jednak nebyl rozšířen Unicode, ale také neexistoval formát OpenType. Noviny v hindštině byly na webu jako Wordové soubory a dodávaly se k tomu speciální fonty ve formátu TrueType, které si člověk nainstaloval. Horší je to se stránkami, kde se předpokládá, že si prohlížeč natáhne font z webu dynamicky. Zkusil jsem to s Internet Explorerem ve Windows 98 a XP, s Mozillou v OS/2 a Linuxu, s FireFoxem v Linuxu, ale font se nikdy nenačetl. Když jsem si ten font stáhl z webu ručně, Windows ani Linux nepoznaly, že v tom souboru je font a nešlo to nainstalovat. Samotný Unicode ještě neřeší všechny problémy. V indických písmech je nutno vytvářet zpřežky a přesunovat nesamostatné samohlásky. V neunicodových fontech se to řešilo tak, že spřežky a poloviční formy souhlásek měky vlastní nestandardní kódy a samohlásky se psaly tam, kde měly být graficky. Ještě teď se na stránkách kódovaných v Unicode najde "ik" místo "ki". Někdy je to zobrazeno správně, někdy se za samohláskou objeví tečkovaný kroužek uznačující chybějící souhlásku: िक. Způsob, jak s indickými písmy zacházet, je popsán ve standardu Unicode v Kapitole 9, použití indických písem ve formátu OpenType je popsáno např. v Indic OpenType Specification. Ve Windows se o zobrazení stará knihovna Uniscribe, v Linuxu Pango nebo ICU. Tyto knihovny nemusí v Linuxu automaticky být, a i když tam jsou, některé programy je nemusí využívat, takže zobrazení indických písem pak není správné. Ovšem tato diskuse nepatří do kapitoly o hindštině, ale spíše do kapitoly o indických písmech, nebo do kapitoly o formátech fontů. --Icebearsoft 11:10, 6. 2. 2008 (UTC)

Re: doplnění gramatiky[editovat zdroj]

Dobrá práce! Ještě bych dodal, že vokativ jednotného čísla je shodný s nepřímým pádem, tj. oslovení chlapče je लड़के, oslovení chlapci je लड़को. Dále se v textu používá na jednom místě označení retroflexní souhlásky a jinde cerebrální souhlásky. Bylo by dobré u prvního výskytu dát ten druhý termín do závorky, aby všichni věděli, že je to totéž. --Icebearsoft 09:33, 7. 2. 2008 (UTC)

Tak jsem se k tomu konečně zase dostal a trochu jsem to poopravil. --Dan Zeman 17. 10. 2008, 08:24 (UTC)

Všeobecná deklarace lidských práv[editovat zdroj]

Chtěl jsem se zeptat, odkud a z jaké doby máte úryvek z Všeobecné deklarace lidských práv. Nepročítal jsem to důkladně, ale hned na prvním řádku ukázky nemá být स्वतन्न्नता, ale स्वतन्त्रता. Verzi UDHR in Unicode přepisoval do počítače člověk, který nezná písmo ani jazyk, a opisoval to z rukopisu naskenovaného v malém rozlišení, takže písmena byla hodně deformovaná. Já jsem ty chyby opravil, na webu je moje verze. Pokud jste to bral z nějaké nedávné verze, znamená to, že jsem ještě něco přehlédl. --Icebearsoft 09:45, 7. 2. 2008 (UTC)

Nechtělo se mi přepisovat ten JPEG, co visí na UNHCHR, tak jsem našel tohle. Je tam disclaimer, že autor hindsky neumí. Já taky ne (i když částečně přečtu písmo a něco jsem si načetl o té gramatice), takže těch třech N jsem si sice všimnul, ale nepokoušel jsem se je opravovat. Transliteraci jsem prováděl vlastním skriptem, takže ani netuším, kudy mi tam vklouzlo to bugdhi. Ještě je jedna verze na Omniglotu, kterou jsem ale včera myslím neprohlížel (nejsem si jistý, ale asi jsem na Omniglot koukal až později při psaní článku o maráthštině. --Dan Zeman 12:14, 8. 2. 2008 (UTC)

Děkuji za informaci. Správná verze je na UDHR in Unicode, znovu jsem to zkontroloval a tři N tam skutečně nejsou. Zřejmě to Eric Müller opravil jen na výše zmíněném serveru. Napíšu mu, aby to vyměnil, těch chyb tam byla spousta. Ten JPEG, který zmiňujete, taky znám. Je to psáno rukou a naskenováno v malém rozlišení, takže když někdo neumí alespoň základy hindštiny a nezná dobře písmo, nemá šanci to přepsat. A když jsem na to poštval spellcheck, našel jsem další chyby. --Icebearsoft 14:56, 17. 2. 2008 (UTC)

Eric Müller mi napsal, že verze, kterou jste našel, je již delší dobu neudržovaná a že již s tímto ISP nespolupracuje. Zůstala tam jako relikt, napsal, že to nechá smazat. A pokud jde o buddhi/budghi, napadlo mě přetáhnout dévanágarský text do editoru a podívat se na to hexadecimálně. Bylo to špatně i v dévanágarí (už jsem to opravil), ale ve většině fontů je rozdíl téměř nepostřehnutelný. (A nezaměňte tohle slovo se slovem बुद्धू = buddhú, což znamená hlupák.) --Icebearsoft 12:59, 19. 2. 2008 (UTC)

Abecední pořadí[editovat zdroj]

Abecední pořadí samohlásek, jak je uvedeno v tabulce, je sanskrtské, nikoliv hindské. V hindské abecedě jsou anusvár, anunásik a visarg na začátku abecedy. Například slovo कुंजी je v abecedě dříve než कुआँ. (Viz např. Hindsko-český slovník, autoři Jaroslav Strnad a kol.) --Icebearsoft 10:39, 8. 2. 2008 (UTC)

No já ten slovník nemám a řídil jsem se tím, co píše Vincenc Pořízka ve své učebnici hindštiny (viz citace v článku) na str. 36. Jinak by mě nenapadlo dát anusvár a spol. sem, protože v Unikódu jsou myslím taky před samohláskami. Ta učebnice je ovšem 22 let stará a soudě podle stylu pana Pořízky, jeho bych si taky zařadil do "staré školy" a ovlivněnost sanskrtem bych u něj jaksi předpokládal. --Dan Zeman 12:21, 8. 2. 2008 (UTC)

Já nejsem expert na historii hindštiny, ale jako každý jazyk, i hindština se vyvíjí. Je možné, že v době, kdy psal učebnice a slovníky Vincenc Pořízka, bylo abecední pořadí bližší sanskrtu. Také se od té doby upustilo od používání některých spřežek a nyní se převážně používá क्‍त a न्‍न, ale to již odbíhám od tématu. --Icebearsoft 12:41, 8. 2. 2008 (UTC)

Moje Pořízkova učebnice byla vydána někdy v sedmdesátých letech, ale je to druhé vydání, přičemž to první vyšlo podle všeho v roce 1959, takže už před půl stoletím. Teď jsem prohlížel nějaké další zdroje a dávají vám za pravdu, tedy jeden z nich. První je totiž Todd Scudiere: Hindi Dictionary & Phrasebook, a tam se drží přepisu do latinky a nedělají dokonce rozdíl ani mezi krátkým a dlouhým á. Zato v tom druhém zdroji, Rupert Snell a Simon Weightman: Teach Yourself Hindi, 2003 (první vydání 1989) je vzadu Glossary a tam je to jasné: anusvár a anunásik jsou v pořadí rovnocenné, např. अंकल - अँग्रेज़ - अंत, ale oba společně leží před všemi samohláskami, např. ढंग je před ढाई. --Dan Zeman 16. 2. 2009, 10:40 (UTC)