Qwen
Qwen (také nazývaná Tongyi Qianwen, čínsky 通义千问, českou transkripcí Tchung-i Čchien-wen) je rodina velkých jazykových modelů vyvinutých čínskou společností Alibaba Cloud. V červenci 2024 byl Qwen v některých žebříčcích hodnocen jako nejlepší čínský jazykový model a na třetím místě na světě za nejlepšími modely Anthropic a OpenAI.[1]
Modely
[editovat | editovat zdroj]Společnost Alibaba poprvé spustila beta verzi modelu Qwen v dubnu 2023 pod názvem Tongyi Qianwen.[2] Architektura modelu byla založena na architektuře Llama vyvinuté společností Meta AI.[3] Veřejně byl model vydán v září 2023 po schválení čínskými úřady.[4] Modely jsou někdy označovány jako open source, ale trénovací program nebyl zveřejněn ani nebyla zdokumentována trénovací data, takže modely nesplňují běžné podmínky tohoto označení.
V červnu 2024 společnost Alibaba spustila řadu modelů Qwen 2 a v září vydala některé ze svých modelů s otevřenými vahami, přičemž své nejpokročilejší modely si ponechala proprietární.[5][6]
28. dubna 2025 byla vydána rodina modelů Qwen 3,[7] které jsou pod licencí Apache 2.0. Zahrnuje jak husté (0,6B, 1,7B, 4B, 8B, 14B a 32B parametrů), tak řídké modely (30B s 3B aktivovanými parametry, 235B s 22B aktivovanými parametry). Byly trénovány na 36 bilionech tokenů ve 119 jazycích a dialektech.[8] Všechny modely kromě variant 0,6B, 1,7B a 4B mají kontextové okno tokenů o velikosti 128K. Stejně jako modely o1 a QwQ 32B od OpenAI, i modely Qwen 3 podporují uvažování, které lze povolit nebo zakázat pomocí tokenizátoru. Modely Qwen 3 jsou k dispozici na chat.qwen.ai a lze je stáhnout prostřednictvím Hugging Face a ModelScope.[9]
Reference
[editovat | editovat zdroj]V tomto článku byl použit překlad textu z článku Qwen na anglické Wikipedii.
Externí odkazy
[editovat | editovat zdroj]
Obrázky, zvuky či videa k tématu Qwen na Wikimedia Commons
- ↑ JIANG, Ben. Alibaba's open-source AI model tops Chinese rivals, ranks 3rd globally [online]. 11 July 2024. Dostupné online. (anglicky)
- ↑ CHIANG, Sheila. Alibaba to roll out its rival to ChatGPT across all its products [online]. 11 April 2023. Dostupné online. (anglicky)
- ↑ Qwen/techmemo-draft.md [online]. August 3, 2023. Dostupné online. (anglicky)
- ↑ JIANG, Ben. Alibaba opens Tongyi Qianwen model to public as new CEO embraces AI [online]. 13 September 2023. Dostupné online. (anglicky)
- ↑ JIANG, Ben. Alibaba says new AI model Qwen2 bests Meta's Llama 3 in tasks like maths and coding [online]. 7 June 2024. Dostupné online. (anglicky)
- ↑ KHARPAL, Arjun. China's Alibaba launches over 100 new open-source AI models, releases text-to-video generation tool [online]. 19 September 2024. Dostupné online. (anglicky)
- ↑ ARA SHAIKH, Jasmeen. Alibaba unveils advanced Qwen 3 AI as Chinese tech rivalry intensifies [online]. April 28, 2025. Dostupné online.
- ↑ WIGGERS, Kyle. Alibaba unveils Qwen3, a family of 'hybrid' AI reasoning models [online]. 28 April 2025. Dostupné online.
- ↑ TEAM, Qwen. Qwen3: Think Deeper, Act Faster [online]. 2025-04-29. Dostupné online. (anglicky)