Китайската надпревара във въоръжаването с изкуствен интелект показва, че секторът се подготвя за седмицата на пускане на голям водещ модел

Китайският AI сектор се готви за монументална седмица с вълна от нови модели – включително мощен „стелт“ претендент – появяващи се, докато местните технологични гиганти се подготвят да представят своите водещи продукти.

Надпреварата за пускане на нови модели преди празника на Лунната Нова година подчертава интензивната глобална конкуренция между граничните компании за вниманието на потребителите на фона на бързото ускоряване на напредъка на AI в началото на 2026 г., след високопоставените версии на американските тежкотоварни компании Anthropic и OpenAI.

В неделя член на екипа за разработка на модели на Alibaba Cloud издаде заявки за изтегляне – предложение на разработчици за добавяне на нов код към споделен софтуерен проект – на платформи за разработчици с отворен код Hugging Face и GitHub за своето следващо поколение модели. Такива платформи са онлайн хранилища, където програмистите могат да споделят, да си сътрудничат и да управляват софтуерен код, което го прави публично достъпен за използване и модифициране.

Централният елемент на това ново семейство е дългоочакваният Qwen-3.5, който трябва да се появи почти година след пускането на предишното поколение модели на базирания в Ханджоу технологичен гигант, Qwen-3, което помогна на Qwen да се превърне в най-популярното семейство отворени модели в световен мащаб през 2025 г. поради силната си производителност, разрешителния лиценз и широкия диапазон от случаи на употреба.

Alibaba Cloud е звеното за AI и облачни изчисления на Alibaba Group Holding, собственик на South China Morning Post.

Въз основа на предварителната информация, разкрита като част от заявките за изтегляне, Qwen-3.5 ще включва два модела – единият с 9 милиарда параметри и другият с 35 милиарда параметри – с вградена мултимодална поддръжка за първи път. Параметрите са променливите, кодиращи „интелигентността“ на модела, които се коригират по време на обучението. Като цяло по-големият брой променливи означава по-мощен модел, въпреки че изисква повече изчисления. А мултимодалната поддръжка означава, че AI може да разбира и обработва различни типове данни, като текст, изображения и аудио.

Двата модела също ще включват архитектурата от следващо поколение на компанията, която беше представена за първи път през септември в експериментален модел, наречен Qwen3-Next.

Нашия източник е Българо-Китайска Търговско-промишлена палaта