StepFun Стъпка 3.5 Flash с напълно отворен код


StepFun Стъпка 3.5 Flash с напълно отворен код

Китайският стартиращ голям модел StepFun разполага с напълно отворен код Step 3.5 Flash, пускайки не само самия модел, но и неговите базови (предварително обучени) тежести, тежести на Midtrain и придружаващата рамка за обучение на Steptron – допълнително напредвайки в ангажимента си за отворена AI инфраструктура за разработване на агенти.

Стъпка 3.5 Flash приема разредена MoE (смес от експерти) архитектура с общо 196 милиарда параметри, като същевременно активира само около 11 милиарда параметри по време на извод. Съобщава се, че при задачи за кодиране с една заявка скоростта на извеждане може да достигне до 350 токена в секунда (TPS). Моделът е специално създаден за сценарии на агенти, демонстрира силна производителност при сложни разсъждения и вериги от задачи с дълъг хоризонт. Според компанията, нейната дълбочина на разсъждения съперничи на определени модели от най-високо ниво със затворен код.

Моделът бързо придоби популярност в общността с отворен код. Изтеглянията на Hugging Face надхвърлиха 300 000 и се изкачиха до номер 1 в OpenRouter Trending榜. В добре известния бенчмарк проект с отворен код OpenClaw (наречен „Little Lobster“ от китайски разработчици), Step 3.5 Flash се издигна до първите две класации.

С пускането на пълни обучителни тежести и поддръжка на рамка, StepFun позиционира Step 3.5 Flash като основен отворен базов модел за следващо поколение AI агенти.

Източник: AI Daily

Source link

Like this:

Like Loading…

Нашия източник е Българо-Китайска Търговско-промишлена палaта