Luchen Technology пуска SDK за фина настройка без сървър, твърди, че пълният RL тръбопровод струва само 1,19 USD


Luchen Technology пуска SDK за фина настройка без сървър, твърди, че пълният RL тръбопровод струва само 1,19 USD

Доставчикът на AI инфраструктура Luchen Technology официално пусна своя SDK за фина настройка, позиционирайки го като първата в Китай напълно отворена платформа за фина настройка без сървър, съвместима с парадигмата на Tinker.

Създадена върху Tinker SDK с отворен код от Thinking Machine Lab, платформата е проектирана да намали драстично инженерната сложност и цената на големите модели след обучение, особено за обучение с подсилване.

Неговият основен дизайн отделя алгоритмичната логика от основната инфраструктура, позволявайки на разработчиците да конструират обучителни конвейери чрез композиране на стандартизирани функционални примитиви. Платформата приема безсървърен модел на ценообразуване, базиран на токени, като таксува потребителите само за ефективно изчисление, като прехвърляне напред, вземане на проби от изводи и стъпки за обучение.

Luchen Technology твърди, че при тестване в реалния свят пълен RL тръбопровод – включително вземане на проби, точкуване и актуализации на PPO (~300 стъпки) – е направил обща изчислителна цена от само 8,61 RMB (приблизително 1,19 USD). Понастоящем SDK поддържа контролирана фина настройка и обучение за подсилване за фамилията модели Qwen 3 на Alibaba, вариращи от 4B до 32B параметри.

Източник: QbitAI

Source link

Like this:

Like Loading…

Нашия източник е Българо-Китайска Търговско-промишлена палaта