


Доставчикът на AI инфраструктура Luchen Technology официално пусна своя SDK за фина настройка, позиционирайки го като първата в Китай напълно отворена платформа за фина настройка без сървър, съвместима с парадигмата на Tinker.
Създадена върху Tinker SDK с отворен код от Thinking Machine Lab, платформата е проектирана да намали драстично инженерната сложност и цената на големите модели след обучение, особено за обучение с подсилване.
Неговият основен дизайн отделя алгоритмичната логика от основната инфраструктура, позволявайки на разработчиците да конструират обучителни конвейери чрез композиране на стандартизирани функционални примитиви. Платформата приема безсървърен модел на ценообразуване, базиран на токени, като таксува потребителите само за ефективно изчисление, като прехвърляне напред, вземане на проби от изводи и стъпки за обучение.
Luchen Technology твърди, че при тестване в реалния свят пълен RL тръбопровод – включително вземане на проби, точкуване и актуализации на PPO (~300 стъпки) – е направил обща изчислителна цена от само 8,61 RMB (приблизително 1,19 USD). Понастоящем SDK поддържа контролирана фина настройка и обучение за подсилване за фамилията модели Qwen 3 на Alibaba, вариращи от 4B до 32B параметри.
Източник: QbitAI
Source link
Like this:
Like Loading…
Нашия източник е Българо-Китайска Търговско-промишлена палaта
