DeepSeek използва AI технологията с отворен код на Alibaba, за да подобри производителността на OCR

Китайската стартираща компания за изкуствен интелект DeepSeek представи във вторник подобрена версия на своя модел за оптично разпознаване на символи (OCR), включваща разработена от Alibaba Cloud система с отворен код за повишаване на производителността.

Новият модел, DeepSeek-OCR 2, замени ключов компонент от оригиналната си архитектура с олекотения модел Qwen2-0.5b на Alibaba Cloud, според изследователска статия, публикувана от компанията.

Актуализацията, която идва малко повече от три месеца след като DeepSeek пусна първата версия на своята OCR система, подчертава нарастващата роля на китайската екосистема с отворен код в напредъка на вътрешното развитие на ИИ.

Alibaba Cloud е подразделението за изкуствен интелект и облачни изчисления на Alibaba Group Holding, която притежава Post.

В оригиналния модел DeepSeek разчита на Contrastive Language Image Pre-training (CLIP), невронна мрежова рамка, разработена от подкрепения от Microsoft OpenAI през 2021 г., която свързва изображения с текстови описания. аз

В OCR приложенията CLIP помага на системите да идентифицират и интерпретират текст, вграден в изображения.

DeepSeek каза, че замяната на CLIP с Qwen2-0.5b на Alibaba позволява на неговия OCR модел да обработва документи по начин, който имитира начина, по който хората четат, следвайки „гъвкави, но семантично съгласувани модели на сканиране, управлявани от присъщи логически структури“, според изследването.

Нашия източник е Българо-Китайска Търговско-промишлена палaта