ПЕКИН, 29 сен (Рейтер) - Китайская компания в сфере искусственного интеллекта DeepSeek анонсировала "экспериментальную" модель, которая, по словам представителей, демонстрирует улучшенные способности к обучению и более качественную обработку длинных текстов по сравнению с предыдущими версиями крупных языковых моделей.
Компания из Ханчжоу охарактеризовала модель DeepSeek-V3.2-Exp как важный этап в разработке архитектуры следующего поколения.
Данная архитектура может стать наиболее значимым достижением DeepSeek с момента выхода моделей V3 и R1, которые произвели сенсацию в Кремниевой долине и среди технологических инвесторов за пределами Китая.
Модель V3.2-Exp включает механизм, именуемый DeepSeek Sparse Attention, который, по утверждению компании, способствует снижению затрат на вычислительные ресурсы и улучшению ряда показателей производительности. Согласно сообщению DeepSeek в соцсети X, опубликованному в понедельник, компания снижает стоимость API более чем на 50%.
Оригинал сообщения на английском языке доступен по коду:
(Эдуардо Баптиста и Бюро Рейтер в Пекине)
Читать еще
Категории
Подпишитесь на нашу рассылку!
Случайное

Украина обсуждает с США возможность

Иордания инициировала тендер на закупку

Мировые фонды акций зафиксировали

Новатэк направил газоконденсат в

