Интересное:

DeepSeek представила новую промежуточную модель ИИ на пути к инновациям

Автор: Семен Торшин
29-09-2025, 13:16
2 мин. чтения
2

ПЕКИН, 29 сен (Рейтер) - Китайская компания в сфере искусственного интеллекта DeepSeek анонсировала "экспериментальную" модель, которая, по словам представителей, демонстрирует улучшенные способности к обучению и более качественную обработку длинных текстов по сравнению с предыдущими версиями крупных языковых моделей.

Компания из Ханчжоу охарактеризовала модель DeepSeek-V3.2-Exp как важный этап в разработке архитектуры следующего поколения.

Данная архитектура может стать наиболее значимым достижением DeepSeek с момента выхода моделей V3 и R1, которые произвели сенсацию в Кремниевой долине и среди технологических инвесторов за пределами Китая.

Модель V3.2-Exp включает механизм, именуемый DeepSeek Sparse Attention, который, по утверждению компании, способствует снижению затрат на вычислительные ресурсы и улучшению ряда показателей производительности. Согласно сообщению DeepSeek в соцсети X, опубликованному в понедельник, компания снижает стоимость API более чем на 50%.

Оригинал сообщения на английском языке доступен по коду:

(Эдуардо Баптиста и Бюро Рейтер в Пекине)

ии