Meituan LongCat-2.0 відкритий код: 1,6 трильйона параметрів без GPU NVIDIA
Як повідомляє Reuters 30 червня, Meituan випустила відкриту AI-модель LongCat-2.0 з 1,6 трильйона параметрів, використовуючи архітектуру Sparse Mixture of Experts (MoE), повністю навчену на вітчизняних ASIC-суперкластерних чіпах без використання GPU NVIDIA або програмного стеку CUDA. Контекстне вікно моделі становить 1 мільйон токенів. Технічні характеристики LongCat-2.0 та цільові сценарії застосування LongCat-2.0 використовує архітектуру Sparse Mixture of Experts (MoE), подібну до рішень DeepS
MarketWhisper·11год тому














