DeepSeek та Пекінський університет випускають статтю DSpark 27 червня, засновник Liang Wenfeng вказаний як автор

DEEPSEEK-2,94%
За даними Guru Club, 27 червня команда DeepSeek та Пекінський університет опублікували наукову роботу під назвою «DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation». У роботі представлено модуль спекулятивного декодування для оптимізації продуктивності інференсу на існуючих моделях DeepSeek-V4-Pro та DeepSeek-V4-Flash. Водночас команда відкрила вихідний код DeepSpec — повностекової кодової бази для навчання та оцінки моделей спекулятивного декодування-чернетки під ліцензією MIT. Наразі DeepSpec підтримує три реалізації: DSpark, DFlash та Eagle3. Зазначається, що засновник DeepSeek Лян Веньфен вказаний як співавтор роботи.
Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.
Прокоментувати
0/400
ManeyToFuturevip
· 06-28 08:02
Погнали 🔥
Переглянути оригіналвідповісти на0