Les coûts de preuve de théorème commencent à augmenter : Mistral publie Leanstral 1.5 open source, environ $4 par problème

Selon la surveillance de Dongcha Beating, Mistral AI a publié Leanstral 1.5, un modèle conçu pour les preuves formelles dans Lean 4. Le modèle compte un total de 119 milliards de paramètres, dont environ 6,5 milliards de paramètres actifs, et est sous licence Apache-2.0, offrant un accès gratuit à l'API. Les évaluations officielles montrent que Leanstral 1.5 a résolu 587 problèmes sur 672 dans le cadre de PutnamBench ; il a obtenu 87 % et 34 % respectivement sur les benchmarks d'algèbre abstraite FATE-H et FATE-X, établissant de nouveaux records de performance parmi les modèles similaires. Le coût moyen par problème pour Leanstral 1.5 sur PutnamBench est d'environ 4 $, bien inférieur aux coûts de plusieurs systèmes précédents, qui allaient de dizaines à des centaines de dollars. À mesure que le budget de tokens par problème augmente, le nombre de problèmes qu'il peut résoudre continue de croître ; dans la preuve de complexité des arbres AVL, le modèle a complété la preuve pertinente après avoir raisonné sur plus de 2,7 millions de tokens et 22 compressions de contexte. En plus des preuves mathématiques, Leanstral 1.5 a également été utilisé pour la vérification de code. L'équipe a découvert 11 bugs réels dans 57 dépôts Rust open source, dont cinq n'avaient pas été signalés auparavant.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé