Le site Web de Coinjie annonce que le nouveau modèle de base de Meituan, longcat-2.0-preview, est désormais en phase de test. Ce modèle compte plus d’un billion de paramètres, le plaçant parmi les modèles de grande taille les plus performants au monde. Des sources proches du dossier révèlent que le nouveau modèle v4 de deepseek, publié le même jour, possède une quantité de paramètres totale et une quantité de paramètres activés essentiellement équivalentes à celles de longcat-2.0-preview de Meituan. La plus grande avancée du nouveau modèle de base de Meituan réside dans le fait que tout le processus d’entraînement et d’inférence repose entièrement sur un cluster de calculs domestique. Selon les informations, la quantité de cartes de calcul utilisées lors de la phase d’entraînement de Meituan se situe entre 50 000 et 60 000, ce qui constitue jusqu’à présent la plus grande tâche d’entraînement de modèle de grande taille réalisée sur une infrastructure de calcul domestique.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler