Tether випустив кросплатформену фреймворк BitNet LoRA, яка підтримує навчання та інференс великих моделей на споживчих GPU та смартфонах

robot
Генерація анотацій у процесі

Deep Tide TechFlow повідомляє, що 17 березня, за словами генерального директора Tether Паоло Ардойно, команда Tether AI випустила нову версію QVAC Fabric, яка інтегрує кросплатформний фреймворк BitNet LoRA і дозволяє тренувати та виконувати великі моделі з мільярдом параметрів на споживчих GPU та смартфонах.

Нова версія QVAC Fabric LLM вперше реалізувала кросплатформне тонке налаштування та виконання BitNet LoRA на AMD, Intel, Apple Metal та мобільних GPU. На флагманських пристроях швидкість GPU-обчислень у 2-11 разів перевищує швидкість CPU, а використання пам’яті зменшується до 90% у порівнянні з моделями з повною точністю. Команда Tether вже завершила тонке налаштування моделей до 3,8 мільярдів параметрів на флагманських смартфонах Pixel 9, S25 та iPhone 16, а також до 13 мільярдів параметрів на iPhone 16. Весь код відкритий на GitHub.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити