Огромная база промптов для нейросетей

Оптимизация использования SmolLM2‑360M на Samsung Galaxy Watch 4

ChatGPT Программирование 3
RecognitionFlat1470

Автор промпта

@RecognitionFlat1470

Этот промпт поможет вам понять, как оптимизировать использование модели SmolLM2‑360M на устройствах с ограниченной памятью, таких как Samsung Galaxy Watch 4. Узнайте, как добиться значительного снижения пикового использования оперативной памяти и улучшить скорость загрузки.

Как использовать этот промпт

"1. Скопируйте промпт в приложение для генерации текста. 2. Заполните переменные [УСТРОЙСТВО] и [ОБЪЕМ_ПАМЯТИ] соответствующими данными. 3. Запустите генерацию и получите подробный инструктаж по оптимизации."

Пример ответа нейросети

""Для оптимизации загрузки модели SmolLM2‑360M на устройстве Samsung Galaxy Watch 4 с 380MB оперативной памяти, вам потребуется внести изменения в llama_model_params. Используя параметр host_ptr, вы сможете напрямую указать на mmap-область. Это снижает потребление оперативной памяти с 524MB до 142MB, что является уменьшением на 74%. В результате время первого запуска сокращается с 19 секунд до 11 секунд, а время второго запуска до 2.5 секунд благодаря использованию кэша KV. Включите приведенный далее код для реализации этих оптимизаций. Код:</br></br>```C++\nllama_model_params.params.host_ptr = mmap_region;\n```\nТаким образом, вы сможете эффективно использовать ресурсы ограниченного устройства и значительно улучшить время загрузки.""

Вы недавно смотрели

Сохранено в браузере
🍪

Мы используем Cookies и LocalStorage

Это необходимо, чтобы сохранять вашу Историю просмотров, подставлять ваши данные в Конструкторе и добавлять промпты в Избранное. Мы не передаем эти данные третьим лицам.