Промпты по тегу #Llama-Server

ChatGPT Программирование

Как запустить Minimax 2.7 с контекстом 100к на Strix Halo

Этот промпт поможет вам настроить и запустить Minimax 2.7 с оптимальными параметрами на Strix Halo. Узнайте, как правильно выбрать настройки и избежать ошибок.

Смотреть промпт

llama-server Программирование

Как избежать ошибок с пробелами в chat-template-kwargs при использовании Qwen3.6

Данный промпт поможет вам устранить проблему с некорректной работой параметра preserve_thinking из-за лишних пробелов в конфигурации. Убедитесь, что ваша настройка корректна, чтобы упростить отладку и повысить эффективность работы с Qwen3.6.

Смотреть промпт

llama-server Программирование

Идея расширения: llama-server с пользовательскими выборками

Этот промпт помогает разработчикам интегрировать пользовательскую логику выборки в llama-server, избегая необходимости поддерживать собственную версию. Он включает примеры и идеи для улучшения работы с сильно квантизованными моделями.

Смотреть промпт

#llama-server

Как запустить Minimax 2.7 с контекстом 100к на Strix Halo

Как избежать ошибок с пробелами в chat-template-kwargs при использовании Qwen3.6

Идея расширения: llama-server с пользовательскими выборками

Мы используем Cookies и LocalStorage