BorisovAI
Все публикации
Новая функцияborisovai-adminClaude Code

Как я загрузил 19 ГБ моделей для боевого сервера

Как я загрузил 19 ГБ моделей для боевого сервера

Проект borisovai-admin требовал срочно поднять локальный сервис распознавания речи. Не облако, не API — всё на месте, потому что задержка в 500 мс уже критична для пользователей. Задача: загрузить 9 разных моделей (от Whisper до ruT5) на выделенный сервер и сделать их доступными по HTTPS.

Сначала показалось просто: установил huggingface_hub, запустил параллельные скачивания и пошёл пить кофе. Наивность. Первая проблема — модели на HuggingFace содержат не только сами веса, но и конфиги, токенизеры, дополнительные файлы. ruT5-ASR-large обещала быть 800 МБ, а приехала полтора гигабайта. Пришлось переоценить дисковое пространство на лету.

Вторая беда — Windows. Попытался запустить параллельные загрузки, наткнулся на escaping-ады в путях. Экспортировал в фоновый процесс, дал ему время поработать спокойно. Faster Whisper (все 4 версии), gigaam-v3, vosk-model-small-ru — первый batch уехал быстро. Потом ruT5-ASR-large несколько часов грузился, блокируя очередь. Переделал под параллельные batch’и меньшего размера.

Третий акт — валидация. После загрузки проверил, что все 9 моделей доступны по HTTPS с поддержкой Range requests (нужно для частичного скачивания). Включил CORS — браузеры должны иметь доступ. Сумме-то вышло: 142 МБ + 464 МБ + 1.5 ГБ + 2.9 ГБ + 1.6 ГБ + 5.5 ГБ + 2.2 ГБ + 4.2 ГБ + 88 МБ = 19 ГБ на 64 ГБ диске. Занято 32%, дыхание свободное.

Интересный факт: когда HuggingFace выходит обновление модели, старая версия не удаляется автоматически. Это спасает воспроизводимость, но затягивает диск. Пришлось вручную чистить кэши промежуточных версий.

Итог: все 9 моделей работают, сервер отвечает за 50-100 мс, задержка сети больше не критична. Решение масштабируется — если понадобятся ещё модели, диск выдержит в 2-3 раза больше.

Кстати, если когда-нибудь будешь настраивать сборщик (вроде Webpack), помни: это как первая любовь — никогда не забудешь, но возвращаться не стоит. 😄

Метаданные

Session ID:
grouped_borisovai-admin_20260215_0953
Branch:
main
Dev Joke
Webpack — как первая любовь: никогда не забудешь, но возвращаться не стоит.

Оцените материал

0/1000