8(800) 222 32 56
Панель управления

Блог King Servers

Квантизация нейросетей: как запускать LLM дешевле без сильной потери качества
Решения для бизнеса

Квантизация нейросетей: как запускать LLM дешевле без сильной потери качества

Квантизация LLM снижает VRAM и стоимость инференса: FP16, INT8, 4-bit, GGUF, AWQ и GPTQ — как выбрать формат и не потерять качество в production.

Андрей Минин, автор блога Андрей Минин, автор блога
Evals для LLM: как проверять качество нейросети перед запуском в бизнесе
Решения для бизнеса

Evals для LLM: как проверять качество нейросети перед запуском в бизнесе

Evals помогают проверить качество LLM перед запуском в бизнесе: от точности и галлюцинаций до regression tests, RAG-оценки, стоимости, задержки и готовности модели к production.

Андрей Минин, автор блога Андрей Минин, автор блога
LLMOps: как управлять жизненным циклом нейросетевой модели в продакшене
Решения для бизнеса

LLMOps: как управлять жизненным циклом нейросетевой модели в продакшене

Статья объясняет, как управлять жизненным циклом LLM в продакшене: версии, тесты, model registry, rollback, мониторинг качества, RAG, логи, инфраструктура и культура LLMOps.

Андрей Минин, автор блога Андрей Минин, автор блога
Cloud-init для VPS: как автоматически готовить сервер после создания
Решения для бизнеса

Cloud-init для VPS: как автоматически готовить сервер после создания

Практическое руководство по cloud-init для VPS: настройка SSH-доступа, пользователей, firewall, пакетов, Docker, обновлений безопасности, мониторинга и базового hardening сервера.

John Garfield John Garfield
PostgreSQL PITR: как настроить восстановление базы на любую точку времени
Решения для бизнеса

PostgreSQL PITR: как настроить восстановление базы на любую точку времени

Статья объясняет, как работает PostgreSQL PITR: зачем нужны base backup и WAL-архивы, как настроить восстановление на точку времени, выбрать recovery target, продумать retention и проверить backup на практике.

Андрей Минин, автор блога Андрей Минин, автор блога
Private container registry: как хранить Docker-образы безопасно и не зависеть от публичных сервисов
Решения для бизнеса

Private container registry: как хранить Docker-образы безопасно и не зависеть от публичных сервисов

Разбираем, зачем нужен private container registry, чем отличаются registry:2, GitLab Registry и Harbor, как настроить доступы, сканирование, подписи, retention policy, бэкапы, CI/CD, мониторинг и защиту Docker-образов.

Андрей Минин, автор блога Андрей Минин, автор блога
Nginx vs Caddy vs Traefik: какой reverse proxy выбрать для VPS, Docker и production-сервисов
Решения для бизнеса

Nginx vs Caddy vs Traefik: какой reverse proxy выбрать для VPS, Docker и production-сервисов

Сравнение Nginx, Caddy и Traefik для VPS, Docker и production: TLS, автосертификаты, Docker labels, performance, observability и практические сценарии выбора.

Андрей Минин, автор блога Андрей Минин, автор блога
Bastion host и jump server: безопасный SSH-доступ к инфраструктуре без прямого входа на серверы
Решения для бизнеса

Bastion host и jump server: безопасный SSH-доступ к инфраструктуре без прямого входа на серверы

Разбираем, как bastion host и jump server помогают безопасно организовать SSH-доступ: закрыть прямой вход на серверы, централизовать аудит, управлять ключами и снизить риски.

Андрей Минин, автор блога Андрей Минин, автор блога
API abuse protection: rate limits, quotas и защита серверов от дорогих запросов
Решения для бизнеса

API abuse protection: rate limits, quotas и защита серверов от дорогих запросов

Как защитить API от дорогих запросов: rate limits, quotas, weighted limits, защита CPU, RAM, GPU и мониторинг перерасхода ресурсов.

Андрей Минин, автор блога Андрей Минин, автор блога