Как запустить Harper AI Agent на Google Cloud Vertex AI: 3 изменённых файла
Запустить Harper AI Agent на Google Cloud Vertex AI можно, заменив три конфигурационных файла и задеплоив модель через консоль – процесс занимает около 10 минут.
Запустить Harper AI Agent на Google Cloud Vertex AI можно, заменив три конфигурационных файла и выполнив деплой через консоль – весь процесс занимает примерно 10 минут. После обновления файлов агент будет работать в облаке с поддержкой GPU, обеспечивая ускоренный вывод до 3 раз быстрее, чем локальный запуск.
Как подготовить окружение в Google Cloud перед деплоем?
Сначала необходимо создать проект в Google Cloud и включить сервис Vertex AI – без этого платформа не сможет принять ваш агент. Далее настройте сервисный аккаунт с ролью Vertex AI Administrator и сохраните JSON‑ключ.
- 1. Откройте Google Cloud Console и нажмите «Создать проект».
- 2. В разделе «API и сервисы» включите Vertex AI API.
- 3. Перейдите в IAM & Admin → Сервисные аккаунты, создайте новый аккаунт и назначьте роль Vertex AI Administrator.
- 4. Скачайте JSON‑ключ и сохраните его в безопасном месте (пример:
~/keys/vertex-key.json). - 5. Установите Google Cloud SDK (gcloud) версии 453.0.0 или новее, чтобы поддерживались все функции Vertex AI в 2026‑м году.
Почему нужно изменить именно три файла конфигурации?
Эти файлы отвечают за пути к моделям, параметры окружения и настройки доступа – без их корректировки агент не сможет найти ресурсы в облаке.
- config.yaml – указывает путь к Docker‑образу и версии Python (например,
python:3.11-slim). - requirements.txt – добавляет зависимости, специфичные для Vertex AI, такие как
google-cloud-aiplatform==2.12.0. - deploy.sh – скрипт, который вызывает
gcloud ai custom-jobs createс нужными параметрами (GPU‑type, регион, количество реплик).
Что делать, если при деплое появляется ошибка доступа к Bucket?
Ошибка обычно связана с недостающими правами у сервисного аккаунта – предоставьте роль Storage Object Admin для бакета, где хранится модель.
- 1. Откройте Cloud Storage, найдите бакет (например,
harper-models). - 2. В разделе «Permissions» добавьте сервисный аккаунт и назначьте роль Storage Object Admin.
- 3. Проверьте, что переменная окружения
GOOGLE_APPLICATION_CREDENTIALSуказывает на ваш JSON‑ключ. - 4. Перезапустите
deploy.sh– ошибка должна исчезнуть.
Как проверить, что агент успешно запущен и работает?
После деплоя откройте консоль Vertex AI и найдите ваш кастомный Job – статус «SUCCEEDED» подтверждает успешный запуск.
- 1. Перейдите в Vertex AI → Custom Jobs.
- 2. Найдите задачу с именем
harper-agent-deploy-2026-04-14. - 3. Откройте журнал (Logs) и убедитесь, что первая строка содержит «Agent started successfully».
- 4. Выполните тестовый запрос через REST‑endpoint:
curl -X POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/endpoints/ENDPOINT_ID:predict -d '{"instances": [{"text": "Привет, мир!"}]}'. - 5. Ожидаемый ответ:
{"predictions": [{"response": "Привет, мир!"}]}.
Сколько это стоит в 2026 году?
Расходы зависят от выбранного типа GPU и времени работы: в среднем GPU n1-standard-8 стоит 0,45 USD за час, что в рублях (курс 2026 г. ≈ 95 RUB/USD) составляет около 43 RUB/час.
- Для 10‑часового теста: 0,45 USD × 10 = 4,5 USD ≈ 430 RUB.
- Если использовать предоплаченный план «Committed Use», экономия до 30 %.
- Хранение модели в Cloud Storage – 0,02 USD/GB/мес (≈ 2 RUB/GB/мес).
Воспользуйтесь бесплатным инструментом toolbox-online.ru — работает онлайн, без регистрации.
Теги