Get Model

curl --request GET \
  --url https://api.egp.scale.com/v5/models/{model_id} \
  --header 'x-api-key: <api-key>'

{
  "id": "<string>",
  "name": "<string>",
  "model_type": "generic",
  "model_vendor": "openai",
  "status": "failed",
  "created_at": "2023-11-07T05:31:56Z",
  "created_by_user_id": "<string>",
  "created_by_identity_type": "user",
  "object": "model",
  "vendor_configuration": {
    "model_image": {
      "registry": "<string>",
      "repository": "<string>",
      "tag": "<string>",
      "command": [
        "<string>"
      ],
      "predict_route": "/predict",
      "streaming_predict_route": "<string>",
      "streaming_command": [
        "<string>"
      ],
      "request_schema": {},
      "response_schema": {},
      "env_vars": {},
      "readiness_delay": 120,
      "healthcheck_route": "/readyz"
    },
    "model_infra": {
      "endpoint_type": "sync",
      "cpus": 3,
      "gpus": 0,
      "gpu_type": "nvidia-tesla-t4",
      "memory": "8Gi",
      "storage": "16Gi",
      "min_workers": 0,
      "max_workers": 1,
      "per_worker": 10,
      "high_priority": false,
      "labels": {},
      "public_inference": false
    }
  },
  "model_metadata": {},
  "model_availability": "unknown"
}

GET

models

{model_id}

Get Model

curl --request GET \
  --url https://api.egp.scale.com/v5/models/{model_id} \
  --header 'x-api-key: <api-key>'

{
  "id": "<string>",
  "name": "<string>",
  "model_type": "generic",
  "model_vendor": "openai",
  "status": "failed",
  "created_at": "2023-11-07T05:31:56Z",
  "created_by_user_id": "<string>",
  "created_by_identity_type": "user",
  "object": "model",
  "vendor_configuration": {
    "model_image": {
      "registry": "<string>",
      "repository": "<string>",
      "tag": "<string>",
      "command": [
        "<string>"
      ],
      "predict_route": "/predict",
      "streaming_predict_route": "<string>",
      "streaming_command": [
        "<string>"
      ],
      "request_schema": {},
      "response_schema": {},
      "env_vars": {},
      "readiness_delay": 120,
      "healthcheck_route": "/readyz"
    },
    "model_infra": {
      "endpoint_type": "sync",
      "cpus": 3,
      "gpus": 0,
      "gpu_type": "nvidia-tesla-t4",
      "memory": "8Gi",
      "storage": "16Gi",
      "min_workers": 0,
      "max_workers": 1,
      "per_worker": 10,
      "high_priority": false,
      "labels": {},
      "public_inference": false
    }
  },
  "model_metadata": {},
  "model_availability": "unknown"
}

Authorizations

x-api-key

string

header

required

Headers

x-selected-account-id

string | null

Path Parameters

model_id

string

required

Response

Successful Response

string

required

name

string

required

model_type

enum<string>

required

Available options:

generic,

completion,

chat_completion

model_vendor

enum<string>

required

Available options:

openai,

cohere,

vertex_ai,

anthropic,

azure,

gemini,

launch,

llmengine,

model_zoo,

bedrock,

xai,

fireworks_ai

status

enum<string>

required

Available options:

failed,

ready,

deploying

created_at

string<date-time>

required

created_by_user_id

string

required

created_by_identity_type

enum<string>

required

Available options:

user,

service_account

object

string

default:model

Allowed value: "model"

vendor_configuration

LaunchVendorConfiguration · object

LaunchVendorConfiguration
LLMEngineVendorConfiguration

Show child attributes

model_metadata

Model Metadata · object

model_availability

enum<string>

Available options:

unknown,

available,

unavailable

Create Model Delete Model

⌘I

Inference

Questions

Vector Stores

Files

Models

Datasets

Dataset Items

Evaluations

Evaluation Groups

Evaluation Charts

Evaluation Dashboards

Evaluation Items

Spans

Span Assessment

Credentials

Agentex Cloud Build

Get Model

Authorizations

Headers

Path Parameters

Response