Too big requests for serverless infinity vector embedding cause errors

I keep running into "400 Bad Request" server errors for this service, and finally discovered that it was because my requests were too large and running into this constraint: https://github.com/runpod-workers/worker-infinity-embedding/blob/acd1a2a81714a14d77eedfe177231e27b18a48bd/src/utils.py#L14

    INPUT_STRING = StringConstraints(max_length=8192 * 15, strip_whitespace=True)
    ITEMS_LIMIT = {
        "min_length": 1,
        "max_length": 8192,
    }

    INPUT_STRING = StringConstraints(max_length=8192 * 15, strip_whitespace=True)
    ITEMS_LIMIT = {
        "min_length": 1,
        "max_length": 8192,
    }

Is this a hard limit?

GitHub

worker-infinity-embedding/src/utils.py at acd1a2a81714a14d77eedfe17...

Contribute to runpod-workers/worker-infinity-embedding development by creating an account on GitHub.

Runpod•15mo ago•

6 replies

zilli

Too big requests for serverless infinity vector embedding cause errors

    INPUT_STRING = StringConstraints(max_length=8192 * 15, strip_whitespace=True)
    ITEMS_LIMIT = {
        "min_length": 1,
        "max_length": 8192,
    }

    INPUT_STRING = StringConstraints(max_length=8192 * 15, strip_whitespace=True)
    ITEMS_LIMIT = {
        "min_length": 1,
        "max_length": 8192,
    }

Is this a hard limit?

GitHub

worker-infinity-embedding/src/utils.py at acd1a2a81714a14d77eedfe17...

Contribute to runpod-workers/worker-infinity-embedding development by creating an account on GitHub.

Too big requests for serverless infinity vector embedding cause errors

Similar Threads

Too big requests for serverless infinity vector embedding cause errors

Similar Threads

Similar Threads

Similar Threads