> ## Documentation Index
> Fetch the complete documentation index at: https://wb-21fd5541-wbdocs-1882.mintlify.site/llms.txt
> Use this file to discover all available pages before exploring further.

# 사용량 정보 및 한도

> W&B Serverless RL의 가격, 사용량 한도, 계정 제한을 알아보세요

<div id="pricing">
  ## 가격
</div>

가격은 Inference, 트레이닝, 저장소의 세 가지 컴포넌트로 구성됩니다. 구체적인 과금 요율은 [가격 페이지](https://site.wandb.ai/pricing/training)에서 확인하세요.

<div id="inference">
  ### Inference
</div>

Serverless RL Inference 요청에는 W\&B Inference와 동일한 가격이 적용됩니다. 자세한 내용은 [모델별 비용](https://site.wandb.ai/pricing/reinforcement-learning)을 참조하세요. 크레딧 구매, 계정 등급, 사용량 상한에 대한 자세한 내용은 [W\&B Inference 문서](/ko/inference/usage-limits#purchase-more-credits)에서 확인하세요.

<div id="training">
  ### 트레이닝
</div>

각 트레이닝 step에서 Serverless RL은 에이전트의 출력과 관련 보상(보상 함수로 계산됨)이 포함된 트래젝토리 배치를 수집합니다. 그런 다음 이 트래젝토리 배치를 사용해 작업에 맞게 base model을 특화하는 LoRA 어댑터의 가중치를 업데이트합니다. 이러한 LoRA를 업데이트하는 트레이닝 작업은 Serverless RL이 관리하는 전용 GPU 클러스터에서 실행됩니다.

트레이닝은 공개 프리뷰 기간 동안 무료입니다.

<div id="model-storage">
  ### 모델 저장소
</div>

Serverless RL은 트레이닝한 LoRA의 체크포인트를 저장하므로, 언제든 이를 평가하거나 서빙하거나 트레이닝을 계속할 수 있습니다. 저장소 비용은 총 체크포인트 크기와 [가격 플랜](https://wandb.ai/site/pricing)에 따라 매월 청구됩니다. 모든 플랜에는 최소 5GB의 무료 저장소가 포함되며, 이는 LoRA 약 30개를 저장하기에 충분합니다. 공간을 절약하려면 성능이 낮은 LoRA를 삭제하는 것이 좋습니다. 방법은 [ART SDK](https://art.openpipe.ai/features/checkpoint-deletion)를 참조하세요.

<div id="limits">
  ## 제한 사항
</div>

* **Inference 동시성 제한**: 기본적으로 Serverless RL은 현재 사용자당 최대 2000개의 동시 요청과 프로젝트당 6000개의 동시 요청까지 지원합니다. 요청 속도 제한을 초과하면 Inference API는 `429 Concurrency limit reached for requests` 응답을 반환합니다. 이 오류를 방지하려면 트레이닝 작업 또는 프로덕션 워크로드가 한 번에 보내는 동시 요청 수를 줄이세요. 더 높은 요청 속도 제한이 필요하면 [support@wandb.com](mailto:support@wandb.com)으로 요청할 수 있습니다.

* **지리적 제한**: Serverless RL은 지원되는 지역에서만 사용할 수 있습니다. 자세한 내용은 [Terms of Service](https://site.wandb.ai/terms/)를 참조하세요.