중요합니다
- Foundry Local은 미리 보기로 제공됩니다. 공개 미리 보기 릴리스에서는 현재 적극적으로 배포되고 있는 기능에 대한 조기 액세스를 제공합니다.
- GA(일반 공급) 전에는 기능, 방식 및 프로세스가 변경되거나 기능이 제한될 수 있습니다.
이 문서에서는 Foundry CLI(로컬 명령줄 인터페이스)에 대한 포괄적인 참조를 제공합니다. CLI는 모델을 관리하고, 서비스를 제어하고, 로컬 캐시를 유지 관리하는 데 도움이 되도록 명령을 논리적 범주로 구성합니다.
필수 조건
- Foundry Local을 설치합니다. 설치 단계는 Foundry Local 시작을 참조하세요.
-
foundryCLI가 사용 가능한 로컬 터미널을 사용하세요. - 처음 다운로드(실행 공급자 및 모델)에 대한 인터넷 액세스 권한이 있는지 확인합니다.
- Azure RBAC: 해당 없음(로컬로 실행).
- Windows에 Intel NPU가 있는 경우 최적의 NPU 가속을 위해 Intel NPU 드라이버를 설치합니다.
빠른 확인
다음 명령을 실행하여 CLI가 설치되고 서비스에 연결할 수 있는지 확인합니다.
CLI 도움말 표시:
foundry --help이 명령은 사용량 정보와 사용 가능한 명령 그룹 목록을 출력합니다.
참조: 개요
서비스 상태를 확인합니다.
foundry service status이 명령은 Foundry 로컬 서비스가 실행 중인지 여부를 출력하고 로컬 엔드포인트를 포함합니다.
참조: 서비스 명령
개요
기본 제공 도움말을 사용하여 명령 및 옵션을 탐색합니다.
CLI는 다음 세 가지 주요 범주로 명령을 구성합니다.
- 모델: AI 모델을 관리하고 실행하기 위한 명령
- 서비스: Foundry 로컬 서비스를 제어하기 위한 명령
- 캐시: 로컬 모델 스토리지를 관리하기 위한 명령
모델 명령
다음 표에는 모델 관리 및 실행과 관련된 명령이 요약되어 있습니다.
비고
인수를 model별칭 또는 모델 ID로 지정할 수 있습니다. 별칭 사용:
- 사용 가능한 하드웨어에 가장 적합한 모델을 자동으로 선택합니다. 예를 들어 Nvidia GPU를 사용할 수 있는 경우 Foundry Local은 최상의 GPU 모델을 선택합니다. 지원되는 NPU를 사용할 수 있는 경우 Foundry Local은 NPU 모델을 선택합니다.
- 모델 ID를 기억할 필요 없이 더 짧은 이름을 사용할 수 있습니다.
특정 모델을 실행하려면 모델 ID를 사용합니다. 예를 들어 사용 가능한 하드웨어와 상관없이 qwen2.5-0.5b를 CPU에서 실행하려면 다음을 사용하십시오: foundry model run qwen2.5-0.5b-instruct-generic-cpu.
| 명령 | 설명 |
|---|---|
foundry model --help |
사용 가능한 모든 모델 관련 명령과 사용량을 표시합니다. |
foundry model run <model> |
지정된 모델을 실행하고, 캐시되지 않은 경우 다운로드하고, 상호 작용을 시작합니다. |
foundry model list |
로컬에서 사용할 수 있는 모든 모델을 나열합니다. 처음 실행 시 하드웨어에 대한 실행 공급자(EP)를 다운로드합니다. |
foundry model list --filter <key>=<value> |
지정된 조건(디바이스, 작업, 별칭, 공급자)으로 필터링된 모델을 나열합니다. |
foundry model info <model> |
특정 모델에 대한 자세한 정보를 표시합니다. |
foundry model info <model> --license |
특정 모델에 대한 라이선스 정보를 표시합니다. |
foundry model download <model> |
모델을 실행하지 않고 로컬 캐시에 다운로드합니다. |
foundry model load <model> |
모델을 서비스에 로드합니다. |
foundry model unload <model> |
서비스에서 모델을 언로드합니다. |
모델 목록 순서 지정
별칭에 대해 여러 모델 ID 변형을 사용할 수 있는 경우 모델 목록에 우선 순위가 지정된 모델이 표시됩니다. 목록의 첫 번째 모델은 모델을 지정하는 경우 실행되는 모델 alias입니다.
모델 목록 필터링
이 명령은 옵션을 foundry model list 사용하여 모델 필터링을 지원합니다 --filter . 키-값 쌍을 사용하여 단일 특성에 따라 모델을 필터링할 수 있습니다.
foundry model list --filter <key>=<value>
이 명령은 필터 키 및 값과 일치하는 모델을 출력합니다.
참조: 모델 목록 필터링
비고
설치 후 처음으로 실행 foundry model list 하면 Foundry Local은 컴퓨터의 하드웨어 구성에 대한 관련 실행 공급자(EP)를 자동으로 다운로드합니다. 모델 목록이 나타나기 전에 다운로드 완료를 나타내는 진행률 표시줄이 표시됩니다.
지원되는 필터 키:
디바이스 - 하드웨어 디바이스 유형
실행 중인 하드웨어 디바이스를 기준으로 모델을 필터링합니다.
가능한 값:
-
CPU- 중앙 처리 단위 모델 -
GPU- 그래픽 처리 단위 모델 -
NPU- 신경망 처리 단위 모델
공급자 - 실행 공급자
실행 공급자 또는 런타임별로 모델을 필터링합니다.
가능한 값:
-
CPUExecutionProvider- CPU 기반 실행 -
CUDAExecutionProvider- NVIDIA CUDA GPU 실행 -
WebGpuExecutionProvider- WebGPU 실행 -
QNNExecutionProvider- Qualcomm 신경망 실행(NPU) -
OpenVINOExecutionProvider- Intel OpenVINO 실행 -
NvTensorRTRTXExecutionProvider- NVIDIA TensorRT 실행 -
VitisAIExecutionProvider- AMD Vitis AI 실행
작업 - 모델 작업 유형
모델을 의도한 사용 사례 또는 작업으로 필터링합니다.
공통 값:
-
chat-completion: 대화형 AI 모델 -
text-generation: 텍스트 생성 모델
별칭 - 모델 별칭
별칭 식별자를 사용하여 모델을 필터링합니다.
* 접미사를 사용한 와일드카드 일치를 지원합니다.
샘플 값:
phi4-cpuqwen2.5-coder-0.5b-instruct-generic-cpudeepseek-r1-distill-qwen-1.5b-generic-cpuphi-4-mini-instruct-generic-cpu
특수 필터 기능
부정 지원: 일치하는 모델을 제외할 값을 접두사로 ! 지정합니다.
foundry model list --filter device=!GPU
이 명령은 결과에서 GPU 모델을 제외합니다.
참조: 특수 필터 기능
와일드카드 일치(별칭만 해당): 별칭으로 필터링할 때 접두사를 일치하도록 추가 * 합니다.
foundry model list --filter alias=qwen*
이 명령은 별칭이 .로 qwen시작하는 모델을 반환합니다.
참조: 특수 필터 기능
예시
foundry model list --filter device=GPU
foundry model list --filter task=chat-completion
foundry model list --filter provider=CUDAExecutionProvider
이러한 예제에서는 디바이스, 작업 및 실행 공급자별로 모델 목록을 필터링합니다.
참조: 모델 목록 필터링
비고
- 모든 비교는 대/소문자를 구분하지 않습니다.
- 명령당 하나의 필터만 사용할 수 있습니다.
- 인식할 수 없는 필터 키로 인해 오류가 발생합니다.
서비스 명령
다음 표에는 Foundry 로컬 서비스 관리 및 실행과 관련된 명령이 요약되어 있습니다.
| 명령 | 설명 |
|---|---|
foundry service --help |
사용 가능한 모든 서비스 관련 명령과 사용량을 표시합니다. |
foundry service start |
Foundry 로컬 서비스를 시작합니다. |
foundry service stop |
Foundry 로컬 서비스를 중지합니다. |
foundry service restart |
Foundry 로컬 서비스를 다시 시작합니다. |
foundry service status |
Foundry 로컬 서비스의 현재 상태를 표시합니다. |
foundry service ps |
Foundry 로컬 서비스에 현재 로드된 모든 모델을 나열합니다. |
foundry service diag |
Foundry 로컬 서비스의 로그를 표시합니다. |
foundry service set <options> |
Foundry 로컬 서비스의 구성을 설정합니다. |
캐시 명령
다음 표에는 모델이 저장되는 로컬 캐시를 관리하기 위한 명령이 요약되어 있습니다.
| 명령 | 설명 |
|---|---|
foundry cache --help |
사용 가능한 모든 캐시 관련 명령 및 해당 사용량을 표시합니다. |
foundry cache location |
현재 캐시 디렉터리를 표시합니다. |
foundry cache list |
로컬 캐시에 저장된 모든 모델을 나열합니다. |
foundry cache cd <path> |
캐시 디렉터리를 지정된 경로로 변경합니다. |
foundry cache remove <model> |
로컬 캐시에서 모델을 제거합니다. |
실행 공급자
실행 공급자는 디바이스에서 가능한 한 효율적으로 모델을 실행하는 하드웨어별 가속 라이브러리입니다.
기본 제공 실행 공급자
Foundry Local에는 CPU 실행 공급자, WebGPU 실행 공급자 및 CUDA 실행 공급자가 포함됩니다.
CPU 실행 공급자는 Microsoft MLAS(선형 대수 서브루틴) 를 사용하여 모든 CPU에서 실행하며 Foundry Local의 CPU 대체입니다.
WebGPU 실행 공급자는 GPU의 가속을 위해 웹 기반 API의 네이티브 구현인 Dawn을 사용하며 Foundry Local의 GPU 대체입니다.
CUDA 실행 공급자는 NVIDIA GPU에서 가속을 위해 NVIDIA CUDA를 사용합니다. 최소 권장 드라이버 버전 32.0.15.5585 및 CUDA 버전 12.5를 사용하는 NVIDIA GeForce RTX 30 시리즈 이상이 필요합니다. NVIDIA 소프트웨어 개발 키트에 대한 사용권 계약(EULA)의 사용 조건의 적용을 받습니다.
플러그 인 실행 공급자
다음 표에 나열된 실행 공급자는 디바이스 및 드라이버 호환성에 따라 Windows에서 동적 다운로드 및 등록에 사용할 수 있습니다. 지정된 사용 조건의 적용을 받습니다.
Foundry Local은 처음 실행 시 이러한 실행 공급자를 자동으로 다운로드합니다. 플러그 인 실행 공급자는 새 버전을 사용할 수 있을 때 자동으로 업데이트됩니다.
| 이름(공급업체) | 요구 사항 | 사용 조건 |
|---|---|---|
NvTensorRTRTXExecutionProvider (NVIDIA) |
최소 권장 드라이버 버전 32.0.15.5585 및 CUDA 버전 12.5를 사용하는 NVIDIA GeForce RTX 30XX 이상 버전 | NVIDIA 소프트웨어 개발 키트에 대한 사용권 계약 - EULA |
OpenVINOExecutionProvider (인텔) |
CPU: 최소 권장 드라이버 32.0.100.9565를 사용하는 Intel TigerLake(11세대) 이상 버전 GPU: 최소 권장 드라이버 32.0.101.1029를 사용하는 Intel AlderLake(12세대) 이상 버전 NPU: 최소 권장 드라이버 32.0.100.4239를 사용하는 Intel ArrowLake(15세대) 이상 버전 |
Intel OBL 배포 상용 사용권 계약 v2025.02.12 |
QNNExecutionProvider (퀄컴) |
Snapdragon(R) X Elite - X1Exxxxx - 최소 드라이버 버전 30.0.140.0 이상 버전의 Qualcomm(R) Hexagon(TM) NPU Snapdragon(R) X Plus - X1Pxxxxx - 최소 드라이버 버전 30.0.140.0 이상 버전의 Qualcomm(R) Hexagon(TM) NPU |
QNN 라이선스를 보려면 Qualcomm® 신경망 처리 SDK를 다운로드하고 ZIP을 추출한 다음 LICENSE.pdf 파일을 엽니다. |
VitisAIExecutionProvider (AMD) |
최소 요구 사항: Adrenalin Edition 25.6.3과 NPU 드라이버 32.00.0203.280 Max: NPU 드라이버 32.00.0203.297이 포함된 Adrenalin Edition 25.9.1 |
추가 라이선스가 필요하지 않습니다. |