다음을 통해 공유


Foundry 로컬 명령줄 인터페이스(CLI) 참조

중요합니다

  • Foundry Local은 미리 보기로 제공됩니다. 공개 미리 보기 릴리스에서는 현재 적극적으로 배포되고 있는 기능에 대한 조기 액세스를 제공합니다.
  • GA(일반 공급) 전에는 기능, 방식 및 프로세스가 변경되거나 기능이 제한될 수 있습니다.

이 문서에서는 Foundry CLI(로컬 명령줄 인터페이스)에 대한 포괄적인 참조를 제공합니다. CLI는 모델을 관리하고, 서비스를 제어하고, 로컬 캐시를 유지 관리하는 데 도움이 되도록 명령을 논리적 범주로 구성합니다.

필수 조건

  • Foundry Local을 설치합니다. 설치 단계는 Foundry Local 시작을 참조하세요.
  • foundry CLI가 사용 가능한 로컬 터미널을 사용하세요.
  • 처음 다운로드(실행 공급자 및 모델)에 대한 인터넷 액세스 권한이 있는지 확인합니다.
  • Azure RBAC: 해당 없음(로컬로 실행).
  • Windows에 Intel NPU가 있는 경우 최적의 NPU 가속을 위해 Intel NPU 드라이버를 설치합니다.

빠른 확인

다음 명령을 실행하여 CLI가 설치되고 서비스에 연결할 수 있는지 확인합니다.

  1. CLI 도움말 표시:

     foundry --help
    

    이 명령은 사용량 정보와 사용 가능한 명령 그룹 목록을 출력합니다.

    참조: 개요

  2. 서비스 상태를 확인합니다.

     foundry service status
    

    이 명령은 Foundry 로컬 서비스가 실행 중인지 여부를 출력하고 로컬 엔드포인트를 포함합니다.

    참조: 서비스 명령

개요

기본 제공 도움말을 사용하여 명령 및 옵션을 탐색합니다.

CLI는 다음 세 가지 주요 범주로 명령을 구성합니다.

  • 모델: AI 모델을 관리하고 실행하기 위한 명령
  • 서비스: Foundry 로컬 서비스를 제어하기 위한 명령
  • 캐시: 로컬 모델 스토리지를 관리하기 위한 명령

모델 명령

다음 표에는 모델 관리 및 실행과 관련된 명령이 요약되어 있습니다.

비고

인수를 model별칭 또는 모델 ID로 지정할 수 있습니다. 별칭 사용:

  • 사용 가능한 하드웨어에 가장 적합한 모델을 자동으로 선택합니다. 예를 들어 Nvidia GPU를 사용할 수 있는 경우 Foundry Local은 최상의 GPU 모델을 선택합니다. 지원되는 NPU를 사용할 수 있는 경우 Foundry Local은 NPU 모델을 선택합니다.
  • 모델 ID를 기억할 필요 없이 더 짧은 이름을 사용할 수 있습니다.

특정 모델을 실행하려면 모델 ID를 사용합니다. 예를 들어 사용 가능한 하드웨어와 상관없이 qwen2.5-0.5b를 CPU에서 실행하려면 다음을 사용하십시오: foundry model run qwen2.5-0.5b-instruct-generic-cpu.

명령 설명
foundry model --help 사용 가능한 모든 모델 관련 명령과 사용량을 표시합니다.
foundry model run <model> 지정된 모델을 실행하고, 캐시되지 않은 경우 다운로드하고, 상호 작용을 시작합니다.
foundry model list 로컬에서 사용할 수 있는 모든 모델을 나열합니다. 처음 실행 시 하드웨어에 대한 실행 공급자(EP)를 다운로드합니다.
foundry model list --filter <key>=<value> 지정된 조건(디바이스, 작업, 별칭, 공급자)으로 필터링된 모델을 나열합니다.
foundry model info <model> 특정 모델에 대한 자세한 정보를 표시합니다.
foundry model info <model> --license 특정 모델에 대한 라이선스 정보를 표시합니다.
foundry model download <model> 모델을 실행하지 않고 로컬 캐시에 다운로드합니다.
foundry model load <model> 모델을 서비스에 로드합니다.
foundry model unload <model> 서비스에서 모델을 언로드합니다.

모델 목록 순서 지정

별칭에 대해 여러 모델 ID 변형을 사용할 수 있는 경우 모델 목록에 우선 순위가 지정된 모델이 표시됩니다. 목록의 첫 번째 모델은 모델을 지정하는 경우 실행되는 모델 alias입니다.

모델 목록 필터링

이 명령은 옵션을 foundry model list 사용하여 모델 필터링을 지원합니다 --filter . 키-값 쌍을 사용하여 단일 특성에 따라 모델을 필터링할 수 있습니다.

foundry model list --filter <key>=<value>

이 명령은 필터 키 및 값과 일치하는 모델을 출력합니다.

참조: 모델 목록 필터링

비고

설치 후 처음으로 실행 foundry model list 하면 Foundry Local은 컴퓨터의 하드웨어 구성에 대한 관련 실행 공급자(EP)를 자동으로 다운로드합니다. 모델 목록이 나타나기 전에 다운로드 완료를 나타내는 진행률 표시줄이 표시됩니다.

지원되는 필터 키:

디바이스 - 하드웨어 디바이스 유형

실행 중인 하드웨어 디바이스를 기준으로 모델을 필터링합니다.

가능한 값:

  • CPU - 중앙 처리 단위 모델
  • GPU - 그래픽 처리 단위 모델
  • NPU - 신경망 처리 단위 모델

공급자 - 실행 공급자

실행 공급자 또는 런타임별로 모델을 필터링합니다.

가능한 값:

  • CPUExecutionProvider - CPU 기반 실행
  • CUDAExecutionProvider - NVIDIA CUDA GPU 실행
  • WebGpuExecutionProvider - WebGPU 실행
  • QNNExecutionProvider - Qualcomm 신경망 실행(NPU)
  • OpenVINOExecutionProvider - Intel OpenVINO 실행
  • NvTensorRTRTXExecutionProvider - NVIDIA TensorRT 실행
  • VitisAIExecutionProvider - AMD Vitis AI 실행

작업 - 모델 작업 유형

모델을 의도한 사용 사례 또는 작업으로 필터링합니다.

공통 값:

  • chat-completion: 대화형 AI 모델
  • text-generation: 텍스트 생성 모델

별칭 - 모델 별칭

별칭 식별자를 사용하여 모델을 필터링합니다. * 접미사를 사용한 와일드카드 일치를 지원합니다.

샘플 값:

  • phi4-cpu
  • qwen2.5-coder-0.5b-instruct-generic-cpu
  • deepseek-r1-distill-qwen-1.5b-generic-cpu
  • phi-4-mini-instruct-generic-cpu

특수 필터 기능

부정 지원: 일치하는 모델을 제외할 값을 접두사로 ! 지정합니다.

foundry model list --filter device=!GPU

이 명령은 결과에서 GPU 모델을 제외합니다.

참조: 특수 필터 기능

와일드카드 일치(별칭만 해당): 별칭으로 필터링할 때 접두사를 일치하도록 추가 * 합니다.

foundry model list --filter alias=qwen*

이 명령은 별칭이 .로 qwen시작하는 모델을 반환합니다.

참조: 특수 필터 기능

예시

foundry model list --filter device=GPU
foundry model list --filter task=chat-completion
foundry model list --filter provider=CUDAExecutionProvider

이러한 예제에서는 디바이스, 작업 및 실행 공급자별로 모델 목록을 필터링합니다.

참조: 모델 목록 필터링

비고

  • 모든 비교는 대/소문자를 구분하지 않습니다.
  • 명령당 하나의 필터만 사용할 수 있습니다.
  • 인식할 수 없는 필터 키로 인해 오류가 발생합니다.

서비스 명령

다음 표에는 Foundry 로컬 서비스 관리 및 실행과 관련된 명령이 요약되어 있습니다.

명령 설명
foundry service --help 사용 가능한 모든 서비스 관련 명령과 사용량을 표시합니다.
foundry service start Foundry 로컬 서비스를 시작합니다.
foundry service stop Foundry 로컬 서비스를 중지합니다.
foundry service restart Foundry 로컬 서비스를 다시 시작합니다.
foundry service status Foundry 로컬 서비스의 현재 상태를 표시합니다.
foundry service ps Foundry 로컬 서비스에 현재 로드된 모든 모델을 나열합니다.
foundry service diag Foundry 로컬 서비스의 로그를 표시합니다.
foundry service set <options> Foundry 로컬 서비스의 구성을 설정합니다.

캐시 명령

다음 표에는 모델이 저장되는 로컬 캐시를 관리하기 위한 명령이 요약되어 있습니다.

명령 설명
foundry cache --help 사용 가능한 모든 캐시 관련 명령 및 해당 사용량을 표시합니다.
foundry cache location 현재 캐시 디렉터리를 표시합니다.
foundry cache list 로컬 캐시에 저장된 모든 모델을 나열합니다.
foundry cache cd <path> 캐시 디렉터리를 지정된 경로로 변경합니다.
foundry cache remove <model> 로컬 캐시에서 모델을 제거합니다.

실행 공급자

실행 공급자는 디바이스에서 가능한 한 효율적으로 모델을 실행하는 하드웨어별 가속 라이브러리입니다.

기본 제공 실행 공급자

Foundry Local에는 CPU 실행 공급자, WebGPU 실행 공급자 및 CUDA 실행 공급자가 포함됩니다.

CPU 실행 공급자는 Microsoft MLAS(선형 대수 서브루틴) 를 사용하여 모든 CPU에서 실행하며 Foundry Local의 CPU 대체입니다.

WebGPU 실행 공급자는 GPU의 가속을 위해 웹 기반 API의 네이티브 구현인 Dawn을 사용하며 Foundry Local의 GPU 대체입니다.

CUDA 실행 공급자는 NVIDIA GPU에서 가속을 위해 NVIDIA CUDA를 사용합니다. 최소 권장 드라이버 버전 32.0.15.5585 및 CUDA 버전 12.5를 사용하는 NVIDIA GeForce RTX 30 시리즈 이상이 필요합니다. NVIDIA 소프트웨어 개발 키트에 대한 사용권 계약(EULA)의 사용 조건의 적용을 받습니다.

플러그 인 실행 공급자

다음 표에 나열된 실행 공급자는 디바이스 및 드라이버 호환성에 따라 Windows에서 동적 다운로드 및 등록에 사용할 수 있습니다. 지정된 사용 조건의 적용을 받습니다.

Foundry Local은 처음 실행 시 이러한 실행 공급자를 자동으로 다운로드합니다. 플러그 인 실행 공급자는 새 버전을 사용할 수 있을 때 자동으로 업데이트됩니다.

이름(공급업체) 요구 사항 사용 조건
NvTensorRTRTXExecutionProvider (NVIDIA) 최소 권장 드라이버 버전 32.0.15.5585 및 CUDA 버전 12.5를 사용하는 NVIDIA GeForce RTX 30XX 이상 버전 NVIDIA 소프트웨어 개발 키트에 대한 사용권 계약 - EULA
OpenVINOExecutionProvider (인텔) CPU: 최소 권장 드라이버 32.0.100.9565를 사용하는 Intel TigerLake(11세대) 이상 버전
GPU: 최소 권장 드라이버 32.0.101.1029를 사용하는 Intel AlderLake(12세대) 이상 버전
NPU: 최소 권장 드라이버 32.0.100.4239를 사용하는 Intel ArrowLake(15세대) 이상 버전
Intel OBL 배포 상용 사용권 계약 v2025.02.12
QNNExecutionProvider (퀄컴) Snapdragon(R) X Elite - X1Exxxxx - 최소 드라이버 버전 30.0.140.0 이상 버전의 Qualcomm(R) Hexagon(TM) NPU
Snapdragon(R) X Plus - X1Pxxxxx - 최소 드라이버 버전 30.0.140.0 이상 버전의 Qualcomm(R) Hexagon(TM) NPU
QNN 라이선스를 보려면 Qualcomm® 신경망 처리 SDK를 다운로드하고 ZIP을 추출한 다음 LICENSE.pdf 파일을 엽니다.
VitisAIExecutionProvider (AMD) 최소 요구 사항: Adrenalin Edition 25.6.3과 NPU 드라이버 32.00.0203.280
Max: NPU 드라이버 32.00.0203.297이 포함된 Adrenalin Edition 25.9.1
추가 라이선스가 필요하지 않습니다.