Riferimento CLI Locale di Foundry

Importante

L'interfaccia della riga di comando locale di Foundry è disponibile in anteprima. Le versioni di anteprima pubblica forniscono access iniziali alle funzionalità in fase di distribuzione attiva.
Funzionalità, approcci e processi possono subire variazioni o avere funzionalità limitate, prima della disponibilità generale (GA).

Questo articolo fornisce informazioni di riferimento complete per l'interfaccia della riga di comando locale di Foundry. L'interfaccia della riga di comando organizza i comandi in categorie logiche per semplificare la gestione dei modelli, il controllo del servizio e la gestione della cache locale.

Prerequisiti

Installare Foundry Local.
Terminale locale in cui è disponibile l'interfaccia della foundry riga di comando.
Assicurarsi di disporre dell'accesso a Internet per i download per la prima volta (provider di esecuzione e modelli).
Azure controllo degli accessi in base al ruolo: non applicabile (viene eseguito localmente).
Se si dispone di una NPU Intel in Windows, installare il driver Intel NPU per un'accelerazione NPU ottimale.

Installare Foundry Local

Installare Foundry Local usando la gestione pacchetti per il sistema operativo.

Windows: aprire un terminale ed eseguire:
```
winget install Microsoft.FoundryLocal
```
macOS: aprire un terminale ed eseguire:
```
brew tap microsoft/foundrylocal
brew install foundrylocal
```
In alternativa, scaricare il programma di installazione dal repository GitHub GitHub locale <>Foundry.

Verificare l'installazione:

foundry --version

Assicurarsi di disporre dei diritti di amministratore per installare il software.

Suggerimento

Se viene visualizzato un errore di connessione al servizio dopo l'installazione , ad esempio Request to local service failed, eseguire foundry service restart.

Verifica rapida

Eseguire questi comandi per verificare che l'interfaccia della riga di comando sia installata e che il servizio sia raggiungibile.

Mostra aiuto CLI
```
 foundry --help
```
Questo comando stampa informazioni sull'utilizzo e l'elenco dei gruppi di comandi disponibili.

Informazioni di riferimento: Panoramica
Controllare lo stato del servizio:
```
 foundry service status
```
Questo comando stampa se il servizio locale Foundry è in esecuzione e include l'endpoint locale.

Riferimento: Comandi del servizio

Informazioni generali

Usare la guida integrata per esplorare i comandi e le opzioni.

L'interfaccia della riga di comando organizza i comandi in tre categorie principali:

Modello: comandi per la gestione e l'esecuzione di modelli di intelligenza artificiale
Servizio: comandi per il controllo del servizio locale Foundry
Cache: comandi per la gestione dell'archiviazione locale del modello

Comandi del modello

La tabella seguente riepiloga i comandi correlati alla gestione e all'esecuzione dei modelli:

Annotazioni

È possibile specificare l'argomento modelutilizzando l'alias o l'ID modello. Uso di un alias:

Seleziona automaticamente il modello migliore per l'hardware disponibile. Ad esempio, se è disponibile una GPU Nvidia, Foundry Local seleziona il modello GPU migliore. Se è disponibile una NPU supportata, Foundry Local seleziona il modello NPU.
Consente di usare un nome più breve senza dover ricordare l'ID modello.

Se si vuole eseguire un modello specifico, usare l'ID modello. Ad esempio, per eseguire il qwen2.5-0.5b su CPU, indipendentemente dall'hardware disponibile, usare: foundry model run qwen2.5-0.5b-instruct-generic-cpu.

Comando	Descrizione
`foundry model --help`	Visualizza tutti i comandi relativi al modello disponibili e il relativo utilizzo.
`foundry model run <model>`	Esegue un modello specificato, lo scarica se non è memorizzato nella cache e avvia un'interazione.
`foundry model list`	Elenca tutti i modelli disponibili per l'uso locale. Alla prima esecuzione, scarica i provider di esecuzione (EP) per l'hardware.
`foundry model list --filter <key>=<value>`	Elenca i modelli filtrati in base ai criteri specificati (dispositivo, attività, alias, provider).
`foundry model info <model>`	Visualizza informazioni dettagliate su un modello specifico.
`foundry model info <model> --license`	Visualizza le informazioni sulla licenza per un modello specifico.
`foundry model download <model>`	Scarica un modello nella cache locale senza eseguirlo.
`foundry model load <model>`	Carica un modello nel servizio.
`foundry model unload <model>`	Scarica un modello dal servizio.

Ordinamento elenco modelli

Quando sono disponibili più varianti di ID modello per un alias, l'elenco dei modelli mostra i modelli in ordine di priorità. Il primo modello nell'elenco è il modello eseguito quando si specifica il modello per alias.

Filtraggio dell'elenco modelli

Il foundry model list comando supporta il filtro dei modelli usando l'opzione --filter . È possibile filtrare i modelli in base a un singolo attributo usando coppie chiave-valore.

foundry model list --filter <key>=<value>

Questo comando stampa i modelli che corrispondono alla chiave e al valore del filtro.

Riferimento: Filtro elenco modelli

Annotazioni

Quando si esegue foundry model list per la prima volta dopo l'installazione, Fonderia Locale scarica automaticamente i provider di esecuzione pertinenti per la configurazione hardware del computer. Viene visualizzata una barra di stato che indica il completamento del download prima che venga visualizzato l'elenco dei modelli.

Chiavi di filtro supportate:

device - Tipo di dispositivo hardware

Filtra i modelli in base al dispositivo hardware in cui vengono eseguiti.

Valori possibili:

CPU - Modelli di unità di elaborazione centrale
GPU - Modelli di unità di elaborazione grafica
NPU - Modelli di unità di elaborazione neurale

provider - Provider di esecuzione

Filtra i modelli in base al provider di esecuzione o al runtime.

Valori possibili:

CPUExecutionProvider - Esecuzione basata sulla CPU
CUDAExecutionProvider - Esecuzione GPU NVIDIA CUDA
WebGpuExecutionProvider - Esecuzione di WebGPU
QNNExecutionProvider - Esecuzione della rete neurale Qualcomm (NPU)
OpenVINOExecutionProvider - Esecuzione di Intel OpenVINO
NvTensorRTRTXExecutionProvider - Esecuzione di NVIDIA TensorRT
VitisAIExecutionProvider - Esecuzione dell'intelligenza artificiale AMD Vitis

task - Tipo di attività modello

Filtra i modelli in base al caso d'uso o all'attività desiderata.

Valori comuni:

chat-completion: modelli di intelligenza artificiale conversazionale
text-generation: modelli di generazione di testo

alias - Alias del modello

Filtra i modelli in base al relativo identificatore di alias. Supporta la corrispondenza dei caratteri jolly con il suffisso *.

Valori di esempio:

phi4-cpu
qwen2.5-coder-0.5b-instruct-generic-cpu
deepseek-r1-distill-qwen-1.5b-generic-cpu
phi-4-mini-instruct-generic-cpu

Funzionalità di filtro speciali

Supporto per la negazione: Anteporre qualsiasi valore a ! per escludere i modelli corrispondenti.

foundry model list --filter device=!GPU

Questo comando esclude i modelli GPU dai risultati.

Riferimento: Funzionalità di filtro speciali

Corrispondenza dei caratteri jolly (solo alias): aggiungere * per trovare le corrispondenze dei prefissi per il filtro in base all'alias.

foundry model list --filter alias=qwen*

Questo comando restituisce modelli il cui alias inizia con qwen.

Riferimento: Funzionalità di filtro speciali

Esempi

foundry model list --filter device=GPU
foundry model list --filter task=chat-completion
foundry model list --filter provider=CUDAExecutionProvider

Questi esempi filtrano l'elenco di modelli in base a dispositivo, attività e provider di esecuzione.

Riferimento: Filtro elenco modelli

Annotazioni

Tutti i confronti non fanno distinzione tra maiuscole e minuscole.
È possibile usare un solo filtro per ogni comando.
Le chiavi di filtro non riconosciute generano un errore.

Eseguire un modello in modo interattivo

Eseguire un modello e interagire con esso direttamente nel terminale:

foundry model run qwen2.5-0.5b

Foundry Local scarica il modello alla prima esecuzione, quindi avvia una sessione interattiva. Immettere un prompt per ottenere una risposta:

Why is the sky blue?

Suggerimento

Sostituire qwen2.5-0.5b con qualsiasi alias del modello dal catalogo. Eseguire foundry model list per visualizzare i modelli disponibili. Foundry Local scarica la variante che meglio corrisponde all'hardware, ad esempio una variante CUDA per GPU NVIDIA o una variante di NPU per i CRITERI di rete Qualcomm.

Comandi del servizio

La tabella seguente riepiloga i comandi correlati alla gestione e all'esecuzione del servizio locale Foundry:

Comando	Descrizione
`foundry service --help`	Visualizza tutti i comandi correlati al servizio disponibili e il relativo utilizzo.
`foundry service start`	Avvia il servizio Foundry Locale.
`foundry service stop`	Arresta il servizio Foundry Local.
`foundry service restart`	Riavvia il servizio Foundry Locale.
`foundry service status`	Visualizza lo stato corrente del servizio locale Foundry.
`foundry service ps`	Elenca tutti i modelli attualmente caricati nel servizio locale Foundry.
`foundry service diag`	Visualizza i log del servizio locale Foundry.
`foundry service set <options>`	Imposta la configurazione del servizio locale Foundry.

Comandi della cache

La tabella seguente riepiloga i comandi per la gestione della cache locale in cui vengono archiviati i modelli:

Comando	Descrizione
`foundry cache --help`	Mostra tutti i comandi correlati alla cache disponibili e il relativo utilizzo.
`foundry cache location`	Mostra la directory della cache corrente.
`foundry cache list`	Elenca tutti i modelli archiviati nella cache locale.
`foundry cache cd <path>`	Modifica la directory della cache nel percorso specificato.
`foundry cache remove <model>`	Rimuove un modello dalla cache locale.

Fornitori di esecuzione

I provider di esecuzione sono librerie di accelerazione specifiche dell'hardware che eseguono modelli nel modo più efficiente possibile nel dispositivo.

Provider di esecuzione predefiniti

Foundry Local include il provider di esecuzione della CPU, il provider di esecuzione WebGPU e il provider di esecuzione CUDA.

Il provider di esecuzione della CPU usa Microsoft Subroutine algebriche lineari (MLAS) per l'esecuzione su qualsiasi CPU ed è il fallback della CPU per Foundry Local.

Il provider di esecuzione WebGPU utilizza Dawn, l'implementazione nativa dell'API basata sul web, per l'accelerazione su qualsiasi GPU, ed è l'alternativa GPU per Foundry Local.

Il provider di esecuzione CUDA usa NVIDIA CUDA per l'accelerazione su GPU NVIDIA. Richiede una serie NVIDIA GeForce RTX 30 e successive con una versione minima consigliata del driver 32.0.15.5585 e CUDA versione 12.5. È soggetto alle seguenti condizioni di licenza: Contratto di licenza per i Kit di Sviluppo Software NVIDIA—EULA.

Provider di esecuzione plug-in

I provider di esecuzione elencati nella tabella seguente sono disponibili per il download dinamico e la registrazione in Windows, a seconda della compatibilità dei dispositivi e dei driver. Sono soggetti alle condizioni di licenza specificate.

Foundry Local scarica automaticamente questi provider di esecuzione al primo avvio. I provider di esecuzione del plug-in vengono aggiornati automaticamente quando sono disponibili nuove versioni.

Nome (fornitore)	Requisiti	Condizioni di licenza
`NvTensorRTRTXExecutionProvider` (NVIDIA)	NVIDIA GeForce RTX 30XX e versioni successive con la versione minima consigliata del driver 32.0.15.5585 e CUDA versione 12.5	Accordo di Licenza con l'Utente Finale per NVIDIA Software Development Kits—EULA
`OpenVINOExecutionProvider` (Intel)	CPU: Intel TigerLake (prima generazione) e versioni successive con il driver minimo consigliato 32.0.100.9565 GPU: Intel AlderLake (12a generazione) e versioni successive con il driver minimo consigliato 32.0.101.1029 NPU: Intel ArrowLake (15a generazione) e versioni successive con il driver minimo consigliato 32.0.100.4239	Contratto di licenza intel OBL Distribution Commercial Use v2025.02.12
`QNNExecutionProvider` (Qualcomm)	Snapdragon(R) X Elite - X1Exxxxx - Qualcomm(R) Hexagon(TM) NPU con una versione minima del driver 30.0.140.0 e versioni successive Snapdragon(R) X Plus - X1Pxxxxx - Qualcomm(R) Hexagon(TM) NPU con versione minima del driver 30.0.140.0 e versioni successive	Per visualizzare la licenza QNN, scaricare Qualcomm® Neural Processing SDK, estrarre il file ZIP e aprire il file LICENSE.pdf.
`VitisAIExecutionProvider` (AMD)	Min: Adrenalin Edition 25.6.3 con driver NPU 32.00.0203.280 Max: Adrenalin Edition 25.9.1 con driver NPU 32.00.0203.297	Nessuna licenza aggiuntiva richiesta

Usare Open WebUI con il server locale

Connettere Open WebUI to Foundry Local per un'interfaccia di chat basata su browser eseguita interamente nel dispositivo.

Avviare un modello e lasciare aperto il terminale:
```
foundry model run qwen2.5-0.5b
```
Ottenere l'URL dell'endpoint locale:
```
foundry service status
```
Copiare l'URL dell'endpoint. Foundry Local assegna una porta dinamica ogni volta che il servizio viene avviato.
Installare e avviare Open WebUI ,quindi aprire http://localhost:8080 nel browser.
Connettere Open WebUI to Foundry Local :Connect Open WebUI to Foundry Local:Connect Open WebUI to Foundry Local:
1. Passare a Impostazioni>Impostazioni Impostazioni Connessioni> amministratore e abilitare Connessioni dirette.
2. Passare a Impostazioni>Connessioni>gestisci connessioni dirette e selezionare +.
3. Impostare URL su http://localhost:PORT/v1 (sostituire PORT con la porta del passaggio 2) e Autenticazione su Nessuno.
4. Seleziona Salva.
Selezionare un modello dall'elenco a discesa e avviare la chat.

Suggerimento

Se non vengono visualizzati modelli, eseguire foundry model run <model> in un terminale e ricaricare Open WebUI. Se la connessione non riesce, confermare la porta con foundry service status.

Aggiornare Foundry Local

Eseguire il comando per il sistema operativo per aggiornare Foundry Local.

Windows:

winget upgrade --id Microsoft.FoundryLocal

macOS:
```
brew upgrade foundrylocal
```

Disinstallare Foundry Local

Eseguire il comando per il sistema operativo per disinstallare Foundry Local.

Windows:

winget uninstall Microsoft.FoundryLocal

macOS:

brew rm foundrylocal
brew untap microsoft/foundrylocal
brew cleanup --scrub

Risoluzione dei problemi

Problemi di connessione al servizio

Se viene visualizzato questo errore quando si esegue un comando come foundry model list:

Exception: Request to local service failed.
Uri: http://127.0.0.1:0/foundry/list

The requested address is not valid in its context. (127.0.0.1:0)

Please check service status with 'foundry service status'.

Riavviare il servizio:

foundry service restart

Questo comando risolve i casi in cui il servizio viene eseguito ma non è accessibile a causa di un problema di associazione di porte.

Per altre indicazioni sulla risoluzione dei problemi, vedere Procedure consigliate e risoluzione dei problemi.

Commenti e suggerimenti

Questa pagina è stata utile?

Last updated on 2026-04-09

Condividi tramite

Riferimento CLI Locale di Foundry

Prerequisiti

Installare Foundry Local

Verifica rapida

Informazioni generali

Comandi del modello

Ordinamento elenco modelli

Filtraggio dell'elenco modelli

device - Tipo di dispositivo hardware

provider - Provider di esecuzione

task - Tipo di attività modello

alias - Alias del modello

Funzionalità di filtro speciali

Esempi

Eseguire un modello in modo interattivo

Comandi del servizio

Comandi della cache

Fornitori di esecuzione

Provider di esecuzione predefiniti

Provider di esecuzione plug-in

Usare Open WebUI con il server locale

Aggiornare Foundry Local

Disinstallare Foundry Local

Risoluzione dei problemi

Problemi di connessione al servizio

Commenti e suggerimenti

Risorse aggiuntive