Home

Federica EU

1/21

Alberto Finzi » 5.Robotica Probabilistica - Filtri Bayesiani (parte seconda)

Robotica Probabilistica: Azioni

Spesso il mondo è dinamico
- Azioni (del robot o di altri agenti)
- Tempo
Come introdurre queste azioni?
Azioni Tipiche: girare ruote, manipolare oggetti, etc.
Sensori imprecisi
Azioni aumentano l’incertezza

Interazione Robot-Ambiente

Modellare le Azioni

Per incorporare il risultato di una azione u nel “belief”, si usa un pdf condizionale

P(x|u,x’)

pdf eseguendo u cambia lo stato da x’ a x.

Esempio Transizioni di Stato

P(x|u,x’) con u = “chiudi la porta”:

Se la porta è aperta, “chiudi la porta” ha successo nel 90% dei casi.

Integrando Risultato Azioni

Continuo:

$P(u|x)=\int P(x|u,x')P(x')dx'$

Discreto:

$P(x|u)=\sum P(x|u,x')P(x')$

Esempio

$P(closed|u)=\sum P(closed|u,x')P(x')$

$=P(closed|u,open)P(open)+P(closed|u, closed)P(closed)$

$=\frac 9{10}\frac 5 8 +\frac 1 1 *\frac 3 8 = \frac{15}{16}$

$P(open|u)=\sum P(open|u,x')P(x')$

$=P(open|u, open)P(open)+P(open, u, closed)P(closed)$

$=\frac 1{10}\frac 5 8 +\frac 0 1 *\frac 3 8 = \frac 1 {16}$
$=1-P(closed|u)$

Stato del Robot

Stato: Tutte le variabili x salienti per l’evoluzione del sistema dinamico

Posa: Localizzazione e Orientazione rispetto ad un sistema di coordinate assoluto (include la configurazione nel caso di manipolatori).
Stato dinamico: Velocità del robot e delle sue componenti/giunti.
Locazione di Features degli oggetti nell’ambiente (landmarks).
Uno stato x_t è completo se l’insieme delle variabili selezionate consente la migliore previsione.

Stato del Robot

Si lavora però con stato incompleto.

Assunzione Markoviana: la previsione migliore si può fare a partire dallo stato attuale (lo stato passato non aggiunge nulla).

Stato ibrido: variabili continue e discrete.
Tempo discreto: X_t+1, X_t

Filtro Bayesiano

Dati:
Flusso di osservazioni z e azioni u:

$d_t=\{u_1, z_1, ..., u_t, z_t\}$

Modello del sensore P(z|x).
Modello delle Azioni P(x|u,x’).
Prior probabilità dello stato del sistema P(x).

Desiderta

Stima dello stato X del sistema dinamico il posterior dello stato è il Belief:

$Bel(x_t)=P(x_t|u_1, z_1, ..., u_t, z_t)$

Filtro Bayesiano

Notazione

Osservazioni

$z_{t1:t_2}=z_{t1}, z_{t1+1}, z_{t1+2},...,z_{t2}$

Azioni

$u_{t1:t_2}=u_{t1}, u_{t1+1}, u_{t1+2},...,u_{t2}$

Assunzione di Markov

Assunzioni

Mondo statico
Rumore indipendente
Modello perfetto, non errori di approssimazione

Probabilità di misura

$p(z_t|x_{0:t}, z_{1:t}, u_{1:t})=p(z_t|x_t)$

Transizione di stato

$p(x_t|x_{1:t}, z_{1:t}, u_{1:t})=p(x_t|x_{t-1}, u_t)$

Indipendenza condizionata

Belief

Il robot deve dedurre la sua posizione dalle misure.

Si distingue stato reale e stato stimato

Bel(xt) = p(x_t | z_1:t , u_1:t)

probablità di x_t date le misure z_1:t e le azioni u_1:t.

Bel’(x_t) = p(x_t| z_1:t-1 , u_1:t)

predizione (stima dello stato prima dell’ultima osservazione).

Calcolo di Bel(x_t) da Bel’(x_t) è la correzione o aggiornamento di misura.

Filtro Bayesiano: derivazione

${Bel(x_t)=P(x_t|u_{1:t},z_{1:t})}$

Bayes $=\eta P(z_t|x_t, u_{1:t}, z_{1:t-1})P(x_t|u_{1:t}, z_{1:t-1})$

Markov = $\eta P (z_t|x_t)P(x_t|u_{1:t}, z_{1:t-1}})$

Total prob. = $\eta P(z_t|x_t)\int P(x_t|u_{1:t}, z_{1:t-1}, x_{t-1})P(x_{t-1}|u_{1:t}z_{1:t-1})dx_{t-1}$

Markov = $\eta P(z_t|x_t)\int P(x_t|u_{t}, x_{t-1})P(x_{t-1}|u_{1:t}z_{1:t-1})dx_{t-1}$

Markov = $\eta P(z_t|x_t)\int P(x_t|u_{t}, x_{t-1})P(x_{t-1}|u_{1:t}z_{1:t-1})dx_{t-1}$
(Omissione di u_t) = $\eta P(z_t|x_t)\int P(x_t|u_t, x_{t-1})Bel (x_{t-1})dx_{t-1}$

Filtro Bayesiano

Algoritmo per il calcolo del Belief: Filtro Bayesiano

Algoritmo ricorsivo: Bel(x_t) calcolato da Bel(x_t-1), u_t, z_t

for all xt

$Bel' (x_t)=\int P(x_t|u_t, x_{t-1})Bel (x_{t-1})dx_{t-1}~~~\text{predizione}$

$Bel (x_t)=\eta P(z_t|x_t)Bel' (x_{t-1})~~~~~~~~~~~~~~~~~~~~~~\text{misura}$

endFor return Bel(x_t)

Algoritmo

Bayes Filter Algorithm

$Bel (x_t)=\eta P(z_t|x_t)\int P(x_t|u_t, x_{t-1})Bel (x_{t-1})dx_{t-1}$

Algoritmo Filtro_Bayes( Bel(x),d ):
η=0
If d perceptual data z then
For all x do
$Bel'(n)=P(z|x)Bel(x)$
$\eta=\eta+Bel'(x)$
For all x do
$Bel'(x)=\eta^{-1}Bel' (x)$
else if d action data item u then
For all x do
$Bel' (x)=\int P(x|u,x')Bel (x')dx'$
Return Bel’(x)

Filtro Bayesiano

Per il calcolo:

occorre il Belif iniziale: Bel(x₀);
se conosco prob 1 sullo stato iniziale (Delta Dirac);
se non conosco allora distribuzione uniforme sul dominio di x₀;
altrimenti altra distribuzione.

Tipologia di Filtri Bayesiani

$Bel (x_t)=\eta P(z_t|x_t)\int P(x_t|u_t, x_{t-1})Bel(x_{t-1})dx_{t-1}$

Filtro di Kalman
Particle Filter
Hidden Markov Model
Dynamic Bayesian Network
Partially Observable Markov Decision Processes (POMDPs)

Tipologia di Filtri Bayesiani

Tutti i filtri richiedono:

Belief iniziale: P(x0)
Probabilità di misura: P(z_t | x_t)
Transizione di stato: P(x_t | u_t, x_t-1)

Assunzione Markoviana

Violazione dell’assunzione markoviana

Dinamiche non modellate dell’ambiente.
Modello probabilistico non accurato.
Rappresentazione probabilistiche approssimate.
Variabili di controllo con influenze multiple.

Però l’assunzione markoviana è robusta.

Filtri Bayesiani: Problema di Localizzazione e Mapping

Localizzazione: P(X_t | M, u_1:t, z_1:t)

Stima della posizione data la Mappa

Mapping: P(M_t | X_t, u_1:t, z_1:t)

Sima della mappa data la posizione

SLAM: P(X_t, M_t | u_1:t, z_1:t)

Stima di mappa e posizione

Riassunto

La legge di Bayes permette di calcolare le probabilità condizionate inverse.
Data l’assunzione di Markov, si può combinare l’evidenza in modo efficiente con l’update recursivo Bayesian.
I Filtri Bayesiani permettono di stimare lo stato di un sistema dinamico.