banner
Casa / Notizia / Profondità di campo estesa nella realtà aumentata
Notizia

Profondità di campo estesa nella realtà aumentata

Mar 27, 2023Mar 27, 2023

Rapporti scientifici volume 13, numero articolo: 8786 (2023) Citare questo articolo

238 accessi

1 Altmetrico

Dettagli sulle metriche

Il dispositivo di visualizzazione 3D mostra un'immagine con informazioni sulla profondità. I dispositivi di visualizzazione 3D convenzionali basati sulla parallasse binoculare possono mettere a fuoco con precisione solo sulla profondità di uno schermo specifico. Poiché l'occhio umano ha una profondità di campo (DOF) ristretta in circostanze normali, i display 3D che forniscono una gamma relativamente ampia di aree di profondità virtuale presentano limitazioni sulla DOF in cui vengono visualizzate immagini 3D chiare. Per risolvere questo problema è necessario trovare le condizioni ottiche per estendere la DOF e analizzare i fenomeni ad essa correlati. Per questo, utilizzando il criterio di Rayleigh e il rapporto di Strehl, viene suggerito un criterio per questa estensione del DOF. Una pratica struttura ottica in grado di estendere efficacemente la DOF è stata ideata utilizzando un display a schermo piatto. Questa struttura ottica potrebbe essere applicata ad AR, VR e MR nel campo dei display vicini all'occhio. Dai risultati di questa ricerca, vengono proposti le condizioni e gli standard ottici fondamentali per i display 3D che in futuro forniranno immagini 3D con DOF esteso. Inoltre, si prevede anche che queste condizioni e criteri possano essere applicati ai progetti ottici per le prestazioni richieste nello sviluppo di display 3D in vari campi.

I display 3D come i display 3D di tipo stereo con occhiali o senza occhiali di solito forniscono parallasse binoculare1,2. Inoltre, per fornire una parallasse del movimento, le informazioni sulla posizione degli osservatori possono essere utilizzate per un processo software come feedback3,4,5,6. Utilizzando un display 3D multivista, la parallasse del movimento può essere fornita anche otticamente7,8,9,10,11. Inoltre, quando una persona guarda un oggetto in un ambiente naturale, le linee visive di entrambi gli occhi convergono verso la posizione dell'oggetto e creano un punto di fissazione nella fovea della retina. Allo stesso tempo, l'occhio regola lo spessore del cristallino in modo che l'immagine della retina diventi chiara concentrandosi sulla profondità di convergenza. In questo modo, l’azione del legame convergenza-accomodamento si svolge naturalmente nell’occhio umano.

Nel caso dell'immagine 3D, un senso di profondità può essere fornito da un'immagine di parallasse binoculare. Il riconoscimento delle immagini 3D si ottiene combinando effetti binoculari e monoculari. Per gli effetti monoculari esiste un effetto di controllo della messa a fuoco. Tuttavia, osservando un'immagine 3D, è noto che la profondità degli oggetti virtuali che l'occhio umano percepisce come immagine chiara sulla retina attraverso l'accomodamento è in media di circa ± 0,3 diottrie per una larghezza della pupilla di 3 mm12. Pertanto, se dal display 3D viene fornita un'immagine 3D con una profondità focale maggiore di ± 0,3 diottrie, a causa della sfocatura dell'immagine sulla retina, un osservatore non può vedere l'immagine 3D complessivamente chiara dall'immagine 3D fornita con tale differenza in profondità. Cioè, si traduce in un conflitto di convergenza-accomodamento (VAC)13,14. Questo fenomeno VAC può causare affaticamento degli occhi, quindi la profondità dell'immagine 3D da esprimere è inevitabilmente limitata e anche l'area di applicazione dell'immagine 3D è limitata. Pertanto, quando la DOF viene ampliata in un'immagine 3D generale, si può dire che l'immagine monoculare è un'immagine 2D che mostra sempre un'immagine chiara indipendentemente dalle informazioni sulla profondità dell'immagine nell'area DOF ingrandita. Tuttavia, se tale immagine 3D viene combinata con la parallasse binoculare della situazione dello sguardo di entrambi gli occhi, è sempre possibile vedere un'immagine chiara quando la profondità dello sguardo di entrambi gli occhi rientra nell'intervallo del DOF. Tuttavia, questa non è un'immagine 3D con le caratteristiche di un'immagine reale. Ma non ci sono problemi nel riconoscere l'immagine 3D del punto di osservazione perché l'osservatore può riconoscere un'immagine chiara anche quando guarda il punto dell'immagine 3D a qualsiasi profondità entro l'intervallo di profondità del DOF.

La tecnologia di visualizzazione 3D per risolvere questo problema VAC dovrebbe essere in grado di controllare la partenza della luce dalla profondità dell'immagine virtuale, in modo simile alla tecnologia olografia15,16. Oppure implementare una visualizzazione spaziale per fornire immagini 3D come in un dispositivo di visualizzazione di immagini volumetriche17,18,19. Queste tecnologie possono essere applicate per display 3D generici senza vetro, ma le tecnologie olografiche presentano ancora alcune limitazioni nelle prestazioni dei modulatori di luce spaziale che visualizzano ampiezza e fase per un'applicazione, e i display 3D volumetrici hanno anche il problema di limitare lo spazio per i display 3D . Pertanto, incontrano notevoli difficoltà nello sviluppo di display 3D commerciali. Pertanto, la ricerca e lo sviluppo di display 3D in grado di fornire informazioni sulla regolazione della messa a fuoco sono stati tentati principalmente nell'area del display vicino all'occhio (NED)20,21,22. Nella NED sono stati condotti numerosi studi per espandere l'area di profondità in cui viene fornita la regolazione della messa a fuoco in modo che possa essere utilizzata anche se l'area di visualizzazione per fornire immagini 3D è limitata. Inoltre, esistono vari metodi per soddisfare la regolazione della messa a fuoco nel metodo della parallasse completa23, nel metodo super-multiview (SMV)24 e nel metodo Light Field25,26. Inoltre, potrebbe essere applicata una tecnologia per modificare la profondità dello schermo virtuale27,28. Se si forma la condizione ottica per l'espansione DOF, nel caso di una visualizzazione 3D nel tipo di visione maxwelliana, anche se al monoculare viene fornito un solo punto di vista, è sempre possibile visualizzare un'immagine 3D chiara quando la profondità dello sguardo binoculare è all'interno della gamma di profondità di DOF. In particolare, il metodo SMV suggerisce la possibilità di fornire un indizio sulle informazioni di controllo della messa a fuoco fornendo più di due punti di informazione sulla parallasse all'interno della pupilla dell'occhio. Proprio come le informazioni sulla profondità possono essere dedotte dalle informazioni sull'immagine di entrambi gli occhi utilizzando la disparità binoculare, si parte dal presupposto che un indizio per la regolazione artificiale della messa a fuoco possa essere fornito fornendo informazioni su due o più disparità a un singolo occhio in modo che le informazioni sulla profondità possano essere dedotte essere fornito anche in un solo occhio. In questo caso, la DOF di ciascuna immagine del punto di vista che forma l'SMV deve essere ampia per fornire informazioni sul controllo della messa a fuoco artificiale e, anche se la messa a fuoco viene spostata a varie profondità, è possibile vedere un'immagine chiara29,30,31. In questo contesto, l'implementazione di una singola immagine di parallasse con un ampio DOF è un fattore importante nella realizzazione di diversi tipi di immagini 3D, tra cui SMV32,33,34,35. Pertanto questa applicazione può essere utilizzata anche se al monoculare viene fornito un solo punto di vista nel caso di una visualizzazione 3D sotto forma di vista maxwelliana. Inoltre, quando un sistema ottico con un ampio intervallo di profondità di DOF viene applicato a una struttura ottica come la vista maxwelliana, SMV, IP e Light Field, è possibile ottenere effetti simili a ologrammi come nei documenti di riferimento29,34,35 applicati a SMV. Di conseguenza, può essere generata un'immagine 3D simile ad un'immagine olografica, che è l'immagine 3D definitiva.