WO2025190693A1

WO2025190693A1 - Filtrage sélectif d'objets virtuels au sein de scènes tridimensionnelles numériques

Info

Publication number: WO2025190693A1
Application number: PCT/EP2025/055532
Authority: WO
Inventors: Renaud Cazoulat; Christophe Daguet; Stephane Denis
Original assignee: Orange SA
Current assignee: Orange SA
Priority date: 2024-03-15
Filing date: 2025-02-28
Publication date: 2025-09-18
Anticipated expiration: 2026-09-15
Also published as: FR3160256A1

Abstract

Procédé de modification d'une scène (10) captée en vue d'une restitution sur une interface, comportant des étapes de : identification (S2) d'un objet (11) de ladite scène (10), lorsque la distance entre ledit objet (11) et ledit observateur (20) est inférieure à une distance donnée et/ou lors d'une orientation relative donnée de l'objet; application (S4) d'un filtre numérique sur l'objet identifié; insertion (S6) dans ladite scène restituée de l'objet issu du filtrage à la place dudit objet identifié.

Description

Filtrage sélectif d’objets virtuels au sein de scènes tridimensionnelles numériques

La présente invention est relative à la génération d’une scène tridimensionnelle pour un observateur, en vue d’une production sur un écran ou via un dispositif de réalité virtuelle ou augmentée. Elle concerne plus particulièrement la modification d’une scène tridimensionnelle pour sa génération, dans laquelle un filtre est appliqué à au moins un objet de la scène.

De nombreuses applications utilisent des scènes tridimensionnelles dans lesquels un observateur est placé, et peut éventuellement se déplacer, et peut observer différents objets qui constitue cette scène, en respectant des caractéristiques de distance et d’orientation tout comme dans le monde physique.

Certaines applications permettent d’insérer dans ces scènes tridimensionnelles des personnes modélisées. Ces personnes modélisées sont des représentations réalistes de personnes physiques.

Selon les applications, l’observateur peut se déplacer librement dans la scène tridimensionnelle. Une projection de celle-ci est donc calculée au fil de l’eau, en temps-réel ou quasi-temps-réel, afin d’adapter l’apparence de la scène aux déplacements de l’observateur.

Ces déplacements peuvent être le fait de déplacements réels d’un utilisateur et observateur qui, par exemple, a revêtu un casque de réalité augmenté, ou bien de manipulation d’un dispositif de direction (comme un joystick par exemple) pour un utilisateur/observateur face à un écran d’ordinateur. Bien évidemment, d’autres cas d’usage sont en outre envisageables.

L’observateur peut donc s’approcher de la personne modélisée aussi près qu’il le souhaite, et se positionner selon tout angle par rapport à elle.

Cette situation peut poser différents types de problèmes.

Tout d’abord, dans une telle situation, la représentation virtuelle hyper réaliste de personnes existantes peut poser un problème d’intimité « virtuelle ». En effet, dans la vie réelle, une personne possède consciemment ou inconsciemment une distance sociale et sera mal à l’aise si l’on s’approche en dessous de cette distance. Parmi d’autres raisons, l’intimité du corps peut être citée, qui peut notamment dépendre de la tenue vestimentaire portée par la personne modélisée. S’agissant d’une représentation réaliste, la problématique se transpose naturellement au monde virtuel, et l’absence de frein empêchant un observateur de se rapprocher autant qu’il le souhaite de la représentation peut donc poser un problème.

En outre, dans une scène tridimensionnelle, selon la logique de l’application, la personne réelle associée à la personne modélisée peut ne pas être informée qu’elle est observée de façon non souhaitée, c’est-à-dire de trop prêt (par exemple car elle n’est pas connectée à l’application gérant la scène tridimensionnelle). Dans la vie réelle, elle pourrait réagir en s’éloignant de sorte à garder ses distances, mais dans une telle situation, elle ne peut pas réagir.

Des mécanismes de « zones interdites » ont été proposés, comme par exemple la zone « guardian » des casques de la marque Oculus Quest. Une telle zone peut être matérialisée en surimpression de la scène tridimensionnelle visualisée par l’observateur. Toutefois, un tel mécanisme est paramétré par l’utilisateur/observateur lui-même et rien n’est prévu pour physiquement l’empêcher de franchir ces limites.

En outre, dans un environnement de réalité augmentée, par exemple, dans lequel la personne modélisée correspond à un emplacement déterminé dans le monde physique, il est impossible de contraindre le libre déplacement de l’observateur qui utilise un casque ou un smartphone. Celui-ci peut franchir ces limites comme si elles n’existaient pas.

Ces propositions ne répondent donc pas à la problématique précédemment évoquée.

Par ailleurs, un autre problème concerne des défauts de l’objet modélisé (qu’il s’agisse d’une personne ou d’un autre objet).

Parmi ces défauts, on peut citer les défauts de reconstruction.

Le principe de reconstruction d’un modèle tridimensionnel d’un objet, par exemple d’une personne réelle, se base sur une prise de vue multiple de l’objet. Pour ce faire, on peut disposer un ensemble de caméras tout autour de l’objet que l’on veut reconstruire. Les images de toutes les caméras au même instant temporel permettent alors la reconstruction d’une représentation, ou modèle, 3D.

Les prises de vue des multiples caméras ne se font pas forcément à 360°. Pour des raisons techniques, il se peut que les caméras ne puissent filmer que sur 180°, si l’objet est devant un mur par exemple, ou si le nombre de caméras disponibles n’est pas suffisant (il faut au moins une trentaine de caméras pour couvrir 360°). Dans un tel cas, la capture de l’objet réel n’est pas complète, ce qui peut se traduire par des artefacts visuels dans le modèle reconstruit plus ou moins important en fonction de la complexité géométrique de l’objet. Aussi, lors d’une navigation dans une scène tridimensionnelle, ces artéfacts peuvent apparaitre et nuire à la qualité du rendu de la scène, du fait de la liberté de l’observateur de se déplacer autour des objets et aussi près qu’il le souhaite.

D’autres défauts concernent les défauts de résolution.

La résolution de l’objet modélisé ne peut pas etre supérieure à la résolution des images sources, issues des caméras utilisées pour la construction du modèle. La résolution du modèle tridimensionnel reconstruit est donc optimale lorsqu’il est affiché avec un point de vue (de l’observateur) équivalent à celui des caméras ayant servi à la prise des image sources, c’est-à-dire quand la position relative de l’observateur correspond à celle d’une des caméras ayant servi à la construction du modèle.

Toutefois, du fait que l’observateur peut se déplacer librement dans la scène tridimensionnelle, pour être affiché à une taille correspondant à la position relative entre l’objet et l’observateur, l’objet peut devoir être agrandi (zoomé) d’un facteur important. Ces agrandissements peuvent faire apparaître des artéfacts visuels impactant la qualité de la représentation tridimensionnelle.

Il existe donc un besoin d’améliorer les propositions actuelles de l’état de la technique.

L’invention vise à éviter à améliorer la situation par rapport aux propositions de l’état de la technique, et en particulier, mais non exclusivement, à répondre aux problèmes précédemment évoqués liés à un rapprochement excessif et/ou un angle d’observation inadéquat(s).

À ces fins, selon un premier aspect, la présente invention peut être mise en œuvre par un procédé de modification d’une scène (10) captée en vue d’une restitution sur une interface, comportant des étapes de

identification (S2) d’un objet (11) de ladite scène (10) lorsque la distance entre ledit objet (11) et ledit observateur (20) est inférieure à une distance donnée et/ou lors d’une orientation relative donnée de l’objet

application (S4) d’un filtre numérique sur l’objet identifié ;

insertion (S6), dans ladite scène restituée, de l’objet issu du filtrage à la place dudit objet identifié.

Ainsi, les différents problèmes décrits précédemment, notamment, se trouvent résolut par une gestion d’un filtrage de l’apparence de l’objet en fonction de la position et/ou de l’orientation relatives de l’objet par rapport à l’observateur. On peut ainsi gérer la problématique de l’intimité « virtuelle » et des artéfacts visuels provoqués par les défauts (parfois inévitables) des modèles tridimensionnels.

En outre, comme il sera vu plus loin, l’application d’un filtre numérique sur une image bidirectionnelle issue d’une projection de l’objet, puis la génération d’un nouvel objet texturé à partir de cette image et prenant la place de l’objet original permet de s’affranchir de calculs tridimensionnels coûteux et d’ainsi offrir un mécanisme compatible avec les contraintes de rendu temps-réel de la navigation d’un utilisateur dans une scène tridimensionnelle.

Suivant des modes de réalisation préférés, l’invention comprend une ou plusieurs des caractéristiques suivantes qui peuvent être utilisées séparément ou en combinaison partielle entre elles ou en combinaison totale entre elles

ledit filtre numérique est configuré en fonction d’un paramètre issu de ladite position, notamment distance, et/ou de ladite orientation relatives.
ledit au moins un filtre numérique est configuré en fonction dudit au moins un paramètre de façon continue dans une plage de valeurs déterminée. Cela permet d’avoir un rendu progressif par exemple.
ledit au moins un paramètre comprend une distance entre ledit objet et ledit observateur, et/ou un angle issu de ladite position et de ladite orientation relatives, formé par une direction principale dudit objet et une direction d’observation dudit observateur.
ledit au moins un filtre numérique comprend un filtre jouant sur un niveau de détails dudit objet perceptibles par ledit observateur, tel un floutage. Ainsi, l’objet peut être plus ou moins reconnaissable, ce qui peut être très intéressant dans le cas d’un modèle associé à une personne réelle.
ledit au moins un filtre numérique comprend un filtre jouant sur la colorimétrie dudit objet. Cela peut par exemple permettre d’ajouter des effets artistiques ou de mise en avant de l’objet au sein d’une scène tridimensionnelle.
ledit objet est une personne modélisée d’une personne réelle, ledit filtre visant à préserver l’intimité de ladite personne réelle
le procédé comprend en outre des étapes de

projection (S3) dudit objet sur une surface bidimensionnelle, selon une position et une orientation relatives dudit objet par rapport audit observateur, de sorte à obtenir une image bidimensionnelle,

génération (S5) d’un nouvel objet dont la texture comprend ladite image bidimensionnelle

et ledit filtre est appliqué sur ladite imagine bidimensionnelle.

ladite scène est tridimensionnelle.

Un autre aspect de l’invention concerne un programme d’ordinateur apte à être mis en œuvre sur un serveur web, le programme comprenant des instructions de code qui, lorsqu’il est exécuté par un processeur, réalise les étapes du procédé tel que précédemment défini.

Un autre aspect de l’invention concerne un support de données sur lequel a été mémorisé au moins une série d’instructions de code de programme pour l’exécution d’un procédé tel que précédemment défini.

D'autres caractéristiques et avantages de l'invention apparaîtront à la lecture de la description qui suit d’un mode de réalisation préféré de l'invention, donnée à titre d'exemple et en référence aux dessins annexés.

La illustre un organigramme illustratif d’un procédé selon un mode de réalisation de l’invention.
La représente un exemple illustratif de position et d’orientation relatives d’un objet par rapport à un observateur.
La illustre deux exemples de configuration d’un filtre en fonction d’un paramètre de distance, selon des modes de réalisation du procédé décrit.
La représente deux exemples de configuration d’un filtre en fonction d’un paramètre d’angle, selon des modes de réalisation du procédé décrit.
La illustre un exemple d’une zone d’intimité ou « interdite » rendue possible par une mise en œuvre du procédé.
La illustre des applications de deux exemples de filtres sur un objet selon différentes intensités, selon des modes de réalisation du procédé décrit.

EXPOSÉ DÉTAILLÉ DE MODES DE RÉALISATION PARTICULIERS

Dans la description qui va suivre, on s’intéresse, pour la clarté de l’exposé, à un unique objet au sein d’une scène tridimensionnelle. Il est toutefois clair qu’une pluralité ou la totalité des objets présents dans une scène tridimensionnelle peuvent être traités ainsi qu’il va décrit. Chaque objet peut être traité, ou non, indépendamment les uns des autres. De la même façon, une même scène peut être générée pour différents observateurs. La description ci-dessous n’est pas limitative des différents cas d’usage et, en particulier, des aspects qui viennent d’être évoqués.

Ces objets peuvent appelées « objets virtuels » dans la mesure où il s’agit de modèles tridimensionnels n’ayant une existence que dans la scène tridimensionnelle. Il peut s’agir en particulier de personnes modélisés, associées à des personnes réelles. En un tel cas, l’objet (personne modélisée) peut adopter une apparence aussi réaliste et fidèle que possible à la personne réelle associée.

Un tel rendu réaliste peut être atteint par différentes techniques de l’état de la technique. Parmi celles utilisées et accessibles à l’homme du métier, on peut citer la méthode de reconstruction 3D exposée dans l’article « 3D Gaussian Splatting for Real-Time Radiance Field Rendering » de Bernhard Kerbl et al, in ACM Trans. Graph, 2018.

Le procédé proposé vise à modifier une scène tridimensionnelle préalablement existante avant son rendu, ou génération, pour un observateur. Dans la mesure où une scène tridimensionnelle doit être périodiquement générée afin de rendre compte des déplacements de l’observateur et/ou des différents objets présents, ce procédé de modification doit préférentiellement être mis en œuvre à chaque itération, c’est-à-dire avant chaque génération.

La génération de la scène tridimensionnelle elle-même n’entre pas dans le cadre du procédé proposé, et fait partie des techniques accessibles à la personne du métier. En particulier, différents outils, ou plateformes existent de façon commerciale et le procédé proposé peut s’appliquer à ces propositions existantes afin de les améliorer.

Sur la , une scène tridimensionnelle 10 est ainsi modifiée par les différentes étapes S1-S6 du procédé proposé. Plus généralement, cette scène est une scène captée en vue d’une restitution sur une interface.

L’étape S7 consiste en la génération (ou rendu) de la scène tridimensionnelle pour l’observateur. Elle peut être considérée comme extérieure et indépendante du procédé proposé, et peut être conforme à l’état de la technique.

Cette génération peut viser divers types d’interface humain-machine. En particulier, il peut s’agir d’un affichage sur un écran d’un ordinateur (comprenant des dispositifs portables tels qu’un téléphone mobile de type « smartphone »), des tablettes numériques, etc.). Il peut également s’agir d’une représentation pour casque de réalité virtuelle ou augmentée.

Le procédé proposé comprend la modification du rendu du modèle 3D en fonction de la position et/ou de l’orientation relatives de l’objet par rapport à l’observateur, en vu du rendu (ou génération) de la scène tridimensionnelle comprenant l’objet pour l’observation.

Une étape préliminaire S1 consiste à déterminer cette position et/ou cette orientation relatives. Elles peuvent être directement déduites de la scène tridimensionnelle 10 qui comprend les données des différents objets (fixes ou mobiles) composant la scène, ainsi que des paramètres de l’observateur. Ces informations sont nécessairement disponibles pour permettre la génération de la scène tridimensionnelle 10 pour l’observateur (étape S7).

La représente un exemple illustratif de position et orientation relatives d’un objet 11 par rapport à un observateur 20.

Sur cette figure, les flèches indiquent les orientations de l’observateur et de l’objet. L’observateur a une orientation (ou « direction d’observation ») qui correspond à son regard dans le monde physique et qui est utilisée pour permettre la génération de la scène tridimensionnelle 10. En particulier, cette orientation, ou direction d’observation, créé une dichotomie entre une partie visible de la scène (située devant lui, c’est-à-dire dans une zone globalement pointée par la flèche) et une partie invisible (située derrière lui, c’est-à-dire à l’opposé de la partie visible par rapport à l’observateur).

Les positions et orientations relatives d’un objet 11 par rapport à un observateur peuvent s’exprimer de différentes façons, ainsi que connu de la personne du métier. Il peut par exemple s’agir d’un 6-tuples comportant 3 composantes pour une position relative et 3 composantes pour un angle solide. Cette expression dépend du mode de représentation des données utilisés par la scène tridimensionnelle 10 et l’application logicielle utilisée.

Selon des modes de réalisation, le procédé décrit peut se baser sur des paramètres issus de ces données.

A titre d’exemples, sur la , sont illustrés une distance d entre l’objet 11 et l’observateur 20, ainsi qu’un angle α entre leurs orientations respectives.

Ces paramètres peuvent être suffisant pour exprimer différents comportements qui peuvent être mis en œuvre dans le cadre du procédé proposé, mais on comprend qu’évidement d’autres paramètres peuvent être définis en fonction d’un comportement souhaité.

Dans une étape S2, l’objet 11 est extrait de la scène tridimensionnelle 10.

Un critère préalable peut être mis en place avant l’extraction, de sorte qu’une partie des objets seulement sont extraits et font l’objet du traitement (application d’un filtre…).

Ce critère peut être basé sur la position et/ou l’orientation relative de l’objet 11 par rapport à l’observateur. En particulier, l’objet peut être sélectionné lorsque au moins un paramètre issu de la position et/ou de l’orientation relative(s) est dans une plage de valeur.

La sélection préalable de l’objet pour traitement sous entends que celui-ci ne fait pas l’objet d’un traitement (application d’un filtre) s’il n’est pas sélectionné. Ce mode de réalisation prend sens lorsqu’on ne peut appliquer un filtre que dans certaines situations ; auquel cas, il est intéressant de ne pas extraire l’objet si aucun filtre ne sera appliqué, afin d’éviter des traitements numériques (étapes S2, S3…) inutiles.

Selon un autre mode de réalisation, l’objet est systématiquement extrait à l’étape S2, sans étape de sélection préalable. Ce mode de réalisation peut faire sens dans le cas où un traitement (filtre) est systématiquement appliqué à l’objet.

En particulier, selon un mode de réalisation, l’objet est identifié dans la scène 10, lorsque la distance entre l’objet 11 et l’observateur 20 est inférieure à une distance donnée et/ou lors d’une orientation relative donnée de l’objet (par rapport à cet observateur).

Après son extraction, ou identification, à l’étape S2, selon un mode de réalisation, l’objet 11 est projeté, dans une étape S3, sur une surface bidimensionnelle selon la position et l’orientation relatives, afin d’obtenir une image bidimensionnelle

Cette étape de projection S3 peut être conventionnelle en soi, c’est-à-dire qu’elle peut correspondre à la projection classiquement effectuée dans une phase de génération S7 d’un objet d’une scène tridimensionnelle. Elle consiste à déterminer une apparence d’un objet tridimensionnelle du point de vue d’un observateur (qui l’observe selon une représentation bidimensionnelle, typiquement sur un écran).

Cette projection S3 dépend donc de la position et de l’orientation (angle de vue) de l’observateur 20 et de la position et de l’orientation de l’objet.

Dans une étape S4, un filtre numérique est appliqué à l’objet précédemment identifié. En particulier, selon un mode de réalisation, le filtre numérique est appliqué sur l’image bidimensionnelle obtenue par la projection de l’objet. Bien évidemment, plusieurs filtres peuvent être appliqués, en combinaison ou en succession.

Ces filtres peuvent être des filtres classiques de traitement d’images numériques.

Un des avantages du procédé proposé est d’ainsi pouvoir utiliser les nombreux filtres numériques disponibles pour l’imagerie 2D et de les appliquer, indirectement, à un objet d’une scène tridimensionnelle.

Un autre avantage, encore plus important, est de rendre possible un traitement au fil de l’eau, du fait de la réduction du coût computationnel apporté par cette façon de faire.

En effet, des filtres 3D ont été proposés dans la littérature scientifique.

Ce modèle est un bon compromis qualité/performance de rendu pour des ordinateurs puissants et disposants de grandes capacités de calcul et de mémoire. Toutefois, il ne peut s’appliquer à des dispositifs de type téléphone mobile ou casque de réalité augmentée ou virtuelle autonomes.

En effet, l’affichage statique 3D d’une image dont le point de vue est modifiable avec la souris ou le doigt peut se contenter une vitesse de rafraîchissement de quelques images par secondes.

Dans un contexte de réalité simulée, augmentée ou totalement virtuelle, le rendu doit se faire en continu afin de refléter les mouvements, même minimes, de l’utilisateur/observateur. Conserver un taux de rafraichissement (ou « frame rate » en anglais) élevé, par exemple entre 30 et 60 images par secondes, est crucial pour garantir une bonne expérience pour l’utilisateur.

De plus, un modèle 3D réaliste, une fois décompressé pour être affiché, peut correspondre à un important volume de données, typiquement au-delà de 10 Mo. Cette masse importante de données rend difficile, voire impossible, tout traitement temps-réel, d’autant que la nature même des filtres 3D ne facilite pas, voire rend totalement impossible, l’implémentation des filtres classiques comme un simple flou.

Ce problème de performance est évidement d’autant plus crucial avec une vidéo volumétrique, qui va changer les données à afficher 30 fois par secondes, par exemple, démultipliant ainsi la masse des données à transmettre et pouvant conduire à une saturation des ressources de l’ordinateur (smartphone, tablette numérique, casque de réalité virtuelle…), et notamment du bus mémoire reliant la mémoire centrale, le processeur CPU et le processeur graphique GPU.

Ce problème du coût computationnel excessif et incompatible avec le requis de temps réel sur un ordinateur aux capacités limités est résolu par la transformation de l’objet en deux dimensions pour réduire la complexité computationnelle.

Une fois le filtre numérique appliqué, dans une étape S5, un nouvel objet est généré puis, dans une étape S6, inséré dans la scène tridimensionnelle à la place de l’objet 11 d’origine.

Le terme « à la place » signifie qu’il remplace cet objet d’origine qui est donc supprimé de la scène. Le nouvel objet est positionné à la même position que l’objet d’origine et selon la même orientation.

La scène tridimensionnelle 10 est ainsi modifiée, avant génération pour une interface associée à l’observateur, en étape S7. L’ensemble des étapes S1-S6 est prévu pour permettre un traitement au fil de l’eau ne retardant pas substantiellement cette étape de génération, de sorte qu’il n’y ait pas d’impact perceptible pour l’utilisateur et observateur.

L’étape S5 comprend la génération d’un objet dont la texture comprend l’image bidimensionnelle résultant de l’application du ou des filtres numériques.

Plus précisément, selon un mode de réalisation, ce nouvel objet peut être un rectangle orienté vers l’observateur. La texture est calculée à partir de la projection de l’objet original en fonction des positions et orientations relatives, de sorte que l’apparence de cette objet texturé correspond à celle qu’aurait l’objet original du point de vue de l’observateur, mais avec, en sus, l’application d’un ou plusieurs filtres numériques.

Ce (ou ces) filtre appliqué peut correspondre à différents cas d’usage et à des choix du développeur de l’application de réalité virtuelle ou augmenté. Il peut également varier selon différents paramètres, en nature ou en intensité.

Selon un mode de réalisation, le filtre numérique est configuré en fonction d’un paramètre issu de la position et/ou de l’orientation relatives de l’objet 11 par rapport à l’observateur 20.

Ce paramètre peut être une distance d, ou un angle α. La distance d peut être la distance entre l’objet 11 et l’observateur, et l’angle peut être l’angle entre leurs orientations respectives, c’est-à-dire entre une direction d’observation et une direction principale, marquant la face avant, de l’objet 11. D’autres paramètres peuvent être également déterminés à partir des position et orientation relatives. Des combinaisons de paramètres peuvent aussi être utilisés pour la configuration des filtres.

La illustre deux exemples de configuration d’un filtre en fonction d’un paramètre de distance d.

On voit sur ces exemples, que l’intensité du filtre, p, dépend de la distance d, de sorte que plus l’observateur est proche de l’objet (d diminue), plus le filtre est fort afin d’impacter l’apparence de l’objet pour l’observateur.

Cette dépendance peut être mise en œuvre de différentes façons.

La ligne en traits pointillés illustre un premier mode de réalisation, dans lequel un seuillage simple est mise en œuvre. Si la distance d est supérieure à un seuil d₁, alors aucun filtre n’est mis en place (valeur de l’intensité du filtre p nulle). Si la distance est inférieure au seuil d₁, alors une valeur p_m est utilisée comme intensité du filtre.

La illustre un exemple d’une telle situation. La distance d₁ forme une zone d’intimité ou « interdite » 12 autour d’un objet 11 qui est ici une représentation réaliste d’une personne réelle. Lorsqu’un observateur s’approche trop près de l’objet 11, et entre dans cette zone 12 (c’est-à-dire d<d₁), alors le filtre numérique est appliqué afin de modifier l’apparence de l’objet (par exemple de le rendre méconnaissable).

La ligne en traits pleins illustre un deuxième mode de réalisation, proposant une approche progressive.

Si la distance d est supérieure à un seuil d₂, alors aucun filtre n’est mis en place (valeur de l’intensité du filtre p nulle). Si la distance est inférieure à un seuil d₁, alors une valeur pm est utilisée comme intensité du filtre. Dans une plage de valeurs [d₁ ; d₂], le filtre est configuré de façon continue, c’est-à-dire que l’intensité (ou tout autre paramètre de configuration) du filtre numérique évolue de façon continue, par exemple linéairement, entre les deux extrema, ici 0 et p_m.

Ainsi, en s’approchant de l’objet 11, l’observateur verra l’apparence de celui-ci d plus en plus impacté jusqu’à un impact maximum lorsqu’il entre dans sa proximité immédiate (d<d₁).

Par exemple, on peut fixer les valeurs d₁=0,5 m et d₂=1,5 m.

La illustre deux exemples de configuration d’un filtre en fonction d’un paramètre d’angle α. Cet angle peut être l’angle entre la direction d’observation et la direction principale (face avant) de l’objet 11. Dans l’exemple, on considère qu’un angle α =0 correspond à la situation de l’observateur faisant face à la face principale de l’objet. Ainsi, un angle α=180° correspond à un observateur faisant face à la face arrière de l’objet.

On voit sur ces exemples, que l’intensité du filtre, p, dépend de l’angle α, de sorte que plus l’observateur s’éloigne de l’angle 0, plus le filtre est fort afin d’impacter l’apparence de l’objet pour l’observateur.

Cette dépendance peut être mise en œuvre de différentes façons.

La ligne en traits pointillés illustre un premier mode de réalisation, dans lequel un seuillage simple est mise en œuvre. Si l’angle α est inférieur à un seuil α_d1 ou supérieur à un angle α_g1 alors aucun filtre n’est mis en place (valeur de l’intensité du filtre p nulle). Les seuils α_d1 et α_g1 peuvent avoir la même valeur absolue (dans le cas où l’objet est symétrique, par exemple), mais sont de signes différents puisque correspond aux deux sens de rotation possible de l’observateur autour de l’objet.

Si l’angle α est inférieure au seuil α_g1, ou supérieur au seuil α_d1, alors une valeur pm est utilisée comme intensité du filtre. Ce cas correspond à la situation où l’angle α est trop éloigné de l’angle α =0 correspondant à une observation de face.

Si l’angle α est supérieure à un seuil α_g2, et si l’angle α est inférieur à un seuil α_d2, alors aucun filtre n’est mis en place (valeur de l’intensité du filtre p nulle).

Si l’angle α est supérieure à un seuil α_d1, ou bien si l’angle α est inférieur à un seuil α_g1, alors une valeur p_m est utilisée comme intensité du filtre.

Dans une plage de valeurs [α_g1 ; α_g2] et dans une plage de valeurs [α_d2 ; α_d1], le filtre est configuré de façon continue, c’est-à-dire que l’intensité (ou tout autre paramètre de configuration) du filtre numérique évolue de façon continue, par exemple linéairement, entre les deux extrema, ici 0 et p_m.

Les valeurs des seuils et des niveaux d’intensité des filtres dépendent des cas d’application, de même que le paramètre (distance, angle…) et la nature du filtre lui-même (ou des filtres, car plusieurs filtres peuvent appliqués).

Dans un cas d’application à la gestion de l’intimité virtuelle d’une personne modélisée correspondant à une personne réelle, le filtre peut dépendre de la distance et être prévu pour jouer sur un niveau de détails perceptibles par l’observateur.

Le risque est, en effet, qu’un observateur s’approche de trop pour observer une personne à un niveau de détail non souhaitée par cette personne. En appliquant un filtre jouant sur le niveau de détail, tel que par exemple un filtre de floutage, lorsque l’observateur se rapproche trop, on peut ainsi pallier ce risque.

Comme vu précédemment, le floutage peut être déclenché lorsque la distance devient inférieure à un seuil donné, et il peut en outre être progressif à mesure que l’observateur se rapproche encore, jusqu’à un niveau maximum. A ce niveau maximum, l’objet peut ne plus être reconnaissable.

Ainsi, on peut préserver l’intimité des personnes réelles ayant un modèle (i.e. une personne modélisée) représenté dans une scène tridimensionnelle, notamment par le jeu sur un niveau de détails perceptibles par l’observateur (ce niveau de détails étant déterminés par un filtre qui dépend d’une distance entre le modèle et l’observateur).

Dans le cas d’un objet imparfait, par exemple du fait d’une reconstruction incomplète sur certaines orientations, notamment sur une face arrière, le filtre peut dépendre de l’angle et être prévu pour jouer sur un niveau de détails perceptibles par l’observateur. Cette situation peut apparaître, comme il a été vu précédemment, dans le cas d’un nombre insuffisant de caméras, ou d’un mauvais positionnement de celles-ci, lors de la construction du modèle 3D par prises de vue de l’objet réel (en particulier d’une personne réelle).

Ainsi, l’objet peut apparaître sans modification lorsqu’il est observé selon un angle ne faisant pas apparaitre de défaut issu (notamment) de la reconstruction du modèle, tandis qu’un filtre peut être appliqué visant à impacter son apparence lorsqu’il est observé selon un angle qui ferait apparaître un défaut de reconstruction. Ce filtre peut justement être destiné à masquer le défaut, en jouant, par exemple, sur un niveau de détails perceptibles par l’observateur (par exemple en appliquant un filtre de flou).

Un autre cas d’application est la gestion de la résolution de l’objet. Comme expliqué précédemment, la modélisation d’un objet est liée à la résolution des images numériques acquises par un ensemble de caméras.

Le filtre peut alors dépendre de la distance et être prévu pour jouer sur un niveau de détails perceptibles par l’observateur. Ainsi, le filtre peut masquer les défauts de résolution lorsque l’observateur est trop proche, de façon plus harmonieuse. Notamment, les artéfacts disharmonieux ou pouvant porter à confusion dans la clarté de la scène tridimensionnelle peuvent être remplacé par des filtrages sur les objets trop proches, de sorte que leur apparence soit plus claire et en rapport avec la résolution du modèle 3D.

Ces différents cas d’application peuvent être gérés par une même application. Ainsi, un même objet peut faire l’objet d’un premier filtre visant à garantir l’intimité virtuelle, d’un deuxième filtre visant à gérer une incomplétude du modèle, un troisième filtre visant à gérer la résolution du modèle, etc.

Les filtres peuvent de toute nature, comme précédemment évoqué. A titre d’exemples, on peut citer :

un flou gaussien (ou « gaussian blur » en anglais),
un effet de cristallisation,
un effet de pixélisation,
un rendu à base de points noirs ou blancs (ou « dotscreen »)
un rendu de type impression (ou « halftone »)
un effet jouant sur la saturation, le contraste et/ou l’intensité,
un effet jouant sur l’exposition,
un effet jouant sur la vibrance des couleurs,
une réduction du bruit,
une amélioration de la netteté
un effet photo noir et blanc,
une recolorisation en sépia,
une recolorisation avec une couleur de base,

etc.

Ces filtres peuvent être configurés par au moins un paramètre, tel une intensité, de façon connue en soi. Dans le cadre du procédé proposé, la configuration peut dépendre d’un paramètre ou éventuellement de plusieurs.

La illustre l’application de deux exemples de filtres sur un objet selon différentes intensités.

Dans la , la figure A illustre un exemple d’objet sur lequel aucun filtre n’est appliqué.

Les figures B et C correspondent à un filtre de type « pixélisation », avec une intensité moyenne pour la figure B et une intensité forte sur la figure C.

Les figures D et E correspondent à un filtre de type « flou gaussien », avec une intensité moyenne pour la figure D et une intensité forte sur la figure E.

Deux niveaux d’intensité sont représentés uniquement à des fins illustratives. Dans un cas réel, davantage de niveaux peuvent être mis en place, y compris une continuité de niveaux comme on a vu précédemment pour certains modes de réalisation du procédé.

Ces deux filtres permettent de jouer sur un niveau de détails perceptibles de l’objet. De façon éventuellement progressive, il est impossible de masquer certains détails ou aspects de l’apparence de l’objet, voire de rendre celui-ci non-reconnaissable. Dans le cas d’une personne physique, on peut par exemple la flouter davantage en fonction du rapprochement de l’observateur afin qu’à distance trop proche elle devienne non-reconnaissable.

Comme avantage supplémentaire, il devient impossible pour un observateur malveillant de capturer une image précise et reconnaissable d’une personne modélisée de trop près.

Il peut être prévu par l’application en charge de la scène tridimensionnelle que chaque personne physique puisse gérer elle-même le comportement des filtres pour son modèle 3D. Notamment, elle peut fixer la distance à laquelle elle ne souhaite pas pouvoir être reconnaissable, ou suffisamment floutée pour qu’aucun détail ne soit perceptible (par exemple le seuil d₁ dans les exemples précédemment décrits).

Il peut être prévu que ces éléments fournis par les personnes physiques souhaitant apparaître dans une scène tridimensionnelle sous une forme modélisée forment un élément d’un contrat de droit à l’image établi entre elles et le gestionnaire de la scène. Le procédé décrit permet donc l’établissement de nouvelles conventions et d’une façon plus fine de gérer son image dans les mondes virtuels.

D’autres cas d’usage sont encore possibles. On peut citer, à titre d’exemples et de façon non limitative :

L'amélioration de la qualité : en chaînant des filtres de rehaussement des couleurs, de modification du contraste, de l'exposition ou de la netteté, il est possible d'améliorer la qualité du rendu, pour pallier des mauvaises conditions de captation des images servant à la reconstruction,
Effets artistiques : recolorisation, noir et blanc, sépia sont des exemples de filtres pouvant être utilisés dans un but artistique,
Effets de signalisation : Il est possible par exemple de faire le rendu en monochrome lorsque le modèle est éloigné, puis de le coloriser au fur et à mesure que l'utilisateur s'approche, attirant ainsi son attention,

On peut voir que dans certains cas d’usage, l’objet fait l’objet d’un traitement de filtrage quel que soit sa position et/ou son orientation.

Seul le filtre lui-même pourra être configuré différemment en fonction de ces éléments. Ainsi, dans le cas de la signalisation, un filtre de rendu en noir & blanc peut être systématiquement appliqué mais avec une valeur d’intensité croissante en fonction de la distance entre l’objet et l’observateur.

Dans le cas d’un filtre artistique, celui-ci peut même ne pas dépendre ni de la position ni de l’orientation de l’objet par rapport à l’observateur.

D’autres avantages du procédé décrit et des nombreux modes de réalisation comprennent, entre autres, des avantages pouvant de différents ordres :

efficacité : appliquer des filtres de manière conditionnelle et d'intensité arbitraire à une structure de données qui ne s'y prête ni par la masse de donnée à traiter, ni par le type de données ;
performance : l'application d'un filtre sur une texture est une opération très efficace et peu gourmande en GPU, contrairement à l’application d’un filtre sur une structure 3D directement;
efficience : la masse de donnée réduite d’une texture par rapport à une frame 3D permet de filtrer des vidéos volumétriques en temps réel,
simplicité : l'utilisation d'un nouvel objet, par exemple rectangulaire (appelé « billboard ») permet une intégration naturelle dans un environnement 3D de type réalité augmenté.
Flexibilité : ce système ne se cantonne pas au masquage et peut servir dans le cadre de nombreux autres usages.

Selon une combinaison des modes de réalisation précédemment décrit, il est proposé un procédé de modification d’une scène tridimensionnelle 10 pour sa génération pour un observateur 20, comportant des étapes de

- extraction S2 d’un objet 11 de ladite scène tridimensionnelle 10, préalablement sélectionné en fonction d’une distance entre ledit objet et ledit observateur, et/ou de ladite orientation relative

- projection S3 ledit objet sur une surface bidimensionnelle, selon une position et une orientation relatives dudit objet par rapport audit observateur, de sorte à obtenir une image bidimensionnelle,

- application (S4) d’au moins un filtre numérique sur ladite image bidimensionnelle ;

- génération (S5) d’un nouvel objet dont la texture comprend ladite image bidimensionnelle, et insertion (S6) dudit nouvel objet dans ladite scène tridimensionnelle à la place dudit objet

Bien entendu, la présente invention n'est pas limitée aux exemples et au mode de réalisation décrits et représentés. Elle est notamment susceptible de nombreuses variantes accessibles à l'homme de l'art, donc certaines ont été décrites précédemment ou simplement évoquées.

Claims

Procédé de modification d’une scène (10) captée en vue d’une restitution sur une interface, comportant des étapes de
identification (S2) d’un objet (11) de ladite scène (10) lorsque la distance entre ledit objet (11) et ledit observateur (20) est inférieure à une distance donnée et/ou lors d’une orientation relative donnée de l’objet

application (S4) d’un filtre numérique sur l’objet identifié ;

insertion (S6), dans ladite scène restituée, de l’objet issu du filtrage à la place dudit objet identifié.
Procédé selon l’une des revendications précédentes, dans lequel ledit filtre numérique est configuré en fonction d’un paramètre issu de ladite distance et/ou de ladite orientation relatives.
Procédé selon la revendication précédente, dans lequel ledit au moins un filtre numérique est configuré en fonction dudit au moins un paramètre de façon continue dans une plage de valeurs déterminée.
Procédé selon l’une des revendications 3 ou 4, dans lequel ledit au moins un paramètre comprend une distance (d) entre ledit objet et ledit observateur, et/ou un angle issu de ladite position et de ladite orientation relatives, formé par une direction principale dudit objet (11) et une direction d’observation dudit observateur (20).
Procédé selon l’une des revendications précédentes, dans lequel ledit au moins un filtre numérique comprend un filtre jouant sur un niveau de détails dudit objet perceptibles par ledit observateur (20), tel un floutage.
Procédé selon l’une des revendications précédentes, dans lequel ledit au moins un filtre numérique comprend un filtre jouant sur la colorimétrie dudit objet (11).
Procédé selon l’une des revendications précédentes, dans lequel ledit objet est une personne modélisée d’une personne réelle, ledit filtre visant à préserver l’intimité de ladite personne réelle.
Procédé selon l’une des revendications précédentes, comportant en outre des étapes de
projection (S3) dudit objet sur une surface bidimensionnelle, selon une position et une orientation relatives dudit objet par rapport audit observateur, de sorte à obtenir une image bidimensionnelle,
génération (S5) d’un nouvel objet dont la texture comprend ladite image bidimensionnelle
et dans lequel ledit filtre est appliqué sur ladite imagine bidimensionnelle.
Procédé selon l’une des revendications précédentes, dans lequel ladite scène est tridimensionnelle.
Programme d’ordinateur apte à être mis en œuvre sur un terminal de lecture de flux multimédia, le programme comprenant des instructions de code qui, lorsqu’il est exécuté par un processeur, réalise les étapes du procédé définie dans les revendications 1 à 8.
Support de données lisible par ordinateur sur lequel a été mémorisé au moins une série d’instructions de code de programme pour l’exécution d’un procédé selon l’une des revendications 1 à 8.