[go: up one dir, main page]

WO2002031773A1 - Image processing apparatus, image processing method, record medium, computer program, and semiconductor device - Google Patents

Image processing apparatus, image processing method, record medium, computer program, and semiconductor device Download PDF

Info

Publication number
WO2002031773A1
WO2002031773A1 PCT/JP2001/008762 JP0108762W WO0231773A1 WO 2002031773 A1 WO2002031773 A1 WO 2002031773A1 JP 0108762 W JP0108762 W JP 0108762W WO 0231773 A1 WO0231773 A1 WO 0231773A1
Authority
WO
WIPO (PCT)
Prior art keywords
image
moving
target
moving image
captured
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/JP2001/008762
Other languages
English (en)
French (fr)
Inventor
Akio Ohba
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Interactive Entertainment Inc
Original Assignee
Sony Computer Entertainment Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Computer Entertainment Inc filed Critical Sony Computer Entertainment Inc
Priority to BR0107310-9A priority Critical patent/BR0107310A/pt
Priority to EP01974693.2A priority patent/EP1324269B1/en
Priority to AU94187/01A priority patent/AU9418701A/en
Priority to MXPA02005288A priority patent/MXPA02005288A/es
Priority to CA002392725A priority patent/CA2392725A1/en
Publication of WO2002031773A1 publication Critical patent/WO2002031773A1/ja
Anticipated expiration legal-status Critical
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/0007Image acquisition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42204User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42204User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
    • H04N21/42206User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor characterized by hardware details
    • H04N21/42222Additional components integrated in the remote control device, e.g. timer, speaker, sensors for detecting position, direction or movement of the remote control, microphone or battery charging device
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/4223Cameras
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • H04N21/4312Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44213Monitoring of end-user related data
    • H04N21/44218Detecting physical presence or behaviour of the user, e.g. using sensors to detect if the user is leaving the room or changes his face expression during a TV program
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
    • H04N7/183Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast for receiving images from a single remote source
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F2300/00Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game
    • A63F2300/10Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game characterized by input arrangements for converting player-generated signals into game device control signals
    • A63F2300/1087Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game characterized by input arrangements for converting player-generated signals into game device control signals comprising photodetecting means, e.g. a camera

Definitions

  • the present invention relates to an image processing technique for using a photographed image photographed by a photographing device such as a video camera as an input interface for commands and the like.
  • Input devices often used in computers, video game machines, and the like include a keyboard, a mouse, and a controller.
  • An operator inputs a desired command by operating these input devices, and causes a computer or the like to perform a process corresponding to the input command. Then, the operator views images, sounds, and the like obtained as processing results on a display device or a speaker.
  • the operator inputs commands by operating many buttons provided on the input device or by operating while looking at a cursor or the like displayed on the display device.
  • Such operations largely depend on the familiarity of the operator. For example, for a person who has never touched the keypad, inputting a desired command using the keyboard is a cumbersome operation, and it takes time to input or an input error due to typo on the keyboard. Easy to cause. Therefore, there is a demand for a man-machine interface that is easy for the operator to operate.
  • An object of the present invention is to provide an image processing technique for using a captured image captured by a capturing device or the like as an input face for inputting a command or the like. Disclosure of the invention
  • the image processing apparatus includes: a mirror surface which captures a mirror moving image including a moving evening get in a part thereof; and a mirror surface which captures an object image representing a predetermined object by the image capturing unit.
  • Image generating means for generating in accordance with the movement of a target included in a moving image, and control means for combining an object image generated by the image generating means with the captured mirror moving image and displaying it on a predetermined display device
  • the “target” refers to a portion of interest, for example, of a subject (person, object, or the like) to be imaged by an imaging device that supplies an image to an image processing device.
  • Another image processing apparatus of the present invention includes: an image capturing unit that captures a specular moving image including a moving target as a part thereof; and detects an image feature between the current mirror moving image and the immediately preceding mirror moving image. Detecting means for detecting the target and its moving component, and changing an object image representing a predetermined object in accordance with the motion component of the target detected by the detecting means. And a control unit that combines the object image generated by the image generation unit with the captured mirror moving image and displays the combined image on a predetermined display device.
  • These image processing devices generate an object image according to the movement of a sunset included in a mirror moving image.
  • the movement, the color, the shape, and the object image of the object image displayed on the display device when there are a plurality of object images are determined by the movement of the target.
  • the target is an operator
  • the object is determined according to the operation of the operator.
  • the mirror moving image can be used as a kind of input interface.
  • the image generation means may generate the object image so as to follow the detected evening movement.
  • the information processing apparatus may further include means for preparing for execution of required processing based on the generated object image according to the motion component of the target.
  • the image generating means is configured to detect a target, and the image generating means is configured to generate the object image so as to change according to the motion component of the one target detected by the detecting means. Is also good.
  • the present invention also provides the following image processing method.
  • a mirror moving image including a moving evening get in a part thereof is captured into an image processing apparatus, and the image processing apparatus converts an object image representing a predetermined object into the captured mirror moving image.
  • An image processing method comprising: generating an object image in accordance with a movement of a target included in an image; synthesizing the generated object image with the captured mirror moving image; and displaying the synthesized image on a predetermined display device. .
  • the present invention also provides the following computer program.
  • the computer program includes a process of capturing a specular moving image including a moving evening get as a part thereof in a convenience store to which a display device is connected; an object image representing a predetermined object; A computer program for executing a process of generating the object image in accordance with the movement of a target included in the image, and a process of combining the generated object image with the captured specular moving image and displaying the image on the display device.
  • the present invention also provides the following semiconductor device.
  • the semiconductor device is incorporated in a device mounted on a computer to which the display device is connected, so that the computer captures a mirror moving image including a moving target as a part thereof, Represents the object image in the target contained in the captured specular moving image.
  • a semiconductor device that forms the function of: a unit that generates the object image in accordance with the movement of the object; BRIEF DESCRIPTION OF THE FIGURES
  • FIG. 1 is an overall configuration diagram of an image processing system to which the present invention is applied
  • FIG. 2 is a configuration diagram of an image processing apparatus according to an embodiment of the present invention
  • FIG. 3 is an embodiment of the present invention.
  • FIG. 3 is a functional block diagram of the image processing apparatus of FIG.
  • FIG. 4 is a flowchart showing the processing procedure of the first embodiment
  • FIG. 5 is a flowchart showing the processing procedure of the first embodiment
  • FIG. 6 exemplifies a composite image according to the first embodiment. It is a figure that
  • FIG. 7 is a diagram illustrating a menu image
  • FIG. 8 is a flowchart showing a processing procedure according to the second embodiment.
  • FIG. 9 is a diagram illustrating a composite image according to the second embodiment.
  • FIG. 10 is an explanatory diagram of drawing by a recursive texture.
  • FIG. 11 is a flowchart showing a processing procedure of the third embodiment.
  • FIG. 12 is a flowchart showing a processing procedure of the third embodiment.
  • FIG. 13 is a composite image according to the third embodiment.
  • FIG. 1 is a diagram showing a configuration example of an image processing system to which the present invention is applied. .
  • This image processing system captures an operator facing the display device 3 with an analog or digital video camera 1 and obtains a moving image.
  • a moving image are sequentially captured in a time-series manner into the image processing device 2 to generate a specular moving image, and a portion of interest in the mirrored moving image such as an operator's eyes and hands (hereinafter, the portion of interest is referred to as a “target )
  • a target Is combined with an object image representing an object such as a menu or a cursor at a site where the object exists, to generate a composite image (also a moving image), and display the composite image on the display device 3 in real time. Things.
  • Mirror moving images can be generated by subjecting moving images captured from the video camera 1 to mirror processing (image left / right inversion processing) by the image processing device 2.
  • a mirror moving image may be generated by capturing a moving image of a mirror reflecting the image with the video camera 1.
  • a composite image whose display form changes in real time in accordance with the movement of the target is displayed on the display device 3.
  • the image processing device 2 is realized by a computer that forms required functions by a computer program.
  • the computer has two buses, a main bus B1 and a sub-bus B2, to which a plurality of semiconductor devices each having a unique function are connected, as shown in the hardware configuration of FIG. 2, for example. are doing. These buses Bl and B2 are connected or disconnected from each other via a bus interface INT.
  • the main bus B 1 has a main CPU 10 as a main semiconductor device, a main memory 11 composed of RAM, a main DMAC (Direct Memory Access Controller) 12, and an MPEG (Moving Picture Experts Group).
  • a graphics processing unit (hereinafter referred to as “GPUj”) 14 that includes a frame coder (MDEC) 13 and a frame memory 15 serving as a drawing memory is connected to the GPU 14.
  • the data drawn in A CRTC (CRT Controller) 16 for generating a video signal for enabling display on the display device 3 is connected.
  • CRTC CRT Controller
  • the main CPU 10 reads a boot program from the ROM 23 on the sub-bus B2 via the bus interface INT when the computer is booted, and executes the boot program to operate the operating system.
  • it reads out the application program data from the media 28 attached to the media drive 27 and stores it in the main memory 11.
  • three-dimensional object data such as coordinate values of vertices (representative points) of polygons) composed of a plurality of basic figures (polygons)
  • shape and movement of the object are determined.
  • the GPU 14 holds the drawing context (drawing data including polygon material), reads out the necessary drawing context according to the display list notified from the main CPU 10, performs the rendering process (drawing process), and executes the frame memory 1 5 is a semiconductor device that has the function of drawing polygons.
  • the frame memory 15 can also use this as a texture memory. Therefore, the pixel image in the frame memory can be pasted as a texture to the polygon to be drawn.
  • the main DMAC 12 performs DMA transfer control for each circuit connected to the main path B1, and also controls each circuit connected to the sub-bus B2 according to the state of the bus interface INT.
  • the MDEC 13 is a semiconductor device that performs DMA transfer control. The MDEC 13 operates in parallel with the main CPU 10 and uses the MPEG (Moving Picture Experts Group) method or A semiconductor device that has the function of decompressing data compressed by the JPEG (Joint Photographic Experts Group) method.
  • the sub bus B2 includes a sub CPU 20 including a microprocessor, a sub memory 21 including a RAM, a sub DMAC 22, a ROM 23 storing a control program such as an operating system, and a sound memory.
  • a semiconductor device for sound processing (SPU (Sound Processing Unit)) 24 that reads out the audio data stored in 25 and outputs it as an audio output 24.
  • Communication control for transmitting and receiving information to and from external devices via a network (not shown) (ATM) 26, a media drive 27 for mounting media 28 such as CD-ROM and DVD-ROM, and an input unit 31 are connected.
  • the sub CPU 20 performs various operations in accordance with the control program stored in the ROM 23.
  • the sub DMAC 22 controls the DMA transfer and the like for each circuit connected to the sub bus B 2 only when the bus interface INT separates the main bus B 1 from the sub bus B 2. It is.
  • the input unit 31 has a connection terminal 32 for inputting an input signal from the operation device 35, a connection terminal 33 for receiving an image signal from the video camera 1, and an audio signal from the video camera 1.
  • a connection terminal 34 is provided.
  • the computer configured in this manner is configured such that the main CPU 10, the sub CPU 20, and the GPU 14 read and execute a required computer program from a recording medium such as the ROM 23 and the medium 28 to execute the image processing device 2.
  • Function blocks required to operate as an image ie, as shown in Fig. 3, image input unit 101, image inversion unit 102, object data storage A unit 103, an object data input unit 104, an object control unit 105, a superimposed image generation unit 106, a difference value detection unit 107, and a display control unit 108 are formed.
  • the image input unit 101 is formed by the input unit 31 and the sub CPU 20 which controls the operation of the image input unit 101, the image inverting unit 102, the object data input unit 104
  • the object control unit 105 and the difference value detection unit 107 are formed by the main CPU 10
  • the superimposed image generation unit 106 is formed by the GPU 14
  • the display control unit 108 is formed by the cooperation of the GPU 14 and the CRTC 16. It is formed.
  • the object data storage unit 103 is formed in a memory area accessible by the main CPU 10, for example, in the main memory 11.
  • the image input unit 101 captures an image captured by the video camera 1 via the connection terminal 33 of the input unit 31. If the input image is a digital image, import it as is. If the captured image to be input is an analog image, AZD conversion is performed to convert it to a digital image and capture it.
  • the image reversing unit 102 performs mirror processing, that is, left-right reversal processing, on the captured image captured by the image input unit 101 to generate a mirror moving image.
  • the object data storage unit 103 holds object data for expressing objects such as menus (including submenus), matchsticks, and cursors, along with their identification data.
  • the object data input unit 104 fetches necessary object data from the object data storage unit 103 and sends it to the object control unit 105.
  • the object data to be captured is specified by the object control unit 105.
  • the object control unit 105 receives an object image based on the object data captured from the object data input unit 104 according to the instruction. Generate an image. In particular, the object control unit 105 determines the display state of the object based on the difference value sent from the difference value detection unit 107, and generates an object image for realizing the display state. The difference value will be described later.
  • the superimposed image generation unit 106 draws a composite image in which the mirror moving image output from the image inversion unit 102 and the object image generated by the object control unit 105 are superimposed on the frame memory 15.
  • the object image may be displayed on a mirror moving image by a known imposition process.
  • the difference value detection unit 107 compares the image features of the mirrored moving image among the composite images generated by the superimposed image generating unit 106 for each frame, and determines the difference between the mirrored moving images of the previous and next frames. The difference value of the image feature in is derived. Further, the difference value detection unit 107 generates a difference image between the mirror moving images of the preceding and succeeding frames as necessary.
  • the difference value of the image feature is a value that quantitatively represents the change of the motion component of the target included in the specular moving image for each frame. For example, it indicates the distance that the target has moved in the specular moving image, or the area between the area where the target has moved and the area before moving.
  • the difference value of the image features represents the change in the movement of each evening target. Changes in target movement can be quantitatively determined.
  • the difference image is an image representing a change in the motion of each evening frame included in the mirror moving image at that time.
  • the evening image before moving and the evening image after moving It is an image composed of a cut image and an image.
  • the difference value detection unit 107 stores a certain mirrored moving image in the main memory 11 as a “reference image” between the mirrored moving image and another mirrored moving image.
  • the mirrored moving image to be stored may be the whole of the mirrored moving image for one frame, but it is sufficient if the difference value of the image feature can be derived, and thus only the one-night get portion may be used.
  • template image when it is necessary to distinguish the image of the target part from the image of the other part, it is called a “template image”.
  • the difference value detected by the difference value detection unit 107 is sent to the object control unit 105 and used to control the movement of the object image.
  • the display control unit 108 converts the composite image generated by the superimposed image generation unit 106 into a video signal and outputs the video signal to the display device 3.
  • the display device 3 displays a composite image (moving image) on the screen according to the video signal.
  • the display device 3 displays a composite image in which a menu image, which is an example of an object image, is superimposed on a mirrored moving image of the operator, which is captured by the video camera 1 and subjected to mirror processing, as shown in FIG. It is assumed that it is displayed by the processing device 2.
  • the target is the hand of the operator, and the amount of hand movement in the area where the menu image is displayed
  • an instruction input for a menu image is performed by detecting an image.
  • the menu images are hierarchical as shown in Fig. 7, and are displayed by the operator.
  • a pull-down image representing one of “selectl”, “select2”, and “select3” in the lower layer is displayed, and one of the pull-down images is selected.
  • the processing decision image eg, “Processing 2 1”, “Processing 2 2”, “Processing 2 3”, “Processing 2 4”
  • the processing decision image eg, “Processing 2 1”, “Processing 2 2”, “Processing 2 3”, “Processing 2 4”
  • the processing determination image is stored in the object data storage unit 103 in association with a program for causing the main CPU 10 to execute the determined processing (event), and a processing determination image is selected. Then, the program associated with it is activated and the corresponding process (event) is executed.
  • FIGS. 4 and 5 show a processing procedure by the image processing device 2 for enabling such an operation.
  • the difference value detection unit 107 determines that the mirrored moving image is updated to that of the next frame, and that the combined image generated by the superimposed image generation unit 106 is updated (step S101). ), Compare the image features of the mirror moving image included in the synthesized image before and after updating, and calculate the difference value (step S102).
  • the difference value calculated here is a value representing one movement of the hand of the operator in the area where the menu image is displayed.
  • the calculated difference value is recorded in the main memory 11, and is cumulatively added for a certain period (step S103).
  • the reason why the difference values are cumulatively added is that the intention of the operator's operation instruction is detected in the image processing apparatus 2 by the operator's multiple hand movements. If the operator's intention of operating instructions can be confirmed by one hand movement, it is not always necessary to perform cumulative addition.
  • the difference value detection unit 107 sends the difference value (accumulated value) to the object control unit 105.
  • the object control unit 105 receives the difference received from the difference value detection unit 107.
  • the color of the menu image is determined according to the value (cumulative value) (step S104). For example, a plurality of menu image colors are prepared, and the colors are sequentially changed each time a hand movement is detected. It may be changed from transparent to translucent or opaque. Further, the difference value (cumulative value) at the present time is compared with a predetermined threshold value (step S105), and if the cumulative value is smaller than the threshold value (step S105: N). Since it is not enough to select “memi” on the menu screen, the process returns to step S 101.
  • step S105 determines that "menu" on the menu screen has been selected, and displays a pull-down image. That fact is reported to the difference value detection unit 107 (step S106).
  • the operator can perform the above operation as if looking at the mirror, so that a man-machine interface that is easy for the operator to operate can be realized. it can.
  • the difference value detection unit 107 When it is found that “menu” on the menu screen has been selected, that is, the difference value (cumulative value) has exceeded the threshold value, the difference value detection unit 107 The image of the operator's hand (target) is held as a template image (step S107).
  • step S108 When the composite image in which the menu image is switched to the lower layer pull-down image by the frame update is displayed (step S108), the operator's hand Search for where the image is in the switched composite image. That is, the difference value detection unit 107 searches the composite image for an image that matches the template image (step S109).
  • the synthesized image is divided into regions each having the same size as the template image, and an image of the region most similar to the template image is searched for from among the divided regions.
  • the image of the region most similar to the template image is, for example, when the sum of the absolute values (or squares) of the pixels between the compared images can be expressed as a distance, This is the image with the minimum distance.
  • step S111 If there is a matching image (step S110: Y), it is determined whether or not it is a pull-down image (step S111). If the image is a pull-down image (step S111: ⁇ ), it is detected which of “sekctl”, “select2”, and “select3” is the pull-down image (step S112). The detected pull-down image becomes the selected balloon image specified by the operator. Information on the selected pull-down image is reported from the difference value detection unit 107 to the object control unit 105.
  • the object control unit 105 reads out the processing decision image associated with the selected pull-down image from the object data storage unit 103, and generates an object image to which this processing decision image is attached (step S1). 13 ).
  • the display device 3 displays the state of the menu sequentially selected by the operator.
  • the pull-down image of “select2” is selected from the top-level menu image, and the processing decision images (“processing 21” and “processing 22”) accompanying the bull-down image of “select2” are selected. , “Processing 2 3" and “Processing 2 4 J) are displayed.
  • the template image is replaced with a new one every frame. That is, the difference value detection unit 107 discards the template image used in the previous frame, and uses the above matched image (the image of the operator's hand used to select the pull-down image) as a new template image. Hold (Step S114). Then, in order to identify one of the processing decision images (“processing 21”, “processing 22”, “processing 23”, “processing 24”) in the same manner as above, step S 1 Return to 0 8.
  • step S111 if the image to be matched is outside the area of the pull-down image but is any of the processing-determined images in the processing-determined image area (step S111: N, S111) 5: Y), assuming that the processing decision image has been selected, determine the content of the processing associated with it, that is, make the program executable, and end the processing using the menu image (step S118) ⁇
  • Step S111: N, S115: N, S116: ⁇ If the image to be matched is outside the pull-down image and the processing decision image area but is within the menu image area (Steps S111: N, S115: N, S116: ⁇ ), the operation is performed. Since the user intends to select another pull-down image, the template image is discarded, the matched image is retained as a new template image, and the process returns to step S108 (step S118) ).
  • step S110: ⁇ If there is no matching target image in step S110 (step S110: ⁇ ), or if there is a matching image but it is an image outside the menu image area, The processing by the menu image is completed (steps S111: N, S115: N, S116: ⁇ ).
  • the operator can easily select the process of the content desired by the user while viewing his / her own mirrored moving image displayed on the screen of the display device 3.
  • you can input instructions while confirming your own behavior on the screen as needed.
  • the eyes do not turn away from the display device 3 as in the case of using the device. ⁇ [Example 2]
  • a program for causing the main CPU 10 to execute an event to be subjected to image processing is associated with the object image, and the movement of the operator in the mirror moving image with respect to the object image is associated with the object image. Accordingly, processing for the corresponding event may be executed.
  • an example of an object image to be superimposed on a specular moving image an example is shown in which an image of a matchstick and a flame image showing a state in which a matchstick is ignited and a fire burns are used.
  • a program for displaying an ignition animation indicating that the match has fired on the display device 3 is associated in advance with the image of the matchstick as the object image. Then, in the composite image, the image of the matchstick is rubbed by the operator in the mirrored moving image, so that an ignition animation is displayed at the ignition portion of the image of the matchstick. The flame image is displayed when the operator rubs the matchstick image.
  • the flame image can be generated by, for example, a recursive texture drawing technique.
  • “Recursive texture drawing” refers to a drawing method in which an image of an object rendered by texture mapping is referred to as a texture of another image and texture mapping is performed recursively.
  • “Texture mapping” is a method of rendering by pasting bitmap data of a texture on the surface of an object in order to enhance the texture of the image of the object.
  • Frame memory 15 can also be used as texture memory. It can be realized by using it.
  • the point where the texture is drawn Perform gom'aud shading on Rigon. That is, the brightness at the vertices of the polygon is calculated, and the brightness inside the polygon is obtained by interpolating from the brightness at each vertex (such a method is called “go-mouth-texture drawing”).
  • the position of each vertex of the mesh that is the basis of the flame image is shifted by a random number, and the position of a new vertex is determined. Also, the brightness of the vertex is determined based on the random number. The position of the vertex and the luminance of the vertex are determined each time the frame is updated.
  • One square of the mesh that is the basis of the flame image is a polygon.
  • an image serving as the basis of the flame drawn in the frame memory 15 is formed by the above-described recursive texture drawing, and the above Gouraud shading is performed based on the brightness of each vertex of the polygon.
  • the ascending airflow, the fluctuation of the flame, and the decay of the flame are expressed in a manner closer to the actual flame.
  • FIG. 8 shows a processing procedure by the image processing device 2 for enabling such an operation.
  • the difference value detection unit 107 updates the mirrored moving image to that of the next frame, and thereby updates the composite image generated by the superimposed image generation unit 106 (step S201). , Compare the image features of the mirrored moving image included in the composite image before and after the update, calculate the difference value of the image in the ignited part of the matchstick image, and generate the difference image of the ignited part of the matchstick image Do (Step S202).
  • the difference value calculated here is a value that quantitatively represents the movement of the hand in the ignited portion of the image of the matchstick when the operator moves the hand.
  • the generated difference image is an image composed of the image of the hand before moving and the image of the hand after moving, in the ignited part of the image of the matchstick when the hand of the target operator moves. Become.
  • the calculated difference value is recorded in the main memory 11 and is cumulatively added for a certain period (step 203).
  • the difference value detection unit 107 sends a cumulative value, which is a value obtained by cumulatively adding the difference image and the difference value, to the object control unit 105.
  • the object control unit 105 determines the color of the difference image according to the accumulated value received from the difference value detection unit 107, and generates a flame image based on the difference image (step S204).
  • the flame image is generated, for example, by dividing the difference image into meshes, and based on the meshes, using the above-described method using the recursive texture.
  • the color of the flame image is determined according to the color of the difference image.
  • the generated flame image is superimposed on the ignition part of the matchstick image.
  • the flame image colored in accordance with the amount of movement of the hand is displayed in the area representing the movement of the hand in the ignited portion of the image of the matchstick.
  • the color of the flame image displayed on the ignited part of the matching rod gradually changes according to the amount of movement of the hand Can be expressed.
  • the object control unit 105 compares the value indicating the color of the flame image with a predetermined threshold value (step S205). For example, when the color of a flame image is represented by R value, G value, and B value, the sum of each value can be used.
  • step S205 If the value indicating the color is equal to or greater than the threshold value (step S205: Y), the object control unit 105 sets the ignition animation indicating that the match has been fired. Is determined to execute the pro program (step S206).
  • the ignition animation it is determined whether to start the ignition animation according to the color of the flame image. For example, if the color of the flame image changes from red to yellow according to the amount of hand movement, the ignition animation starts when the flame image turns yellow. The operator can know from the color of the flame image how far to move his hand to start the ignition animation.
  • the superimposed image generation unit 106 generates a composite image by superimposing an image obtained by superimposing an ignition animation on an object image including an image of a matchstick and a flame image on a mirror moving image obtained from the video camera 1 ( Step S207).
  • the ignition animation is displayed in the ignition part of the matchstick image.
  • step S205 If the value indicating the color is smaller than the threshold value (step S205: N), the object control unit 105 generates an object image obtained by superimposing a flame image on a matchstick image. Send to Part 106. The superimposed image generation unit 106 superimposes such an object image on the mirror moving image obtained from the video camera 1 to generate a composite image (step S208).
  • step S209: Y If there is no instruction to end the processing (step S209: ⁇ ), the process returns to step S201, and the display control unit 108 returns to step S207 or step S208.
  • the generated composite image is displayed on the display device 3.
  • the operator can perform operations to execute various events while viewing his / her own mirrored moving image, making processing easier than using conventional input devices such as a keyboard and mouse. Input for execution can be performed.
  • FIG. 13 (a) a composite image in which a cursor (pointer) image which is an example of an object image is superimposed on a mirror moving image of the operator is displayed on the display device 3, as shown in FIG. 13 (a). 2, and it is assumed that the mirror moving image includes a plurality of targets such as an operator's hand, eyes, and mouth.
  • a force sol image is a face-like image in which the eyes are emphasized, and it is possible to move the eyes to face the target.
  • the cursor image moves following the movement of the target. That is, when the cursor image is far from the target, the cursor image moves toward the target, and when the force image captures the evening target, the cursor image moves toward the target. Try to follow.
  • FIGS. 11 and 12 show processing procedures by the image processing apparatus 2 for enabling such an operation.
  • the difference value detection unit 107 updates the mirrored moving image to that of the next frame, and thereby the synthesized image generated by the superimposed image generation unit 106 is updated.
  • the image features of the mirror moving image included in the combined image before and after the update are compared, and the difference value is calculated (step S302).
  • the difference value calculated here is a value obtained by quantifying the movement of the operator's hand, eye, mouth, and the like, which is a candidate for a sunset, in the mirror moving image.
  • the difference value detection unit 107 sends the difference value of each evening to the object control unit 105.
  • the object control unit 105 detects one target based on the difference value of each target sent from the difference value detection unit 107 (step S305). 3). For example, a target having a maximum difference value is detected. In this example, the operator's hand is detected as a target.
  • the object control unit 105 determines the display state of the cursor image according to the target.
  • the object control unit 105 determines whether or not the evening get is outside the cursor image in the composite image updated in step S301 (step S304). When the target is within the cursor image (step S304: N), the object control unit 10 determines that the force image captures the evening get (step S308).
  • step S304: Y the object control unit 105 determines that the force image does not capture the target, and determines the display state of the cursor image. I do. That is, the object control unit 105 generates a cursor image in which the eyes in the force sol image face the direction of the target.
  • the speed at which the force image moves toward the evening get is determined according to the distance between the cursor image and the target (step S306).
  • This speed is set, for example, such that the farther the cursor image is from the target, the higher the speed. In this way, an image can be obtained in which the farther the cursor image is from the target, the sooner the cursor image moves to the target.
  • Step S307 The force image as described above is superimposed by the superimposition image generation unit 106 on the specular moving image of the next frame to generate a composite image as shown in Fig. 13 (a). Then, returning to step S301, the same operation is performed on the generated composite image.
  • steps S301 to S307 are performed until the cursor image captures the target, that is, until the target is determined to be within the cursor image in step S304. .
  • the eyes in the force-sol image look at the direction of the target (hand) and provide an image in which the force-sol image follows the target be able to.
  • the difference value detection unit 107 holds the image of the evening get at that time as a template image (step S309). For example, a portion of the mirror moving image that overlaps the force-sol image is stored as a template image.
  • the difference value detecting unit 107 obtains a mirror moving image of the next frame from the image inverting unit 102 (step S310).
  • the difference value detection unit 107 searches for a position of an image matching the held template image from among the obtained mirror moving images (step S311).
  • the obtained specular moving image is divided into regions having the same size as the template image, and an image in the region most similar to the template image is searched for from among the divided regions.
  • the search when a matching image is detected, the position of the detected image is reported to the object control unit 105.
  • the object control unit 105 determines the position reported from the difference value detection unit 107 as the position of the force sol image in the next composite image (step S312).
  • the superimposed image generation unit 106 sets the position determined by the object control unit 105 in step S312 on the same mirrored video as the mirrored video obtained by the difference value detection unit 107 in step S310.
  • a composite image as shown in Fig. 13 (b) is generated by superimposing the force sol image on the image (step S3 13).
  • the frame is updated, and the generated composite image is displayed on the display device 3 by the display control unit 108 (step S314).
  • the cursor image follows the target by repeating the above operations (steps S309 to S314) after capturing the target. Such an image is obtained.
  • the cursor image captures the target (hand) as shown in Fig. 13 (b)
  • the force sol image will be displayed at that destination .
  • the force sol image is extended by the operator in accordance with the hand movement recognized as the target. It is displayed at the tip of the hand. .
  • the operator can determine which part of the operator is functioning as a force solver when selecting a process. You can understand at a glance.
  • the locus of the movement of the target can be displayed on the display device 3.
  • pictures and characters drawn on the space can be displayed on the display device 3.
  • the operator when the operator needs to input data or the like, the operator can easily view the synthesized image displayed on the display device by using the mirrored video. Input and selection are possible, and a more convenient input interface can be realized without the need for familiarity.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Social Psychology (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Databases & Information Systems (AREA)
  • User Interface Of Digital Computer (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Processing Or Creating Images (AREA)
  • Studio Devices (AREA)
  • Studio Circuits (AREA)

Description

明細 ; 画像処理装置、 画像処理方法、 記録媒体、 コンピュータプログラム、 半導 体デバイス 技術分野
本発明は、 ビデオカメラなどの撮影装置により撮影された撮影画像を、 コマンド等の入カインタフェースとして利用するための画像処理技術に関 する。 背景技術
コンピュータ、 ビデオゲーム機などによく用いられる入力装置として、 キーボード、 マウス、 コントローラ等がある。 操作者は、 これらの入力装 置を操作することにより所望のコマンドを入力して、 入力されたコマンド に応じた処理をコンピュータ等に行わせる。 そして操作者は、 処理結果と して得られた画像、 音などを、 ディスプレイ装置やスピーカにより視聴す る。
操作者は、 入力装置に備えられる多くのボタンを操作したり、 ディスプ レイ装置に表示されたカーソルなどを見ながら操作することにより、 コマ ンドの入力を行うこととなる。
このような操作は、 操作者の慣れに依存する部分が大きい。 例えばキー ポ一ドを全く触ったことのない者にとって、 キーボードを用いて所望のコ マンドを入力することは面倒な操作であり、 入力に時間がかかったり、 キ 一ボードの打ち間違いによる入力ミスを起こしやすい。 そのために、 操作 者が操作しやすいマンマシンィンタフェースに対する要望がある。
一方、 マルチメディア技術の発達により、 ビデオカメラにより撮影した 撮影画像を、 コンピュータなどに取り込んで編集し、 これをディスプレイ 装置に表示して楽しむことが、 一般の家庭でも手軽に行えるようになって いる。 また、 顔などの身体の撮影画像を解析して特徴部分を抽出し、 個人 の特定を行うなどの個人認証にも用いられている。
従来、 このような撮影画像は、 編集又は解析といった、 コンピュータに よって処理されるための情報として用いられている。 しかし、撮影画像が、 例えばコンピュータにコマンドを入力するといつた目的で用いられること はなかった。
本発明の目的は、 撮影装置等により撮影された撮影画像をコマンド等を 入力するための入カイン夕フェースとして利用するための画像処理技術を 提供することにある。 発明の開示
本発明の画像処理装置は、 動きのある夕一ゲットをその一部に含む鏡面 動画像を取り込む画像取込手段と、 所定のオブジェクトを表すオブジェク ト画像を、 前記画像取込手段で取り込んだ鏡面動画像に含まれるターゲッ トの動きに応じて生成する画像生成手段と、 この画像生成手段で生成した オブジェク卜画像を前記取り込んだ鏡面動画像と合成して所定のディスプ レイ装置に表示させる制御手段とを備えてなる。
「ターゲット」 とは、 例えば画像処理装置に画像を供給する撮影装置に よる撮影対象体 (人物又は物体等) のうち注目する部分をいう。
本発明の他の画像処理装置は、 動きのあるターゲットをその一部に含む 鏡面動画像を取り込む画像取込手段と、 現時点の鏡面動画像と直前の鏡面 動画像との間の画像特徴を検出することにより前記ターゲット及びその動 き成分を検出する検出手段と、 所定のオブジェクトを表すオブジェクト画 像を、 前記検出手段で検出されたターゲットの動き成分に応じて変化する ように生成する画像生成手段と、 この画像生成手段で生成したオブジェク ト画像を前記取り込んだ鏡面動画像と合成して所定のディスプレイ装置に 表示させる制御手段とを備える。
これらの画像処理装置は、 鏡面動画像に含まれる夕ーゲットの動きに応 じて、 オブジェクト画像を生成する。 つまり、 ターゲットの動きにより、 ディスプレイ装置に表示されるオブジェクト画像の動きや色、 形、 ォブジ ェクト画像が複数ある場合にはどのオブジェクト画像を表示するか等が決 められる。 例えば、 ターゲットが操作者である場合には、 操作者の動作に 応じてオブジェクトが決まることになる。 このように、 鏡面動画像を入力 ィンタフェースの一種として利用可能となる。
これらの画像処理装置において、 前記画像生成手段が、 前記検出された 夕一ゲットの動きに追従するように前記オブジェクト画像を生成するよう にしてもよい。
また、 前記ターゲットの動き成分に応じて、 前記生成されたォブジェク ト画像に基づく所要の処理の実行準備を行う手段をさらに備えるようにし てもよい。
前記画像生成手段で生成されたォブジェクト画像と前記現時点の鏡面動 画像とが合成された合成画像と、 前記直前の鏡面動画像に含まれる夕一ゲ ットの部分の画像であるテンプレート画像と、 を比較して、 前記テンプレ ―ト画像と画像特徴が最も類似する前記合成画像の部分の画像を検出する と共に、 この検出した前記合成画像の前記部分の画像に前記オブジェクト 画像が含まれているときに、 こ ωオブジェクト画像に基づく所要の処理の 実行準備を行う手段をさらに備えるようにしてもよい。
前記オブジェクト画像を所定の処理に対応付けしておき、 前記検出手段 で検出された前記ターゲッ卜の動き成分が所定の条件を満たすときに前記 オブジェクト画像に対応付けされた前記処理を実行する手段をさらに備え るようにすると、 ターゲットの動きに応じて、 処理の実行が可能となる。 また、 鏡面動画像に含まれる前記ターゲットを複数とし、 前記検出手段 を、 前記複数のターゲットの各々についてその動き成分を検出して、 検出 した前記複数のターゲットの各々の動き成分に基づいて一のターゲットを 検出するように構成し、 前記画像生成手段を、 前記オブジェクト画像を、 前記検出手段で検出された前記一のターゲットの前記動き成分に応じて変 化するように生成するように構成してもよい。
本発明は、 また、 以下のような画像処理方法を提供する。 この画像処理 方法は、 動きのある夕一ゲットをその一部に含む鏡面動画像を画像処理装 置に取り込み、 前記画像処理装置で、 所定のオブジェクトを表すオブジェ クト画像を、 前記取り込んだ鏡面動画像に含まれるターゲッ卜の動きに応 じて生成するとともに、 生成した前記オブジェクト画像を前記取り込んだ 鏡面動画像と合成して所定のディスプレイ装置に表示させることを特徴と する、 画像処理方法である。
本発明は、 また、 以下のようなコンピュータプログラムを提供する。 こ のコンピュータプログラムは、 ディスプレイ装置が接続されたコンビュ一 夕に、動きのある夕一ゲットをその一部に含む鏡面動画像を取り込む処理、 所定のオブジェクトを表すオブジェクト画像を、 前記取り込んだ鏡面動画 像に含まれるターゲットの動きに応じて生成する処理、 生成した前記ォブ ジェクト画像を前記取り込んだ鏡面動画像と合成して前記ディスプレイ装 置に表示させる処理、を実行させるためのコンピュータプログラムである。 本発明は、 また、 以下のような半導体デバイスを提供する。 この半導体 デバイスは、 ディスプレイ装置が接続されたコンピュータに搭載された装 置に組み込まれることにより、 前記コンピュータに、 動きのあるターゲッ トをその一部に含む鏡面動画像を取り込む手段、 所定のオブジェクトを表 すォブジェクト画像を、 前記取り込んだ鏡面動画像に含まれるターゲット の動きに応じて生成する手段、 生成した前記オブジェクト画像を前記取り 込んだ鏡面動画像と合成して前記ディスプレイ装置に表示させる手段、 の 機能を形成させる半導体デバイスである。 図面の簡単な説明
第 1図は、 本発明を適用した画像処理システムの全体構成図であり、 第 2図は、 本発明の実施形態による画像処理装置の構成図であり、 第 3図は; 本発明の実施形態の画像処理装置が具備する機能プロック図 であり、
第 4図は、 実施例 1の処理手順を示すフローチヤ トであり、 第 5図は、 実施例 1の処理手順を示すフローチヤ一卜であり、 第 6図は、 実施例 1による合成画像を例示した図であり、
第 7図は、 メニュー画像を例示した図であり、
第 8図は、 実施例 2の処理手順を示すフローチャートであり、 第 9図は、 実施例 2による合成画像を例示した図であり、
第 1 0図は、 再帰テクスチャによる描画の説明図であり、
第 1 1図は、 実施例 3の処理手順を示すフローチャートであり、 第 1 2図は、 実施例 3の処理手順を示すフロ一チャートであり、 第 1 3図は、 実施例 3による合成画像を例示した図である。 発明を実施するための最良の形態
以下、 本発明の実施形態を、 添付図面を参照しつつ、 詳細に説明する。 第 1図は、 本発明を適用した画像処理システムの構成例を示した図であ る。 . .
この画像処理システムは、 ディスプレイ装置 3に対座する操作者をアナ ログ又はデジタルのビデオカメラ 1で撮影し、 これにより得られた動画像 を画像処理装置 2に時系列的に連続に取り込んで鏡面動画像を生成すると ともに、 この鏡面動画像のうち、 操作者の目、 手などの注目対象部分 (以 下、 注目対象部分を 「ターゲット」 と称する) が存在する部位にメニュー やカーソル等のオブジェクトを表すオブジェクト画像を合成して合成画像 (これも動画像となる) を生成し、 この合成画像をディスプレイ装置 3上 にリアルタイムに表示させるものである。
鏡面動画像は、 ビデオカメラ 1から取り込んだ動画像を画像処理装置 2 で鏡面処理 (画像の左右反転処理) することにより生成することができる が、 ビデオカメラ 1の前に鏡を置き、 操作者を映した鏡面の動画像をビデ ォカメラ 1で撮影することによって鏡面動画像を生成するようにしてもよ い。 いずれにしても、 ディスプレイ装置 3上には、 ターゲットの動きに応 じてその表示形態がリアルタイムに変化する合成画像が表示されるように する。
画像処理装置 2は、 コンピュータプログラムにより所要の機能を形成す るコンピュータにより実現される。
この実施形態によるコンピュータは、 例えば第 2図にそのハードウェア 構成を示すように、 それぞれ固有の機能を有する複数の半導体デバイスが 接続されたメインバス B 1とサブバス B 2の 2本のバスを有している。 こ れらのバス B l、 B 2は、 バスインタフェース I NTを介して互いに接続 され又は切り離されるようになつている。
メインバス B 1には、主たる半導体デバイスであるメイン C PU 1 0と、 RAMで構成されるメインメモリ 1 1と、 メイン DM AC (Direct Memory Access Controller) 1 2と、 MPEG (Moving Picture Experts Group) 丁 コーダ (MDEC) 1 3と、 描画用メモリとなるフレームメモリ 1 5を内 蔵する描画処理装置 (Graphic Processing Unit、 以下、 「GPUj) 14が 接続される。 GPU 14には、 フレームメモリ 1 5に描画されたデータを ディスプレイ装置 3で表示できるようにするためのビデォ信号を生成する CRTC (CRT Controller) 1 6が接続される。
メイン C PU 1 0は、 コンピュータの起動時にサブバス B 2上の ROM 2 3から、バスインタフェース I NTを介して起動プログラムを読み込み、 その起動プログラムを実行してォペレ一ティングシステムを動作させる。 また、 メディアドライブ 27を制御するとともに、 このメディアドライブ 2 7に装着されたメディァ 28からアプリケーシヨンプログラムゃデ一夕 を読み出し、 これをメインメモリ 1 1に記憶させる。 さらに、 メディア 2 8から読み出した各種データ、 例えば複数の基本図形 (ポリゴン) で構成 された 3次元オブジェクトデータ (ポリゴンの頂点 (代表点) の座標値な ど) に対して、 オブジェクトの形状や動き等を表現するためのジオメトリ処理 (座標値演算処理) を行い、 そして、 ジオメトリ処理によるポリゴン定義情報 (使用するポリゴンの形状及びその描画位置、 ポリゴンを構成する素材の種類、 色調、 質感等の指定) をその内容とするディスプレイリストを生成する。
GPU14は、 描画コンテクスト (ポリゴン素材を含む描画用のデータ) を 保持しており、 メイン CPU 10から通知されるディスプレイリストに従って 必要な描画コンテクストを読み出してレンダリング処理 (描画処理) を行い、 フレームメモリ 1 5にポリゴンを描画する機能を有する半導体デバイスであ る。 フレームメモリ 15は、 これをテクスチャメモリとしても使用できる。 そ のため、 フレームメモリ上のピクセルイメージをテクスチャとして、 描画する ポリゴンに貼り付けることができる。
メイン DMAC 1 2は、 メインパス B 1に接続されている各回路を対象 として DMA転送制御を行うとともに、 バスィン夕フェース I NTの状態 に応じて、 サブバス B 2に接続されている各回路を対象として DM A転送 制御を行う半導体デバイスであり、 MDEC 1 3は、 メイン CPU 1 0と 並列に動作し、 MPEG (Moving Picture Experts Group) 方式あるいは J PEG (Joint Photographic Experts Group) 方式等で圧縮されたデータ を伸張する機能を有する半導体デバイスである。
サブバス B 2には、 マイクロプロセッサなどで構成されるサブ C PU 2 0、 RAMで構成されるサブメモリ 2 1、 サブ DMAC 22、 オペレーテ ィングシステムなどの制御プログラムが記憶されている ROM 23、 サゥ ンドメモリ 25に蓄積された音デ一夕を読み出してオーディオ出力として 出力する音声処理用半導体デバイス (S PU (Sound Processing Unit) ) 24、 図示しないネットワークを介して外部装置と情報の送受信を行う通 信制御部 (ATM) 26、 CD— ROMや DVD— ROMなどのメディア 2 8を装着するためのメディアドライブ 27及び入力部 3 1が接続されて いる。
サブ CPU 20は、 ROM 2 3に記憶されている制御プログラムに従つ て各種動作を行う。 サブ DMAC 22は、 バスインタフエ一ス I NTがメ ィンバス B 1とサブバス B 2を切り離している状態においてのみ、 サブバ ス B 2に接続されている各回路を対象として DMA転送などの制御を行う 半導体デバイスである。 入力部 3 1は、 操作装置 3 5からの入力信号が入 力される接続端子 32、 ビデオカメラ 1からの画像信号が入力される接続 端子 33、 及びビデオカメラ 1からの音声信号が入力される接続端子 34 を備える。
なお、 本明細書では、 画像についてのみ説明を行い、 便宜上、 音声につ いての説明は省略する。
このように構成されるコンピュータは、 メイン CPU 1 0、 サブ CPU 2 0、 GPU 14が、 ROM 23及びメディア 28等の記録媒体から所要 のコンピュータプログラムを読み込んで実行することにより、 画像処理装 置 2として動作するうえで必要な機能ブロック、 すなわち、 第 3図に示す ような、 画像入力部 1 0 1、 画像反転部 1 02、 オブジェクトデータ記憶 部 1 03、 オブジェクトデ一夕入力部 1 04、オブジェクト制御部 1 0 5、 重畳画像生成部 1 0 6、 差分値検出部 1 07、 表示制御部 1 08を形成す る。
第 1図に示したハードウェアとの関係では、 画像入力部 1 0 1は入力部 3 1及びその動作を制御するサブ CPU 20により形成され、 画像反転部 1 02、 オブジェクトデ一夕入力部 104、 オブジェクト制御部 1 05及 び差分値検出部 1 07はメイン CPU 1 0により形成され、 重畳画像生成 部 106は GPU 14により形成され、 表示制御部 108は GPU14と CRTC 1 6との協働により形成される。 オブジェクトデータ記憶部 1 0 3は、 メイン C PU 10がアクセス可能なメモリ領域、 例えばメインメモ リ 1 1に形成される。
画像入力部 1 0 1は、 ビデオカメラ 1により撮影された撮影画像を入力 部 3 1の接続端子 3 3を介して取り込む。 入力される撮影画像がデジタル 画像の場合は、 そのまま取り込む。 入力される撮影画像がアナログ画像の 場合は、 AZD変換を行ってデジタル画像に変換して取り込む。
画像反転部 1 02は、 画像入力部 10 1により取り込んだ撮影画像を鏡 面処理、 すなわち左右反転処理して鏡面動画像を生成する。
オブジェクトデータ記憶部 1 03は、 メニュー (サブメニューを含む)、 マッチ棒、 カーソル等のオブジェクトを表現するためのオブジェクトデー 夕をその識別データと共に保持する。
オブジェクトデータ入力部 1 04は、 オブジェクトデ一夕記憶部 1 0 3 から必要なオブジェクトデータを取り込んで、 オブジェクト制御部 1 0 5 へ送る。 取り込むべきオブジェクトデ一夕は、 オブジェクト制御部 10 5 により指示される。
オブジェクト制御部 1 0 5は、 指示内容に応じてオブジェクトデータ入 力部 1 04より取り込んだオブジェクトデ一夕に基づいてオブジェクト画 像を生成する。 特に、 オブジェクト制御部 1 0 5は、 差分値検出部 1 0 7 から送られる差分値に基づいてオブジェクトの表示状態を決定し、 その表 示状態を実現するためのオブジェクト画像を生成する。 差分値については 後述する。
重畳画像生成部 1 0 6は、 画像反転部 1 0 2から出力された鏡面動画像 とォブジェクト制御部 1 0 5により生成されるォブジェクト画像とを重畳 した合成画像をフレームメモリ 1 5に描画する。
なお、 オブジェクト画像を重畳して合成画像を生成するほかに、 公知の インポーズ処理により、 鏡面動画像上にオブジェクト画像を表示するよう にしてもよい。
差分値検出部 1 0 7は、 重畳画像生成部 1 0 6により生成される合成画 像のうち、 鏡面動画像の画像特徴を 1フレーム毎に比較し、 前後のフレ一 ムの鏡面動画像間における画像特徴の差分値を導出する。 また、 差分値検 出部 1 0 7は、 必要に応じて、 前後のフレームの鏡面動画像間の差分画像 を生成する。
画像特徴の差分値は、 鏡面動画像に含まれるターゲッ卜の動き成分のフ レーム毎の変化を定量的に表す値となる。 例えば、 鏡面動画像内でターゲ ットが動いた距離や、 動いた先の領域と動く前の領域との間の面積を表す ことになる。
一つの鏡面動画像内に複数のターゲッ卜が含まれる場合には、 画像特徴 の差分値が各々の夕ーゲットの動きの変化を表すようになるので、 この差 分値を求めることにより、 個々のターゲッ卜の動きの変化を定量的に求め ることができる。
差分画像は、 その時点における鏡面動画像に含まれる夕一ゲットのフレ ーム毎の動きの変化を表す画像となる。 例えば、 2つの鏡面動画像間で夕 ーゲッ卜が動いたときの、 動く前の夕ーゲットの画像と動いた後の夕一ゲ ッ卜の画像とからなる画像である。
差分値及び差分画像を導出するために、 差分値検出部 1 0 7は、 ある鏡 面動画像を他のフレームの鏡面動画像との間の 「参照用画像」 としてメイ ンメモリ 1 1に記憶する。 記憶しておく鏡面動画像は、 1フレーム分の鏡 面動画像の全体でもよいが、画像特徴の差分値を導出できれば足りるので、 夕一ゲットの部分のみであつてもよい。
以後の説明において、 タ一ゲッ卜の部分の画像を他の部分の画像と区別 する必要がある場合は、 それを 「テンプレート画像」 という。
差分値検出部 1 0 7で検出した差分値は、 オブジェクト制御部 1 0 5に 送られ、 オブジェクト画像の動きを制御するために用いられる。
表示制御部 1 0 8は、 重畳画像生成部 1 0 6で生成された合成画像をビ デォ信号に変換してディスプレイ装置 3に出力する。 ディスプレイ装置 3 は、 このビデオ信号により、 画面上に合成画像 (動画像) を表示させる。 ぐ画像処理方法 >
次に、 上記のような画像処理システムにより行われる画像処理方法の実 施例を説明する。
[実施例 1 ]
ディスプレイ装置 3には、 第 6図に示すように、 ビデオカメラ 1により 撮影され、 鏡面処理された操作者の鏡面動画像に、 オブジェクト画像の一 例となるメニュー画像が重畳された合成画像が画像処理装置 2によって表 示されているものとする。
ターゲットとしては、 操作者の目、 口、 手など、 種々のものを選定する ことができるが、 ここでは、 操作者の手をターゲットとし、 メニュー画像 が表示されている領域内における手の動き量を検出することによって、 メ ニュ一画像に対する指示入力を行う場合の例を挙げる。
メニュー画像は第 7図に示すように階層的になっており、 操作者によつ て最上位層の「meim」が選択されると、その下位層の「selectl」、 「select2」、 「select3」 のいずれかを表すプルダウン画像が表示され、 プルダウン画像 の中からいずれかが選択されると、 選択されたブルダゥン画像の下位層の メニューの処理決定画像 (例えば 「処理 2 1」、 「処理 2 2」、 「処理 2 3」、 「処理 2 4」) が表示されるようになっている。
処理決定画像は、 決定した処理 (イベント) をメイン C P U 1 0に実行 させるためのプログラムと対応付けられてオブジェクトデ一タ記億部 1 0 3に記憶されており、 ある処理決定画像が選択されると、 それに対応付け られたプログラムが起動して、 該当する処理 (イベント) が実行されるよ うになっている。
このような動作を可能にするための画像処理装置 2による処理手順を第 4図及び第 5図に示す。
まず、 第 4図を参照する。 差分値検出部 1 0 7は、 鏡面動画像が次のフ レームのものに更新され、 それによつて重畳画像生成部 1 0 6により生成 される合成画像が更新されると (ステップ S 1 0 1 )、 更新する前後の合 成画像に含まれる鏡面動画像の画像特徴を比較し、 その差分値を算出する (ステップ S 1 0 2 )。 ここで算出される差分値は、 メニュー画像が表示 されている領域内における操作者の 1回の手の動きを表す値である。 算出 された差分値はメインメモリ 1 1に記録され、一定期間累積加算される(ス テツプ S 1 0 3 )。 差分値を累積加算するのは、 操作者による複数回の手 の動きによって操作者の操作指示の意志を画像処理装置 2において検知す るためである。 1回の手の動き量によって操作者の操作指示の意志を確認 できる場合は、 必ずしも累積加算を行う必要はない。
差分値検出部 1 0 7は、 差分値 (累積値) をォブジェクト制御部 1 0 5 へ送る。
オブジェクト制御部 1 0 5は、 差分値検出部 1 0 7から受け取った差分 値 (累積値) に応じてメニュー画像の色を決定する (ステップ S 1 0 4 )。 例えばメニュ一画像の色を複数色用意しておき、 手の動きが検出されるた びにその色を逐次変えていく。 透明から半透明、 不透明のように変えるよ うにしてもよい。 また、 現時点での差分値 (累積値) を予め定められてい るしきい値と比較し (ステップ S 1 0 5 )、 累積値がしきい値より小さい 場合は (ステップ S 1 0 5 : N)、 メニュー画面の 「memi」 が選択された とするには十分ではないとして、 ステップ S 1 0 1に戻る。
累積値がしきい値以上になった場合 (ステップ S 1 0 5 : Y)、 ォブジ ェクト制御部 1 0 5は、 メニュー画面の 「menu」 が選択されたと判断し て、 プルダウン画像を表示させると共にその旨を差分値検出部 1 0 7に報 告する (ステップ S 1 0 6 )。
このように、 メニュー画像が表示された領域内で検出した操作者の手の 動き量の累積値がしきい値以上になることをもって、 メニュー画像の 「memi」 が選択されたことを検知し、 プルダウン画像を表示させる。 手 の動き量の累積値によってメニュー画像の色が変わるので、 操作者は、 あ とどの程度手を動かせば 「menu」 が選択されるようになるかがわかるよ うになっている。
また、 ディスプレイ装置 3には鏡面動画像が表示されるために、 操作者 は、 鏡を見ている感覚で上記の操作ができるために、 操作者が操作し易い マンマシンィン夕フェースを実現することができる。
第 5図に移り、 メニュー画面の 「menu」 が選択されたこと、 すなわち 差分値 (累積値) がしきい値以上になったことがわかると、 差分値検出部 1 0 7は、 そのときの操作者の手 (ターゲット) の画像をテンプレート画 像として保持する (ステップ S 1 0 7 )。
フレーム更新によってメニュ一画像がその下位層のプルダウン画像に切 り替わった合成画像が表示されると (ステップ S 1 0 8 )、 操作者の手の 画像が切り替わった合成画像のどこにあるかを探索する。 すなわち、 差分 値検出部 1 0 7は、 合成画像の中から、 テンプレート画像とマッチングす る画像を探索する (ステップ S 1 0 9 )。
具体的には、 その合成画像をテンプレート画像と同じ大きさの領域毎に 分割し、 分割した各領域の画像のうち、 テンプレート画像に最も類似する 領域の画像を探索する。 テンプレート画像に最も類似する領域の画像は、 ' 例えば比較する画像の画素間の逢分の絶対値 (又は 2乗) の総和を距離と して表すことができるときに、 テンプレ一ト画像との距離が最小となる画 像である。
マッチングする画像があった場合は (ステップ S 1 1 0 : Y)、 それが プルダウン画像かどうかを判定する (ステップ S 1 1 1 )。 プルダウン画 像であった場合は(ステップ S 1 1 1 : Υ)、それが、 「sekctl」、 「select2」、 「select3」のどの領域のプルダウン画像かを検出する(ステップ S 1 1 2 )。 検出したプルダウン画像が、 操作者によって指示された選択されたブルダ ゥン画像となる。 選択されたプルダウン画像に関する情報は、 差分値検出 部 1 0 7からオブジェクト制御部 1 0 5へ報告される。
オブジェクト制御部 1 0 5は、 選択されたプルダウン画像に付随する処 理決定画像をォブジェクトデータ記憶部 1 0 3から読み出し、 この処理決 定画像が付されたォブジェクト画像を生成する (ステップ S 1 1 3 )。
このようにして、 ディスプレイ装置 3には操作者によって逐次選択され ていくメニューの様子が表示される。
第 7図の例では、 最上位層のメニュー画像から 「select2」 のプルダウン 画像が選択され、 その 「select2」 のブルダウン画像に付随する処理決定画 像 (「処理 2 1」、 「処理 2 2」、 「処理 2 3」、 「処理 2 4 J ) が表示されて いる。
テンプレート画像は、 フレーム毎に、逐次新しいものに置き換えられる。 すなわち、 差分値検出部 1 0 7は、 前のフレームで使用したテンプレー ト画像を破棄し、 上記のマッチングした画像 (プルダウン画像の選択に用 いた操作者の手の画像) を新たなテンプレート画像として保持する (ステ ップ S 1 1 4 )。その後、上記と同様にして処理決定画像(「処理 2 1」、 「処 理 2 2」、 「処理 2 3」、 「処理 2 4」) のいずれかを特定するために、 ステ ップ S 1 0 8に戻る。
ステップ S 1 1 1において、 マッチングする画像がプルダウン画像の領 域外であるが、 処理決定画像領域内のいずれかの処理決定画像であった場 合は (ステップ S 1 1 1 : N、 S 1 1 5 : Y)、 その処理決定画像が選択さ れたとして、 これに対応付けられた処理の内容を決定し、 すなわちプログ ラムを実行可能にし、 メニュー画像による処理を終える (ステップ S 1 1 8 ) ο
マッチングする画像がプルダウン画像及び処理決定画像領域外である が、 メニュー画像領域内であった場合は (ステップ S 1 1 1 : N、 S 1 1 5 : N、 S 1 1 6 : Υ)、 操作者が他のプルダウン画像を選択しょうとする ことなので、 テンプレート画像を破棄し、 マッチングした画像を新たなテ ンプレート画像として保持したうえで、 ステップ S 1 0 8に戻る (ステツ プ S 1 1 7 )。
ステップ S 1 1 0においてマッチングする比較対象画像がなかった場合 (ステップ S 1 1 0 : Ν)、 あるいはマッチングする画像はあるが、 それ がメニュー画像領域外の画像であった場合は、 その時点でメニュー画像に よる処理を終える (ステップ S 1 1 1 : N、 S 1 1 5 : N、 S 1 1 6 : Ν)。 以上の手順でメニュー画像による処理を行うことにより、 操作者は、 デ イスプレイ装置 3の画面に映し出される自分の鏡面動画像を見ながら、 容 易に自分の欲する内容の処理を選択可能となる。 また、 自分の挙動を画面 上で随時確認しながら指示の入力を行えるために、 キーボ一ドなどの入力 装置を用いる場合のように、 目をディスプレイ装置 3からそらすことがな くなる。 · [実施例 2 ]
本実施形態の画像処理システムにより、 オブジェクト画像に、 画像処理 の対象となるィベントをメイン C P U 1 0に実行させるためのプログラム を対応付けして、 オブジェクト画像に対する鏡面動画像内の操作者の動き に応じて、 該当するイベントのための処理が実行されるようにすることも 可能である。
ここでは、 鏡面動画像に重畳するオブジェクト画像の一例として、 マツ チ棒の画像と、 そのマッチ棒が発火して火が燃える様子を表す炎画像とを 用いる場合の例を示す。
前提として、 事前に、 オブジェクト画像であるマッチ棒の画像に、 マツ チが発火したことを表す着火アニメーションをディスプレイ装置 3に表示 するためのプログラムを対応付けしておく。 そして、 合成画像内で、 マツ チ棒の画像を、 鏡面動画像内の操作者が擦るように挙動することにより、 マッチ棒の画像の着火部分に、 着火アニメーションが表示されるようにす る。 炎画像は、 操作者がマッチ棒の画像を擦ったときに表示される。
炎画像は、 例えば再帰テクスチャ描画の手法により生成することができ る。
「再帰テクスチャ描画」 とは、 テクスチャマッピングでレンダリングし た物体の画像を他の画像のテクスチャとして参照し、 再帰的にテクスチャ マッピングしていく描画手法をいう。 「テクスチャマッピング」 とは、 あ る物体の画像の質感を高めるために、 その物体の表面にテクスチャのビッ トマップデータを貼り付けてレンダリングする手法であり、 フレームメモ リ 1 5をテクスチャメモリとしても使用することにより実現可能となる。 このような再帰テクスチャ描画を行う際には、 テクスチャが描画されるポ リゴンにグ一口一シェーディング ( gom'aud shading) を行う。 すなわち、 ポリゴンの頂点における輝度を計算し、 ポリゴン内部の輝度を各頂点の輝 度から補間して求める (このような手法は、 「グー口一テクスチャ描画」 と呼ばれる) ようにする。
炎画像の表現には、 まず、 第 1 0図に示すように、 炎画像の基となるメ ッシュの各頂点の位置を乱数によりずらして、新たな頂点の位置を決める。 また、頂点の輝度も乱数に基づいて決める。頂点の位置及び頂点の輝度は、 フレーム更新の度に決められる。 炎画像の基となるメッシュの一マスがポ リゴンとなる。
各ポリゴンに、 フレームメモリ 1 5に描画された炎の基となる画像を上 記の再帰テクスチャ描画により形成し、 ポリゴンの各頂点の輝度に基づい て上記のグーローシェ一ディングを施す。 これにより、炎による上昇気流、 炎のゆらぎ、 減衰の様子が、 より現実の炎に近い内容で表現される。
ディスプレイ装置 3には、 第 9図に示すような、 操作者の鏡面動画像に マッチ棒の画像が重畳された合成画像が、 画像処理装置 2によって表示さ れているものとする。 ここでは、 操作者の手を夕一ゲットとする。 マッチ 棒の画像が表示されている領域内における手の動き量を検出することによ つて、 マッチ棒の画像に対応付けされたプログラムが実行され、 着火ァニ メーシヨンがディスプレイ装置 3に表示される。
このような動作を可能にするための画像処理装置 2による処理手順を第 8図に示す。
差分値検出部 1 0 7は、 鏡面動画像が次のフレームのものに更新され、 それによつて重畳画像生成部 1 0 6により生成される合成画像が更新され ると (ステップ S 2 0 1 )、 更新する前後の合成画像に含まれる鏡面動画 像の画像特徴を比較して、 マッチ棒の画像の着火部分における画像の差分 値を算出するとともに、 マッチ棒の画像の着火部分の差分画像を生成する (ステップ S 2 0 2 )。 ここで算出される差分値は、 操作者が手を動かし たときの、 マッチ棒の画像の着火部分における手の動きを定量的に表す値 である。 また、 生成される差分画像は、 ターゲットである操作者の手が動 いたときの、 マッチ棒の画像の着火部分における、 動かす前の手の画像と 動かした後の手の画像とからなる画像となる。
算出された差分値はメインメモリ 1 1に記録され、 一定期間累積加算さ れる (ステップ 2 0 3 )。
差分値検出部 1 0 7は、 差分画像及び差分値の累積加算された値である 累積値をオブジェクト制御部 1 0 5へ送る。
オブジェクト制御部 1 0 5は、 差分値検出部 1 0 7から受け取った累積 値に応じて差分画像の色を決定し、 この差分画像に基づいて炎画像を生成 する (ステップ S 2 0 4 )。 炎画像は、 例えば、 差分画像をメッシュに分 け、 このメッシュに基づいて、 前述の再帰テクスチャを用いた手法により 生成される。 炎画像の色は、 差分画像の色に応じて決められる。 生成され た炎画像は、 マッチ棒の画像の着火部分に重ねられる。
これにより、 手が動いた量に応じた色が付された炎画像が、 マッチ棒の 画像の着火部分の手の動きを表す領域内に表示されることになる。
炎画像の色を差分値の累積値に応じて決めることにより、 例えば、 マツ チ棒の着火部分に表示される炎画像の色が、 手の動いた量に応じて次第に 変化していく様子が表現できる。
次いで、 オブジェクト制御部 1 0 5は、 炎画像の色を示す値と、 予め定 められるしきい値とを比較する (ステップ S 2 0 5 )。 例えば炎画像の色 を R値、 G値、 B値で表している場合には、 それぞれの値の合計を用いる ことができる。
色を示す値がしきい値以上の場合は (ステップ S 2 0 5 : Y)、 ォブジ ェクト制御部 1 0 5は、 マッチが発火したことを表す着火アニメ一ション を表示するプロプログラムの実行を決定する (ステップ S 2 0 6 )。
つまり、 炎画像の色が何色かに応じて着火アニメーションを開始するか 否かを決定する。 例えば、 炎画像の色が手の動き量に応じて赤色から黄色 に変化する場合、 炎画像が黄色になることにより、 着火アニメーションを 開始する。 操作者は、 炎画像の色により、 あとどの程度手を動かせば着火 アニメ一ションが開始されるかを知ることができる。
重畳画像生成部 1 0 6は、 マッチ棒の画像及び炎画像を含むオブジェク ト画像に着火アニメーションを重ねた画像を、 ビデオカメラ 1から得られ た鏡面動画像に重畳して合成画像を生成する (ステップ S 2 0 7 )。 着火 アニメーションは、 マッチ棒の画像の着火部分に表示される。
色を示す値がしきい値より小さい場合は (ステップ S 2 0 5 : N)、 ォ ブジェク卜制御部 1 0 5は、 マッチ棒の画像に、 炎画像を重ねたオブジェ クト画像を重畳画像生成部 1 0 6へ送る。 重畳画像生成部 1 0 6は、 この ようなオブジェクト画像を、 ビデオカメラ 1から得られた鏡面動画像に重 畳して合成画像を生成する (ステップ S 2 0 8 )。
その後、 例えば操作装置 3 5から処理を終了する旨の指示があると、 処 理を終了する (ステップ S 2 0 9 : Y)。 処理を終了する旨の指示がなけ れば (ステップ S 2 0 9 : Ν)、 ステップ S 2 0 1に戻って、 表示制御部 1 0 8は、 ステップ S 2 0 7又はステップ S 2 0 8で生成された合成画像 をディスプレイ装置 3に表示する。
以上のように、 操作者がマッチ棒の画像の着火部分で手を動かす量に応 じて、 マッチ棒の画像に対応付けされた着火アニメーションを表示するプ ログラムを実行するか否かを決める処理が実行される。
操作者が、 自.分の鏡面動画像を見ながら種々のイベントを実行させるた めの操作を行えるので、 従来のキ一ポードゃマウスなどの入力装置を用い た操作よりも、 簡単に処理を実行させるための入力を行うことができる。 [実施例 3 ]
他の実施例について説明する。 前提として、 ディスプレイ装置 3には、 第 1 3図 (a ) に示すように、 操作者の鏡面動画像に、 オブジェクト画像 の一例となるカーソル (ポインタ) 画像が重畳された合成画像が画像処理 装置 2によって表示されており、 鏡面動画像内には、 操作者の手、 目、 口 などの複数のターゲットが含まれているものとする。
ここでは、 これらの複数の夕一ゲッ卜の中から操作者の手に注目して、 カーソル画像に、 この手の動きを追従させるような場合の例を挙げる。 力一ソル画像は、 第 1 3図 (a ) に示すように、 目の部分が強調された 顔のような画像であり、 目を、 ターゲットの方向を向くように動かすこと が可能である。 またカーソル画像は、 ターゲットの動きに追従して動く。 つまり、 カーソル画像がターゲットから離れている場合には、 カーソル画 像がターゲッ卜に向かって移動し、 力一ソル画像が夕一ゲットを捕捉して いる場合には、 カーソル画像がターゲットの動きに追従するようにする。 このような動作を可能にするための画像処理装置 2による処理手順を第 1 1図及び第 1 2図に示す。
まず第 1 1図を参照し、 差分値検出部 1 0 7は、 鏡面動画像が次のフレ —ムのものに更新され、 それによつて重畳画像生成部 1 0 6により生成さ れる合成画像が更新されると (ステップ S 3 0 1 )、 更新する前後の合成 画像に含まれる鏡面動画像の画像特徴を比較し、その差分値を算出する(ス テツプ S 3 0 2 )。 ここで算出される差分値は、 鏡面動画像内の、 夕ーゲ ットの候補となる操作者の手、 目、 口等の動きを定量化した値である。 差分値検出部 1 0 7は、 各夕一ゲットの差分値をオブジェクト制御部 1 0 5へ送る。
オブジェクト制御部 1 0 5は、 差分値検出部 1 0 7から送られた各ター ゲットの差分値に基づいて一のターゲットを検出する (ステップ S 3 0 3 )。 例えば、 差分値が最大となるターゲットを検出する。 この例では、 操作者の手をタ一ゲットとして検出する。
ターゲットを検出すると、 オブジェクト制御部 1 0 5は、 ターゲットに 応じてカーソル画像の表示状態を決定する。
まず、 オブジェクト制御部 1 0 5は、 ステップ S 3 0 1で更新された合 成画像内で夕一ゲットがカーソル画像外にあるか否かを判定する (ステツ プ S 3 0 4 )。 ターゲットがカーソル画像内にあるときには (ステップ S 3 0 4 : N)、 オブジェクト制御部 1 0 は、 力一ソル画像が夕一ゲット を捕捉していると判断する (ステップ S 3 0 8 )。
ターゲットがカーソル画像外にあるときには (ステップ S 3 0 4 : Y)、 オブジェクト制御部 1 0 5は、 力一ソル画像がターゲットを捕捉していな いと判断して、 カーソル画像の表示状態を決める処理を行う。 つまりォプ ジェクト制御部 1 0 5は、 力一ソル画像内の目がターゲットの方向を向く ようなカーソル画像を生成する。
また、 カーソル画像とターゲットの距離に応じて、 力一ソル画像が夕一 ゲットへ向かう速度を決める (ステップ S 3 0 6 )。 この速度は、 例えば、 カーソル画像がターゲットから遠いほど高速になるようにする。 このよう にすると、 カーソル画像がターゲットから遠方にあるほど、 早急にカーソ ル画像がターゲットへ向かうような画像が得られる。
以上のような力一ソル画像を、 重畳画像生成部 1 0 6により、 次のフレ ームの鏡面動画像に重畳することにより、 第 1 3図 (a ) に示すような合 成画像を生成する (ステップ S 3 0 7 )。 そしてステップ S 3 0 1に戻り、 生成した合成画像について、 同様の動作を行う。
ステップ S 3 0 1乃至ステップ S 3 0 7の動作を、 カーソル画像がタ一 ゲットを捕捉するまで、 つまりステップ S 3 0 4でターゲットがカーソル 画像内にあると判定されるまで、 行うことになる。 このような動作により、 第 13図 (a) に示すように、 力一ソル画像内 の目がターゲット (手) の方向を見て、 力一ソル画像がターゲットを追い かけるような画像を提供することができる。
第 12図に移り、 カーソル画像がターゲットを捕捉すると、 差分値検出 部 1 07は、 そのときの夕一ゲットの画像をテンプレート画像として保持 する (ステップ S 3 0 9)。 例えば、 鏡面動画像の力一ソル画像に重なる 部分をテンプレー卜画像として保持する。
次いで、 差分値検出部 1 0 7は、 次のフレームの鏡面動画像を画像反転 部 1 02から入手する (ステップ S 3 1 0)。 差分値検出部 107は、 入 手した鏡面動画像のうち、 保持しているテンプレート画像とマッチングす る画像の位置を探索する (ステップ S 3 1 1)。
具体的には、 入手した鏡面動画像をテンプレート画像と同じ大きさの領 域に分割し、 分割した各領域の画像のうち、 テンプレート画像に最も類似 する領域の画像を探索する。 探索の結果、 マッチングする画像を検出する と、 検出した画像の位置をオブジェクト制御部 105に報告する。
オブジェクト制御部 1 05は、 差分値検出部 1 07から報告のあった位 置を、 次の合成画像における力一ソル画像の位置に決める (ステップ S 3 12)。
重畳画像生成部 1 06は、 ステップ S 3 1 0で差分値検出部 107が入 手した鏡面動画像と同じ鏡面動画像上の、 ステップ S 3 1 2でォブジェク ト制御部 1 05が決めた位置に力一ソル画像を重畳することにより、 第 1 3図 (b) に示すような合成画像を生成する (ステップ S 3 1 3)。 次い で、 フレームを更新して、 表示制御部 1 0 8により、 生成した合成画像を ディスプレイ装置 3に表示する (ステップ S 314)。
以上のようなターゲット捕捉後の動作 (ステップ S 30 9〜ステップ S 3 14) を繰り返すことにより、 カーソル画像が、 ターゲットに追従する ような画像が得られる。 つまり、 カーソル画像が、 第 1 3図 (b ) に示す ようにターゲット (手) を捕捉すると、 その後は、 ターゲットが移動して も、 その移動先に力一ソル画像が表示されることになる。 第 1 3図 (b ) から第 1 3図 (c ) のように、 操作者が手を伸ばしても、 力一ソル画像は、 ターゲットとして認識した手の動きに合わせて、 操作者が伸ばした手の先 に表示される。 .
カーソル画像を用いることにより、 例えば実施例 1のようにメニュー画 像から処理を選択する場合などに、 操作者が、 自分のどの部位が処理選択 の際の力一ソルとして機能しているかが、 一目でわかるようになる。
また、 例えば、 カーソル画像が移動した軌跡を残して表示するようにす ると、 タ一ゲットが移動した軌跡をディスプレイ装置 3に表示できるよう になる。 これにより例えば、 空間上に描いた絵や文字などが、 ディスプレ ィ装置 3に表示可能となる。
以上の説明から明らかなように、 本発明によれば、 操作者がデータ等を 入力する必要がある場合は、 鏡面動画像を用いることにより、 ディスプレ ィ装置に表示された合成画像を見ながら容易に入力や選択が可能となり、 慣れを必要とせず、 より使い勝手のよい入カインタフェースを実現するこ とができる。
本発明の技術思想および範囲を逸脱することなしに、 種々の実施例およ び変更が可能である。 上記した実施例は本発明の例示にすぎず、 本発明の 範囲を制限するものではない。 本発明の範囲は、 実施例ではなく、 添付の 請求の範囲により示されている。 本発明の請求の範囲 ¾びその均等範囲内 でなされた種々の実施例は本発明の範囲内に含まれるものである。

Claims

請求の範囲
1 . 動きのある夕一ゲットをその一部に含む鏡面動画像を取り込む画像 取込手段と、
所定のオブジェクトを表すオブジェクト画像を、 前記画像取込手段で取 り込んだ鏡面動画像に含まれる夕一ゲッ卜の動きに応じて生成する画像生 成手段と、
この画像生成手段で生成したオブジェクト画像を前記取り込んだ鏡面動 画像と合成して所定のディスプレイ装置に表示させる制御手段とを備えて なる、 画像処理装置。
2 . 動きのあるターゲットをその一部に含む鏡面動画像を時系列的に取 り込む画像取込手段と、
' 現時点の鏡面動画像と直前の鏡面動画像との間の画像特徴を検出するこ とにより前記ターゲット及びその動き成分を検出する検出手段と、
所定のオブジェクトを表すオブジェクト画像を、 前記検出手段で検出さ れた夕一ゲットの動き成分に応じて変化するように生成する画像生成手段 と、
この画像生成手段で生成したオブジェクト画像を前記取り込んだ鏡面動 画像と合成して所定のディスプレイ装置に表示させる制御手段とを備え る、 画像処理装置。
3 . 前記画像生成手段は、 前記検出されたターゲットの動きに追従する ように前記オブジェクト画像を生成するように構成されている、 請求の範 囲第 2項記載の画像処理装置。
4 . 前記ターゲットの動き成分に応じて、 前記生成されたオブジェクト 画像に基づく所要の処理の実行準備を行う手段をさらに備えてなる、 請求 の範囲第 2項記載の画像処理装置。
5 . 前記画像生成手段で生成されたォブジェクト画像と前記現時点の鏡 面動画像とが合成された合成画像と、 前記直前の鏡面動画像に含まれる夕 ーゲットの部分の画像であるテンプレート画像とを比較して、 前記テンプ レート画像と画像特徴が最も類似する前記合成画像の部分の画像を検出す ると共に、 この検出した前記合成画像の前記部分の画像に前記オブジェク ト画像が含まれているときに、 このオブジェクト画像に基づく所要の処理 の実行準備を行う手段をさらに備えてなる、 請求の範囲第 2項記載の画像
6 . 前記オブジェクト画像は所定の処理に対応付けされており、 前記検出手段で検出された前記夕ーゲッ卜の動き成分が所定の条件を満 たすときに前記オブジェクト画像に対応付けされた前記処理を実行する手 段をさらに備える、 請求の範囲第 2項記載の画像処理装置。
7 . 前記鏡面動画像には、 複数の前記ターゲットが含まれており、 前記検出手段は、 前記複数のタ一ゲットの各々についてその動き成分を 検出して、 検出した前記複数のターゲットの各々の動き成分に基づいて一 のターゲットを検出するように構成されており、
前記画像生成手段は、 前記オブジェクト画像を、 前記検出手段で検出さ れた前記一のターゲッ卜の前記動き成分に応じて変化するように生成する ように構成されている、 請求の範囲第 2項記載の画像処理装置。
8 . 動きのあるターゲットをその一部に含む鏡面動画像を画像処理装置 に取り込み、
前記画像処理装置で、
所定のオブジェクトを表すオブジェクト画像を、 前記取り込んだ鏡面動 画像に含まれる夕一ゲットの動きに応じて生成するとともに、 生成した前 記ォブジェクト画像を前記取り込んだ鏡面動画像と合成して所定のディス プレイ装置に表示させることを特徴とする、 画像処理方法。
9 . ディスプレイ装置が接続されたコンピュータに、
動きのある夕一ゲッ卜をその一部に含む鏡面動画像を取り込む処理、 所定のオブジェクトを表すオブジェクト画像を、 前記取り込んだ鏡面動 画像に含まれる夕一ゲッ卜の動きに応じて生成する処理、
生成した前記オブジェクト画像を前記取り込んだ鏡面動画像と合成して 前記ディスプレイ装置に表示させる処理、 を実行させるためのコンビユー 夕プログラム。
1 0 . 請求の範囲第 9項に記載されたコンピュータプログラムを記録し てなる、 コンピュータ読み取り可能な記録媒体。
1 1 . ディスプレイ装置が接続されたコンピュータに搭載された装置に 組み込まれることにより、 前記コンピュータに、
動きのあるタ一ゲッ卜をその一部に含む鏡面動画像を取り込む手段、 所定のオブジェクトを表すオブジェクト画像を、 前記取り込んだ鏡面動 画像に含まれる夕一ゲットの動きに応じて生成する手段、
生成した前記オブジェクト画像を前記取り込んだ鏡面動画像と合成して 前記ディスプレイ装置に表示させる手段、 の機能を形成させる半導体デバ イス。
PCT/JP2001/008762 2000-10-06 2001-10-04 Image processing apparatus, image processing method, record medium, computer program, and semiconductor device Ceased WO2002031773A1 (en)

Priority Applications (5)

Application Number Priority Date Filing Date Title
BR0107310-9A BR0107310A (pt) 2000-10-06 2001-10-04 Processador de imagem, método de processamento de imagem, programa de computador, mìdia de gravação e dispositivo semicondutor
EP01974693.2A EP1324269B1 (en) 2000-10-06 2001-10-04 Image processing apparatus, image processing method, record medium, computer program, and semiconductor device
AU94187/01A AU9418701A (en) 2000-10-06 2001-10-04 Image processing apparatus, image processing method, record medium, computer program, and semiconductor device
MXPA02005288A MXPA02005288A (es) 2000-10-06 2001-10-04 Procesador de imagen, metodo de procesamiento de imagen, medio de registro, programa de computadora y dispositivo esmi conductor.
CA002392725A CA2392725A1 (en) 2000-10-06 2001-10-04 Image processing apparatus, image processing method, record medium, computer program, and semiconductor device

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2000-307574 2000-10-06
JP2000307574 2000-10-06
JP2001-295098 2001-09-26
JP2001295098A JP3725460B2 (ja) 2000-10-06 2001-09-26 画像処理装置、画像処理方法、記録媒体、コンピュータプログラム、半導体デバイス

Publications (1)

Publication Number Publication Date
WO2002031773A1 true WO2002031773A1 (en) 2002-04-18

Family

ID=26601678

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2001/008762 Ceased WO2002031773A1 (en) 2000-10-06 2001-10-04 Image processing apparatus, image processing method, record medium, computer program, and semiconductor device

Country Status (11)

Country Link
US (3) US6771277B2 (ja)
EP (1) EP1324269B1 (ja)
JP (1) JP3725460B2 (ja)
KR (1) KR100845390B1 (ja)
CN (1) CN1279761C (ja)
AU (1) AU9418701A (ja)
BR (1) BR0107310A (ja)
CA (1) CA2392725A1 (ja)
MX (1) MXPA02005288A (ja)
TW (1) TWI231445B (ja)
WO (1) WO2002031773A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022525954A (ja) * 2019-03-18 2022-05-20 グーグル エルエルシー ゲームストリームのフレーム間のディスパリティのためのフレームオーバーレイ

Families Citing this family (175)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6585622B1 (en) 1999-12-03 2003-07-01 Nike, Inc. Interactive use an athletic performance monitoring and reward method, system, and computer program product
US8956228B2 (en) * 1999-12-03 2015-02-17 Nike, Inc. Game pod
JP4615252B2 (ja) * 2000-10-06 2011-01-19 株式会社ソニー・コンピュータエンタテインメント 画像処理装置、画像処理方法、記録媒体、コンピュータプログラム、半導体デバイス
WO2004007034A1 (en) * 2002-07-12 2004-01-22 Awaba Group Pty Ltd A dance training device
AU2003288938A1 (en) * 2002-10-30 2004-06-07 Nike International Ltd. Clothes with tracking marks for computer games
US8206219B2 (en) 2002-10-30 2012-06-26 Nike, Inc. Interactive gaming apparel for interactive gaming
JP3854229B2 (ja) * 2003-01-07 2006-12-06 株式会社東芝 画像処理装置
DE20300882U1 (de) * 2003-01-21 2003-03-13 Fraunhofer Ges Forschung Vorrichtung zur interaktiven Steuerung eines Mauszeigers einer graphischen Benutzerschnittstelle
JP4323180B2 (ja) * 2003-02-13 2009-09-02 日本電信電話株式会社 自己画像表示を用いたインタフェース方法、装置、およびプログラム
GB2398690B (en) * 2003-02-21 2006-05-10 Sony Comp Entertainment Europe Control of data processing
GB2398691B (en) 2003-02-21 2006-05-31 Sony Comp Entertainment Europe Control of data processing
US8243636B2 (en) 2003-05-06 2012-08-14 Apple Inc. Messaging system and service
US7982751B2 (en) * 2003-07-11 2011-07-19 The University Of North Carolina Methods and systems for controlling a computer using a video image and for combining the video image with a computer desktop
US7453158B2 (en) * 2003-07-31 2008-11-18 Nvidia Corporation Pad over active circuit system and method with meshed support structure
US7495343B1 (en) * 2003-07-31 2009-02-24 Nvidia Corporation Pad over active circuit system and method with frame support structure
GB0321337D0 (en) * 2003-09-11 2003-10-15 Massone Mobile Advertising Sys Method and system for distributing advertisements
WO2005065798A1 (ja) * 2004-01-06 2005-07-21 Sony Computer Entertainment Inc. 情報処理システム、エンタテインメントシステム、および情報処理システムの入力受け付け方法
JP3847753B2 (ja) 2004-01-30 2006-11-22 株式会社ソニー・コンピュータエンタテインメント 画像処理装置、画像処理方法、記録媒体、コンピュータプログラム、半導体デバイス
JP3853796B2 (ja) * 2004-03-18 2006-12-06 株式会社ソニー・コンピュータエンタテインメント 情報処理装置およびエンタテインメント装置
JP2005301479A (ja) * 2004-04-08 2005-10-27 Akinori Yoshino 投影された提示者の動作による命令入力装置
GB2415639B (en) * 2004-06-29 2008-09-17 Sony Comp Entertainment Europe Control of data processing
JP4005061B2 (ja) 2004-06-30 2007-11-07 株式会社ソニー・コンピュータエンタテインメント 情報処理装置、プログラム、および、情報処理装置におけるオブジェクト制御方法
JP4005060B2 (ja) 2004-06-30 2007-11-07 株式会社ソニー・コンピュータエンタテインメント 情報処理システム、プログラムおよびゲームキャラクタ移動制御方法
US20060019746A1 (en) * 2004-07-22 2006-01-26 Atlantic City Coin & Slot Service Company, Inc Gaming device utilizing player image
JP4433948B2 (ja) * 2004-09-02 2010-03-17 株式会社セガ 背景画像取得プログラム、ビデオゲーム装置、背景画像取得方法、および、プログラムを記録したコンピュータ読み取り可能な記録媒体
JP4419768B2 (ja) * 2004-09-21 2010-02-24 日本ビクター株式会社 電子機器の制御装置
JP4717445B2 (ja) * 2005-01-06 2011-07-06 株式会社バンダイナムコゲームス 画像処理システム、画像処理装置、ゲーム装置、プログラム、情報記憶媒体および画像処理方法
CN100412908C (zh) * 2005-03-07 2008-08-20 腾讯科技(深圳)有限公司 一种多个动画文件的合并显示方法
WO2006098255A1 (ja) * 2005-03-15 2006-09-21 Shunsuke Nakamura 画像表示方法およびその装置
JP4583981B2 (ja) * 2005-03-16 2010-11-17 株式会社リコー 画像処理装置
US7679689B2 (en) 2005-05-16 2010-03-16 Victor Company Of Japan, Limited Electronic appliance
JP4861699B2 (ja) * 2005-06-29 2012-01-25 株式会社コナミデジタルエンタテインメント ネットワークゲームシステム、ネットワークゲームシステムの制御方法、ゲーム装置、ゲーム装置の制御方法及びプログラム
JP2007072564A (ja) * 2005-09-05 2007-03-22 Sony Computer Entertainment Inc マルチメディア再生装置、メニュー操作受付方法およびコンピュータプログラム
JP2007087100A (ja) * 2005-09-22 2007-04-05 Victor Co Of Japan Ltd 電子機器システム
US7877387B2 (en) 2005-09-30 2011-01-25 Strands, Inc. Systems and methods for promotional media item selection and promotional program unit generation
US20070109600A1 (en) * 2005-11-15 2007-05-17 Lexmark International, Inc. Printer optimization method and system
US8549442B2 (en) * 2005-12-12 2013-10-01 Sony Computer Entertainment Inc. Voice and video control of interactive electronically simulated environment
JP4569555B2 (ja) * 2005-12-14 2010-10-27 日本ビクター株式会社 電子機器
JP2007272067A (ja) * 2006-03-31 2007-10-18 Brother Ind Ltd 画像表示装置
JP4742976B2 (ja) * 2006-05-12 2011-08-10 富士ゼロックス株式会社 遠隔指示システム、遠隔指示方法及びプログラム
GB2438449C (en) * 2006-05-24 2018-05-30 Sony Computer Entertainment Europe Ltd Control of data processing
KR100801087B1 (ko) * 2006-07-05 2008-02-11 삼성전자주식회사 스트럭처드 라이트를 이용한 이동체 감지 시스템 및 방법,상기 시스템을 포함하는 이동 로봇
JP4707034B2 (ja) 2006-07-07 2011-06-22 株式会社ソニー・コンピュータエンタテインメント 画像処理方法、入力インタフェース装置
JP4689548B2 (ja) * 2006-07-19 2011-05-25 株式会社ソニー・コンピュータエンタテインメント 画像処理装置、画像処理方法、記録媒体、コンピュータプログラム、半導体デバイス
JP4650381B2 (ja) * 2006-09-08 2011-03-16 日本ビクター株式会社 電子機器
US8144121B2 (en) * 2006-10-11 2012-03-27 Victor Company Of Japan, Limited Method and apparatus for controlling electronic appliance
JP2008146243A (ja) * 2006-12-07 2008-06-26 Toshiba Corp 情報処理装置、情報処理方法、及びプログラム
JP4720738B2 (ja) * 2006-12-20 2011-07-13 日本ビクター株式会社 電子機器
GB2438475A (en) 2007-03-07 2007-11-28 Cvon Innovations Ltd A method for ranking search results
KR20080088802A (ko) * 2007-03-30 2008-10-06 삼성전자주식회사 디스플레이 상에서 포인터 이동속도가 가변적인 gui제공방법 및 이를 적용한 영상기기
GB2441399B (en) 2007-04-03 2009-02-18 Cvon Innovations Ltd Network invitation arrangement and method
US8671000B2 (en) 2007-04-24 2014-03-11 Apple Inc. Method and arrangement for providing content to multimedia devices
KR101328950B1 (ko) 2007-04-24 2013-11-13 엘지전자 주식회사 화상 디스플레이 방법 및 이를 구현할 수 있는 화상통신용단말기
US8726194B2 (en) * 2007-07-27 2014-05-13 Qualcomm Incorporated Item selection using enhanced control
JP4415198B2 (ja) * 2007-08-30 2010-02-17 カシオ計算機株式会社 画像合成装置及びプログラム
US8325214B2 (en) 2007-09-24 2012-12-04 Qualcomm Incorporated Enhanced interface for voice and video communications
US20110199635A1 (en) * 2008-02-08 2011-08-18 I-Jong Lin Printing Method Using Multiple Processors
JP5116514B2 (ja) * 2008-03-11 2013-01-09 キヤノン株式会社 撮像装置および表示制御方法
US8073203B2 (en) * 2008-04-15 2011-12-06 Cyberlink Corp. Generating effects in a webcam application
JP2009265709A (ja) * 2008-04-22 2009-11-12 Hitachi Ltd 入力装置
US8514251B2 (en) * 2008-06-23 2013-08-20 Qualcomm Incorporated Enhanced character input using recognized gestures
US8133119B2 (en) * 2008-10-01 2012-03-13 Microsoft Corporation Adaptation for alternate gaming input devices
KR20100039017A (ko) * 2008-10-07 2010-04-15 한국전자통신연구원 메뉴 마크업 언어를 이용한 원격 제어 장치
US20100091085A1 (en) * 2008-10-15 2010-04-15 Sony Corporation And Sony Electronics Inc. Augmenting tv menu icon with images in front of tv
JP2010142592A (ja) * 2008-12-22 2010-07-01 Nintendo Co Ltd ゲームプログラムおよびゲーム装置
US8866821B2 (en) * 2009-01-30 2014-10-21 Microsoft Corporation Depth map movement tracking via optical flow and velocity prediction
US9652030B2 (en) * 2009-01-30 2017-05-16 Microsoft Technology Licensing, Llc Navigation of a virtual plane using a zone of restriction for canceling noise
JP2010176510A (ja) * 2009-01-30 2010-08-12 Sanyo Electric Co Ltd 情報表示装置
US8294767B2 (en) 2009-01-30 2012-10-23 Microsoft Corporation Body scan
US8295546B2 (en) 2009-01-30 2012-10-23 Microsoft Corporation Pose tracking pipeline
US8732623B2 (en) * 2009-02-17 2014-05-20 Microsoft Corporation Web cam based user interaction
JP5635736B2 (ja) * 2009-02-19 2014-12-03 株式会社ソニー・コンピュータエンタテインメント 情報処理装置および情報処理方法
JP4767331B2 (ja) * 2009-03-10 2011-09-07 株式会社ソニー・コンピュータエンタテインメント 画像処理装置、画像処理方法、記録媒体、コンピュータプログラム、半導体デバイス
US8773355B2 (en) * 2009-03-16 2014-07-08 Microsoft Corporation Adaptive cursor sizing
US9256282B2 (en) 2009-03-20 2016-02-09 Microsoft Technology Licensing, Llc Virtual object manipulation
US8988437B2 (en) 2009-03-20 2015-03-24 Microsoft Technology Licensing, Llc Chaining animations
US8194101B1 (en) * 2009-04-01 2012-06-05 Microsoft Corporation Dynamic perspective video window
US8314832B2 (en) * 2009-04-01 2012-11-20 Microsoft Corporation Systems and methods for generating stereoscopic images
US9898675B2 (en) 2009-05-01 2018-02-20 Microsoft Technology Licensing, Llc User movement tracking feedback to improve tracking
US9498718B2 (en) * 2009-05-01 2016-11-22 Microsoft Technology Licensing, Llc Altering a view perspective within a display environment
US8649554B2 (en) 2009-05-01 2014-02-11 Microsoft Corporation Method to control perspective for a camera-controlled computer
US20100277470A1 (en) * 2009-05-01 2010-11-04 Microsoft Corporation Systems And Methods For Applying Model Tracking To Motion Capture
US8253746B2 (en) * 2009-05-01 2012-08-28 Microsoft Corporation Determine intended motions
US8942428B2 (en) 2009-05-01 2015-01-27 Microsoft Corporation Isolate extraneous motions
US8503720B2 (en) 2009-05-01 2013-08-06 Microsoft Corporation Human body pose estimation
US8181123B2 (en) * 2009-05-01 2012-05-15 Microsoft Corporation Managing virtual port associations to users in a gesture-based computing environment
US9015638B2 (en) * 2009-05-01 2015-04-21 Microsoft Technology Licensing, Llc Binding users to a gesture based system and providing feedback to the users
US9377857B2 (en) * 2009-05-01 2016-06-28 Microsoft Technology Licensing, Llc Show body position
US8638985B2 (en) 2009-05-01 2014-01-28 Microsoft Corporation Human body pose estimation
US8340432B2 (en) 2009-05-01 2012-12-25 Microsoft Corporation Systems and methods for detecting a tilt angle from a depth image
US20100295771A1 (en) * 2009-05-20 2010-11-25 Microsoft Corporation Control of display objects
US20100295782A1 (en) 2009-05-21 2010-11-25 Yehuda Binder System and method for control based on face ore hand gesture detection
EP2256590A1 (en) * 2009-05-26 2010-12-01 Topspeed Technology Corp. Method for controlling gesture-based remote control system
US8112719B2 (en) * 2009-05-26 2012-02-07 Topseed Technology Corp. Method for controlling gesture-based remote control system
JP2010277197A (ja) * 2009-05-26 2010-12-09 Sony Corp 情報処理装置、情報処理方法およびプログラム
US8744121B2 (en) 2009-05-29 2014-06-03 Microsoft Corporation Device for identifying and tracking multiple humans over time
US8542252B2 (en) 2009-05-29 2013-09-24 Microsoft Corporation Target digitization, extraction, and tracking
US20100306716A1 (en) * 2009-05-29 2010-12-02 Microsoft Corporation Extending standard gestures
US8145594B2 (en) 2009-05-29 2012-03-27 Microsoft Corporation Localized gesture aggregation
US8320619B2 (en) * 2009-05-29 2012-11-27 Microsoft Corporation Systems and methods for tracking a model
US9182814B2 (en) * 2009-05-29 2015-11-10 Microsoft Technology Licensing, Llc Systems and methods for estimating a non-visible or occluded body part
US8418085B2 (en) * 2009-05-29 2013-04-09 Microsoft Corporation Gesture coach
US8379101B2 (en) * 2009-05-29 2013-02-19 Microsoft Corporation Environment and/or target segmentation
US20100302365A1 (en) * 2009-05-29 2010-12-02 Microsoft Corporation Depth Image Noise Reduction
US8509479B2 (en) 2009-05-29 2013-08-13 Microsoft Corporation Virtual object
US20100302138A1 (en) * 2009-05-29 2010-12-02 Microsoft Corporation Methods and systems for defining or modifying a visual representation
US20100306685A1 (en) * 2009-05-29 2010-12-02 Microsoft Corporation User movement feedback via on-screen avatars
US8803889B2 (en) 2009-05-29 2014-08-12 Microsoft Corporation Systems and methods for applying animations or motions to a character
US9383823B2 (en) 2009-05-29 2016-07-05 Microsoft Technology Licensing, Llc Combining gestures beyond skeletal
US9400559B2 (en) 2009-05-29 2016-07-26 Microsoft Technology Licensing, Llc Gesture shortcuts
US8856691B2 (en) * 2009-05-29 2014-10-07 Microsoft Corporation Gesture tool
US8176442B2 (en) * 2009-05-29 2012-05-08 Microsoft Corporation Living cursor control mechanics
US8625837B2 (en) 2009-05-29 2014-01-07 Microsoft Corporation Protocol and format for communicating an image from a camera to a computing environment
US7914344B2 (en) * 2009-06-03 2011-03-29 Microsoft Corporation Dual-barrel, connector jack and plug assemblies
US20110010497A1 (en) * 2009-07-09 2011-01-13 Sandisk Il Ltd. A storage device receiving commands and data regardless of a host
US8390680B2 (en) * 2009-07-09 2013-03-05 Microsoft Corporation Visual representation expression based on player expression
US9159151B2 (en) * 2009-07-13 2015-10-13 Microsoft Technology Licensing, Llc Bringing a visual representation to life via learned input from the user
GB2471905B (en) * 2009-07-17 2011-08-31 Sony Comp Entertainment Europe User interface and method of user interaction
JP2010003303A (ja) * 2009-07-21 2010-01-07 Victor Co Of Japan Ltd 電子機器の制御装置
US8847984B2 (en) * 2009-07-27 2014-09-30 Disney Enterprises, Inc. System and method for forming a composite image in a portable computing device having a dual screen display
US20110025689A1 (en) * 2009-07-29 2011-02-03 Microsoft Corporation Auto-Generating A Visual Representation
US9141193B2 (en) * 2009-08-31 2015-09-22 Microsoft Technology Licensing, Llc Techniques for using human gestures to control gesture unaware programs
JP5343773B2 (ja) * 2009-09-04 2013-11-13 ソニー株式会社 情報処理装置、表示制御方法及び表示制御プログラム
US9633476B1 (en) * 2009-10-29 2017-04-25 Intuit Inc. Method and apparatus for using augmented reality for business graphics
US20110109617A1 (en) * 2009-11-12 2011-05-12 Microsoft Corporation Visualizing Depth
US9146669B2 (en) * 2009-12-29 2015-09-29 Bizmodeline Co., Ltd. Password processing method and apparatus
JP5659510B2 (ja) * 2010-03-10 2015-01-28 ソニー株式会社 画像処理装置、画像処理方法及びプログラム
SG184183A1 (en) * 2010-03-19 2012-10-30 Xyz Wave Pte Ltd An apparatus for enabling control of content on a display device using at least one gesture, consequent methods enabled by the apparatus and applications of the apparatus
JP4794678B1 (ja) * 2010-05-24 2011-10-19 株式会社ソニー・コンピュータエンタテインメント 映像処理装置、映像処理方法、および映像通信システム
US9367847B2 (en) 2010-05-28 2016-06-14 Apple Inc. Presenting content packages based on audience retargeting
EP2400379A1 (en) * 2010-06-23 2011-12-28 MFA Informatik AG Graphical control of a computer by a user
EP2421251A1 (en) * 2010-08-17 2012-02-22 LG Electronics Display device and control method thereof
JP5327211B2 (ja) 2010-12-28 2013-10-30 カシオ計算機株式会社 撮像装置、撮像制御方法及びプログラム
US8942917B2 (en) 2011-02-14 2015-01-27 Microsoft Corporation Change invariant scene recognition by an agent
CN102645970B (zh) 2011-02-22 2015-10-28 鸿富锦精密工业(深圳)有限公司 移动向量触发控制方法及使用其的电子装置
ES2693060T3 (es) * 2011-03-17 2018-12-07 Ssi Schäfer Automation Gmbh Control y supervisión de una instalación de almacén y preparación de pedidos mediante movimiento y voz
JP5585505B2 (ja) * 2011-03-17 2014-09-10 セイコーエプソン株式会社 画像供給装置、画像表示システム、画像供給装置の制御方法、画像表示装置、及び、プログラム
US8928589B2 (en) * 2011-04-20 2015-01-06 Qualcomm Incorporated Virtual keyboards and methods of providing the same
US8873841B2 (en) * 2011-04-21 2014-10-28 Nokia Corporation Methods and apparatuses for facilitating gesture recognition
US8620113B2 (en) 2011-04-25 2013-12-31 Microsoft Corporation Laser diode modes
EP2703949B1 (en) 2011-04-28 2017-10-25 NEC Solution Innovators, Ltd. Information processing device, information processing method, and recording medium
KR101514169B1 (ko) 2011-04-28 2015-04-21 엔이씨 솔루션 이노베이터 가부시키가이샤 정보 처리 장치, 정보 처리 방법 및 기록 매체
US8760395B2 (en) 2011-05-31 2014-06-24 Microsoft Corporation Gesture recognition techniques
US9727132B2 (en) * 2011-07-01 2017-08-08 Microsoft Technology Licensing, Llc Multi-visor: managing applications in augmented reality environments
GB2493906A (en) * 2011-08-15 2013-02-27 Moheb Milad Superimposed images for revealing changes in the settings of an analogue control console
JP2013080413A (ja) * 2011-10-05 2013-05-02 Sony Corp 入力装置、入力認識方法
US8635637B2 (en) 2011-12-02 2014-01-21 Microsoft Corporation User interface presenting an animated avatar performing a media reaction
US9100685B2 (en) 2011-12-09 2015-08-04 Microsoft Technology Licensing, Llc Determining audience state or interest using passive sensor data
US9043766B2 (en) * 2011-12-16 2015-05-26 Facebook, Inc. Language translation using preprocessor macros
KR101410410B1 (ko) * 2011-12-21 2014-06-27 주식회사 케이티 체감형 학습 장치 및 방법
JP5567606B2 (ja) * 2012-01-31 2014-08-06 東芝テック株式会社 情報処理装置及びプログラム
US8898687B2 (en) 2012-04-04 2014-11-25 Microsoft Corporation Controlling a media program based on a media reaction
CA2775700C (en) 2012-05-04 2013-07-23 Microsoft Corporation Determining a future portion of a currently presented media program
GB2501925B (en) * 2012-05-11 2015-04-29 Sony Comp Entertainment Europe Method and system for augmented reality
JP5507773B1 (ja) 2012-07-13 2014-05-28 太郎 諌山 要素選択装置、要素選択方法、および、プログラム
TWI488069B (zh) * 2012-10-08 2015-06-11 Qisda Corp 光學繪圖方法
TWI455044B (zh) * 2012-10-31 2014-10-01 Hwa Hsia Inst Of Technology 應用影像辨識之反應訓練系統及方法
JP5689103B2 (ja) * 2012-11-07 2015-03-25 任天堂株式会社 ゲームプログラム、ゲームシステム、ゲーム装置、およびゲーム制御方法
JPWO2014103732A1 (ja) * 2012-12-26 2017-01-12 ソニー株式会社 画像処理装置および画像処理方法、並びにプログラム
US9857470B2 (en) 2012-12-28 2018-01-02 Microsoft Technology Licensing, Llc Using photometric stereo for 3D environment modeling
JP6048189B2 (ja) * 2013-02-08 2016-12-21 株式会社リコー 投影システム、画像生成プログラム、情報処理装置及び画像生成方法
US9940553B2 (en) 2013-02-22 2018-04-10 Microsoft Technology Licensing, Llc Camera/object pose from predicted coordinates
EP3007786A1 (en) 2013-06-14 2016-04-20 Intercontinental Great Brands LLC Interactive video games
CN103428551A (zh) * 2013-08-24 2013-12-04 渭南高新区金石为开咨询有限公司 一种手势遥控系统
US9609236B2 (en) 2013-09-16 2017-03-28 Kyle L. Baltz Camera and image processing method
US9990034B2 (en) * 2013-11-15 2018-06-05 Lg Electronics Inc. Transparent display device and control method therefor
KR20150110032A (ko) * 2014-03-24 2015-10-02 삼성전자주식회사 영상데이터 처리 전자장치 및 방법
JP5979450B2 (ja) * 2014-07-28 2016-08-24 株式会社クラス・マイスター ゲーム装置の制御プログラム
US9977565B2 (en) 2015-02-09 2018-05-22 Leapfrog Enterprises, Inc. Interactive educational system with light emitting controller
CN104680477A (zh) * 2015-03-04 2015-06-03 江西科技学院 一种图像镜像算法
CN106022887A (zh) * 2016-05-26 2016-10-12 江阴迈德机械有限公司 一种仿真穿戴试镜
CN106057171B (zh) * 2016-07-21 2019-05-24 Oppo广东移动通信有限公司 控制方法及控制装置
US11003264B2 (en) * 2016-09-07 2021-05-11 Chui Woo Lee Device, method and program for generating multidimensional reaction-type image, and method and program for reproducing multidimensional reaction-type image
US11360506B2 (en) 2017-07-06 2022-06-14 Hewlett-Packard Development Company, L.P. Mounting assemblies for peripheral modules
JP7305401B2 (ja) * 2018-09-06 2023-07-10 キヤノン株式会社 画像処理装置、画像処理装置の作動方法、及びプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06153017A (ja) * 1992-11-02 1994-05-31 Sanyo Electric Co Ltd 機器の遠隔制御装置
JPH07281666A (ja) * 1994-04-05 1995-10-27 Casio Comput Co Ltd 画像制御装置
US5594469A (en) * 1995-02-21 1997-01-14 Mitsubishi Electric Information Technology Center America Inc. Hand gesture machine control system
US5732227A (en) * 1994-07-05 1998-03-24 Hitachi, Ltd. Interactive information processing system responsive to user manipulation of physical objects and displayed images

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01315884A (ja) * 1988-06-16 1989-12-20 Sony Corp パターン追跡方法
US5261041A (en) * 1990-12-28 1993-11-09 Apple Computer, Inc. Computer controlled animation system based on definitional animated objects and methods of manipulating same
JPH06102993A (ja) * 1992-09-22 1994-04-15 Nippon Telegr & Teleph Corp <Ntt> 指示入力装置
US5936610A (en) * 1993-07-27 1999-08-10 Canon Kabushiki Kaisha Control device for image input apparatus
JP3419050B2 (ja) * 1993-11-19 2003-06-23 株式会社日立製作所 入力装置
JPH07155467A (ja) * 1993-12-02 1995-06-20 Sega Enterp Ltd 遊戯者の画像入力を有するビデオゲーム装置
JPH086708A (ja) * 1994-04-22 1996-01-12 Canon Inc 表示装置
JPH09128141A (ja) * 1995-11-07 1997-05-16 Sony Corp 制御装置および制御方法
JPH09265538A (ja) * 1996-03-29 1997-10-07 Matsushita Electric Works Ltd 自動追尾装置
KR19990011180A (ko) * 1997-07-22 1999-02-18 구자홍 화상인식을 이용한 메뉴 선택 방법
US6072494A (en) * 1997-10-15 2000-06-06 Electric Planet, Inc. Method and apparatus for real-time gesture recognition
JP3209178B2 (ja) * 1998-03-30 2001-09-17 日本電気株式会社 マウスおよびマウスを用いる情報処理装置
US6088018A (en) * 1998-06-11 2000-07-11 Intel Corporation Method of using video reflection in providing input data to a computer system
KR100553671B1 (ko) * 1998-06-27 2006-05-10 삼성전자주식회사 컴퓨터 시스템의 포인팅 장치 구동 방법
US6392675B1 (en) * 1999-02-24 2002-05-21 International Business Machines Corporation Variable speed cursor movement

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06153017A (ja) * 1992-11-02 1994-05-31 Sanyo Electric Co Ltd 機器の遠隔制御装置
JPH07281666A (ja) * 1994-04-05 1995-10-27 Casio Comput Co Ltd 画像制御装置
US5732227A (en) * 1994-07-05 1998-03-24 Hitachi, Ltd. Interactive information processing system responsive to user manipulation of physical objects and displayed images
US5594469A (en) * 1995-02-21 1997-01-14 Mitsubishi Electric Information Technology Center America Inc. Hand gesture machine control system

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP1324269A4 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022525954A (ja) * 2019-03-18 2022-05-20 グーグル エルエルシー ゲームストリームのフレーム間のディスパリティのためのフレームオーバーレイ
JP2024038339A (ja) * 2019-03-18 2024-03-19 グーグル エルエルシー ゲームストリームのフレーム間のディスパリティのためのフレームオーバーレイ
JP7458411B2 (ja) 2019-03-18 2024-03-29 グーグル エルエルシー ゲームストリームのフレーム間のディスパリティのためのフレームオーバーレイ
JP7731452B2 (ja) 2019-03-18 2025-08-29 グーグル エルエルシー ゲームストリームのフレーム間のディスパリティのためのフレームオーバーレイ

Also Published As

Publication number Publication date
CA2392725A1 (en) 2002-04-18
JP3725460B2 (ja) 2005-12-14
KR100845390B1 (ko) 2008-07-09
CN1393003A (zh) 2003-01-22
JP2002196855A (ja) 2002-07-12
EP1324269A4 (en) 2006-02-08
US20070013718A1 (en) 2007-01-18
US7176945B2 (en) 2007-02-13
US20020097247A1 (en) 2002-07-25
EP1324269A1 (en) 2003-07-02
BR0107310A (pt) 2002-08-27
EP1324269B1 (en) 2017-01-25
KR20020059844A (ko) 2002-07-13
US20040233224A1 (en) 2004-11-25
TWI231445B (en) 2005-04-21
CN1279761C (zh) 2006-10-11
US6771277B2 (en) 2004-08-03
MXPA02005288A (es) 2002-12-11
AU9418701A (en) 2002-04-22

Similar Documents

Publication Publication Date Title
JP3725460B2 (ja) 画像処理装置、画像処理方法、記録媒体、コンピュータプログラム、半導体デバイス
JP3847753B2 (ja) 画像処理装置、画像処理方法、記録媒体、コンピュータプログラム、半導体デバイス
JP5275978B2 (ja) データ処理の制御
TWI469813B (zh) 在動作擷取系統中追踪使用者群組
US8860847B2 (en) Computer-readable storage medium having stored thereon image generation program, capturing apparatus, capturing system, and image generation method for creating an image
JP7127659B2 (ja) 情報処理装置、仮想・現実合成システム、学習済みモデルの生成方法、情報処理装置に実行させる方法、プログラム
JP2009237680A (ja) プログラム、情報記憶媒体および画像生成システム
JP6431259B2 (ja) カラオケ装置、ダンス採点方法、およびプログラム
JP2007293429A (ja) 画像閲覧装置、コンピュータの制御方法及びプログラム
WO2005065798A1 (ja) 情報処理システム、エンタテインメントシステム、および情報処理システムの入力受け付け方法
JP4615252B2 (ja) 画像処理装置、画像処理方法、記録媒体、コンピュータプログラム、半導体デバイス
JP7285045B2 (ja) 画像合成装置、画像合成方法及びプログラム
JP4689548B2 (ja) 画像処理装置、画像処理方法、記録媒体、コンピュータプログラム、半導体デバイス
JP4485991B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP3599185B2 (ja) 画像描画方法、画像描画装置、データ構造、記録媒体及びプログラム
JP7418107B2 (ja) 形状推定装置、形状推定方法及びプログラム
JP5265315B2 (ja) 画像表示装置、画像表示方法、プログラム及び情報記憶媒体
JP4767331B2 (ja) 画像処理装置、画像処理方法、記録媒体、コンピュータプログラム、半導体デバイス
JP2000020748A (ja) 情報加工方法および情報加工装置および記録媒体
JP2024154183A (ja) 情報処理装置、情報処理方法、及びプログラム
JP2010128584A (ja) 画像表示装置、画像表示方法、プログラム及び情報記憶媒体

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AU BR CA CN IN KR MX NZ RU SG

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): BE CH DE DK ES FI FR GB IT NL SE

WWE Wipo information: entry into national phase

Ref document number: 94187/01

Country of ref document: AU

WWE Wipo information: entry into national phase

Ref document number: IN/PCT/2002/00630/MU

Country of ref document: IN

WWE Wipo information: entry into national phase

Ref document number: 519056

Country of ref document: NZ

REEP Request for entry into the european phase

Ref document number: 2001974693

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 2001974693

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 2392725

Country of ref document: CA

WWE Wipo information: entry into national phase

Ref document number: PA/a/2002/005288

Country of ref document: MX

WWE Wipo information: entry into national phase

Ref document number: 1020027007197

Country of ref document: KR

WWE Wipo information: entry into national phase

Ref document number: 018030432

Country of ref document: CN

WWP Wipo information: published in national office

Ref document number: 1020027007197

Country of ref document: KR

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWP Wipo information: published in national office

Ref document number: 2001974693

Country of ref document: EP