WO2011083732A1 - Information processing system - Google Patents
Information processing system Download PDFInfo
- Publication number
- WO2011083732A1 WO2011083732A1 PCT/JP2010/073746 JP2010073746W WO2011083732A1 WO 2011083732 A1 WO2011083732 A1 WO 2011083732A1 JP 2010073746 W JP2010073746 W JP 2010073746W WO 2011083732 A1 WO2011083732 A1 WO 2011083732A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- information
- user
- information processing
- processing system
- mdb
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/43—Querying
- G06F16/432—Query formulation
- G06F16/434—Query formulation using image data, e.g. images, photos, pictures taken by a user
Definitions
- the present invention relates generally to an information processing system, and more particularly to an information processing system that performs evaluation based on the number of reference links to a database.
- Information retrieval technology has advanced as the number of viewers and the amount of information on the network increase with the spread of the Internet in recent years. For example, there are a number of portal sites that can use powerful search engines. In addition, a technology has also been developed that analyzes the search keywords and access history of readers, and delivers Web pages and advertisements that meet the preferences of the readers, and marketing based on the keywords used by readers will also be conducted.
- the information providing apparatus stores access frequency information representing access frequency information indicating the frequency of access to each content by the user in association with user identification information identifying the user, and access tendency to content among the users
- the inter-user similarity calculation means for calculating the inter-user similarity representing the similarity between the users based on the access frequency information stored in the access history storage means, and the inter-user similarity between the user and each user
- Content score calculating means for calculating a content score which is information indicating the usefulness of the content for the user from the access frequency information of each user weighted by the content score calculating means, and the content score calculated by the content score calculating means
- Content score is associated with the user identification information Storing index storage means, query input means for receiving an input of a query including user identification information transmitted from the communication terminal device, and acquiring content identification information of content conforming to the query received by the query input means
- a provision information generation unit that generates provision information from the acquired content identification information by referring to
- This search server includes a blog article collecting means for collecting blog articles, a period determining means for determining a target period for displaying the appearance frequency of a search keyword according to information received from a client, and a section for each section determined from the target period.
- the appearance frequency of the search keyword is counted for the blog article updated in the above, and the appearance frequency counting means for generating time series information of appearance frequency, the peak interval detection means for detecting the peak interval of the appearance frequency, and the peak interval
- the related keyword extraction means for extracting the related keyword of the search keyword from the blog article updated in 4 and the graph information generation means for generating the graph information which graphed the time-series information and transmitting it to the client A related keyword is displayed as a label of the peak section.
- This advertisement delivery system refers to the user profile of the user corresponding to the user terminal from among a plurality of advertisement data stored in advance. Then, the advertisement data to be distributed to the user terminal is extracted based on the user profile by reference. Next, the present invention is characterized in that the extracted advertisement data is distributed to the user terminal via the network to display an advertisement.
- the tabulation of reference history and access history in the conventional system is only to total the access to the entire page in units of the location (URL etc.) of the web page, and for example, to any part of the web page It was not possible to collect attention information that led to details, such as whether the viewer was interested.
- text processing is mainly performed, such as counting the frequency of use of keywords and calculating the degree of association between keywords.
- technology to improve the delivery efficiency of advertisements is also limited to analysis and analysis of profile information such as user's gender, age group, preferences, and areas of interest to extract and deliver highly relevant advertisements. An analysis of an object that the viewer specifically (or not) focused on is desired.
- an object of the present invention is to provide an information processing system that analyzes a specific object (the object) focused by a viewer and distributes information, advertisements, and the like related to the object of interest. .
- a plurality of objects for which a specific object is recognized in response to an image search request from a user based on a mother database (MDB) reconstructed from a database for constructing the object The search request from the user is evaluated according to the scene, and it is possible to sequentially provide the user who made the image search request with the advertisement and / or service related to the target object according to the degree of attention.
- MDB mother database
- the information processing system makes it possible to provide statistical data generated from the degree of attention to a plurality of objects to a user and / or a third party.
- the information processing system when there is an unregistered specific object recognition request in a mother database (MDB) reconstructed from a database for forming an object, a plurality of users and If an unknown object discovery notification (attention) is given to three parties, and if it is possible to distinguish an object based on the collective intelligence from the user and the information provided by the third party, the detailed database pertaining to the object will be MDB After registration, a plurality of users and third parties are notified that the unknown object has been identified, and advertisements and / or services relating to the target object can be sequentially provided to the user.
- MDB mother database
- the information processing system enables the user to change the attribute of a part of the object according to the user's preference using the MDB of the object for which the specific object is recognized, and the user's preference or request To provide to third parties as marketing information.
- the information processing system preliminarily registers, in the MDB, an object which is likely to be put into the market in advance, and can promptly respond to an image search request from a future user.
- the degree of attention is evaluated based on the transition history information, and the evaluation is performed based on the evaluation.
- Statistical data can be provided to third parties as marketing information.
- the following effects can be obtained.
- (1) With regard to an object focused by a viewer in a specific image (including still images and moving images, the same applies hereinafter), it is useful for the viewer based on the degree of attention (frequency and / or attention rank) of the object It is possible to realize an information processing system that provides additional information.
- (2) It is possible to realize an information processing system which additionally displays a display such as an advertisement and / or a service related to the target object based on the degree of attention of an object which the viewer focuses on in a specific image scene.
- (3) It is possible to provide an information processing system that performs marketing based on the transition of the degree of attention of the viewer with respect to an individual object in a specific scene such as an image.
- MDB mother database
- ADB in one embodiment of an information processing system concerning the present invention. It is explanatory drawing explaining the example of analysis of the view object in the scene in the other embodiment of the information processing system concerning the present invention (example of generation of marketing data). It is an explanatory view explaining an operation flow in one embodiment of an information processing system concerning the present invention. It is an explanatory view explaining an operation flow in one embodiment of an information processing system concerning the present invention. It is an explanatory view explaining an operation flow in one embodiment of an information processing system concerning the present invention. It is an explanatory view explaining an operation flow in one embodiment of an information processing system concerning the present invention. It is an explanatory view explaining an operation flow in one embodiment of an information processing system concerning the present invention. It is an explanatory view explaining an operation flow in one embodiment of an information processing system concerning the present invention. It is an explanatory view explaining an operation flow in one embodiment of an information processing system concerning the present invention.
- FIG. 1 shows a system configuration of an information processing system according to an embodiment of the present invention.
- the information processing system 100 includes an information processing server 101, an MDB 102, and terminal devices 105a to 105d used by a user.
- the server 101 and the MDB 102 are connected by a connection 103, and the server 101 and the terminal device group 105 are networks It is connected to 104.
- the server in the present specification is a computer system that provides some service in response to a request from a client, means a computer group in which a plurality of server systems are coupled, and is driven by a plurality of software.
- the meaning of the server is positioned as described above.
- the computer as hardware is, in its most basic configuration, an electronic computer provided with an arithmetic logic unit, a control unit, a storage device, and an input / output device connected by an instruction bus and a data bus. Arithmetic operation, logical operation, comparison operation, shift operation, etc. are executed in the arithmetic logic unit based on information (bit data) input from the input / output device via the input / output interface. The executed data is stored in the storage device as needed and output from the input / output device. The series of processes are controlled by a software program stored in a storage device.
- Each server machine in the present invention is also hardware that is minimally equipped with the above-described basic functions as a computer, and is controlled by programs such as an operating system, device drivers, and application software.
- FIG. 2 shows functional blocks of the information processing server 101 and the MDB 102 in an embodiment of the information processing system according to the present invention.
- the information processing server 101 includes, as software functional blocks, an area processing unit 201, a general object recognition unit 202, a specific object recognition unit 203, a network communication control unit 204, a data search processing unit 205, and an MDB search unit 206. And an MDB learning unit 207, an MDB management unit 208, a scene processing unit 210, a marketing information generation unit 211, and a focus point processing unit 212.
- the functional blocks of the information processing server 101 are not necessarily limited to these, but these representative functions will be briefly described.
- the area processing unit 201 performs area division in the image, cutting out of partial images, and the like.
- the general object recognition unit 202 recognizes an object included in an image with a general name (category). Further, the object recognition unit 203 collates the information registered in the MDB 102 to identify an object.
- a network communication control unit 204 performs image input / output processing, information communication control with a terminal, and the like.
- the data search processing unit 205 collects information from the link destination, performs an inquiry of collective intelligence, collection, and a search.
- the MDB search unit 206 searches for tag data such as the name of an object.
- the MDB learning unit 207 performs addition of detailed information on an object, registration of time information, registration, addition, and the like of incidental information.
- the MDB management unit 208 extracts feature points and feature amounts from object configuration data, extracts category information from incidental information, registers in category data, extends, divides, updates, integrates, and corrects category classification in category data. Register new categories,
- the scene processing unit 210 performs processing to recognize the same scene in a still image or a moving image
- the marketing information generation unit 211 which will be described later, is a database (DB) structure (attention database extracted from the degree of attention to a specific object : Generate marketing information based on the information of ADB).
- the focus point processing unit 212 performs specific object recognition based on the MDB 102, processes a reference to a target object, etc., and stores the totaled result in the ADB 2101.
- the MDB 102 includes object configuration data 251, incidental information data 252, feature amount data 253, category data 254, and nonspecific object data 255. Although the MDB 102 is not necessarily limited to these, these representative functions will be briefly described.
- the object configuration data 251 is a database for configuring an object, and configures or manufactures an object, such as structure, shape, dimensions of the object, connection information of parts, layout drawing, movable part, movable range, weight, rigidity, etc. Holds basic information necessary for
- the additional information data 252 holds all the information on the object such as the name of the object, the manufacturer, the part number, the date and time, the material, the composition, and the processing information.
- the feature amount data 253 holds feature points and feature amount information of individual objects generated based on the above information.
- the category data 254 holds information used when performing category classification of an object in the general object recognition unit.
- the unspecified number data 255 stores an object not recognized by the specific object recognition unit. If a specific object is recognized by the evolution of MDB, it is removed.
- FIG. 3 shows a terminal device in an embodiment of the information processing system according to the present invention.
- the terminal devices 105a to 105d are client terminal devices widely used by users, and include computers, personal digital assistants (PDAs), cellular phones, and the like. That is, the terminal devices 105a to 105d represent a state in which many kinds of electronic information devices are connected to the network.
- PDAs personal digital assistants
- the terminal devices 105a to 105d represent a state in which many kinds of electronic information devices are connected to the network.
- the terminal device 105 when the terminal device 105 is described, one of the terminal devices 105a to 105d connected to the network is referred to.
- the terminal devices 105a to 105d do not have to be all the same model. It may be a terminal device provided with equivalent functions (or minimum functions that can be performed).
- typical functional blocks of the terminal device 105 will be described.
- the terminal devices 105a to 105d include an input / output unit 301, a network connection unit 302, a CPU 303, a storage unit 304, and a power supply unit 305.
- the input / output unit 301 is, for example, an input device such as a keyboard, a mouse, a pen, a jog dial, a joystick, a touch pad (including one incorporated in a display), a microphone for voice recognition, and an output such as a display, a speaker, or a vibrator Configured with devices.
- the network connection unit 302 is an interface for connecting to a network, and may be wired or wireless.
- the CPU 303 is a central processing unit
- the storage unit 304 is a storage device such as a hard disk and a memory
- the power supply unit 305 is a battery or the like.
- a sensor for detecting inclination or acceleration a GPS receiver, or the like can be mounted as needed.
- FIG. 4 shows a data flow in an embodiment of the information processing system according to the present invention.
- the user 401 browses the scene 402 using the terminal device 105, and the information processing server 101 is inquired about an object focused on the scene 402. This inquiry is made by pointing an object of interest in the scene 402 with a pointing device of the terminal device 105 (not shown).
- a frame group recording one continuous situation is the same scene.
- an aggregate of the plurality of moving images similarly constitutes the same scene.
- the scene is stored, for example, on a third party server (not shown) and can be viewed by a plurality of users. For example, the user can inquire of the object of interest to the information processing server 101 via the software according to the present invention incorporated in the terminal device 105.
- the information processing server 101 identifies an object detectable based on the MDB 102 from various still images and moving images existing on the network in advance, In response to the query for the object recognition request, the recognition result of the specific object in the scene 402 can be promptly returned to the user.
- the information processing server 101 tries to observe which object in the scene the user focused on by performing object recognition in response to an inquiry about a target object from the user for each scene.
- the third party 404 can provide the user with the outgoing information 405 from the advertiser and the service provider.
- the concept of the scene assumed in the present invention is a wide range. For example, assume a fashion show in which many models appear. When shooting this fashion show with multiple cameras from different angles, the stage stage constitutes one scene, and the images from each camera constitute one view. The scene in the present invention assumes not only the view at each camera but also the former scene.
- a scene assumed by the present invention is reconstructed from a plurality of contents created by the user's hand and called UCG (user-generated content) or CGC (consumer generated content), and uploaded to a server or shared site.
- UCG user-generated content
- CGC consumer generated content
- Ru still images and moving images of sports watching games uploaded from a user to a shared site can also constitute the same scene.
- the same scene is reconstructed from the video of the surveillance camera taken from a plurality of angles.
- the information processing server 101 in FIG. 4 performs a process of recognizing the same scene in a still image or a moving image, and recognizes a specific object based on the MDB 102 and processes a reference to a target object, etc.
- focused rank means a focused index by a plurality of users (for example, how many users focused on it, etc.)
- focused frequency means the frequency that a specific user focuses on the same specific object. Do.
- the information processing server 101 can also solve the unconfirmed object by inquiring of collective intelligence and third parties about the unconfirmed object for which the specific object could not be identified (FIG. 4).
- a third party can provide object configuration data such as CAD for the product of the third party as specific object information to the information processing server 101 in order to obtain more accurate marketing information (FIG. 4).
- the information processing server 101 can also provide the advertiser 405 or a third party 406 with the statistical data or the marketing information generated by the marketing information generation unit 211 (FIG. 4).
- FIG. 5 illustrates ADB, MDB and data flow of the marketing information generation unit in an embodiment of the information processing system according to the present invention.
- the data structure of a recognition object in each scene is managed in the ADB 2101 for each scene.
- the scene 1 in the scene 1 (501), specific objects 501a and 501b are recognized.
- category general name level of object
- specific object information name and type of specific product
- attention degree e.g., attention degree
- (4) attention object for each specific object Transition information is stored in a predetermined data structure.
- transition information can be used to generate statistical data based on transitions within categories, transitions between categories, as well as transitions along a time axis as described later.
- the information processing server 101 has a feature of grasping a scene and analyzing the degree of attention of a specific object in the scene.
- FIG. 6A is a specific example of a scene. As shown in the figure, in the scene 402, the Champs Elysees with the view of the Etoile Arc de Triomphe 601 seen at a distance is photographed, and on the Champs Elysees, an infinite number of cars are traveling.
- the scene 402 is shared by a plurality of users, and the user can designate an object of interest using a pointing device or the like of the terminal device 105 (not shown).
- the user can point to various objects in the scene 402, but for simplicity of explanation, the prevailal arch 601, the car 602 and the car 603 are taken as representative examples of the pointed objects, and the degree of attention obtained respectively is obtained Will be described based on FIG. 6B.
- FIG. 6B is a specific example of ADB.
- the scene 402 is a view assigned an ID of 402, and the type is photo. And, it constitutes one view of a scene (c1010) called "Chants elysée where Etoile Arc de Triomphe can be seen".
- another view 403 ID 403, type is a moving image (movie)) configuring the scene (c 1010) is registered.
- the upper table of FIG. 6B has the following data structure in one embodiment.
- the object 601 focused in the scene 402 is recognized as "Etoile Arc de Triomphe 601" by the recognition processing (Fig. 12 etc.) described later, the focused object 602 is recognized as “car type A (602)", and the focused object 603 is “car type B (603) "is recognized. Then, the link to the MDB of the recognized object and the degree of attention of the object are recorded.
- the attention degree of the Etoile Arc de Triomphe 601 is 3557
- the attention degree of the car type A (602) is 15, and the attention degree of the car type B (603) is 135.
- the calculation of the degree of attention is appropriately weighted as well as the number of times of reference by the user.
- the middle table of FIG. 6B has the following data structure in one embodiment.
- the table at the bottom of FIG. 6B shows a data structure for managing the focus time for each of the scene, view, and target object.
- the object 602 is focused on January 5, 2010 at 13:23:45 in the view 402 of the scene C 1010, and a link to the object 602 is established. It can be seen that this object is a car type A of a car (in FIG. 6B middle row).
- the lower table of FIG. 6B has the following data structure in one embodiment.
- FIG. 7A shows statistical information of a scene generated from the accumulation of the degree of attention of the user for each object, which is detected for each scene by the information processing system 100, and FIG. , 1 hour, 6 hours, 24 hours, 1 week, January, 3 months, half a year, 1 year, 10 years, etc.), and is statistical information generated from a change in the degree of attention for each object in each scene.
- the generation of these statistical information will be described in detail along with the underlying idea.
- the information processing system 100 identifies the object 1 (the car 1), and stores the information stored in the MDB (for example, manufacturer, model name, year, color, model (for example, 2 doors, 3 doors, hatchback) , One box, etc.), displacement, etc.) and / or options that can be identified (eg sunroof, roof rack, fog lights, wheels etc.), and links to the information in each MDB to the objects in the scene It records with an attention degree as a thing regarding the object 1 in ADB.
- the MDB for example, manufacturer, model name, year, color, model (for example, 2 doors, 3 doors, hatchback) , One box, etc.), displacement, etc.
- options eg sunroof, roof rack, fog lights, wheels etc.
- the user further performs specific object recognition of another object in the object 1 (car 1), for example, the wheel N, the information of MDB as the object N in the ADB of the scene (for example, the manufacturer name, etc.) Record links to model number, size, model year, retail price, material, etc.).
- the specific object recognition is similarly performed, and the detectable object information unique to the car is recorded as the ADB 2 of the object. Furthermore, even when the user gives an instruction to specify an object other than a car, the information is recorded in the ADB as focused information of each object.
- the information processing system 100 identifies a car as described above. As a result, if the car is already detected, the degree of attention of the object A in the registered ADB is updated. If it is a newly detected car, it is newly registered as an object 3 in the ADB. Furthermore, when the user instructs specific object recognition of the wheel N of the car, the degree of attention of the wheel N is similarly updated.
- the information processing system 100 can accumulate the degree of attention of each user for each object detected for each scene, and generate statistical information of the scene (FIG. 7A). ).
- the information processing system 100 takes a unit of a period (for example, 1 hour, 6 hours, 24 hours, 1 week, January, 3 months, half a year, 1 year, 10 years, etc.) It is possible to generate statistical information on the change in the degree of attention of the object in a unit of period related to the degree of attention of the object in each scene (FIG. 7B).
- the above generation example is an example, and various other marketing data can be extracted.
- the following data can be generated.
- Degree of attention in the category to which the object belongs for example, car
- data generation such as model name, model, color, year model, etc. of top N cars with high degree of attention of user in car X car in scene.
- Data generation such as the category, name, degree of attention, etc. of the high-ranked objects for each view in the scene
- FIG. 8 illustrates an operation flow (in particular, object recognition in a scene and generation flow of ADB) in an embodiment of the information processing system according to the present invention.
- the process proceeds to S802, and data such as an image is input.
- the data includes a plurality of images such as still images and moving images, and these data are arranged in time series.
- step S803 a scene is cut out from the input data. And it cuts out a view for each cut out scene.
- step S804 an object is cut out from the cut out view this time using a segmentation method or the like.
- step S805 recognition processing of a specific object (see FIG. 12 described later) is performed.
- step S806 it is determined whether there is an image capable of recognizing a specific object in the view. If YES, the process returns to step S805 to repeat the subsequent processing.
- FIG. 9 illustrates an operation flow (in particular, an ADB update and an object reference history registration flow) in an embodiment of the information processing system according to the present invention.
- S901 processing of a focused point instructed by the user using a pointing device or the like of the portable terminal 105 (not shown) is started.
- step S902 category recognition based on general object recognition and object identification processing based on specific object recognition are performed on an area (target object) specified by the user in a view in a scene.
- S903 it is determined whether or not the target object has been recognized. If it can not be recognized in S903 (No in S903), the processing is ended, but if it can be recognized (Yes in S903), the process proceeds to step S904.
- S904 it is determined whether the recognized object has already been recognized in the scene. Specifically, the object structure of interest is searched and investigated. If the object is a detected object (Yes in S904), the process proceeds to S906. On the other hand, if it is a newly detected object (No in S904), the process proceeds to S905.
- S905 registration processing of object information to ADB is performed. That is, since what is registered is a newly detected object, an object ID, a category, a link to an MDB are registered in the object structure of interest in FIG. 6B, and further, a scene ID, a link to a view ID, and an image type (Photo or video) is registered.
- the process proceeds to S 906, where the degree of attention of the ADB (FIG. 6B) regarding the object of interest is updated. Then, the process proceeds to S 907, the reference history regarding the object of interest is registered in the ADB (FIG. 6B) as a scene ID, view ID, time, and a link to the object, and the process for the object of interest ends (S 908).
- the attention degree rank of ADB is updated. This value makes it possible to estimate how many people are paying attention to the object.
- an advertisement and / or service appropriate for the user is selected from the attention level and transition information of the ADB. Then, the selected advertisement and / or service is presented to the user (S1009), and the process is ended (S1010).
- FIG. 11 shows an operation flow (generation of marketing information based on attention degree and information related to the object (for example, scene, transition, place, time, etc.) in one embodiment of the information processing system according to the present invention.
- the process proceeds to S1102, and the user focuses on a specific object. For example, the object is clicked with a mouse, or the object is surrounded.
- S1103 it is determined whether the object has already been recognized by the information processing system. If it is recognized (Yes in S1103), the object attention degree structure of the object is obtained (S1104). If not recognized (S1104), the process of FIG. 12 is executed to recognize the specific object (S1105).
- S1106 when the specific object is recognized in the process of FIG. 12, an ADB is generated and a link with the MDB is established.
- the attention degree rank of ADB is updated. This value indicates how many people pay attention to the object.
- marketing information is generated from the attention degree rank of the ADB, transition information, and information related to the object. Then, the selected marketing information is provided to the third party (S1109), and this step is ended (S1110).
- the start of the image recognition process starts with the input of an original image in the terminal device 105 or the clipping of a scene by the information processing server 101 (S1202).
- the original image may be a two-dimensional image or a three-dimensional image.
- an instruction of the target area of any object in the original image is made through a device (not shown) such as a pointing device, and the entire original image is input without processing an instruction of the target point.
- a method of BOF Bag-Of-Features
- recognition of the detected object category (general name of object) is performed.
- the process branches depending on whether the category can be recognized or not, and the determination is made in S1205. If the category can not be recognized, the process proceeds to S 1206, where it is judged about the handling of the existing category (S 1207), but if the category recognition of the object is possible regardless of the presence or absence of the instruction at the focus point The process advances to step S1209 to proceed to object recognition processing.
- step S1211 it is determined whether identification of a specific object has been achieved. If the specific object can be identified, the process advances to step S1213, and it is determined whether the individual object image extracted in step S1209 includes more detailed information than the detailed data of the object registered in the MDB 201. If YES in S1213, the process advances to S1214, the detailed data of the object in the MDB 201 is updated by the MDB learning unit, and more detailed information comes to be included. On the other hand, if it is determined No at S1213, the process proceeds to S1215, and the next determination is made.
- step S1215 it is determined that the general object can not be recognized in step S1205, and the process advances to steps S1208, S1209, and S1210 in the determination of step S1206, and is determined when the specific object is recognized (Yes in step S1211).
- the specified object is an existing category
- the definition of the existing category registered in the MDB 201 is expanded or divided if the information distance of the objects in the category is dispersed by the expansion, Alternatively, if the information distance from the proximity category is equal to or less than the information distance between objects in the category, the defect of the information of the existing object is found by integration or registration of the specified object. A correction is made and category data is updated (S1216).
- the specified object is not an existing category in S1215, the process transitions to S1207 and is registered as a new category.
- the learning function of the MDB management 202 in the above description improves the specific object recognition capability by being appropriately reflected in the operation of the information processing system according to the present invention.
- the user directly uses the MDB for the object to directly set the attributes (eg, color, surface treatment, presence / absence of options, etc.) of the object in the scene. Allows changes such as zooming, viewpoint movement, and composition so that they can be picked up visually and interactively according to taste.
- the change according to the user's taste, new specification request items, etc. are more detailed as marketing information It becomes possible to collect and realize effective multi-product production.
- An object to be put into the market is registered in advance in the MDB, and the image search request from the user can be promptly responded.
- a third party such as a manufacturer, pre-registers some of the CAD data of the new product family with the MDB and embeds it in a scene that can be shared by many users. After that, it will also be possible to introduce products with high attention to the market. On the other hand, for products that are not focused on the user for a long time, it is a good decision material for considering design changes, sales suspension, and so on.
- prior registration of an object which may be put into the market in advance into the MDB be promptly deregistered (deleted) from the MDB as an absent object when not put into the market.
- a method of object identification using collective intelligence there are the following. For example, it is carried out by searching an encyclopedia on the Internet or automatically posting it on a Q & A bulletin board.
- the search query is created using the category obtained by general object recognition and the feature quantity generated by the MDB, and the search is executed. Then, a new feature quantity is extracted from the returned content, and it is tried again whether identification of the object is possible.
- the original image is uploaded to the notice board together with the category obtained by general object recognition.
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- General Engineering & Computer Science (AREA)
- Game Theory and Decision Science (AREA)
- Mathematical Physics (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
本発明は、広く情報処理システムに関し、特にデータベースへの参照リンクの数等に基づき評価を行う情報処理システムに関する。 The present invention relates generally to an information processing system, and more particularly to an information processing system that performs evaluation based on the number of reference links to a database.
近年のインターネットの普及とともに閲覧者の数及びネットワーク上の情報量が増大したことによって、情報検索技術が進歩してきた。例えば、強力な検索エンジンを利用可能なポータルサイトがいくつも運営されている。また、閲覧者の検索キーワードやアクセス履歴等を解析して閲覧者の嗜好にあったWebページや広告を配信する技術も開発され、閲覧者が使用するキーワードに基づいたマーケティングも行われるようになった。 Information retrieval technology has advanced as the number of viewers and the amount of information on the network increase with the spread of the Internet in recent years. For example, there are a number of portal sites that can use powerful search engines. In addition, a technology has also been developed that analyzes the search keywords and access history of readers, and delivers Web pages and advertisements that meet the preferences of the readers, and marketing based on the keywords used by readers will also be conducted. The
例えば、ユーザにとって有用な情報を精度良く且つ容易に提供することができる情報提供装置がある(特許文献1)。この情報提供装置は、ユーザによる各コンテンツに対するアクセスの頻度を表すアクセス頻度情報を、当該ユーザを識別するユーザ識別情報に対応付けて格納するアクセス履歴格納手段と、各ユーザ間におけるコンテンツへのアクセス傾向の類似性を表すユーザ間類似度を、前記アクセス履歴格納手段に格納された前記アクセス頻度情報に基づいて算出するユーザ間類似度計算手段と、ユーザと各ユーザとの間の前記ユーザ間類似度により重み付けした当該各ユーザの前記アクセス頻度情報から、当該ユーザにとってのコンテンツの有用度を表す情報であるコンテンツスコアを算出するコンテンツスコア計算手段と、前記コンテンツスコア計算手段によって算出された各コンテンツの前記コンテンツスコアを前記ユーザ識別情報に対応付けて記憶するインデックス格納手段と、通信端末装置から送信された、ユーザ識別情報を含むクエリの入力を受け付けるクエリ入力手段と、前記クエリ入力手段により受け付けられた前記クエリに適合するコンテンツのコンテンツ識別情報を取得し、当該クエリに含まれるユーザ識別情報に対応付けられて前記インデックス格納手段に記憶された前記コンテンツスコアを参照して、取得した前記コンテンツ識別情報から提供情報を生成する提供情報生成手段と、前記提供情報生成手段により生成された前記提供情報を前記通信端末装置に出力する提供情報出力手段とを備えることを特徴とする情報提供装置である。 For example, there is an information providing apparatus which can provide useful information accurately and easily for the user (Patent Document 1). The information providing apparatus stores access frequency information representing access frequency information indicating the frequency of access to each content by the user in association with user identification information identifying the user, and access tendency to content among the users The inter-user similarity calculation means for calculating the inter-user similarity representing the similarity between the users based on the access frequency information stored in the access history storage means, and the inter-user similarity between the user and each user Content score calculating means for calculating a content score which is information indicating the usefulness of the content for the user from the access frequency information of each user weighted by the content score calculating means, and the content score calculated by the content score calculating means Content score is associated with the user identification information Storing index storage means, query input means for receiving an input of a query including user identification information transmitted from the communication terminal device, and acquiring content identification information of content conforming to the query received by the query input means A provision information generation unit that generates provision information from the acquired content identification information by referring to the content score stored in the index storage unit in association with user identification information included in the query; And a provision information output unit configured to output the provision information generated by the provision information generation unit to the communication terminal apparatus.
また、検索キーワードの流行時期と流行した理由を提示する検索サーバがある(特許文献2)。この検索サーバは、ブログ記事を収集するブログ記事収集手段と、クライアントから受信した情報に従い検索キーワードの出現頻度表示する対象期間を決定する期間決定手段と、対象期間から決定した区間ごとに、区間内に更新されたブログ記事を対象とし検索キーワードの出現頻度をカウントし、出現頻度の時系列情報を生成する出現頻度カウント手段と、出現頻度のピーク区間を検出するピーク区間検出手段と、ピーク区間内に更新されたブログ記事から検索キーワードの関連キーワードを抽出する関連キーワード抽出手段と、時系列情報をグラフ化したグラフ情報を生成し、クライアントに送信するグラフ情報生成手段を備え、グラフ情報においては、ピーク区間のラベルとして関連キーワードが表示されることを特徴としている。 In addition, there is a search server that presents the season of search keywords and the reason for the popularity (Patent Document 2). This search server includes a blog article collecting means for collecting blog articles, a period determining means for determining a target period for displaying the appearance frequency of a search keyword according to information received from a client, and a section for each section determined from the target period. The appearance frequency of the search keyword is counted for the blog article updated in the above, and the appearance frequency counting means for generating time series information of appearance frequency, the peak interval detection means for detecting the peak interval of the appearance frequency, and the peak interval The related keyword extraction means for extracting the related keyword of the search keyword from the blog article updated in 4 and the graph information generation means for generating the graph information which graphed the time-series information and transmitting it to the client A related keyword is displayed as a label of the peak section.
また、バナー広告の広告効果を広告主側が容易に把握できるとともに、より広告効果の高いバナー広告をユーザ毎に提供する広告配信システムがある(特許文献3)。この広告配信システムは、あらかじめ記憶した複数の広告データのなかからユーザ端末に対応するユーザのユーザプロファイルを参照する。そして参照してユーザプロファイルに基づいて、当該ユーザ端末に配信すべき広告データを抽出する。次に、抽出した広告データをユーザ端末にネットワークを介して配信し、広告を表示することを特徴としている。 In addition, there is an advertisement distribution system in which the advertiser side can easily grasp the advertising effect of the banner advertisement, and provides the banner advertisement having a higher advertising effect to each user (Patent Document 3). This advertisement delivery system refers to the user profile of the user corresponding to the user terminal from among a plurality of advertisement data stored in advance. Then, the advertisement data to be distributed to the user terminal is extracted based on the user profile by reference. Next, the present invention is characterized in that the extracted advertisement data is distributed to the user terminal via the network to display an advertisement.
しかしながら、従来のシステムにおける参照履歴やアクセス履歴の集計は、あくまでもWebページの所在(URL等)を単位としたページ全体に対するアクセスを集計するものであり、例えばWebページの中のどの部分に対して閲覧者が興味を持ったかなど、細部にいたる着目情報を収集することはできなかった。 However, the tabulation of reference history and access history in the conventional system is only to total the access to the entire page in units of the location (URL etc.) of the web page, and for example, to any part of the web page It was not possible to collect attention information that led to details, such as whether the viewer was interested.
さらに、検索キーワードや検索クエリに基づくマーケット分析においても、キーワードの使用頻度のカウントやキーワード同士の関連度を演算するといった、テキスト処理が中心であった。また、広告の配信効率を高めるための技術についても、ユーザの性別、年齢層、嗜好、興味のある分野といったプロファイル情報を分析して関連度の高い広告を抽出し配信するといったものにとどまっており、閲覧者が具体的に着目した(あるいは着目しなかった)物についての分析が望まれる。 Furthermore, also in market analysis based on search keywords and search queries, text processing is mainly performed, such as counting the frequency of use of keywords and calculating the degree of association between keywords. In addition, technology to improve the delivery efficiency of advertisements is also limited to analysis and analysis of profile information such as user's gender, age group, preferences, and areas of interest to extract and deliver highly relevant advertisements. An analysis of an object that the viewer specifically (or not) focused on is desired.
そこで、本発明は、閲覧者によって着目された具体的な対象物(the object)について分析を行い、この着目物体に関連する情報や広告等を配信する情報処理システムを提供することを目的とする。 Therefore, an object of the present invention is to provide an information processing system that analyzes a specific object (the object) focused by a viewer and distributes information, advertisements, and the like related to the object of interest. .
本発明に係る情報処理システムは、物体を構成するためのデータベースから再構成されたマザーデータベース(MDB)をもとにユーザからの画像検索要求に応じて特定物体認識された物体に対し、複数のユーザからの検索要求をシーンに応じて評価し、着目度に応じて対象物体に関わる広告及び/又はサービスを当該画像検索要求を行なったユーザに順次提供することを可能にする。 In the information processing system according to the present invention, a plurality of objects for which a specific object is recognized in response to an image search request from a user based on a mother database (MDB) reconstructed from a database for constructing the object The search request from the user is evaluated according to the scene, and it is possible to sequentially provide the user who made the image search request with the advertisement and / or service related to the target object according to the degree of attention.
また、本発明に係る情報処理システムは、複数の物体への着目度から生成した統計データをユーザ及び/又は第三者に提供することを可能にする。 Further, the information processing system according to the present invention makes it possible to provide statistical data generated from the degree of attention to a plurality of objects to a user and / or a third party.
また、本発明に係る情報処理システムは、物体を構成するためのデータベースから再構成されたマザーデータベース(MDB)に未登録の特定物体認識要求があった場合、当該物体に対し複数のユーザ及び第三者に不明物体発見の告知(アテンション)を行い、上記ユーザからの集合知及び第三者から提供される情報に基づいて物体を判別可能な場合は、当該物体に関わる詳細なデータベースをMDBに登録したのち、複数のユーザ及び第三者に不明物体の同定ができた旨の案内を行い、対象物体に関わる広告及び/又はサービスをユーザに順次提供可能にする。 Further, in the information processing system according to the present invention, when there is an unregistered specific object recognition request in a mother database (MDB) reconstructed from a database for forming an object, a plurality of users and If an unknown object discovery notification (attention) is given to three parties, and if it is possible to distinguish an object based on the collective intelligence from the user and the information provided by the third party, the detailed database pertaining to the object will be MDB After registration, a plurality of users and third parties are notified that the unknown object has been identified, and advertisements and / or services relating to the target object can be sequentially provided to the user.
また、本発明に係る情報処理システムは、特定物体認識された物体のMDBを用いて、前記ユーザがその物体の一部の属性をユーザの好みに応じて変更可能にし、そのユーザの好みや要求をマーケティング情報として第三者に提供することを可能にする。 Further, the information processing system according to the present invention enables the user to change the attribute of a part of the object according to the user's preference using the MDB of the object for which the specific object is recognized, and the user's preference or request To provide to third parties as marketing information.
また、本発明に係る情報処理システムは、予め市場に投入する可能性のある物体をMDBに先行登録し、将来のユーザからの画像検索要求に速やかに対応可能にする。 In addition, the information processing system according to the present invention preliminarily registers, in the MDB, an object which is likely to be put into the market in advance, and can promptly respond to an image search request from a future user.
また、本発明に係る情報処理システムは、前記シーン内におけるユーザからの特定物体認識要求が他の物体に推移した場合、その推移履歴情報をもとに着目度の評価を行い、その評価に基づいた統計データをマーケティング情報として第三者に提供することを可能にする。 Further, in the information processing system according to the present invention, when the specific object recognition request from the user in the scene transits to another object, the degree of attention is evaluated based on the transition history information, and the evaluation is performed based on the evaluation. Statistical data can be provided to third parties as marketing information.
本発明に係る情報処理システムによれば、次のような効果を奏する。
(1)閲覧者が特定の画像(静止画像及び動画像を含む。以下、同じ)シーンにおいて着目した物体について、その着目度(着目頻度及び/又は着目ランク)を元に閲覧者の役に立つような追加情報を提供する情報処理システムを実現できる。
(2)閲覧者が特定の画像シーンにおいて着目した物体について、その着目度を元に対象物体に関連する広告及び/又はサービス等の表示を付加表示する情報処理システムを実現できる。
(3)画像等の特定のシーンにおける個別の物体に対する閲覧者の着目度の推移を元にマーケティングを行う情報処理システムを提供できる。
According to the information processing system of the present invention, the following effects can be obtained.
(1) With regard to an object focused by a viewer in a specific image (including still images and moving images, the same applies hereinafter), it is useful for the viewer based on the degree of attention (frequency and / or attention rank) of the object It is possible to realize an information processing system that provides additional information.
(2) It is possible to realize an information processing system which additionally displays a display such as an advertisement and / or a service related to the target object based on the degree of attention of an object which the viewer focuses on in a specific image scene.
(3) It is possible to provide an information processing system that performs marketing based on the transition of the degree of attention of the viewer with respect to an individual object in a specific scene such as an image.
以下、本発明に情報処理システムを実施するための形態について詳述する。 Hereinafter, modes for implementing the information processing system according to the present invention will be described in detail.
図1に、本発明に係る情報処理システムの一実施形態におけるシステム構成図を示す。
情報処理システム100は、情報処理サーバ101と、MDB102と、ユーザが使用する端末装置105a~105dとからなり、サーバ101とMDB102とは接続103で接続され、サーバ101及び端末装置群105は、ネットワーク104に接続されている。
FIG. 1 shows a system configuration of an information processing system according to an embodiment of the present invention.
The
なお、本明細書におけるサーバは、クライアントからの要求に対して何らかのサービスを提供するコンピュータシステムであり、複数のサーバシステムが結合したコンピュータ群を意味し、複数のソフトウェアにより駆動される。したがって、本明細書では、サーバの意義を上記のとおり位置付ける。 The server in the present specification is a computer system that provides some service in response to a request from a client, means a computer group in which a plurality of server systems are coupled, and is driven by a plurality of software. Thus, in the present specification, the meaning of the server is positioned as described above.
また、ハードウェアとしてのコンピュータは、最も基本的な構成としては、命令バス及びデータバスで接続された算術論理演算ユニットと制御ユニットと記憶装置と入出力装置とを備えた電子計算機である。入出力インタフェースを介して入出力装置から入力された情報(ビットデータ)に基づき算術論理演算ユニットにおいて算術演算や論理演算、比較演算、シフト演算等が実行される。実行されたデータは必要に応じて記憶装置に記憶され、入出力装置から出力される。これら一連の処理は、記憶装置に記憶されたソフトウェアプログラムによって制御される。本発明における各サーバマシンも、上記のとおりのコンピュータとしての基本機能を最低限備えたハードウェアであり、オペレーティングシステムやデバイスドライバ、そしてアプリケーションソフトウェアといったプログラム群によって制御されている。 The computer as hardware is, in its most basic configuration, an electronic computer provided with an arithmetic logic unit, a control unit, a storage device, and an input / output device connected by an instruction bus and a data bus. Arithmetic operation, logical operation, comparison operation, shift operation, etc. are executed in the arithmetic logic unit based on information (bit data) input from the input / output device via the input / output interface. The executed data is stored in the storage device as needed and output from the input / output device. The series of processes are controlled by a software program stored in a storage device. Each server machine in the present invention is also hardware that is minimally equipped with the above-described basic functions as a computer, and is controlled by programs such as an operating system, device drivers, and application software.
図2に、本発明に係る情報処理システムの一実施形態における情報処理サーバ101及びMDB102の機能ブロックを示す。情報処理サーバ101は、ソフトウェア機能ブロックとして、領域処理部201と、一般物体認識部202と、特定物体認識部203と、ネットワーク通信制御部204と、データ検索処理部205と、MDB検索部206と、MDB学習部207と、MDBマネージメント部208と、シーン処理部210と、マーケティング情報生成部211と、着目点処理部212とからなる。情報処理サーバ101の機能ブロックは必ずしもこれらに限定されるものではないが、これら代表的な機能について簡単に説明する。
FIG. 2 shows functional blocks of the
領域処理部201は、画像内の領域分割や部分画像の切出しなどを行う。一般物体認識部202は、画像中に含まれる物体を一般的な名称(カテゴリ)で認識する。また、物体認識部203は、MDB102に登録された情報と照合し、物体を同定する。ネットワーク通信制御部204は、画像の入力出力処理や、端末との情報通信制御などを行う。データ検索処理部205は、リンク先から情報を収集したり、集合知の問合せや、収集、ならびに検索などを行う。MDB検索部206は、物体の名称等のタグデータ等を検索する。MDB学習部207は、物体に関する詳細情報の追加、時間情報の登録、付帯情報の登録、更新、追加などを行う。MDBマネージメント部208は、物体構成データから特徴点や特徴量の抽出、付帯情報からカテゴリ情報を抽出しカテゴリデータへの登録や、カテゴリデータ内のカテゴリ分類の拡張、分割、更新、統合、修正、新規カテゴリの登録などを行う。
The
シーン処理部210は、静止画像又は動画像における同一シーンを認識する処理を行い、マーケティング情報生成部211は、後述する、特定物体への着目度から抽出されたデータベース(DB)構造体(アテンションデータベース:ADB)の情報に基づいてマーケティング情報を生成する。着目点処理部212は、MDB102に基づいて特定物体認識を行い、着目物体への参照等を処理し、集計した結果をADB2101に格納する。
The
また、MDB102は、物体構成データ251と、付帯情報データ252と、特徴量データ253と、カテゴリデータ254と、不特定物体データ255からなる。MDB102は必ずしもこれらに限定されるものではないが、これら代表的な機能について簡単に説明する。
Further, the
物体構成データ251は、物体を構成するためのデータベースであり、物体の構造や形状、寸法、部品の接続情報、配置図、可動部、可動範囲、重量、剛性など、物体を構成ないし製造するのに必要な基本情報を保持している。
付加情報データ252は、物体の名称、製造者、部品番号、日時、素材、組成、加工情報など物体に関するあらゆる情報を保持している。
特徴量データ253は、上記情報に基づいて生成される個々の物体の特徴点や特徴量情報を保持している。
カテゴリデータ254は、一般物体認識部において物体のカテゴリ分類を行う際に使用する情報を保持している。
不特定多数データ255は、特定物体認識部において認識されなかった物体を格納しておく。MDBの進化により特定物体認識された場合には取り除かれる。
The
The
The
The
The
図3に、本発明に係る情報処理システムの一実施形態における端末装置を示す。端末装置105a~105dは、広くユーザが使用するクライアント端末装置であり、コンピュータ、携帯情報端末(PDA)、携帯電話機等が含まれる。つまり、端末装置105a~105dは、多様な種類の電子情報機器が多数ネットワークに接続されている様子をあらわしている。以下、端末装置105と記載した場合にはネットワークに接続された端末装置105a~105dのいずれか1台をさす。当然のことながら、端末装置105a~105dはすべて同一機種である必要はない。同等の機能(あるいは実施可能な最低限の機能)を備えた端末装置であればよい。ここでは端末装置105の代表的な機能ブロックについて説明する。
FIG. 3 shows a terminal device in an embodiment of the information processing system according to the present invention. The
端末装置105a~105dは、入出力部301と、ネットワーク接続部302と、CPU303と、記憶部304と、電源部305とからなる。入出力部301は、例えば、キーボード、マウス、ペン、ジョグダイヤル、ジョイスティック、タッチパッド(ディスプレイに内蔵されるものを含む)、音声認識用のマイクなどの入力デバイスと、ディスプレイ、スピーカ、バイブレーターなどの出力デバイスとで構成される。ネットワーク接続部302は、ネットワークに接続するためのインタフェースであって、有線/無線を問わない。
The
CPU303は、中央処理装置であり、記憶部304は、ハードディスク、メモリ等の記憶装置であり、電源部305は、バッテリー等である。
The
このほか、必要に応じて傾きや加速度を検出するセンサ、GPS受信機などを搭載することもできる。 In addition to this, a sensor for detecting inclination or acceleration, a GPS receiver, or the like can be mounted as needed.
図4に、本発明に係る情報処理システムの一実施形態におけるデータフローを示す。本発明に係る情報処理システムでは、ユーザ401が端末装置105を使ってシーン402を閲覧し、シーン402において着目した物体について情報処理サーバ101に問い合わせが行われる。この問い合わせは、図示しない端末装置105のポインティングデバイスによりシーン402内の着目物体を指示することにより行われる。
FIG. 4 shows a data flow in an embodiment of the information processing system according to the present invention. In the information processing system according to the present invention, the
ここで、シーンは、2次元であれば写真などの静止画で切り取られる単一のフレームのみならず、複数の写真が同一の状況を捉えていればその集合体が同一シーンとなる。動画像であれば、連続した一つの状況を記録したフレーム群が同一シーンとなる。なお、動画像であっても、複数の動画像が同一シーンを記録している場合は、同じくそれら複数の動画像の集合体が同一シーンを構成する。
シーンは、例えば第三者のサーバ(不図示)に保存され、複数のユーザから閲覧可能である。
ユーザは、例えば、端末装置105に組み込まれた本発明に係るソフトウェアを介して、着目物体の問い合わせを情報処理サーバ101に行うことができる。
Here, in the case of a two-dimensional scene, not only a single frame cut out as a still image such as a photograph but also an aggregate thereof becomes the same scene if a plurality of photographs capture the same situation. In the case of a moving image, a frame group recording one continuous situation is the same scene. Even in the case of a moving image, when a plurality of moving images record the same scene, an aggregate of the plurality of moving images similarly constitutes the same scene.
The scene is stored, for example, on a third party server (not shown) and can be viewed by a plurality of users.
For example, the user can inquire of the object of interest to the
一方で、図4には示されていないが、情報処理サーバ101は、予めネットワーク上に存在する様々な静止画像や動画像から、MDB102をもとに検出可能な物体を同定し、ユーザからの物体認識要求の問い合わせに応じて、速やかにシーン402中の特定物体の認識結果をユーザに返すことができる。同様に、ユーザ及び第三者404からリアルタイムにアップロード及び配信される静止画像や動画像の場合は、MDB102をもとにリアルタイムに特定物体の検出を開始し、ユーザ及び第三者404に当該検出結果を速やかに返す。すなわち、情報処理サーバ101は、シーン毎のユーザからの着目物体についての問い合わせに対する物体認識を行うことにより、シーン中のどの物体にユーザが着目したかを観測しようとするものである。これらにより、第三者404は、広告主及びサービス提供者からの発信情報405をユーザに提供が可能になる。
On the other hand, although not shown in FIG. 4, the
なお、本発明において想定されているシーンの概念は、広範囲に渡るものである。例えば、多くのモデルが登場するファッション・ショーを想定する。このファッション・ショーを複数カメラで異なる角度から撮影する場合には、ステージ舞台は1つのシーンを構成し、各カメラからの映像は1つ1つのビューを構成する。本発明におけるシーンは、それぞれのカメラにおけるビューのみならず、前者のシーンをも想定している。 The concept of the scene assumed in the present invention is a wide range. For example, assume a fashion show in which many models appear. When shooting this fashion show with multiple cameras from different angles, the stage stage constitutes one scene, and the images from each camera constitute one view. The scene in the present invention assumes not only the view at each camera but also the former scene.
また、UCG(user-generated content)やCGC(consumer generated content)、と呼ばれる、ユーザの手により作成され、サーバや共有サイトにアップロードされた複数のコンテンツからも本発明が想定するシーンが再構成される。例えば、ユーザから共有サイトにアップロードされたスポーツ観戦の静止画像や動画像も、同一のシーンを構成することが可能である。あるいは、複数の角度から撮られた監視カメラの映像から同一シーンが再構成される。 In addition, a scene assumed by the present invention is reconstructed from a plurality of contents created by the user's hand and called UCG (user-generated content) or CGC (consumer generated content), and uploaded to a server or shared site. Ru. For example, still images and moving images of sports watching games uploaded from a user to a shared site can also constitute the same scene. Alternatively, the same scene is reconstructed from the video of the surveillance camera taken from a plurality of angles.
シーンの活用には、上述のようなコンテンツのみならず、第三者404や広告主等405が予めユーザの反応を見たい物体を含む静止画像や動画像を用意し、ユーザにどの程度着目されるかを観測する場合もある。
In order to utilize the scene, not only the content as described above, but also
図4における情報処理サーバ101には、静止画像又は動画像における同一シーンを認識する処理を行うシーン処理部210と、MDB102に基づいて特定物体認識を行い着目物体への参照等を処理する着目点処理部212と、着目点処理部212によって処理された集計結果等を記録しておくためのADB2101と、ADB2101に記録された情報に基づいて後述するマーケティング情報を生成するためのマーケティング情報生成部211とが含まれている。
なお、「着目ランク」とは、複数ユーザによる着目指数(例えば、何人のユーザが着目したか等)を意味し、「着目頻度」は、特定のユーザが同一の特定物体に着目する頻度を意味する。
The
In addition, "focused rank" means a focused index by a plurality of users (for example, how many users focused on it, etc.), and "focused frequency" means the frequency that a specific user focuses on the same specific object. Do.
なお、情報処理サーバ101は、特定物体を同定できなかった未確認の物体についても集合知や第三者等に問い合わせることにより(図4)、未確認の物体について解決を図ることも可能である。
The
また、第三者は、より正確なマーケティング情報を得るために自己の製品についてのCAD等の物体構成データを特定物体情報として情報処理サーバ101に提供することができる(図4)。また、情報処理サーバ101は、マーケティング情報生成部211で生成された統計データ又はマーケティング情報を広告主405や第三者406に提供することができる(図4)。
Also, a third party can provide object configuration data such as CAD for the product of the third party as specific object information to the
図5に、本発明に係る情報処理システムの一実施形態におけるADBとMDB及びマーケティング情報生成部のデータフローとを説明する。 FIG. 5 illustrates ADB, MDB and data flow of the marketing information generation unit in an embodiment of the information processing system according to the present invention.
図5において、情報処理サーバ101では、シーンごとにそれぞれのシーンにおける認識物体についてのデータ構造をADB2101に管理している。例えば、図5において、シーン1(501)では、特定物体501aと501bとが認識されている。認識された結果、特定物体ごとに(1)カテゴリ(物体の一般名称レベル)、(2)特定物体情報(特定製品の名称や型式)、(3)着目度、及び(4)着目物体についての遷移情報が、所定のデータ構造に格納される。ここで、遷移情報は、カテゴリ内の遷移、カテゴリ間の遷移のほか、後述のように時間軸に沿った遷移に基づく統計データを生成するために使用することができる。
In FIG. 5, in the
ここまでの説明で明らかなように、情報処理サーバ101は、シーンを把握し、シーンの中での特定物体の着目度を分析するという特徴を有している。
As apparent from the above description, the
図6に、本発明に係る情報処理システムの一実施形態におけるシーン及び着目度分析の具体例を説明する。 A specific example of scene and attention level analysis in an embodiment of the information processing system according to the present invention will be described with reference to FIG.
図6Aは、シーンの具体例である。図に示すとおり、シーン402には、遠方にエトワール凱旋門601が見えるシャンゼリゼ通りが撮影されており、シャンゼリゼ通りには無数の自動車が走行している。
FIG. 6A is a specific example of a scene. As shown in the figure, in the
シーン402は、複数のユーザに共有されており、ユーザは着目した物体を図示しない端末装置105のポインティングデバイスなどにより指示することができる。ユーザはシーン402の様々な物体を指示することができるが、説明の簡単のため、指示された物体の代表例として、凱旋門601、自動車602及び自動車603を取り上げ、それぞれどのような着目度が得られたかを図6Bに基づいて説明する。
The
図6Bは、ADBの具体例である。まず、図6Bの上段のテーブルのとおり、シーン402は、IDとして402が割り当てられたビューであり、タイプは写真(photo)である。そして、「エトワール凱旋門が見えるシャンゼリゼ通り」というシーン(c1010)の1つのビューを構成している。図6Bの上段のテーブルによれば、このID402によって識別されるビューの他に、シーン(c1010)を構成する他のビュー403(ID403、タイプは動画(movie))が登録されている。つまり、ID403のコンテンツ(不図示)もシーン(c1010)に属することから、ID402と同様に「エトワール凱旋門が見えるシャンゼリゼ通り」というシーンを構成する。
図6Bの上段のテーブルは、一実施形態において以下のデータ構造を有している。
The upper table of FIG. 6B has the following data structure in one embodiment.
なお、「着目物体へのリンク」フィールドには、そのシーン(ないしビュー)において着目された1以上の着目物体へのリンクが張られる。図6Bにおいては、上述のとおり凱旋門601、自動車602及び自動車603が着目されているので、これらへのリンクが張られている。また、ビュー403(コンテンツ不図示)においても凱旋門601が含まれているので凱旋門601へのリンクが張られている。
In the “link to target object” field, a link to one or more target objects focused in the scene (or view) is provided. In FIG. 6B, since the Arc of
次に、図6Bの中段のテーブルに、着目物体ごとにまとめられた構造データを示す。後述する認識処理(図12等)により、シーン402において着目された物体601は「エトワール凱旋門601」と認識され、着目物体602は「車種A(602)」と認識され、着目物体603は「車種B(603)」と認識されている。そして、認識された物体についてのMDBへのリンクと、その物体の着目度が記録されている。図6Bの中段のテーブルでは、エトワール凱旋門601の着目度は3557であり、車種A(602)の着目度は15であり、車種B(603)の着目度は135である。
着目度の算出は、ユーザによる参照回数のみならず、適宜重み付けが行われる。
図6Bの中段のテーブルは、一実施形態において以下のデータ構造を有している。
The calculation of the degree of attention is appropriately weighted as well as the number of times of reference by the user.
The middle table of FIG. 6B has the following data structure in one embodiment.
なお、「ビューへのリンク」フィールドには、その着目物体が存在するビュー1以上のビューへのリンクが張られる。図6Bにおいては、上述のとおり凱旋門601がビュー402及び403に含まれているので、これらのビューへのリンクが張られている。
In the "link to view" field, a link to one or more views in which the object of interest exists is provided. In FIG. 6B, since the
図6Bの下段のテーブルに、シーン、ビュー及び着目物体ごとの着目時間を管理するデータ構造を示す。図6Bの下段1行目には、シーンC1010のビュー402において物体602が2010年1月5日13時23分45秒に着目されたことが記録されるとともに、物体602へのリンクが張られ(図6B中段)、この物体が自動車の車種Aであることが分かる。
図6Bの下段のテーブルは、一実施形態において以下のデータ構造を有している。
The lower table of FIG. 6B has the following data structure in one embodiment.
なお、図6Bの下段には、時間を記録するための項目が1つしかないが、これに替えて着目された時間の複数の履歴を着目したユーザ(IDやIPアドレス等により特定できる)とともにリストとして管理するようにしてもよい。 In the lower part of FIG. 6B, there is only one item for recording time, but in place of this, along with the user (can be identified by ID, IP address, etc.) focusing on multiple histories of the focused time. It may be managed as a list.
図7に、本発明に係る情報処理システムの他の実施形態でのシーンにおける着目物体の分析例(マーケティングデータの生成例)を説明する。図7(A)は、情報処理システム100によってシーンごとに検出された、物体ごとのユーザの着目度の蓄積から生成されたシーンの統計情報であり、図7(B)は、ある期間(例えば、1時間、6時間、24時間、1週間、1月、3ヶ月、半年、1年、10年など)ごとの、各シーンにおける物体ごとの着目度変化から生成された統計情報である。これら統計情報の生成について、前提となる考え方とともに詳述する。
An example of analysis of an object of interest (example of generation of marketing data) in a scene in another embodiment of the information processing system according to the present invention will be described with reference to FIG. FIG. 7A shows statistical information of a scene generated from the accumulation of the degree of attention of the user for each object, which is detected for each scene by the
あるシーンの1つのビュー(例えば写真)において、ユーザAが物体1(自動車1)の特定物体認識指示を行ったとする。この場合、情報処理システム100は、物体1(自動車1)を特定し、MDBに格納されている情報(例えば、メーカー、モデル名、年式、色、モデル(例えば、2ドア、3ドア、ハッチバック、ワンボックスなど)、排気量など)、及び/又は、特定できるオプション(例えば、サンルーフ、ルーフラック、フォグランプ、ホイールなど)を検出し、それぞれのMDB内の情報へのリンクをそのシーンの物体のADBに物体1に関するものとして着目度と共に記録する。もし、ユーザがさらに物体1(自動車1)の中の別の物体、たとえばホイールNの特定物体認識を行った場合には、同様にそのシーンのADBに物体NとしてMDBの情報(例えばメーカー名、型番、サイズ、年式、小売価格、材質など)へのリンクを記録する。
It is assumed that the user A instructs the specific object recognition of the object 1 (the car 1) in one view (for example, a photo) of a certain scene. In this case, the
次に、同じユーザAが他の物体2(自動車2)の特定物体を行うと、同様に特定物体認識を行い、その自動車固有の検出可能な物体情報を物体のADB2として記録する。さらに、ユーザが自動車以外の物体の特定指示を行った場合にも、それぞれの物体の着目情報としてADBに記録しておく。
Next, when the same user A performs a specific object of another object 2 (car 2), the specific object recognition is similarly performed, and the detectable object information unique to the car is recorded as the
また、別のユーザBが同じシーンのあるビューにおいて、ある自動車の特定物体認識を行ったとする。この場合、情報処理システム100は、前記と同様に自動車の特定を行う。その結果、その自動車が既検出であれば登録されているADB内の物体Aの着目度を更新する。もし新規検出の自動車であれば、ADB内に物体3として新規に登録する。さらに、同ユーザがその車のホイールNの特定物体認識を指示した場合、同様にホイールNの着目度を更新する。
Further, it is assumed that another user B performs specific object recognition of a certain car in a certain view of the same scene. In this case, the
こうして、上記プロセスを繰り返すことで、情報処理システム100は、シーンごとに検出された物体ごとの各ユーザの着目度を蓄積し、そのシーンの統計情報を生成することができる(図7(A))。
Thus, by repeating the above process, the
また、上記処理と並行して、情報処理システム100は、ある期間(例えば、1時間、6時間、24時間、1週間、1月、3ヶ月、半年、1年、10年など)を単位として、各シーンにおける物体の着目度に関する期間単位での物体の着目度の変化に関する統計情報を生成することができる(図7(B))。
Further, in parallel with the above processing, the
上記生成例は一例であり、この他にも様々なマーケティングデータが抽出可能である。
例えば、下記のようなデータを生成することができる。
1.物体の属するカテゴリ(例えば、自動車)内における着目度。例えば、シーン内の自動車X台中ユーザの着目度上位N台の車種名、モデル、カラー、年式などのデータ生成。
2.シーン内の全物体中の、上位N物体のカテゴリ、名称、着目度ランクや、物体のシーン内における場所などのデータ生成。
3.シーン内のビューごとの着目度上位の物体のカテゴリ、名称、着目度などのデータ生成。
The above generation example is an example, and various other marketing data can be extracted.
For example, the following data can be generated.
1. Degree of attention in the category to which the object belongs (for example, car). For example, data generation such as model name, model, color, year model, etc. of top N cars with high degree of attention of user in car X car in scene.
2. Data generation of top N object categories, names, attention ranks, and locations of objects in the scene, among all objects in the scene.
3. Data generation such as the category, name, degree of attention, etc. of the high-ranked objects for each view in the scene
図8に、本発明に係る情報処理システムの一実施形態における動作フロー(特に、シーン内の物体認識及びADBの生成フロー)を説明する。まず、S801において情報処理システム100における定常処理ステップが開始されると、S802に進み、画像等のデータが入力される。例えば、データには複数の静止画や動画等の画像が含まれ、これらのデータは時系列に並んでいる。次に、S803に進み、入力データからシーンを切り出す。そして切り出されたシーンごとにビューを切り出す。
FIG. 8 illustrates an operation flow (in particular, object recognition in a scene and generation flow of ADB) in an embodiment of the information processing system according to the present invention. First, when the steady process step in the
S804において、切り出されたビューから、今度はセグメンテーション手法等を用いて物体が切り出される。次に、S805に進み、特定物体の認識処理(後述する図12参照)が行なわれる。 In S804, an object is cut out from the cut out view this time using a segmentation method or the like. Next, in step S805, recognition processing of a specific object (see FIG. 12 described later) is performed.
そして、S806において、特定物体が認識されれば(例えば、図12参照)、ADBを生成し、MDBとのリンクを確立する。次に、S807に進み、そのビューにさらに特定物体認識可能な画像が存在するかどうかが判断され、Yesの場合にはS805に復帰して以降の処理を繰り返す。 Then, if a specific object is recognized in S806 (for example, see FIG. 12), ADB is generated and a link with MDB is established. Next, in step S807, it is determined whether there is an image capable of recognizing a specific object in the view. If YES, the process returns to step S805 to repeat the subsequent processing.
上記S807においてNoの場合、すなわち最終的に、シーン、ビュー、及びそこにあるすべての特定物体を認識したら、S808に進んで処理を終了する。なお、この時点でシーン、ビューはMDBへのリンクを持つことになるので、それらを再構成して新しいシーンを作り上げることも可能になる。 In the case of No in the above-mentioned S807, that is, finally when the scene, the view, and all the specific objects present in it are recognized, the process proceeds to S808 and the processing is ended. At this point in time, scenes and views will have links to MDBs, so it will be possible to reconstruct them and create new scenes.
図9に、本発明に係る情報処理システムの一実施形態における動作フロー(特に、ADBの更新及び物体の参照履歴の登録フロー)を説明する。まず、S901において、図示しない携帯端末105のポインティングデバイス等によりユーザに指示された着目点の処理が開始される。次に、S902に進み、シーン内のビューにおいて、ユーザが指示した領域(着目物体)について、一般物体認識によるカテゴリ認識及び特定物体認識による物体の特定処理を行う。そして、S903において、着目物体の認識が出来たかどうかが判断される。S903において認識できなければ(S903においてNoの場合)処理を終了するが、認識できた場合(S903においてYesの場合)は、ステップS904に進む。 FIG. 9 illustrates an operation flow (in particular, an ADB update and an object reference history registration flow) in an embodiment of the information processing system according to the present invention. First, in S901, processing of a focused point instructed by the user using a pointing device or the like of the portable terminal 105 (not shown) is started. Next, in step S902, category recognition based on general object recognition and object identification processing based on specific object recognition are performed on an area (target object) specified by the user in a view in a scene. Then, in S903, it is determined whether or not the target object has been recognized. If it can not be recognized in S903 (No in S903), the processing is ended, but if it can be recognized (Yes in S903), the process proceeds to step S904.
S904においては、認識された物体が既にそのシーンにおいて認識されているかどうかが判断される。具体的には、着目物体構造体内を検索して調査される。もし、既検出物体であれば(S904において、Yes)、S906に進む。一方で、新規検出物体であれば(S904において、No)S905に進む。 In S904, it is determined whether the recognized object has already been recognized in the scene. Specifically, the object structure of interest is searched and investigated. If the object is a detected object (Yes in S904), the process proceeds to S906. On the other hand, if it is a newly detected object (No in S904), the process proceeds to S905.
S905においては、ADBへの物体情報の登録処理が行われる。つまり、登録されるものは新規検出物体であるので、図6Bの着目物体構造体に、物体ID、カテゴリ、MDBへのリンクが登録され、さらにシーンID、ビューIDへのリンク、及び画像のタイプ(写真、あるいは動画)が登録される。 In S905, registration processing of object information to ADB is performed. That is, since what is registered is a newly detected object, an object ID, a category, a link to an MDB are registered in the object structure of interest in FIG. 6B, and further, a scene ID, a link to a view ID, and an image type (Photo or video) is registered.
次に、S906に進み、着目物体に関するADB(図6B)の着目度が更新される。そして、S907に進み、着目物体に関する参照履歴がADB(図6B)にシーンID,ビューID、時間、及び物体へのリンクとして登録され、着目物体に関する処理は終了する(S908)。 Next, the process proceeds to S 906, where the degree of attention of the ADB (FIG. 6B) regarding the object of interest is updated. Then, the process proceeds to S 907, the reference history regarding the object of interest is registered in the ADB (FIG. 6B) as a scene ID, view ID, time, and a link to the object, and the process for the object of interest ends (S 908).
図10に、本発明に係る情報処理システムの一実施形態における動作フロー(ADBの情報に基づいた広告選択フロー)を説明する。まず、S1001においてユーザがある物体に着目した場合の処理が開始されると、S1002に進み、ユーザが特定の物体に着目する。例えば、当該物体をマウスでクリックしたり、当該物体を囲んだりする。そして、S1003において、当該物体が既に本情報処理システムで認識されているかが判断される。認識されていれば(S1003においてYes)、S1004に進み、当該物体のADBを入手する。また、認識されていなければ(S1003においてNo)、S1005に進み、図12の処理が実行され特定物体が認識される。次に、S1006に進み、図12の処理で特定物体が認識されれば、ADBが生成され、MDBとのリンクが確立される。 The operation | movement flow (The advertisement selection flow based on the information of ADB) in one Embodiment of the information processing system based on this invention is demonstrated to FIG. First, when the process in the case where the user focuses on an object in S1001 is started, the process proceeds to S1002 and the user focuses on a specific object. For example, the object is clicked with a mouse, or the object is surrounded. Then, in S1003, it is determined whether the object has already been recognized by the information processing system. If it is recognized (Yes in S1003), the process advances to S1004 to obtain the ADB of the object. If it is not recognized (No in S1003), the process proceeds to S1005, the process of FIG. 12 is executed, and the specific object is recognized. Next, the process proceeds to S1006, and when the specific object is recognized in the process of FIG. 12, an ADB is generated and a link with the MDB is established.
次に、S1007に進み、ADBの着目度ランクが更新される。この値によって、当該物体がどれだけ多くの人によって着目されているかが推定可能になる。S1008では、当該ADBの着目度や遷移情報から、ユーザに適切な広告及び/又はサービスが選び出される。そして、選び出された広告及び/又はサービスをユーザに提示し(S1009)、処理を終了する(S1010)。 Next, in S1007, the attention degree rank of ADB is updated. This value makes it possible to estimate how many people are paying attention to the object. In S1008, an advertisement and / or service appropriate for the user is selected from the attention level and transition information of the ADB. Then, the selected advertisement and / or service is presented to the user (S1009), and the process is ended (S1010).
図11に、本発明に係る情報処理システムの一実施形態における動作フロー(着目度及び当該物体に関連する情報(例えば、シーン、遷移、場所、時間、等)に基づいたマーケティング情報の生成)を説明する。まず、S1101において処理を開始すると、S1102に進み、利用者が特定の物体に着目する。例えば、当該物体をマウスでクリックしたり、当該物体を囲んだりする。そして、S1103において、当該物体が既に本情報処理システムで認識されているかどうかが判断される。認識されていれば(S1103でYes)、当該物体の物体着目度構造体を入手する(S1104)。認識されていなければ(S1104)、図12の処理を実行して特定物体を認識する(S1105)。S1106において、図12の処理で特定物体が認識されれば、ADBが生成され、MDBとのリンクが確立される。また、S1107においては、ADBの着目度ランクが更新される。この値によって、当該物体がどれだけ多くの人によって着目されているかがわかる。 FIG. 11 shows an operation flow (generation of marketing information based on attention degree and information related to the object (for example, scene, transition, place, time, etc.) in one embodiment of the information processing system according to the present invention. explain. First, when the process is started in S1101, the process proceeds to S1102, and the user focuses on a specific object. For example, the object is clicked with a mouse, or the object is surrounded. Then, in S1103, it is determined whether the object has already been recognized by the information processing system. If it is recognized (Yes in S1103), the object attention degree structure of the object is obtained (S1104). If not recognized (S1104), the process of FIG. 12 is executed to recognize the specific object (S1105). In S1106, when the specific object is recognized in the process of FIG. 12, an ADB is generated and a link with the MDB is established. In S1107, the attention degree rank of ADB is updated. This value indicates how many people pay attention to the object.
次に、S1108に進み、当該ADBの着目度ランク、遷移情報、及び当該物体に関連する情報からマーケティング情報が生成される。そうして、選び出されたマーケティング情報が第3者に提供され(S1109)、本ステップを終了する(S1110)。 Next, proceeding to S1108, marketing information is generated from the attention degree rank of the ADB, transition information, and information related to the object. Then, the selected marketing information is provided to the third party (S1109), and this step is ended (S1110).
図12に基づいて、MDB201を使った物体認識のフローを説明する。
The flow of object recognition using the
[一般物体認識]
画像認識処理の開始(S1201)は、まず、端末装置105における元画像の入力もしくは情報処理サーバ101によるシーンの切り出しからはじまる(S1202)。元画像は、2次元画像であるか3次元画像であるかを問わない。また、元画像の入力に際しては、その元画像におけるどの物体の着目領域の指示がポインティングデバイス等のデバイス(不図示)を通じてなされる場合と、着目点の指示がなく元画像全体が処理対象として入力される場合(例えば、情報処理サーバ101によるシーンの切り出し)がある。次に、S1204において一般物体認識処理が行われる。一般物体認識処理には、例えば、BOF(Bag-Of-Features)の手法を採用することができる。この一般物体認識処理では、検出された物体のカテゴリ(物体の一般名称)の認識まで行われる。ただし、着目点の指示がされた場合は、カテゴリの認識ができた場合とできなかった場合とで処理が分岐し、その判断はS1205で行われる。カテゴリ認識ができなかった場合には、S1206へ進み、既存のカテゴリの取り扱いについて判断がなされる(S1207)が、着目点に指示の有無に関わらず物体のカテゴリ認識が出来た場合には、特定物体認識処理へ進むべくS1209へ進む。
[General object recognition]
The start of the image recognition process (S1201) starts with the input of an original image in the terminal device 105 or the clipping of a scene by the information processing server 101 (S1202). The original image may be a two-dimensional image or a three-dimensional image. In addition, when an original image is input, an instruction of the target area of any object in the original image is made through a device (not shown) such as a pointing device, and the entire original image is input without processing an instruction of the target point. (For example, clipping of a scene by the information processing server 101). Next, general object recognition processing is performed in S1204. For example, a method of BOF (Bag-Of-Features) can be adopted for the general object recognition processing. In this general object recognition process, recognition of the detected object category (general name of object) is performed. However, when an instruction of a focused point is given, the process branches depending on whether the category can be recognized or not, and the determination is made in S1205. If the category can not be recognized, the process proceeds to S 1206, where it is judged about the handling of the existing category (S 1207), but if the category recognition of the object is possible regardless of the presence or absence of the instruction at the focus point The process advances to step S1209 to proceed to object recognition processing.
[特定物体認識]
S1205の判断において特定物体認識処理へ進む場合は、まず、S1209において個別物体画像の切り出し処理が行われる。そして、切り出された個別物体画像について、特定物体認識処理が行われる(S1210)。特定物体認識処理では、MDB201に登録された物体構成データから抽出された特徴量データに基づく一致度を算出する評価関数によって物体の同定が試みられる。
[Specific object recognition]
In the case of proceeding to the specific object recognition processing in the determination of S1205, first, the cutout processing of the individual object image is performed in S1209. Then, a specific object recognition process is performed on the clipped individual object image (S1210). In the specific object recognition process, identification of an object is attempted by an evaluation function that calculates the degree of coincidence based on feature amount data extracted from object configuration data registered in the
[学習処理(1)]
一方で、S1205の判断において一般物体認識ができなかった場合には、S1206へ進み、着目物体の持つ特徴量と、MDB201が把握している既存のカテゴリに属する物体の特徴量との情報距離に基づいて、その着目物体を含む新たなカテゴリを登録するか(S1207)、その着目物体に近接する既存カテゴリの拡張を検討するか(S1208)の判断が行われる。新たなカテゴリを登録する(S1207)場合にはS1204に復帰し、既存のカテゴリを拡張する(S1208)場合にはS1209へ進む。
[Learning process (1)]
On the other hand, if general object recognition can not be performed in the determination of S1205, the process advances to S1206, and the information distance between the feature amount of the object of interest and the feature amount of the object belonging to the existing category that the
[特定物体認識後 学習処理(2)]
S1211においては、特定物体の同定ができたかどうかが判断される。特定物体の同定ができた場合には、S1213に進み、S1209において切り出された個別物体画像にMDB201に登録されている物体の詳細データよりもさらに精細な情報が含まれるかが判断される。もし、S1213においてYesと判断された場合には、S1214に進み、MDB201におけるその物体の詳細データはMDB学習部により更新され、より精細な情報を有するようになる。一方で、S1213においてNoと判断された場合には、S1215に進み、次の判断がなされる。
[After specific object recognition learning processing (2)]
In S1211, it is determined whether identification of a specific object has been achieved. If the specific object can be identified, the process advances to step S1213, and it is determined whether the individual object image extracted in step S1209 includes more detailed information than the detailed data of the object registered in the
S1215は、S1205において一般物体認識ができなかったと判断された場合であって、S1206の判断でS1208、S1209、S1210へ進み、特定物体の認識ができた(S1211でYes)場合に判断される。S1215において、特定された物体が既存のカテゴリであった場合には、MDB201に登録されているその既存カテゴリの定義を拡張、あるいは拡張によりカテゴリ内の物体の情報距離が分散する場合には分割、あるいは近接カテゴリとの情報距離が前記カテゴリ内の物体間の情報距離と同程度以下になった場合には統合、あるいは特定された物体の登録により既存の物体の情報の齟齬を発見した場合には修正を施し、カテゴリデータをアップデートする(S1216)。一方で、S1215において、特定された物体が既存のカテゴリでなかった場合には、S1207へ遷移し、新規カテゴリとして登録する。
In step S1215, it is determined that the general object can not be recognized in step S1205, and the process advances to steps S1208, S1209, and S1210 in the determination of step S1206, and is determined when the specific object is recognized (Yes in step S1211). In S1215, if the specified object is an existing category, the definition of the existing category registered in the
S1211において、特定物体の認識ができなかった場合は、MDB201においてその物体は「未確認物体」として登録され、将来の処理に備えて認識処理を終了する(S1217)。S1216において既存カテゴリを拡張してアップデートされた場合も認識処理を終了する(S1217)。
In S1211, when the specific object can not be recognized, the object is registered as an “unconfirmed object” in the
上記の説明におけるMDBマネージメント202の学習機能は、本発明に係る情報処理システムの稼動において適宜反映されることにより、特定物体認識能力を向上させる。
The learning function of the
[その他の実施例]
なお、本発明に係る情報処理システムにおいて、次のような実施形態もとりうる。
[Other embodiments]
In the information processing system according to the present invention, the following embodiment can be taken.
(1)上述した実施例において特定物体認識された物体に関し、その物体についてのMDBを用いてユーザが直接シーン内で物体の一部の属性(例えば、色とか表面処理、オプションの有無など)を好みに応じて可視的かつインタラクティブに手に取るように拡大、視点移動、合成等の変更を可能にする。これにより、大量生産に対応して必ずしもユーザの様々な趣向に対応した商品投入が行われなかった状況から、ユーザの好みに応じた変更や新たな仕様要求項目等をマーケティング情報としてよりきめ細やかに収集可能となり、効果的な多品種生産を実現できる。 (1) With regard to an object for which a specific object has been recognized in the above-described embodiment, the user directly uses the MDB for the object to directly set the attributes (eg, color, surface treatment, presence / absence of options, etc.) of the object in the scene. Allows changes such as zooming, viewpoint movement, and composition so that they can be picked up visually and interactively according to taste. As a result, from the situation where the product introduction corresponding to various tastes of the user is not necessarily performed in response to mass production, the change according to the user's taste, new specification request items, etc. are more detailed as marketing information It becomes possible to collect and realize effective multi-product production.
(2)予め市場に投入する予定の物体をMDBに先行登録し、ユーザからの画像検索要求に速やかに対応可能にする。例えば、製造者等の第三者が新しい製品群のCADデータの一部をMDBに先行登録し、多くのユーザによって共有可能なシーンに埋め込む。そうしたのち、着目度の高い製品から市場に投入することも可能になる。反対に、いつまでたってもユーザに着目されない製品については、設計変更や販売の見合わせなどを検討するための良い判断材料となる。
なお、こうした予め市場に投入可能性のある物体のMDBへの先行登録は、市場投入されない場合に、不存在物体として速やかにMDBから登録抹消(削除)されることが望ましい。
(2) An object to be put into the market is registered in advance in the MDB, and the image search request from the user can be promptly responded. For example, a third party, such as a manufacturer, pre-registers some of the CAD data of the new product family with the MDB and embeds it in a scene that can be shared by many users. After that, it will also be possible to introduce products with high attention to the market. On the other hand, for products that are not focused on the user for a long time, it is a good decision material for considering design changes, sales suspension, and so on.
In addition, it is desirable that prior registration of an object which may be put into the market in advance into the MDB be promptly deregistered (deleted) from the MDB as an absent object when not put into the market.
(3)上記特定物体認識された結果は、ADBに格納したが、これら認識結果としてのメタデータ(テキスト)を元のシーンないしビュー画像(例えば、JPEG画像)フォーマットの所定の領域にエンベデッドすることにより、従前の画像検索システムにも寄与できる。 (3) Although the result of the specific object recognition is stored in ADB, embedding the metadata (text) as the recognition result into a predetermined area of the original scene or view image (for example, JPEG image) format Can contribute to the conventional image retrieval system.
(4)物体を構成するためのデータベースから再構成されたMDBに未登録の特定物体認識要求があった場合、当該物体に対し複数のユーザ群及び第三者に不明物体発見の告知(アテンション)を行い、上記ユーザからの集合知及び第三者から提供される情報に基づいて物体を判別可能な場合は、当該物体に関わる詳細なデータベースをMDBの物体構成データ251及び/又は付帯情報データ252に登録したのち、複数のユーザ群及び第三者に不明物体の同定の告知を行い、対象物体に関わる広告及び/又はサービスをユーザ群に順次提供することを可能にする。
そして、上記においても不明な物体は、将来の解析のために、MDBの不特定物体データ255に保存する。
なお、集合知を利用した物体同定の方法としては、次のものがある。例えば、ネット上の百科事典を検索したり、Q&A掲示板に自動投稿することで実施される。ネット上の百科事典をシステムが自ら検索するには、一般物体認識で得られたカテゴリとともにMDBより生成された特徴量を用いて検索クエリを作成し検索を実行する。そして返送されてきた内容から新たな特徴量を抽出して物体の同定が可能か再度試みる。また、Q&A掲示板に自動投稿する場合は、一般物体認識で得られたカテゴリとともに元画像を掲示板にアップロードする。このとき、あらかじめ用意された定型文を自動編集して、「この○○について、型式を教えてください」とか、「この△△△について、設計情報を公開されているウェブサイトを教えてください」といったクエリを投稿する。そうして、他のユーザ(人間を含む)から「それは、xx-xxxxです」とか、「その△△△の設計データは、http://www.aaabbb.com/cad/data.dxfから入手可能です」といったアドバイスが寄せられる。システムは、これらのアドバイスを分析及び評価し、指定されたURLへアクセスし物体の設計データ等のダウンロードを試みる。新たに得られた設計データに基づいて物体の同定に成功すれば、得られた新たなデータがMDBに追加され、データベースが更新される。
(4) When there is an unregistered specific object recognition request in an MDB reconstructed from a database for constructing an object, notification of unknown object detection to a plurality of user groups and third parties with respect to the object (attention) And if it is possible to determine an object based on the collective intelligence from the user and information provided by a third party, a detailed database pertaining to the object is
Then, the unknown object also in the above is stored in the
As a method of object identification using collective intelligence, there are the following. For example, it is carried out by searching an encyclopedia on the Internet or automatically posting it on a Q & A bulletin board. In order for the system to search the encyclopedia on the Internet by itself, the search query is created using the category obtained by general object recognition and the feature quantity generated by the MDB, and the search is executed. Then, a new feature quantity is extracted from the returned content, and it is tried again whether identification of the object is possible. Also, when automatically posting on the Q & A notice board, the original image is uploaded to the notice board together with the category obtained by general object recognition. At this time, automatically edit the fixed form prepared in advance, and "Please tell me the model of this ○○" or "Please tell the website where the design information is disclosed about this △" Post a query such as Then, from other users (including human beings), "It is xx-xxxx" or "The design data of that Δ 入手 is obtained from http://www.aaabbb.com/cad/data.dxf "Can be done" advice. The system analyzes and evaluates these advices, accesses a designated URL, and attempts to download object design data and the like. If the object identification is successful based on the newly obtained design data, the obtained new data is added to the MDB and the database is updated.
100 情報処理システム
101 情報処理サーバ
102 マザーデータベース(MDB)
103 接続(ネットワーク)
104 ネットワーク
105a~105d 端末装置
100
103 connection (network)
104
Claims (6)
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2011548972A JP5679220B2 (en) | 2010-01-07 | 2010-12-28 | Information processing system |
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2010002211 | 2010-01-07 | ||
| JP2010-002211 | 2010-01-07 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| WO2011083732A1 true WO2011083732A1 (en) | 2011-07-14 |
Family
ID=44305468
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| PCT/JP2010/073746 Ceased WO2011083732A1 (en) | 2010-01-07 | 2010-12-28 | Information processing system |
Country Status (2)
| Country | Link |
|---|---|
| JP (1) | JP5679220B2 (en) |
| WO (1) | WO2011083732A1 (en) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2018212022A1 (en) * | 2017-05-15 | 2018-11-22 | ダイキン工業株式会社 | Product information generating system |
| JP2019101457A (en) * | 2017-11-28 | 2019-06-24 | 株式会社コロプラ | Method executed by computer for providing information via head mount device, program for causing computer to execute the same, and information processing device |
| JP2021096753A (en) * | 2019-12-19 | 2021-06-24 | 株式会社リコー | Information processing system, method, program, and recording medium |
| US20220314432A1 (en) * | 2019-12-17 | 2022-10-06 | Preferred Networks, Inc. | Information processing system, information processing method, and nonvolatile storage medium capable of being read by computer that stores information processing program |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2000322438A (en) * | 1999-05-13 | 2000-11-24 | Nippon Telegr & Teleph Corp <Ntt> | Cyber pictorial book data classification method and recording medium recording this method |
| JP2002236846A (en) * | 2001-02-09 | 2002-08-23 | Seiko Epson Corp | Ad distribution method, ad distribution server and ad distribution system |
| JP2002335518A (en) * | 2001-05-09 | 2002-11-22 | Fujitsu Ltd | Control device, server, and program for controlling display device |
Family Cites Families (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP4175390B2 (en) * | 2006-06-09 | 2008-11-05 | ソニー株式会社 | Information processing apparatus, information processing method, and computer program |
-
2010
- 2010-12-28 JP JP2011548972A patent/JP5679220B2/en active Active
- 2010-12-28 WO PCT/JP2010/073746 patent/WO2011083732A1/en not_active Ceased
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2000322438A (en) * | 1999-05-13 | 2000-11-24 | Nippon Telegr & Teleph Corp <Ntt> | Cyber pictorial book data classification method and recording medium recording this method |
| JP2002236846A (en) * | 2001-02-09 | 2002-08-23 | Seiko Epson Corp | Ad distribution method, ad distribution server and ad distribution system |
| JP2002335518A (en) * | 2001-05-09 | 2002-11-22 | Fujitsu Ltd | Control device, server, and program for controlling display device |
Cited By (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2018212022A1 (en) * | 2017-05-15 | 2018-11-22 | ダイキン工業株式会社 | Product information generating system |
| CN110462649A (en) * | 2017-05-15 | 2019-11-15 | 大金工业株式会社 | Product Information Generation System |
| EP3627405A4 (en) * | 2017-05-15 | 2020-11-04 | Daikin Industries, Ltd. | PRODUCT INFORMATION GENERATION SYSTEM |
| JP2019101457A (en) * | 2017-11-28 | 2019-06-24 | 株式会社コロプラ | Method executed by computer for providing information via head mount device, program for causing computer to execute the same, and information processing device |
| US20220314432A1 (en) * | 2019-12-17 | 2022-10-06 | Preferred Networks, Inc. | Information processing system, information processing method, and nonvolatile storage medium capable of being read by computer that stores information processing program |
| JP2021096753A (en) * | 2019-12-19 | 2021-06-24 | 株式会社リコー | Information processing system, method, program, and recording medium |
| JP7516754B2 (en) | 2019-12-19 | 2024-07-17 | 株式会社リコー | Information processing system, method, program, and recording medium |
Also Published As
| Publication number | Publication date |
|---|---|
| JP5679220B2 (en) | 2015-03-04 |
| JPWO2011083732A1 (en) | 2013-05-13 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN113496428B (en) | Method and system for matching local content | |
| US10796343B2 (en) | Systems and methods for augmenting digital content | |
| US10311452B2 (en) | Computerized systems and methods of mapping attention based on W4 data related to a user | |
| TWI402702B (en) | Method, computer readable storage medium, and computing systems of method of presenting results of a web page query | |
| KR101486496B1 (en) | Location-based content-targeted information | |
| JP5596152B2 (en) | Information matching method and system on electronic commerce website | |
| US7899252B2 (en) | Object information derived from object images | |
| US20100005001A1 (en) | Systems and methods for advertising | |
| US20030083937A1 (en) | Advertisement delivery systems, advertising content and advertisement delivery apparatus, and advertisement delivery methods | |
| US20020038456A1 (en) | Method and system for the automatic production and distribution of media content using the internet | |
| WO2008053577A1 (en) | Radio id managing apparatus, radio id managing method and radio id recorder | |
| CN107018486A (en) | Handle the method and system of virtual query | |
| US20040103027A1 (en) | Advertisement distributing server system, and advertise distributing method | |
| CN101568921A (en) | Dynamic pricing models for digital content | |
| CN102317937A (en) | System and method for aggregating and ranking data from a plurality of web sites | |
| CN101520782A (en) | Method and system for directionally releasing special-subject information relevant to online images | |
| JP7095335B2 (en) | Image search device, printed matter, image search method and image search program | |
| CN108959595B (en) | Website construction and experience method and device based on virtual and reality | |
| JP4740630B2 (en) | Fashion creation advertising method and program | |
| JP5679220B2 (en) | Information processing system | |
| JP6799655B1 (en) | User interface methods, terminal programs, terminal devices, and advertising systems | |
| US20100299166A1 (en) | Generating relevant keywords for monetization in an electronic map environment | |
| KR20130089420A (en) | Systems and methods for domain advertising and domain sharing service | |
| TWI779375B (en) | Method for conditionally displaying digital content, system thereof and computer-readable storage | |
| JP5052095B2 (en) | Document file creation method, wireless ID acquisition method, and conversion processing apparatus |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| 121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 10842243 Country of ref document: EP Kind code of ref document: A1 |
|
| WWE | Wipo information: entry into national phase |
Ref document number: 2011548972 Country of ref document: JP |
|
| NENP | Non-entry into the national phase |
Ref country code: DE |
|
| 122 | Ep: pct application non-entry in european phase |
Ref document number: 10842243 Country of ref document: EP Kind code of ref document: A1 |