[go: up one dir, main page]

WO2025058107A1 - 인공 지능 장치 및 그의 동작 방법 - Google Patents

인공 지능 장치 및 그의 동작 방법 Download PDF

Info

Publication number
WO2025058107A1
WO2025058107A1 PCT/KR2023/013814 KR2023013814W WO2025058107A1 WO 2025058107 A1 WO2025058107 A1 WO 2025058107A1 KR 2023013814 W KR2023013814 W KR 2023013814W WO 2025058107 A1 WO2025058107 A1 WO 2025058107A1
Authority
WO
WIPO (PCT)
Prior art keywords
image
artificial intelligence
electronic device
prompt
generation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
PCT/KR2023/013814
Other languages
English (en)
French (fr)
Inventor
김용태
박재철
이성학
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Priority to PCT/KR2023/013814 priority Critical patent/WO2025058107A1/ko
Publication of WO2025058107A1 publication Critical patent/WO2025058107A1/ko
Pending legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • G06F40/56Natural language generation
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications

Definitions

  • the display device is, for example, an intelligent display device that adds a computer support function to a broadcast reception function, and while remaining faithful to the broadcast reception function, it can have an Internet function, etc., and can have a more convenient interface such as a manual input device, a touch screen, or a space remote control.
  • a wired or wireless Internet function it can be connected to the Internet and a computer, and can also perform functions such as e-mail, web browsing, banking, or games.
  • a standardized general-purpose OS can be used for these various functions.
  • the display device described in the present invention can perform various user-friendly functions, for example, since various applications can be freely added or deleted on a general-purpose OS kernel. More specifically, the display device can be, for example, a network TV, an HBBTV, a smart TV, an LED TV, an OLED TV, etc., and in some cases, can also be applied to a smartphone.
  • FIG. 1 is a block diagram illustrating the configuration of a display device according to one embodiment of the present invention.
  • the display device (100) may include a broadcast receiving unit (130), an external device interface (135), a memory (140), a user input interface (150), a controller (170), a wireless communication interface (173), a display (180), a speaker (185), and a power supply circuit (190).
  • the broadcast receiving unit (130) may include a tuner (131), a demodulator (132), and a network interface (133).
  • the tuner (131) can select a specific broadcast channel according to a channel selection command.
  • the tuner (131) can receive a broadcast signal for the selected specific broadcast channel.
  • a demodulator (132) can separate a received broadcast signal into a video signal, an audio signal, and a data signal related to a broadcast program, and can restore the separated video signal, audio signal, and data signal into a form that can be output.
  • the external device interface (135) can receive an application or a list of applications within an adjacent external device and transmit them to the controller (170) or memory (140).
  • the external device interface (135) can provide a connection path between the display device (100) and the external device.
  • the external device interface (135) can receive one or more of images and audio output from an external device connected wirelessly or wiredly to the display device (100) and transmit them to the controller (170).
  • the external device interface (135) can include a plurality of external input terminals.
  • the plurality of external input terminals can include an RGB terminal, one or more HDMI (High Definition Multimedia Interface) terminals, and a component terminal.
  • a video signal of an external device input through an external device interface (135) can be output through a display (180).
  • a voice signal of an external device input through an external device interface (135) can be output through a speaker (185).
  • An external device that can be connected to the external device interface (135) may be any one of a set-top box, a Blu-ray player, a DVD player, a game console, a sound bar, a smartphone, a PC, a USB memory, and a home theater, but these are only examples.
  • the network interface (133) can provide an interface for connecting the display device (100) to a wired/wireless network including the Internet.
  • the network interface (133) can transmit or receive data to or from another user or another electronic device through the connected network or another network linked to the connected network.
  • some of the content data stored in the display device (100) can be transmitted to a selected user or electronic device among other users or other electronic devices pre-registered in the display device (100).
  • the network interface (133) can access a predetermined web page through a connected network or another network linked to the connected network. That is, it can access a predetermined web page through a network and transmit or receive data with the corresponding server.
  • the network interface (133) can receive content or data provided by a content provider or a network operator. That is, the network interface (133) can receive content such as movies, advertisements, games, VOD, broadcast signals, etc., and information related thereto provided from a content provider or a network provider through a network.
  • the network interface (133) can receive firmware update information and update files provided by the network operator, and transmit data to the Internet or content provider or network operator.
  • the network interface (133) can select and receive a desired application from among applications open to the public via a network.
  • the memory (140) stores programs for each signal processing and control within the controller (170) and can store processed images, voices, or data signals.
  • the memory (140) can store an application or a list of applications input from an external device interface (135) or a network interface (133).
  • controller (170) can control the overall operation within the display device (100).
  • the controller (170) of the display device (100) can transmit an image generation request and information of the electronic device to the AI server (500) through the network interface (133) (S605).
  • the controller (170) can transmit an image generation request and information of an electronic device to the communication unit (510) of the AI server (500) through the network interface (133).
  • the processor (560) of the AI server (500) can generate a first prompt based on the received image generation request and information of the electronic device (S607).
  • the first prompt may be a command to be input into a generation AI model loaded on the first generation AI server (610).
  • the processor (560) can generate a first prompt by combining the image generation request and information of the electronic device.
  • the processor (560) can generate the first prompt by using the analysis result of the image generation request, the name of the electronic device, and the operating status information of the electronic device.
  • Analysis results of an image generation request may include the user's intent.
  • the processor (560) can convert the voice command into text and obtain the analysis results of the converted text using a natural language processing engine.
  • the analysis of voice commands may result in a request to create a specific mood image for the standby screen.
  • the processor (560) can generate a sentence by combining the analysis result of the image generation request, the name of the electronic device, and the operation status information of the electronic device, and can obtain the generated sentence as the first prompt.
  • the processor (560) of the AI server (500) can transmit the generated first prompt to the first generation AI server (610) through the communication unit (510) (S609).
  • the first generation AI server (610) may be a server that generates natural language in response to a prompt.
  • the first generation AI server (610) can generate a plurality of sentences in response to the first prompt.
  • Each of the plurality of sentences can be a sentence representing the analysis result of the image generation request and the characteristics of each operation state of the electronic device.
  • the processor (560) of the AI server (500) can receive a plurality of sentences in response to the first prompt from the first generation AI server (610) (S611).
  • the first generation AI server (610) can generate a plurality of sentences in response to the first prompt.
  • Each of the plurality of sentences can be a sentence representing the analysis result of the image generation request and the characteristics of each operation state of the electronic device.
  • the second prompt may be a command that causes the image generation AI model of the second generation AI server (630) to generate an image.
  • the processor (560) of the AI server (500) can transmit the generated second prompt to the second generation AI server (630) through the communication unit (510) (S615).
  • the processor (560) of the AI server (500) can transmit multiple images to the display device (100) through the communication unit (510) (S619).
  • the usability of the waiting screen that reflects the user's intention can increase.
  • the natural language generation result may include a plurality of sentences representing the analysis result of the image generation request and the characteristics of each operational state of the electronic device.
  • the image generation prompt may be a prompt including a sentence received from the first generation AI server (610) and the operational status of the electronic device.
  • the image prompter (563) can transmit an image generation prompt including a sentence and the operation status of each electronic device to a second generation AI server (630) that generates the image.
  • the display device (100) can transmit voice data and information of an electronic device linked to the display device (100) to the AI server (500).
  • the AI server (500) can also directly collect electronic devices linked to the display device (100).
  • the AI server (500) can convert voice data into text data and obtain analysis results of the text data.
  • the natural language prompter (561) of the AI server (500) can generate a natural language generation prompt based on the analysis results and information of the electronic device.
  • the analysis results may include the intention to generate an image of a beach atmosphere on the waiting screen.
  • Information about an electronic device may include the name of the electronic device and information about the operating status of the electronic device.
  • the first generation AI server (610) can generate multiple sentences based on a natural language generation prompt.
  • the multiple sentences generated by the first generation AI server (610) may be ⁇ Draw Waikiki Beach>, ⁇ Draw a clothesline in the sky in the background of this picture>, and ⁇ Draw laundry hanging on a clothesline on this picture>.
  • Each of the multiple sentences may contain a subject requesting a drawing of the analysis results and the operating status of the electronic device.
  • the first generation AI server (610) can transmit a plurality of generated sentences to the AI server (500).
  • the image prompter (563) can generate a basic image generation prompter (563a) that combines ⁇ Draw Waikiki Beach> and the basic state of the electronic device (drying start).
  • the basic state can be a drying start state or a power off state.
  • the second generation IA server (630) can generate a basic image (711) based on the basic image generation prompter (563a) and transmit the generated basic image (711) to the AI server (500).
  • the base image (711) may be an image including Waikiki Beach.
  • the image prompter (563) can generate a first operation state image generation prompter (563b) that combines ⁇ Draw a clothesline in the sky in the background of this picture> and the first operation state of the electronic device (Laundry start state).
  • the first operation state image generation prompter (563b) may include ⁇ Draw a clothesline in the sky in the background of this picture>, the first operation state of the electronic device, and the first image (711).
  • the second generation IA server (630) can generate a first image (713) based on the first operation state image generation prompter (563b) and transmit the generated first image (713) to the AI server (500).
  • the first image (713) may be an image that merges a clothesline representing the characteristics of the first operation state into the base image (711).
  • the image prompter (563) can generate a second operation state image generation prompter (563c) that combines ⁇ Draw laundry hanging on a clothesline on this picture> and a second operation state (Drying start state) of the electronic device.
  • the second operation state image generation prompter (563c) may include ⁇ Draw a clothesline in the sky in the background of this picture>, the second operation state of the electronic device, and the second image (713).
  • the second generation IA server (630) can generate a second image (715) based on the second operation state image generation prompter (563c) and transmit the generated second image (715) to the AI server (500).
  • the second image (715) may be an image including a Waikiki beach, a clothesline, and clothes hanging on a clothesline for drying.
  • the second image (715) may include more clothes hanging on a clothesline compared to the first image (713).
  • the AI server (500) can store the basic image (711), the first image (713), and the second image (715) in the generated image DB (700).
  • the AI server (500) can transmit the basic image (711), the first image (713), and the second image (715) to the display device (100).
  • the display device (100) can display any one of the basic image (711), the first image (713), and the second image (715) according to the operating status of the electronic device.
  • FIGS. 8A and 8B are drawings explaining changes in images displayed on a standby screen according to changes in the status of an electronic device linked to a display device.
  • the display device (100) can receive an image generation request for generating a standby screen.
  • the display device (100) enters the standby screen.
  • the display device (100) can display a basic image (711) on the standby screen when the operating state of the electronic device (800) is the basic operating state.
  • the basic operating state can be either a drying completion state or a power off state.
  • the display device (100) can display a first image (713) corresponding to the first operation state on the standby screen based on information about the changed operation state.
  • the operating state of the electronic device (800) can be changed from a first operating state to a second operating state (state 2), and the electronic device (800) can transmit information about the changed operating state to the display device (100).
  • the second operating state can be a drying start state indicating the start of drying.
  • the second operating state can be a state indicating the end of washing and the start of drying.
  • the display device (100) can display a second image (715) corresponding to the second operation state on the standby screen based on information about the changed operation state.
  • the display device (100) can play images (711, 713, 715) in the form of GIF (Graphics Interchange Format) or play the images in reverse order depending on changes in the operating state of the electronic device (800).
  • GIF Graphics Interchange Format
  • the display device (100) can sequentially reproduce the second image (715), the first image (713), and the basic image (711) when the operating state of the electronic device (800) is changed in the order of drying start state, drying completion state, and basic state.
  • a user can have a desired image provided on a standby screen with just a simple utterance for image generation.
  • the above-described method can be implemented as a processor-readable code on a medium in which a program is recorded.
  • the processor-readable medium include a ROM, a RAM, a CD-ROM, a magnetic tape, a floppy disk, an optical data storage device, and the like.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

본 개시의 실시 예에 따른 인공 지능 장치는 디스플레이 장치와 통신하는 통신부 및 상기 디스플레이 장치로부터 대기 화면의 이미지 생성 요청 및 상기 디스플레이 장치와 연동된 전자 기기의 동작 상태 정보를 상기 통신부를 통해 수신하고, 상기 이미지 생성 요청의 분석 결과와 상기 전자 기기의 동작 상태 정보에 기초하여 자연어 생성을 위한 제1 프롬프트를 생성하고, 상기 제1 프롬프트를 제1 생성 인공 지능 서버에 전송하고, 상기 제1 생성 인공 지능 서버로부터 상기 제1 프롬프트에 대한 응답으로 복수의 문장들을 수신하고, 상기 복수의 문장들에 기초하여 이미지 생성을 위한 제2 프롬프트를 생성하고, 상기 제2 프롬프트를 제2 생성 인공 지능 서버에 전송하고, 상기 제2 생성 인공 지능 서버로부터 상기 전자 기기의 동작 상태들에 대응하는 복수의 이미지들을 수신할 수 있다.

Description

인공 지능 장치 및 그의 동작 방법
본 개시는 인공 지능 장치에 관한 것으로, 사용자의 발화에 맞는 이미지를 생성할 수 있는 인공 지능 장치에 관한 것이다.
유선 또는 무선 통신망을 이용한 디지털 TV 서비스가 보편화되고 있다. 디지털 TV 서비스는 기존의 아날로그 방송 서비스에서는 제공할 수 없었던 다양한 서비스를 제공할 수 있다.
예를 들어, 디지털 TV 서비스의 종류인 IPTV(Internet Protocol Television), smart TV 서비스의 경우 사용자로 하여금 시청 프로그램의 종류, 시청 시간 등을 능동적으로 선택할 수 있도록 하는 양방향성을 제공한다. IPTV, smart TV서비스는 이러한 양방향성을 기반으로 하여 다양한 부가 서비스, 예컨대 인터넷 검색, 홈쇼핑, 온라인 게임 등을 제공할 수도 있다.
기존의 TV에서 제공하는 대기 화면은 미리 정해진 UI에서 사용자가 이미지를 선택하는 방식으로, 대기 화면의 설정이 제한적이었다.
또한, TV에서 대기 화면에 대한 이미지 제공을 위해 활용할 수 있는 정보는 미리 정해진 규칙에 기반하여 전달받은 연결된 제품, 연결 정보 등의 한정적인 내용뿐이었다.
본 개시는 디스플레이 장치의 소프트웨어 변경없이 대기 화면 상에, 사용자가 원하는 정보와 사용자 인터페이스를 제공하는 것에 그 목적이 있다.
본 개시는 이미지 생성을 위한 단순한 발화만으로, 원하는 이미지를 대기 화면 상에 제공하는 것에 그 목적이 있다.
본 개시의 실시 예에 따른 인공 지능 장치는 디스플레이 장치와 통신하는 통신부 및 상기 디스플레이 장치로부터 대기 화면의 이미지 생성 요청 및 상기 디스플레이 장치와 연동된 전자 기기의 동작 상태 정보를 상기 통신부를 통해 수신하고, 상기 이미지 생성 요청의 분석 결과와 상기 전자 기기의 동작 상태 정보에 기초하여 자연어 생성을 위한 제1 프롬프트를 생성하고, 상기 제1 프롬프트를 제1 생성 인공 지능 서버에 전송하고, 상기 제1 생성 인공 지능 서버로부터 상기 제1 프롬프트에 대한 응답으로 복수의 문장들을 수신하고, 상기 복수의 문장들에 기초하여 이미지 생성을 위한 제2 프롬프트를 생성하고, 상기 제2 프롬프트를 제2 생성 인공 지능 서버에 전송하고, 상기 제2 생성 인공 지능 서버로부터 상기 전자 기기의 동작 상태들에 대응하는 복수의 이미지들을 수신할 수 있다.
본 개시의 실시 예에 따른 인공 지능 장치의 동작 방법은 디스플레이 장치로부터 대기 화면의 이미지 생성 요청 및 상기 디스플레이 장치와 연동된 전자 기기의 동작 상태 정보를 수신하는 단계; 상기 이미지 생성 요청의 분석 결과와 상기 전자 기기의 동작 상태 정보에 기초하여 자연어 생성을 위한 제1 프롬프트를 생성하는 단계; 상기 제1 프롬프트를 제1 생성 인공 지능 서버에 전송하는 단계; 상기 제1 생성 인공 지능 서버로부터 상기 제1 프롬프트에 대한 응답으로 복수의 문장들을 수신하는 단계; 상기 복수의 문장들에 기초하여 이미지 생성을 위한 제2 프롬프트를 생성하는 단계; 상기 제2 프롬프트를 제2 생성 인공 지능 서버에 전송하는 단계; 및 상기 제2 생성 인공 지능 서버로부터 상기 전자 기기의 동작 상태들에 대응하는 복수의 이미지들을 수신하는 단계를 포함할 수 있다.
본 개시의 실시 예에 따르면, 대기 화면 상에, 사용자가 원하는 정보와 사용자 인터페이스가 디스플레이 장치의 소프트웨어 변경없이 제공될 수 있다. 이에 따라, 사용자의 의도가 반영된 대기 화면의 활용도가 증가될 수 있다.
본 개시의 실시 예에 따르면, 사용자는 이미지 생성을 위한 단순한 발화만으로, 원하는 이미지가 대기 화면 상에 제공될 수 있다. 이에 따라, 사용자와 디스플레이 장치(100) 간 인터랙션이 강화될 수 있다.
도 1은 본 발명의 일 실시 예에 따른 디스플레이 장치의 구성을 블록도로 도시한 것이다.
도 2은 본 발명의 일 실시 예에 따른 원격제어장치의 블록도이다.
도 3은 본 발명의 일 실시 예에 따른 원격제어장치의 실제 구성 예를 보여준다.
도 4는 본 발명의 실시 예에 따라 원격 제어 장치를 활용하는 예를 보여준다.
도 5는 본 개시의 일 실시 예에 따른 인공 지능 (Artificial Intelligence, AI) 서버를 나타낸다.
도 6은 본 개시의 일 실시 예에 따른 AI 시스템의 동작 방법을 설명하기 위한 래더다이어 그램이다.
도 7a 및 도 7b는 본 개시의 실시 예에 따라 생성 AI를 통해 대기 화면의 이미지들을 생성하는 과정을 설명하는 도면이다.
도 8a 및 도 8b는 디스플레이 장치와 연동된 전자 기기의 상태 변화에 따라 대기 화면 상에 표시되는 이미지의 변경을 설명하는 도면이다.
이하, 본 발명과 관련된 실시 예에 대하여 도면을 참조하여 보다 상세하게 설명한다. 이하의 설명에서 사용되는 구성요소에 대한 접미사 "모듈" 및 "부"는 명세서 작성의 용이함만이 고려되어 부여되거나 혼용되는 것으로서, 그 자체로 서로 구별되는 의미 또는 역할을 갖는 것은 아니다.
본 발명의 실시예에 따른 디스플레이 장치는, 예를 들어 방송 수신 기능에 컴퓨터 지원 기능을 추가한 지능형 디스플레이 장치로서, 방송 수신 기능에 충실하면서도 인터넷 기능 등이 추가되어, 수기 방식의 입력 장치, 터치 스크린 또는 공간 리모콘 등 보다 사용에 편리한 인터페이스를 갖출 수 있다. 그리고, 유선 또는 무선 인터넷 기능의 지원으로 인터넷 및 컴퓨터에 접속되어, 이메일, 웹브라우징, 뱅킹 또는 게임 등의 기능도 수행가능하다. 이러한 다양한 기능을 위해 표준화된 범용 OS가 사용될 수 있다.
따라서, 본 발명에서 기술되는 디스플레이 장치는, 예를 들어 범용의 OS 커널 상에, 다양한 애플리케이션이 자유롭게 추가되거나 삭제 가능하므로, 사용자 친화적인 다양한 기능이 수행될 수 있다. 상기 디스플레이 장치는, 보다 구체적으로 예를 들면, 네트워크 TV, HBBTV, 스마트 TV, LED TV, OLED TV 등이 될 수 있으며, 경우에 따라 스마트폰에도 적용 가능하다.
도 1은 본 발명의 일 실시예에 따른 디스플레이 장치의 구성을 블록도로 도시한 것이다.
도 1을 참조하면, 디스플레이 장치(100)는 방송 수신부(130), 외부장치 인터페이스(135), 메모리(140), 사용자입력 인터페이스(150), 컨트롤러(170), 무선 통신 인터페이스(173), 디스플레이(180), 스피커(185), 전원 공급 회로(190)를 포함할 수 있다.
방송 수신부(130)는 튜너(131), 복조기(132) 및 네트워크 인터페이스(133)를 포함할 수 있다.
튜너(131)는 채널 선국 명령에 따라 특정 방송 채널을 선국할 수 있다. 튜너(131)는 선국된 특정 방송 채널에 대한 방송 신호를 수신할 수 있다.
복조기(132)는 수신한 방송 신호를 비디오 신호, 오디오 신호, 방송 프로그램과 관련된 데이터 신호로 분리할 수 있고, 분리된 비디오 신호, 오디오 신호 및 데이터 신호를 출력이 가능한 형태로 복원할 수 있다.
외부장치 인터페이스(135)는 인접하는 외부 장치 내의 애플리케이션 또는 애플리케이션 목록을 수신하여, 컨트롤러(170) 또는 메모리(140)로 전달할 수 있다.
외부장치 인터페이스(135)는 디스플레이 장치(100)와 외부 장치 간의 연결 경로를 제공할 수 있다. 외부장치 인터페이스(135)는 디스플레이 장치(100)에 무선 또는 유선으로 연결된 외부장치로부터 출력된 영상, 오디오 중 하나 이상을 수신하여, 컨트롤러(170)로 전달할 수 있다. 외부장치 인터페이스(135)는 복수의 외부 입력 단자들을 포함할 수 있다. 복수의 외부 입력 단자들은 RGB 단자, 하나 이상의 HDMI(High Definition Multimedia Interface) 단자, 컴포넌트(Component) 단자를 포함할 수 있다.
외부장치 인터페이스(135)를 통해 입력된 외부장치의 영상 신호는 디스플레이(180)를 통해 출력될 수 있다. 외부장치 인터페이스(135)를 통해 입력된 외부장치의 음성 신호는 스피커(185)를 통해 출력될 수 있다.
외부장치 인터페이스(135)에 연결 가능한 외부 장치는 셋톱박스, 블루레이 플레이어, DVD 플레이어, 게임기, 사운드 바, 스마트폰, PC, USB 메모리, 홈 씨어터 중 어느 하나일 수 있으나, 이는 예시에 불과하다.
네트워크 인터페이스(133)는 디스플레이 장치(100)를 인터넷망을 포함하는 유/무선 네트워크와 연결하기 위한 인터페이스를 제공할 수 있다. 네트워크 인터페이스(133)는 접속된 네트워크 또는 접속된 네트워크에 링크된 다른 네트워크를 통해, 다른 사용자 또는 다른 전자 기기와 데이터를 송신 또는 수신할 수 있다.
또한, 디스플레이 장치(100)에 미리 등록된 다른 사용자 또는 다른 전자 기기 중 선택된 사용자 또는 선택된 전자기기에, 디스플레이 장치(100)에 저장된 일부의 컨텐츠 데이터를 송신할 수 있다.
네트워크 인터페이스(133)는 접속된 네트워크 또는 접속된 네트워크에 링크된 다른 네트워크를 통해, 소정 웹 페이지에 접속할 수 있다. 즉, 네트워크를 통해 소정 웹 페이지에 접속하여, 해당 서버와 데이터를 송신 또는 수신할 수 있다.
그리고, 네트워크 인터페이스(133)는 컨텐츠 제공자 또는 네트워크 운영자가 제공하는 컨텐츠 또는 데이터들을 수신할 수 있다. 즉, 네트워크 인터페이스(133)는 네트워크를 통하여 컨텐츠 제공자 또는 네트워크 제공자로부터 제공되는 영화, 광고, 게임, VOD, 방송 신호 등의 컨텐츠 및 그와 관련된 정보를 수신할 수 있다.
또한, 네트워크 인터페이스(133)는 네트워크 운영자가 제공하는 펌웨어의 업데이트 정보 및 업데이트 파일을 수신할 수 있으며, 인터넷 또는 컨텐츠 제공자 또는 네트워크 운영자에게 데이터들을 송신할 수 있다.
네트워크 인터페이스(133)는 네트워크를 통해, 공중에 공개(open)된 애플리케이션들 중 원하는 애플리케이션을 선택하여 수신할 수 있다.
메모리(140)는 컨트롤러(170) 내의 각 신호 처리 및 제어를 위한 프로그램이 저장하고, 신호 처리된 영상, 음성 또는 데이터신호를 저장할 수 있다.
또한, 메모리(140)는 외부장치 인터페이스(135) 또는 네트워크 인터페이스(133)로부터 입력되는 영상, 음성, 또는 데이터 신호의 임시 저장을 위한 기능을 수행할 수도 있으며, 채널 기억 기능을 통하여 소정 이미지에 관한 정보를 저장할 수도 있다.
메모리(140)는 외부장치 인터페이스(135) 또는 네트워크 인터페이스(133)로부터 입력되는 애플리케이션 또는 애플리케이션 목록을 저장할 수 있다.
디스플레이 장치(100)는 메모리(140) 내에 저장되어 있는 컨텐츠 파일(동영상 파일, 정지영상 파일, 음악 파일, 문서 파일, 애플리케이션 파일 등)을 재생하여 사용자에게 제공할 수 있다.
사용자입력 인터페이스(150)는 사용자가 입력한 신호를 컨트롤러(170)로 전달하거나, 컨트롤러(170)로부터의 신호를 사용자에게 전달할 수 있다. 예를 들어, 사용자입력 인터페이스(150)는 블루투스(Bluetooth), WB(Ultra Wideband), 지그비(ZigBee) 방식, RF(Radio Frequency) 통신 방식 또는 적외선(IR) 통신 방식 등 다양한 통신 방식에 따라, 원격제어장치(200)로부터 전원 온/오프, 채널 선택, 화면 설정 등의 제어 신호를 수신하여 처리하거나, 컨트롤러(170)로부터의 제어 신호를 원격제어장치(200)로 송신하도록 처리할 수 있다.
또한, 사용자입력 인터페이스(150)는, 전원키, 채널키, 볼륨키, 설정치 등의 로컬키(미도시)에서 입력되는 제어 신호를 컨트롤러(170)에 전달할 수 있다.
컨트롤러(170)에서 영상 처리된 영상 신호는 디스플레이(180)로 입력되어 해당 영상 신호에 대응하는 영상으로 표시될 수 있다. 또한, 컨트롤러(170)에서 영상 처리된 영상 신호는 외부장치 인터페이스(135)를 통하여 외부 출력장치로 입력될 수 있다.
컨트롤러(170)에서 처리된 음성 신호는 스피커(185)로 오디오 출력될 수 있다. 또한, 컨트롤러(170)에서 처리된 음성 신호는 외부장치 인터페이스(135)를 통하여 외부 출력장치로 입력될 수 있다.
그 외, 컨트롤러(170)는, 디스플레이 장치(100) 내의 전반적인 동작을 제어할 수 있다.
또한, 컨트롤러(170)는 사용자입력 인터페이스(150)를 통하여 입력된 사용자 명령 또는 내부 프로그램에 의하여 디스플레이 장치(100)를 제어할 수 있으며, 네트워크에 접속하여 사용자가 원하는 애플리케이션 또는 애플리케이션 목록을 디스플레이 장치(100) 내로 다운받을 수 있도록 할 수 있다.
컨트롤러(170)는 사용자가 선택한 채널 정보 등이 처리한 영상 또는 음성신호와 함께 디스플레이(180) 또는 스피커(185)를 통하여 출력될 수 있도록 한다.
또한, 컨트롤러(170)는 사용자입력 인터페이스(150)를 통하여 수신한 외부장치 영상 재생 명령에 따라, 외부장치 인터페이스(135)를 통하여 입력되는 외부 장치, 예를 들어, 카메라 또는 캠코더로부터의, 영상 신호 또는 음성 신호가 디스플레이(180) 또는 스피커(185)를 통해 출력될 수 있도록 한다.
한편, 컨트롤러(170)는 영상을 표시하도록 디스플레이(180)를 제어할 수 있으며, 예를 들어 튜너(131)를 통해 입력되는 방송 영상, 또는 외부장치 인터페이스(135)를 통해 입력되는 외부 입력 영상, 또는 네트워크 인터페이스부를 통해 입력되는 영상, 또는 메모리(140)에 저장된 영상이 디스플레이(180)에서 표시되도록 제어할 수 있다. 이 경우, 디스플레이(180)에 표시되는 영상은 정지 영상 또는 동영상일 수 있으며, 2D 영상 또는 3D 영상일 수 있다.
또한, 컨트롤러(170)는 디스플레이 장치(100) 내에 저장된 컨텐츠, 또는 수신된 방송 컨텐츠, 외부로 부터 입력되는 외부 입력 컨텐츠가 재생되도록 제어할 수 있으며, 상기 컨텐츠는 방송 영상, 외부 입력 영상, 오디오 파일, 정지 영상, 접속된 웹 화면, 및 문서 파일 등 다양한 형태일 수 있다.
무선 통신 인터페이스(173)는 유선 또는 무선 통신을 통해 외부 기기와 통신을 수행할 수 있다. 무선 통신 인터페이스(173)는 외부 기기와 근거리 통신(Short range communication)을 수행할 수 있다. 이를 위해, 무선 통신 인터페이스(173)는 블루투스(Bluetooth™), RFID(Radio Frequency Identification), 적외선 통신(Infrared Data Association; IrDA), UWB(Ultra Wideband), ZigBee, NFC(Near Field Communication), Wi-Fi(Wireless-Fidelity), Wi-Fi Direct, Wireless USB(Wireless Universal Serial Bus) 기술 중 적어도 하나를 이용하여, 근거리 통신을 지원할 수 있다. 이러한, 무선 통신 인터페이스(173)는 근거리 무선 통신망(Wireless Area Networks)을 통해 디스플레이 장치(100)와 무선 통신 시스템 사이, 디스플레이 장치(100)와 다른 디스플레이 장치(100) 사이, 또는 디스플레이 장치(100)와 디스플레이 장치(100, 또는 외부서버)가 위치한 네트워크 사이의 무선 통신을 지원할 수 있다. 근거리 무선 통신망은 근거리 무선 개인 통신망(Wireless Personal Area Networks)일 수 있다.
여기에서, 다른 디스플레이 장치(100)는 본 발명에 따른 디스플레이 장치(100)와 데이터를 상호 교환하는 것이 가능한(또는 연동 가능한) 웨어러블 디바이스(wearable device, 예를 들어, 스마트워치(smartwatch), 스마트 글래스(smart glass), HMD(head mounted display)), 스마트 폰과 같은 이동 단말기가 될 수 있다. 무선 통신 인터페이스(173)는 디스플레이 장치(100) 주변에, 통신 가능한 웨어러블 디바이스를 감지(또는 인식)할 수 있다.
나아가, 컨트롤러(170)는 감지된 웨어러블 디바이스가 본 발명에 따른 디스플레이 장치(100)와 통신하도록 인증된 디바이스인 경우, 디스플레이 장치(100)에서 처리되는 데이터의 적어도 일부를, 무선 통신 인터페이스(173)를 통해 웨어러블 디바이스로 송신할 수 있다. 따라서, 웨어러블 디바이스의 사용자는, 디스플레이 장치(100)에서 처리되는 데이터를, 웨어러블 디바이스를 통해 이용할 수 있다.
디스플레이(180)는 컨트롤러(170)에서 처리된 영상 신호, 데이터 신호, OSD 신호 또는 외부장치 인터페이스(135)에서 수신되는 영상 신호, 데이터 신호 등을 각각 R,G,B 신호로 변환하여 구동 신호를 생성할 수 있다.
한편, 도 1에 도시된 디스플레이 장치(100)는 본 발명의 일실시예에 불과하므로. 도시된 구성요소들 중 일부는 실제 구현되는 디스플레이 장치(100)의 사양에 따라 통합, 추가, 또는 생략될 수 있다.
즉, 필요에 따라 2 이상의 구성요소가 하나의 구성요소로 합쳐지거나, 혹은 하나의 구성요소가 2 이상의 구성요소로 세분되어 구성될 수 있다. 또한, 각 블록에서 수행하는 기능은 본 발명의 실시예를 설명하기 위한 것이며, 그 구체적인 동작이나 장치는 본 발명의 권리범위를 제한하지 아니한다.
본 발명의 또 다른 실시예에 따르면, 디스플레이 장치(100)는 도 1에 도시된 바와 달리, 튜너(131)와 복조기(132)를 구비하지 않고 네트워크 인터페이스(133) 또는 외부장치 인터페이스(135)를 통해서 영상을 수신하여 재생할 수도 있다.
예를 들어, 디스플레이 장치(100)는 방송 신호 또는 다양한 네트워크 서비스에 따른 컨텐츠들을 수신하기 위한 등과 같은 셋탑 박스 등과 같은 영상 처리 장치와 상기 영상 처리 장치로부터 입력되는 컨텐츠를 재생하는 컨텐츠 재생 장치로 분리되어 구현될 수 있다.
이 경우, 이하에서 설명할 본 발명의 실시예에 따른 디스플레이 장치의 동작 방법은 도 1을 참조하여 설명한 바와 같은 디스플레이 장치(100)뿐 아니라, 상기 분리된 셋탑 박스 등과 같은 영상 처리 장치 또는 디스플레이(180) 및 오디오출력부(185)를 구비하는 컨텐츠 재생 장치 중 어느 하나에 의해 수행될 수도 있다.
다음으로, 도 2 내지 도 3을 참조하여, 본 발명의 일 실시 예에 따른 원격제어장치에 대해 설명한다.
도 2은 본 발명의 일 실시 예에 따른 원격제어장치의 블록도이고, 도 3은 본발명의 일 실시 예에 따른 원격제어장치(200)의 실제 구성 예를 보여준다.
먼저, 도 2를 참조하면, 원격제어장치(200)는 지문인식기(210), 무선통신회로(220), 사용자 입력 인터페이스(230), 센서(240), 출력 인터페이스(250), 전원공급회로(260), 메모리(270), 컨트롤러(280), 마이크로폰(290)를 포함할 수 있다.
도 2을 참조하면, 무선통신회로(220)는 전술하여 설명한 본 발명의 실시 예들에 따른 디스플레이 장치 중 임의의 어느 하나와 신호를 송수신한다.
원격제어장치(200)는 RF 통신규격에 따라 디스플레이 장치(100)와 신호를 송수신할 수 있는 RF 회로(221)을 구비하며, IR 통신규격에 따라 디스플레이 장치(100)와 신호를 송수신할 수 있는 IR 회로(223)을 구비할 수 있다. 또한, 원격제어장치(200)는 블루투스 통신규격에 따라 디스플레이 장치(100)와 신호를 송수신할 수 있는 블루투스 회로(225)를 구비할 수 있다. 또한, 원격제어장치(200)는 NFC(Near Field Communication) 통신 규격에 따라 디스플레이 장치(100)와 신호를 송수할 수 있는 NFC 회로(227)을 구비하며, WLAN(Wireless LAN) 통신 규격에 따라 디스플레이 장치(100)와 신호를 송수신할 수 있는 WLAN 회로(229)을 구비할 수 있다.
또한, 원격제어장치(200)는 디스플레이 장치(100)로 원격제어장치(200)의 움직임 등에 관한 정보가 담긴 신호를 무선통신회로(220)를 통해 전송한다.
한편, 원격제어장치(200)는 디스플레이 장치(100)가 전송한 신호를 RF 회로(221)을 통하여 수신할 수 있으며, 필요에 따라 IR 회로(223)을 통하여 디스플레이 장치(100)로 전원 온/오프, 채널 변경, 볼륨 변경 등에 관한 명령을 전송할 수 있다.
사용자 입력 인터페이스(230)는 키패드, 버튼, 터치 패드, 또는 터치 스크린 등으로 구성될 수 있다. 사용자는 사용자 입력 인터페이스(230)를 조작하여 원격제어장치(200)으로 디스플레이 장치(100)와 관련된 명령을 입력할 수 있다. 사용자 입력 인터페이스(230)가 하드키 버튼을 구비할 경우 사용자는 하드키 버튼의 푸쉬 동작을 통하여 원격제어장치(200)으로 디스플레이 장치(100)와 관련된 명령을 입력할 수 있다. 이에 대해서는 도 3을 참조하여 설명한다.
도 3을 참조하면, 원격제어장치(200)는 복수의 버튼을 포함할 수 있다. 복수의 버튼은 지문 인식 버튼(212), 전원 버튼(231), 홈 버튼(232), 라이브 버튼(233), 외부 입력 버튼(234), 음량 조절 버튼(235), 음성 인식 버튼(236), 채널 변경 버튼(237), 확인 버튼(238) 및 뒤로 가기 버튼(239)을 포함할 수 있다.
지문 인식 버튼(212)은 사용자의 지문을 인식하기 위한 버튼일 수 있다. 일 실시예로, 지문 인식 버튼(212)은 푸쉬 동작이 가능하여, 푸쉬 동작 및 지문 인식 동작을 수신할 수도 있다.
전원 버튼(231)은 디스플레이 장치(100)의 전원을 온/오프 하기 위한 버튼일 수 있다.
홈 버튼(232)은 디스플레이 장치(100)의 홈 화면으로 이동하기 위한 버튼일 수 있다.
라이브 버튼(233)은 실시간 방송 프로그램을 디스플레이 하기 위한 버튼일 수 있다.
외부 입력 버튼(234)은 디스플레이 장치(100)에 연결된 외부 입력을 수신하기 위한 버튼일 수 있다.
음량 조절 버튼(235)은 디스플레이 장치(100)가 출력하는 음량의 크기를 조절하기 위한 버튼일 수 있다.
음성 인식 버튼(236)은 사용자의 음성을 수신하고, 수신된 음성을 인식하기 위한 버튼일 수 있다.
채널 변경 버튼(237)은 특정 방송 채널의 방송 신호를 수신하기 위한 버튼일 수 있다.
확인 버튼(238)은 특정 기능을 선택하기 위한 버튼일 수 있고, 뒤로 가기 버튼(239)은 이전 화면으로 되돌아가기 위한 버튼일 수 있다.
다시 도 2를 설명한다.
사용자 입력 인터페이스(230)가 터치스크린을 구비할 경우 사용자는 터치스크린의 소프트키를 터치하여 원격제어장치(200)로 디스플레이 장치(100)와 관련된 명령을 입력할 수 있다. 또한, 사용자 입력 인터페이스(230)는 스크롤 키나, 조그 키 등 사용자가 조작할 수 있는 다양한 종류의 입력수단을 구비할 수 있으며 본 실시 예는 본 발명의 권리범위를 제한하지 아니한다.
센서(240)는 자이로 센서(241) 또는 가속도 센서(243)를 구비할 수 있으며, 자이로 센서(241)는 원격제어장치(200)의 움직임에 관한 정보를 센싱할 수 있다.
예를 들어, 자이로 센서(241)는 원격제어장치(200)의 동작에 관한 정보를 x,y,z 축을 기준으로 센싱할 수 있으며, 가속도 센서(243)는 원격제어장치(200)의 이동속도 등에 관한 정보를 센싱할 수 있다. 한편, 원격제어장치(200)는 거리측정센서를 더 구비할 수 있어, 디스플레이 장치(100)의 디스플레이(180)와의 거리를 센싱할 수 있다.
출력 인터페이스(250)는 사용자 입력 인터페이스(230)의 조작에 대응하거나 디스플레이 장치(100)에서 전송한 신호에 대응하는 영상 또는 음성 신호를 출력할 수 있다.
사용자는 출력 인터페이스(250)를 사용자 입력 인터페이스(230)의 조작 여부 또는 디스플레이 장치(100)의 제어 여부를 인지할 수 있다.
예를 들어, 출력 인터페이스(250)는 사용자 입력 인터페이스(230)가 조작되거나 무선 통신부(225)를 통하여 디스플레이 장치(100)와 신호가 송수신되면 점등되는 LED(251), 진동을 발생하는 진동기(253), 음향을 출력하는 스피커(255), 또는 영상을 출력하는 디스플레이(257)을 구비할 수 있다.
또한, 전원공급회로(260)는 원격제어장치(200)으로 전원을 공급하며, 원격제어장치(200)이 소정 시간 동안 움직이지 않은 경우 전원 공급을 중단함으로서 전원 낭비를 줄일 수 있다.
전원공급회로(260)는 원격제어장치(200)에 구비된 소정 키가 조작된 경우에 전원 공급을 재개할 수 있다.
메모리(270)는 원격제어장치(200)의 제어 또는 동작에 필요한 여러 종류의 프로그램, 애플리케이션 데이터 등이 저장될 수 있다.
원격제어장치(200)가 디스플레이 장치(100)와 RF 회로(221)을 통하여 무선으로 신호를 송수신할 경우, 원격제어장치(200)과 디스플레이 장치(100)는 소정 주파수 대역을 통하여 신호를 송수신한다.
원격제어장치(200)의 컨트롤러(280)는 원격제어장치(200)과 페어링된 디스플레이 장치(100)와 신호를 무선으로 송수신할 수 있는 주파수 대역 등에 관한 정보를 메모리(270)에 저장하고 참조할 수 있다.
컨트롤러(280)는 원격제어장치(200)의 제어에 관련된 제반사항을 제어한다. 컨트롤러(280)는 사용자 입력 인터페이스(230)의 소정 키 조작에 대응하는 신호 또는 센서(240)에서 센싱한 원격제어장치(200)의 움직임에 대응하는 신호를 무선 통신부(225)를 통하여 디스플레이 장치(100)로 전송할 수 있다.
또한, 원격제어장치(200)의 마이크로폰(290)은 음성을 획득할 수 있다.
마이크로폰(290)는 복수 개로 구비될 수 있다.
다음으로 도 4를 설명한다.
도 4는 본 발명의 실시 예에 따라 원격 제어 장치를 활용하는 예를 보여준다.
도 4의 (a)는 원격 제어 장치(200)에 대응하는 포인터(205)가 디스플레이(180)에 표시되는 것을 예시한다.
사용자는 원격 제어 장치(200)를 상하, 좌우로 움직이거나 회전할 수 있다. 디스플레이 장치(100)의 디스플레이(180)에 표시된 포인터(205)는 원격 제어 장치(200)의 움직임에 대응한다. 이러한 원격 제어 장치(200)는, 도면과 같이, 3D 공간 상의 움직임에 따라 해당 포인터(205)가 이동되어 표시되므로, 공간 리모콘이라 명명할 수 있다.
도 4의 (b)는 사용자가 원격 제어 장치(200)를 왼쪽으로 이동하면, 디스플레이 장치(100)의 디스플레이(180)에 표시된 포인터(205)도 이에 대응하여 왼쪽으로 이동하는 것을 예시한다.
원격 제어 장치(200)의 센서를 통하여 감지된 원격 제어 장치(200)의 움직임에 관한 정보는 디스플레이 장치(100)로 전송된다. 디스플레이 장치(100)는 원격 제어 장치(200)의 움직임에 관한 정보로부터 포인터(205)의 좌표를 산출할 수 있다. 디스플레이 장치(100)는 산출한 좌표에 대응하도록 포인터(205)를 표시할 수 있다.
도 4의 (c)는, 원격 제어 장치(200) 내의 특정 버튼을 누른 상태에서, 사용자가 원격 제어 장치(200)를 디스플레이(180)에서 멀어지도록 이동하는 경우를 예시한다. 이에 의해, 포인터(205)에 대응하는 디스플레이(180) 내의 선택 영역이 줌인되어 확대 표시될 수 있다.
이와 반대로, 사용자가 원격 제어 장치(200)를 디스플레이(180)에 가까워지도록 이동하는 경우, 포인터(205)에 대응하는 디스플레이(180) 내의 선택 영역이 줌아웃되어 축소 표시될 수 있다.
한편, 원격 제어 장치(200)가 디스플레이(180)에서 멀어지는 경우, 선택 영역이 줌아웃되고, 원격 제어 장치(200)가 디스플레이(180)에 가까워지는 경우, 선택 영역이 줌인될 수도 있다.
또한, 원격 제어 장치(200) 내의 특정 버튼을 누른 상태에서는 상하, 좌우 이동의 인식이 배제될 수 있다. 즉, 원격 제어 장치(200)가 디스플레이(180)에서 멀어지거나 접근하도록 이동하는 경우, 상, 하, 좌, 우 이동은 인식되지 않고, 앞뒤 이동만 인식되도록 할 수 있다. 원격 제어 장치(200) 내의 특정 버튼을 누르지 않은 상태에서는, 원격 제어 장치(200)의 상, 하, 좌, 우 이동에 따라 포인터(205)만 이동하게 된다.
한편, 포인터(205)의 이동속도나 이동방향은 원격 제어 장치(200)의 이동속도나 이동방향에 대응할 수 있다.
한편, 본 명세서에서의 포인터는, 원격 제어 장치(200)의 동작에 대응하여, 디스플레이(180)에 표시되는 오브젝트를 의미한다. 따라서, 포인터(205)로 도면에 도시된 화살표 형상 외에 다양한 형상의 오브젝트가 가능하다. 예를 들어, 점, 커서, 프롬프트, 두꺼운 외곽선 등을 포함하는 개념일 수 있다. 그리고, 포인터(205)가 디스플레이(180) 상의 가로축과 세로축 중 어느 한 지점(point)에 대응하여 표시되는 것은 물론, 선(line), 면(surface) 등 복수 지점에 대응하여 표시되는 것도 가능하다.
도 5는 본 개시의 일 실시 예에 따른 인공 지능 (Artificial Intelligence, AI) 서버를 나타낸다.
도 5를 참조하면, AI 서버(500)는 머신 러닝 알고리즘을 이용하여 인공 신경망을 학습시키거나 학습된 인공 신경망을 이용하는 장치를 의미할 수 있다.
AI 서버(500)는 복수의 서버들로 구성되어 분산 처리를 수행할 수도 있고, 5G 네트워크로 정의될 수 있다.
AI 서버(500)는 AI 장치(100)의 일부의 구성으로 포함되어, AI 프로세싱 중 적어도 일부를 함께 수행할 수도 있다.
AI 서버(500)는 통신부(510), 메모리(530), 러닝 프로세서(540) 및 프로세서(560)를 포함할 수 있다.
통신부(510)는 디스플레이 장치(100)와 같은 외부 장치와 데이터를 송수신할 수 있다.
메모리(530)는 모델 저장부(531)를 포함할 수 있다.
모델 저장부(531)는 러닝 프로세서(540)을 통하여 학습 중인 또는 학습된 모델(또는 인공 신경망, 531a)을 저장할 수 있다.
러닝 프로세서(540)는 학습 데이터를 이용하여 인공 신경망(531a)을 학습시킬 수 있다. 학습 모델은 인공 신경망의 AI 서버(500)에 탑재된 상태에서 이용되거나, 디스플레이 장치(100)와 같은 외부 장치에 탑재되어 이용될 수도 있다.
학습 모델은 하드웨어, 소프트웨어 또는 하드웨어와 소프트웨어의 조합으로 구현될 수 있다. 학습 모델의 일부 또는 전부가 소프트웨어로 구현되는 경우 학습 모델을 구성하는 하나 이상의 명령어(instruction)는 메모리(530)에 저장될 수 있다.
프로세서(560)는 학습 모델을 이용하여 새로운 입력 데이터에 대하여 결과 값을 추론하고, 추론한 결과 값에 기초한 응답이나 제어 명령을 생성할 수 있다.
도 6은 본 개시의 일 실시 예에 따른 AI 시스템의 동작 방법을 설명하기 위한 래더다이어 그램이다.
도 6을 참조하면, AI 시스템은 디스플레이 장치(100), AI 서버(500), 제1 생성 AI 서버(610) 및 제2 생성 AI 서버(630)를 포함할 수 있다.
도 6에서 제1 생성 AI 서버(610) 및 제2 생성 AI 서버(630)는 하나의 서버로 구성될 수도 있다.
또한, 도 6에서는 2개의 생성 AI 서버를 예를 들어 설명하나, 3개 이상의 생성 AI 서버들이 구비될 수도 있다.
도 6을 참조하면, 디스플레이 장치(100)의 컨트롤러(170)는 대기 화면의 이미지 생성 요청을 수신할 수 있다(S601).
일 실시 예에서 대기 화면은 디스플레이 장치(100)의 저전력 모드에서 표시되는 화면일 수 있다.
이미지 생성 요청은 사용자가 발화한 음성 명령, 사용자의 텍스트 입력, 원격 제어 장치(200)로부터 수신된 명령 중 어느 하나일 수 있다.
디스플레이 장치(100)의 컨트롤러(170)는 디스플레이 장치(100)와 연동된 전자 기기의 정보를 획득할 수 있다(S603).
전자 기기의 정보는 전자 기기의 명칭, 전자 기기의 동작 상태 정보를 포함할 수 있다.
동작 상태 정보는 전자 기기의 동작 상태들을 포함할 수 있다. 예를 들어, 전자 기기가 세탁 기능과 건조 기능을 구비한 가전 기기인 경우, 동작 상태 정보는 세탁 시작, 세탁 중, 세탁 완료, 건조 시작, 건조 중, 건조 완료를 포함할 수 있다.
컨트롤러(170)는 네트워크 인터페이스(133)를 통해 디스플레이 장치(100)와 연동된 하나 이상의 전자 기기로부터 전자 기기의 정보를 수신할 수 있다.
일 실시 예에서 컨트롤러(170)는 이미지 생성 요청에 따라 전자 기기에 요청 메시지를 전송할 수 있고, 요청 메시지에 응답하여 전자 기기의 정보를 수신할 수 있다.
또 다른 실시 예에서 컨트롤러(170)는 이미지 생성 요청의 획득 전에 전자 기기에 요청 메시지를 전송할 수 있고, 요청 메시지에 응답하여 전자 기기의 정보를 미리 획득할 수도 있다.
디스플레이 장치(100)의 컨트롤러(170)는 네트워크 인터페이스(133)를 통해 이미지 생성 요청 및 전자 기기의 정보를 AI 서버(500)에 전송할 수 있다(S605).
컨트롤러(170)는 이미지 생성 요청 및 전자 기기의 정보를 네트워크 인터페이스(133)를 통해 AI 서버(500)의 통신부(510)로 전송할 수 있다.
AI 서버(500)의 프로세서(560)는 수신된 이미지 생성 요청 및 전자 기기의 정보에 기초하여 제1 프롬프트를 생성할 수 있다(S607).
일 실시 예에서 제1 프롬프트는 제1 생성 AI 서버(610)에 탑재된 생성 AI 모델에 입력되기 위한 명령어일 수 있다.
생성 AI 모델은 딥 러닝 또는 머신 러닝을 이용하여, 명령에 대한 응답으로 컨텐트를 생성하는 모델일 수 있다.
제1 프롬프트는 자연어 생성 AI 모델로 하여금 자연어를 생성하도록 하는 명령어일 수 있다.
프로세서(560)는 이미지 생성 요청 및 전자 기기의 정보를 조합하여 제1 프롬프트를 생성할 수 있다. 프로세서(560)는 이미지 생성 요청의 분석 결과, 전자 기기의 명칭 및 전자 기기의 동작 상태 정보를 이용하여 제1 프롬프트를 생성할 수 있다.
이미지 생성 요청의 분석 결과는 사용자의 의도를 포함할 수 있다.
예를 들어, 이미지 생성 요청이 사용자가 발화한 음성 명령인 경우, 프로세서(560)는 음성 명령을 텍스트로 변환하고, 자연어 처리 엔진을 이용하여 변환된 텍스트의 분석 결과를 획득할 수 있다.
음성 명령의 분석 결과는 대기 화면을 위한 특정 분위기의 이미지 생성을 요구하는 결과일 수 있다.
프로세서(560)는 이미지 생성 요청의 분석 결과, 전자 기기의 명칭 및 전자 기기의 동작 상태 정보를 조합하여 하나의 문장을 생성할 수 있고, 생성된 문장을 제1 프롬프트로 획득할 수 있다.
AI 서버(500)의 프로세서(560)는 생성된 제1 프롬프트를 통신부(510)를 통해 제1 생성 AI 서버(610)에 전송할 수 있다(S609).
제1 생성 AI 서버(610)는 프롬프트에 대한 응답으로 자연어를 생성하는 서버일 수 있다.
제1 생성 AI 서버(610)는 제1 프롬프트에 대한 응답으로 복수의 문장들을 생성할 수 있다. 복수의 문장들 각각은 이미지 생성 요청의 분석 결과 및 전자 기기의 각 동작 상태의 특징을 나타내는 문장일 수 있다.
복수의 문장들 각각은 이미지 생성 요청의 분석 결과 및 전자 기기의 각 동작 상태의 특징을 반영한 이미지의 생성을 명령하는 문장일 수 있다.
AI 서버(500)의 프로세서(560)는 제1 생성 AI 서버(610)로부터 제1 프롬프트에 대한 응답으로, 복수의 문장들을 수신할 수 있다(S611).
제1 생성 AI 서버(610)는 제1 프롬프트에 대한 응답으로 복수의 문장들을 생성할 수 있다. 복수의 문장들 각각은 이미지 생성 요청의 분석 결과 및 전자 기기의 각 동작 상태의 특징을 나타내는 문장일 수 있다.
제1 생성 AI 서버(610)는 생성된 복수의 문장들을 AI 서버(500)에 전송할 수 있다.
AI 서버(500)의 프로세서(560)는 수신된 복수의 문장들에 기초하여 제2 프롬프트를 생성할 수 있다(S613).
일 실시 예에서 제2 프롬프트는 제2 생성 AI 서버(630)에 탑재된 생성 AI 모델에 입력되기 위한 명령어일 수 있다.
제2 프롬프트는 제2 생성 AI 서버(630)의 이미지 생성 AI 모델로 하여금 이미지를 생성하도록 하는 명령어일 수 있다.
프로세서(560)는 제1 프롬프트의 응답인 복수의 문장들 및 각 문장에 상응하는 전자 기기의 동작 상태를 포함하는 제2 프롬프트를 생성할 수 있다.
제2 프롬프트는 복수의 문장들 중 어느 하나 및 해당 문장에 상응하는 동작 상태만을 포함할 수도 있다.
제2 프롬프트는 제1 생성 AI 서버(610)로부터 수신된 복수의 문장들을 포함할 수 있다.
AI 서버(500)의 프로세서(560)는 생성된 제2 프롬프트를 통신부(510)를 통해 제2 생성 AI 서버(630)에 전송할 수 있다(S615).
제2 생성 AI 서버(630)는 제2 프롬프트에 대한 응답으로 이미지를 생성하는 서버일 수 있다.
제2 생성 AI 서버(630)는 제2 프롬프트에 대한 응답으로 복수의 이미지들을 생성할 수 있다. 복수의 이미지들 각각은 이미지 생성 요청의 분석 결과 및 전자 기기의 각 동작 상태의 특징을 나타내는 이미지일 수 있다.
AI 서버(500)의 프로세서(560)는 제2 생성 AI 서버(630)로부터 제2 프롬프트에 대한 응답으로, 복수의 이미지들을 수신할 수 있다(S617).
프로세서(560)는 수신된 복수의 이미지들을 메모리(530)에 저장하거나, 외부 데이터 베이스(미도시)에 저장할 수 있다.
AI 서버(500)의 프로세서(560)는 복수의 이미지들을 통신부(510)를 통해 디스플레이 장치(100)로 전송할 수 있다(S619).
프로세서(560)는 복수의 이미지들을 통신부(510)를 통해 디스플레이 장치(100)의 네트워크 인터페이스(133)로 전송할 수 있다.
복수의 이미지들 각각에는 복수의 동작 상태들 각각이 매칭되어 있을 수 있다.
디스플레이 장치(100)의 컨트롤러(170)는 대기 화면의 진입에 따라 복수의 이미지들 중 기본 이미지를 디스플레이(180) 상에 표시한다(S621).
기본 이미지는 전자 기기의 기본 동작 상태에 대응하는 이미지일 수 있다.
기본 이미지는 이미지 생성 요청의 분석 결과 및 전자 기기의 기본 동작 상태에 대응하는 이미지일 수 있다.
디스플레이 장치(100)의 컨트롤러(170)는 기본 이미지를 표시 중, 전자 기기의 동작 상태가 변경되었는지를 판단할 수 있다(S623).
컨트롤러(170)는 전자 기기의 동작 상태가 제1 상태에서 제2 상태로 변경되었는지를 판단할 수 있다.
컨트롤러(170)는 전자 기기로부터 전자 기기의 동작 상태에 대한 정보를 주기적으로 수신할 수 있고, 수신된 정보에 기초하여, 전자 기기의 동작 상태가 변경되었는지를 판단할 수 있다.
디스플레이 장치(100)의 컨트롤러(170)는 전자 기기의 동작 상태가 변경된 경우, 복수의 이미지들 중 변경된 동작 상태에 대응하는 이미지를 디스플레이(180) 상에 표시할 수 있다(S625).
컨트롤러(170)는 전자 기기의 동작 상태가 제1 상태에서 제2 상태로 변경된 경우, 대기 화면 상에서 제1 상태에 상응하는 제1 이미지를 제2 상태에 상응하는 제2 이미지로 변경할 수 있다.
이와 같이, 본 개시의 실시 예에 따르면, 대기 화면 상에, 사용자가 원하는 정보와 사용자 인터페이스가 디스플레이 장치(100)의 소프트웨어 변경없이 제공될 수 있다.
이에 따라, 사용자의 의도가 반영된 대기 화면의 활용도가 증가될 수 있다.
한편, 컨트롤러(170)는 전자 기기의 동작 상태에 대응하는 이미지 및 동작 상태를 나타내는 알림을 디스플레이(180) 상에 표시할 수 있다.
도 7a 및 도 7b는 본 개시의 실시 예에 따라 생성 AI를 통해 대기 화면의 이미지들을 생성하는 과정을 설명하는 도면이다.
AI 서버(500)의 프로세서(560)는 자연어 프롬프터(561) 및 이미지 프롬프터(563)를 포함할 수 있다.
자연어 프롬프터(561)는 디스플레이 장치(100)로부터 수신된 이미지 생성 요청의 분석 결과 및 전자 기기의 정보에 기초하여 자연어 생성 프롬프트를 생성할 수 있다.
자연어 생성 프롬프트는 이미지 생성 요청의 분석 결과 및 전자 기기의 정보를 포함하는 하나의 문장일 수 있다.
자연어 프롬프터(651)는 생성된 자연어 생성 프롬프트는 자연어를 생성하는 제1 생성 AI(610)에 전송할 수 있다.
제1 생성 AI(610)는 자연어 생성 프롬프트를 입력으로 하여, 자연어 생성 결과를 생성할 수 있고, 생성된 자연어 생성 결과를 AI 서버(500)의 이미지 프롬프터(563)에 전송할 수 있다.
자연어 생성 결과는 이미지 생성 요청의 분석 결과 및 전자 기기의 각 동작 상태의 특징을 나타내는 복수의 문장들을 포함할 수 있다.
이미지 프롬프터(563)는 제1 생성 AI 서버(610)로부터 수신된 자연어 생성 결과에 기반하여, 이미지 생성 프롬프트를 생성할 수 있다.
이미지 생성 프롬프트는 제1 생성 AI 서버(610)로부터 수신된 문장과 전자 기기의 동작 상태를 포함하는 프롬프트일 수 있다.
이미지 프롬프터(563)는 문장과 각 전자 기기의 동작 상태를 포함하는 이미지 생성 프롬프트를 이미지를 생성하는 제2 생성 AI 서버(630)에 전송할 수 있다.
제2 생성 AI 서버(630)는 이미지 생성 프롬프트에 응답하여, 이미지 생성 결과를 생성할 수 있고, 생성된 이미지 생성 결과를 AI 서버(500)에 전송할 수 있다.
이미지 생성 결과는 이미지 생성 프롬프트에 따라 제2 생성 AI 서버(630)의 이미지 생성 모델이 생성한 이미지일 수 있다.
이미지 프롬프터(563)는 전자 기기의 동작 상태에 상응하는 이미지 생성 프롬프트를 복수 개 생성할 수 있고, 생성된 복수의 이미지 생성 프롬프트들을 순차적으로 제2 생성 AI 서버(630)에 전송할 수 있다.
이미지 프롬프터(563)는 복수의 이미지 생성 프롬프트들 각각에 상응하는 복수의 이미지들을 순차적으로 제2 생성 AI 서버(630)로부터 수신할 수 있다.
또 다른 실시 예에서 이미지 프롬프터(563)는 복수의 이미지 생성 프롬프트들을 한번에 제2 생성 AI 서버(630)에 전송할 수 있고, 제2 생성 AI 서버(630)로부터 복수의 이미지들을 한번에 수신할 수 있다.
이미지 생성 프롬프트는 기본 이미지 생성 프롬프트(563a), 제1 동작 상태 이미지 생성 프롬프트(563b) 및 제2 동작 상태 이미지 생성 프롬프트(563c) 중 어느 하나일 수 있다.
기본 이미지 생성 프롬프트(563a)는 전자 기기의 기본 동작 상태에 상응하는 기본 이미지의 생성을 명령하는 프롬프트일 수 있다.
제1 동작 상태 이미지 생성 프롬프트(563b)는 전자 기기의 제1 동작 상태에 상응하는 이미지의 생성을 명령하는 프롬프트일 수 있다.
제2 동작 상태 이미지 생성 프롬프트(563c)는 전자 기기의 제2 동작 상태에 상응하는 이미지의 생성을 명령하는 프롬프트일 수 있다.
AI 서버(500)는 기본 이미지 생성 프롬프트(563a)를 제2 생성 AI 서버(630)로 전송할 수 있고, 기본 이미지 생성 프롬프트(563a)에 대한 응답으로 기본 이미지를 수신할 수 있다.
AI 서버(500)는 제1 동작 상태 이미지 생성 프롬프트(563b)를 제2 생성 AI 서버(630)로 전송할 수 있고, 제1 동작 상태 이미지 생성 프롬프트(563b)에 대한 응답으로 제1 이미지를 수신할 수 있다.
AI 서버(500)는 제2 동작 상태 이미지 생성 프롬프트(563c)를 제2 생성 AI 서버(630)로 전송할 수 있고, 제2 동작 상태 이미지 생성 프롬프트(563c)에 대한 응답으로 제2 이미지를 수신할 수 있다.
AI 서버(500)는 수신된 기본 이미지, 제1 이미지 및 제2 이미지를 생성 이미지 DB(700)에 저장할 수 있다.
도 7b는 실제 사용자가 발화한 음성 명령에 따라 자동으로 음성 명령에 적합한 이미지를 생성하는 과정을 설명하는 도면이다.
도 7b에서 사용자는 <generate a beach-like standby screen>를 발화했음을 가정한다.
디스플레이 장치(100)는 사용자가 발화한 음성 명령에 상응하는 음성 데이터를 AI 서버(500)에 전송할 수 있다.
디스플레이 장치(100)는 음성 데이터 및 디스플레이 장치(100)와 연동된 전자 기기의 정보를 AI 서버(500)에 전송할 수 있다.
AI 서버(500)는 디스플레이 장치(100)와 연동된 전자 기기를 자신이 직접 수집할 수도 있다.
AI 서버(500)는 음성 데이터를 텍스트 데이터로 변환하고, 텍스트 데이터의 분석 결과를 획득할 수 있다.
AI 서버(500)의 자연어 프롬프터(561)는 분석 결과와 전자 기기의 정보에 기초하여 자연어 생성 프롬프트를 생성할 수 있다.
분석 결과는 대기 화면 상에 해변 분위기의 이미지를 생성해달라는 의도를 포함할 수 있다.
전자 기기의 정보는 전자 기기의 명칭 및 전자 기기의 동작 상태 정보를 포함할 수 있다.
제1 생성 AI 서버(610)는 자연어 생성 프롬프트에 기초하여 복수의 문장들을 생성할 수 있다.
제1 생성 AI 서버(610)가 생성한 복수의 문장들은 <Draw Waikiki Beach>, <Draw a clothesline in the sky in the background of this picture> 및 <Draw laundry hanging on a clothesline on this picture>일 수 있다.
복수의 문장들 각각은 분석 결과와 전자 기기의 동작 상태를 그려 달라는 주제를 포함할 수 있다.
제1 생성 AI 서버(610)는 생성된 복수의 문장들을 AI 서버(500)에 전송할 수 있다.
AI 서버(500)의 이미지 프롬프터(563)는 수신된 복수의 문장들 각각과 전자 기기의 동작 상태를 조합하여 이미지 생성 프롬프트를 생성할 수 있다.
이미지 프롬프터(563)는 <Draw Waikiki Beach>와 전자 기기의 기본 상태(건조 완료 상태, Drying start)를 조합한 기본 이미지 생성 프롬프터(563a)를 생성할 수 있다. 기본 상태는 건조 완료 상태 또는 전원 오프 상태일 수 있다.
제2 생성 IA 서버(630)는 기본 이미지 생성 프롬프터(563a)에 기초하여 기본 이미지(711)를 생성할 수 있고, 생성된 기본 이미지(711)를 AI 서버(500)에 전송할 수 있다.
기본 이미지(711)는 와이키키 해변을 포함하는 이미지일 수 있다.
이미지 프롬프터(563)는 <Draw a clothesline in the sky in the background of this picture>와 전자 기기의 제1 동작 상태(세탁 시작 상태, Laundry start)를 조합한 제1 동작 상태 이미지 생성 프롬프터(563b)를 생성할 수 있다.
제1 동작 상태 이미지 생성 프롬프터(563b)는 <Draw a clothesline in the sky in the background of this picture>, 전자 기기의 제1 동작 상태 및 제1 이미지(711)를 포함할 수 있다.
제2 생성 IA 서버(630)는 제1 동작 상태 이미지 생성 프롬프터(563b)에 기초하여 제1 이미지(713)를 생성할 수 있고, 생성된 제1 이미지(713)를 AI 서버(500)에 전송할 수 있다.
제1 이미지(713)는 와이키키 해변 및 세탁의 시작을 나타내는 빨래줄을 포함하는 이미지일 수 있다. 제1 이미지(713)는 기본 이미지(711)에 비해 빨래줄을 더 포함할 수 있다.
제1 이미지(713)는 기본 이미지(711)에 제1 동작 상태의 특징을 나타내는 빨래줄을 병합한 이미지일 수 있다.
이미지 프롬프터(563)는 <<Draw laundry hanging on a clothesline on this picture>와 전자 기기의 제2 동작 상태(건조 시작 상태, Drying start)를 조합한 제2 동작 상태 이미지 생성 프롬프터(563c)를 생성할 수 있다.
제2 동작 상태 이미지 생성 프롬프터(563c)는 <Draw a clothesline in the sky in the background of this picture>, 전자 기기의 제2 동작 상태 및 제2 이미지(713)를 포함할 수 있다.
제2 생성 IA 서버(630)는 제2 동작 상태 이미지 생성 프롬프터(563c)에 기초하여 제2 이미지(715)를 생성할 수 있고, 생성된 제2 이미지(715)를 AI 서버(500)에 전송할 수 있다.
제2 이미지(715)는 와이키키 해변, 빨래줄 및 건조를 나타내는 빨래줄에 널린 옷을 포함하는 이미지일 수 있다. 제2 이미지(715)는 제1 이미지(713)에 비해 빨래줄에 널린 옷들을 더 포함할 수 있다.
제2 이미지(715)는 제1 이미지(713)에 제2 동작 상태의 특징을 나타내는 빨래줄에 널린 옷을 병합한 이미지일 수 있다.
AI 서버(500)는 기본 이미지(711), 제1 이미지(713) 및 제2 이미지(715)를 생성 이미지 DB(700)에 저장할 수 있다.
AI 서버(500)는 기본 이미지(711), 제1 이미지(713) 및 제2 이미지(715)를 디스플레이 장치(100)에 전송할 수 있다.
디스플레이 장치(100)는 기본 이미지(711), 제1 이미지(713) 및 제2 이미지(715)를 메모리(140)에 저장할 수 있다.
디스플레이 장치(100)는 기본 이미지(711), 제1 이미지(713) 및 제2 이미지(715) 중 어느 하나를 전자 기기의 동작 상태에 맞게 표시할 수 있다.
도 8a 및 도 8b는 디스플레이 장치와 연동된 전자 기기의 상태 변화에 따라 대기 화면 상에 표시되는 이미지의 변경을 설명하는 도면이다.
도 8a 및 도 8b에서 기본 이미지(711), 제1 이미지(713) 및 제2 이미지(715)는 도 6 내지 도 7b의 과정에서 따라 생성된 이미지들일 수 있다.
디스플레이 장치(100)는 대기 화면의 생성을 위한 이미지 생성 요청을 수신할 수 있다.
AI 서버(500)는 도 6 내지 도 7b의 이미지 생성 로직에 따라 대기 화면 상에 표시할 복수의 이미지들 생성하고, 생성된 이미지들을 생성 이미지 DB에 저장할 수 있다.
AI 서버(500)는 생성된 이미지들을 디스플레이 장치(100)에 전송할 수 있다.
디스플레이 장치(100)는 대기 화면으로 진입한다.
디스플레이 장치(100)는 전자 기기(800)의 동작 상태가 기본 동작 상태인 경우, 기본 이미지(711)를 대기 화면 상에 표시할 수 있다. 기본 동작 상태는 건조 완료 상태 또는 전원 오프 상태 중 어느 하나일 수 있다.
전자 기기(800)의 동작 상태는 기본 동작 상태에서 제1 동작 상태(상태1)로 변경될 수 있고, 전자 기기(800)는 변경된 동작 상태에 대한 정보를 디스플레이 장치(100)에 전송할 수 있다. 제1 동작 상태는 세탁의 시작을 나타내는 세탁 시작 상태일 수 있다.
디스플레이 장치(100)는 변경된 동작 상태에 대한 정보에 기초하여 제1 동작 상태에 상응하는 제1 이미지(713)를 대기 화면 상에 표시할 수 있다.
전자 기기(800)의 동작 상태는 제1 동작 상태에서 제2 동작 상태(상태2)로 변경될 수 있고, 전자 기기(800)는 변경된 동작 상태에 대한 정보를 디스플레이 장치(100)에 전송할 수 있다. 제2 동작 상태는 건조의 시작을 나타내는 건조 시작 상태일 수 있다. 제2 동작 상태는 세탁의 종료 및 건조의 시작을 나타내는 상태일 수 있다.
디스플레이 장치(100)는 변경된 동작 상태에 대한 정보에 기초하여 제2 동작 상태에 상응하는 제2 이미지(715)를 대기 화면 상에 표시할 수 있다.
한편, 디스플레이 장치(100)는 전자 기기(800)의 동작 상태의 변화에 따라 이미지들(711, 713, 715)을 GIF(Graphics Interchange Format)의 형태로 재생하거나, 이미지들을 역순으로 재생할 수 있다.
디스플레이 장치(100)는 전자 기기(800)의 동작 상태가 건조 시작 상태, 건조 완료 상태 및 기본 상태 순으로 변경된 경우, 제2 이미지(715), 제1 이미지(713) 및 기본 이미지(711)를 순차적으로 재생할 수 있다.
이와 같이, 본 개시의 실시 예에 따르면, 사용자는 이미지 생성을 위한 단순한 발화만으로, 원하는 이미지가 대기 화면 상에 제공될 수 있다.
이에 따라, 사용자와 디스플레이 장치(100) 간 인터랙션이 강화될 수 있다.
본 발명의 일 실시 예에 의하면, 전술한 방법은, 프로그램이 기록된 매체에 프로세서가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 프로세서가 읽을 수 있는 매체의 예로는, ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장장치 등이 있다.
상기와 같이 설명된 디스플레이 장치는 상기 설명된 실시 예들의 구성과 방법이 한정되게 적용될 수 있는 것이 아니라, 상기 실시 예들은 다양한 변형이 이루어질 수 있도록 각 실시 예들의 전부 또는 일부가 선택적으로 조합되어 구성될 수도 있다.

Claims (15)

  1. 인공 지능 장치에 있어서,
    디스플레이 장치와 통신하는 통신부; 및
    상기 디스플레이 장치로부터 대기 화면의 이미지 생성 요청 및 상기 디스플레이 장치와 연동된 전자 기기의 동작 상태 정보를 상기 통신부를 통해 수신하고,
    상기 이미지 생성 요청의 분석 결과와 상기 전자 기기의 동작 상태 정보에 기초하여 자연어 생성을 위한 제1 프롬프트를 생성하고,
    상기 제1 프롬프트를 제1 생성 인공 지능 서버에 전송하고,
    상기 제1 생성 인공 지능 서버로부터 상기 제1 프롬프트에 대한 응답으로 복수의 문장들을 수신하고,
    상기 복수의 문장들에 기초하여 이미지 생성을 위한 제2 프롬프트를 생성하고,
    상기 제2 프롬프트를 제2 생성 인공 지능 서버에 전송하고,
    상기 제2 생성 인공 지능 서버로부터 상기 전자 기기의 동작 상태들에 대응하는 복수의 이미지들을 수신하는
    프로세서를 포함하는
    인공 지능 장치.
  2. 제1항에 있어서,
    상기 프로세서는
    상기 통신부를 통해 상기 복수의 이미지들을 상기 디스플레이 장치에 전송하는
    인공 지능 장치.
  3. 제1항에 있어서,
    상기 프로세서는
    상기 분석 결과, 상기 전자 기기의 명칭 및 상기 전자 기기의 동작 상태 정보를 조합하여 생성된 문장을 상기 제1 프롬프트로 획득하는
    인공 지능 장치.
  4. 제3항에 있어서,
    상기 복수의 문장들 각각은
    상기 분석 결과 및 상기 전자 기기의 각 동작 상태의 특징을 반영한 이미지의 생성을 명령하는 문장인
    인공 지능 장치.
  5. 제4항에 있어서,
    상기 제2 프롬프트는
    상기 복수의 문장들 및 각 문장에 상응하는 상기 전자 기기의 동작 상태들을 포함하는
    인공 지능 장치.
  6. 제4항에 있어서,
    상기 제2 프롬프트는
    상기 복수의 문장들 중 어느 하나 및 상기 어느 하나의 문장에 상응하는 상기 전자 기기의 동작 상태를 포함하는
    인공 지능 장치.
  7. 제1항에 있어서,
    상기 복수의 이미지들은
    상기 분석 결과 및 상기 전자 기기의 기본 동작 상태를 반영한 기본 이미지,
    상기 기본 이미지에 상기 전자 기기의 제1 동작 상태의 특징을 병합한 제1 이미지 및
    상기 제1 이미지에 상기 전자 기기의 제2 동작 상태의 특징을 병합한 제2 이미지를 포함하는
    인공 지능 장치.
  8. 제1항에 있어서,
    상기 이미지 생성 요청은
    사용자가 발화한 음성 명령이고,
    상기 프로세서는
    상기 음성 명령을 텍스트 데이터로 변환하고, 변환된 텍스트 데이터에 기초하여 상기 분석 결과를 획득하는
    인공 지능 장치.
  9. 인공 지능 장치의 동작 방법에 있어서,
    디스플레이 장치로부터 대기 화면의 이미지 생성 요청 및 상기 디스플레이 장치와 연동된 전자 기기의 동작 상태 정보를 수신하는 단계;
    상기 이미지 생성 요청의 분석 결과와 상기 전자 기기의 동작 상태 정보에 기초하여 자연어 생성을 위한 제1 프롬프트를 생성하는 단계;
    상기 제1 프롬프트를 제1 생성 인공 지능 서버에 전송하는 단계;
    상기 제1 생성 인공 지능 서버로부터 상기 제1 프롬프트에 대한 응답으로 복수의 문장들을 수신하는 단계;
    상기 복수의 문장들에 기초하여 이미지 생성을 위한 제2 프롬프트를 생성하는 단계;
    상기 제2 프롬프트를 제2 생성 인공 지능 서버에 전송하는 단계; 및
    상기 제2 생성 인공 지능 서버로부터 상기 전자 기기의 동작 상태들에 대응하는 복수의 이미지들을 수신하는 단계를 포함하는
    인공 지능 장치의 동작 방법.
  10. 제9항에 있어서,
    상기 복수의 이미지들을 상기 디스플레이 장치에 전송하는 단계를 더 포함하는
    인공 지능 장치의 동작 방법.
  11. 제9항에 있어서,
    상기 제1 프롬프트를 생성하는 단계는
    상기 분석 결과, 상기 전자 기기의 명칭 및 상기 전자 기기의 동작 상태 정보를 조합하여 생성된 문장을 상기 제1 프롬프트로 획득하는 단계를 포함하는
    인공 지능 장치의 동작 방법.
  12. 제11항에 있어서,
    상기 복수의 문장들 각각은
    상기 분석 결과 및 상기 전자 기기의 각 동작 상태의 특징을 반영한 이미지의 생성을 명령하는 문장인
    인공 지능 장치의 동작 방법.
  13. 제12항에 있어서,
    상기 제2 프롬프트는
    상기 복수의 문장들 및 각 문장에 상응하는 상기 전자 기기의 동작 상태들을 포함하는
    인공 지능 장치의 동작 방법.
  14. 제12항에 있어서,
    상기 제2 프롬프트는
    상기 복수의 문장들 중 어느 하나 및 상기 어느 하나의 문장에 상응하는 상기 전자 기기의 동작 상태를 포함하는
    인공 지능 장치의 동작 방법.
  15. 제9항에 있어서,
    상기 복수의 이미지들은
    상기 분석 결과 및 상기 전자 기기의 기본 동작 상태를 반영한 기본 이미지,
    상기 기본 이미지에 상기 전자 기기의 제1 동작 상태의 특징을 병합한 제1 이미지 및
    상기 제1 이미지에 상기 전자 기기의 제2 동작 상태의 특징을 병합한 제2 이미지를 포함하는
    인공 지능 장치의 동작 방법.
PCT/KR2023/013814 2023-09-14 2023-09-14 인공 지능 장치 및 그의 동작 방법 Pending WO2025058107A1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/KR2023/013814 WO2025058107A1 (ko) 2023-09-14 2023-09-14 인공 지능 장치 및 그의 동작 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/KR2023/013814 WO2025058107A1 (ko) 2023-09-14 2023-09-14 인공 지능 장치 및 그의 동작 방법

Publications (1)

Publication Number Publication Date
WO2025058107A1 true WO2025058107A1 (ko) 2025-03-20

Family

ID=95021486

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2023/013814 Pending WO2025058107A1 (ko) 2023-09-14 2023-09-14 인공 지능 장치 및 그의 동작 방법

Country Status (1)

Country Link
WO (1) WO2025058107A1 (ko)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120154557A1 (en) * 2010-12-16 2012-06-21 Katie Stone Perez Comprehension and intent-based content for augmented reality displays
KR20190104267A (ko) * 2019-07-23 2019-09-09 엘지전자 주식회사 운전 로그 및 인공지능모델을 이용하여 고장 진단을 하는 인공 지능 기기 및 그 방법
KR102405385B1 (ko) * 2021-01-28 2022-06-07 정진희 3d 컨텐츠를 위한 여러 오브젝트를 생성하는 방법 및 시스템
KR102570178B1 (ko) * 2023-04-17 2023-08-25 (주)유알피 초거대 ai를 활용한 딥러닝 기반 생성형 ai 시스템의 학습 데이터셋 생성 및 활용방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120154557A1 (en) * 2010-12-16 2012-06-21 Katie Stone Perez Comprehension and intent-based content for augmented reality displays
KR20190104267A (ko) * 2019-07-23 2019-09-09 엘지전자 주식회사 운전 로그 및 인공지능모델을 이용하여 고장 진단을 하는 인공 지능 기기 및 그 방법
KR102405385B1 (ko) * 2021-01-28 2022-06-07 정진희 3d 컨텐츠를 위한 여러 오브젝트를 생성하는 방법 및 시스템
KR102570178B1 (ko) * 2023-04-17 2023-08-25 (주)유알피 초거대 ai를 활용한 딥러닝 기반 생성형 ai 시스템의 학습 데이터셋 생성 및 활용방법

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ANONYMOUS: "From Midjourney Prompt Text to Art: A Guide for Midjourney Users", WIKIDOCS, 27 June 2023 (2023-06-27), XP093292381, Retrieved from the Internet <URL:https://wikidocs.net/204665> *

Similar Documents

Publication Publication Date Title
WO2021060590A1 (ko) 디스플레이 장치 및 인공 지능 시스템
WO2019135433A1 (ko) 디스플레이 장치 및 디스플레이 장치를 포함하는 시스템
WO2021025245A1 (ko) 디스플레이 장치 및 서라운드 사운드 시스템
WO2021060575A1 (ko) 인공 지능 서버 및 그의 동작 방법
WO2021010511A1 (ko) 디스플레이 장치
WO2019164049A1 (en) Display device and operating method thereof
WO2021033785A1 (ko) 사용자의 음성을 통해 가전 기기를 제어할 수 있는 디스플레이 장치 및 인공 지능 서버
WO2022014739A1 (ko) 디스플레이 장치 및 그의 동작 방법
WO2025084447A1 (ko) 인공 지능 시스템 및 그의 동작 방법
WO2021054495A1 (ko) 디스플레이 장치 및 인공 지능 서버
WO2021015319A1 (ko) 디스플레이 장치 및 그의 동작 방법
WO2021045278A1 (ko) 디스플레이 장치
WO2025058107A1 (ko) 인공 지능 장치 및 그의 동작 방법
WO2023200026A1 (ko) 디스플레이 장치
WO2020230923A1 (ko) 음성 인식 서비스를 제공하기 위한 디스플레이 장치 및 그의 동작 방법
WO2021177495A1 (ko) 자연어 처리 장치
WO2021045243A1 (ko) 디스플레이 장치 및 그 제어 방법
WO2020222322A1 (ko) 음성 인식 서비스를 제공하기 위한 디스플레이 장치
WO2021015307A1 (ko) 사용자의 음성을 통해 가전 기기를 제어할 수 있는 디스플레이 장치 및 인공 지능 서버
WO2024010110A1 (ko) 디스플레이 장치 및 그의 동작 방법
WO2025110257A1 (ko) 디스플레이 장치 및 그의 동작 방법
WO2024005226A1 (ko) 디스플레이 장치
WO2025075212A1 (ko) 디스플레이 장치 및 그의 동작 방법
WO2025254240A1 (ko) 디스플레이 장치 및 그의 동작 방법
WO2023153639A1 (ko) 디스플레이 시스템

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 23952347

Country of ref document: EP

Kind code of ref document: A1