JP7753747B2 - コミュニケーションサーバー及びコミュニケーションシステム - Google Patents
コミュニケーションサーバー及びコミュニケーションシステムInfo
- Publication number
- JP7753747B2 JP7753747B2 JP2021153741A JP2021153741A JP7753747B2 JP 7753747 B2 JP7753747 B2 JP 7753747B2 JP 2021153741 A JP2021153741 A JP 2021153741A JP 2021153741 A JP2021153741 A JP 2021153741A JP 7753747 B2 JP7753747 B2 JP 7753747B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- filter
- audio
- communication server
- terminal device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Telephonic Communication Services (AREA)
Description
実施形態に係るコミュニケーションサーバーは、音声データを処理するプロセッサを含む。プロセッサは、特定人の音声成分を抽出する音声フィルタとして機能する。プロセッサは、第1端末装置からの入力音声データを音声フィルタに与え、音声フィルタから出力された音声成分を含む出力音声データを第1端末装置とは異なる第2端末装置へ送る。
図1には、実施形態に係るオンライン会議システムの構成例が示されている。オンライン会議システムは、コミュニケーションシステムの一態様である。
Claims (16)
- 音声データを処理するプロセッサであって、複数の音声フィルタからなる音声フィルタ列として機能するプロセッサを含み、
前記複数の音声フィルタは、それぞれ、特定人の音声成分以外の成分を抑圧又は除外して前記特定人の音声成分を抽出するものであり、
前記プロセッサは、
前記音声フィルタ列の中から、第1端末装置からの入力音声データを与える音声フィルタを選択し、
前記入力音声データを、選択された音声フィルタに与え、
前記選択された音声フィルタから出力された音声成分を含む出力音声データを前記第1端末装置とは異なる第2端末装置へ送る、
ことを特徴とするコミュニケーションサーバー。 - 請求項1記載のコミュニケーションサーバーにおいて、
複数のユーザーに対応する前記複数の音声フィルタを管理するための複数のフィルタ管理情報を有するフィルタ管理テーブルを含み、
前記プロセッサは、
前記フィルタ管理テーブルを参照することにより、前記音声フィルタ列の中から前記入力音声データを与える前記音声フィルタを選択する、
ことを特徴とするコミュニケーションサーバー。 - 請求項1記載のコミュニケーションサーバーにおいて、
前記プロセッサは、
前記第1端末装置及び前記第2端末装置を含む端末装置群と前記音声フィルタ列の入力側との間で入力切換制御を実行し、
前記音声フィルタ列の出力側と前記端末装置群との間で出力切換制御を実行する、
ことを特徴とするコミュニケーションサーバー。 - 請求項3記載のコミュニケーションサーバーにおいて、
前記入力切換制御には、音声フィルタバイパス制御が含まれる、
ことを特徴とするコミュニケーションサーバー。 - 請求項3記載のコミュニケーションサーバーにおいて、
前記出力切換制御には、前記音声フィルタ列の中の複数の音声フィルタから出力された複数の音声成分を合成して前記出力音声データを生成する制御が含まれる、
ことを特徴とするコミュニケーションサーバー。 - 請求項1記載のコミュニケーションサーバーにおいて、
前記プロセッサは、
前記入力音声データに対応する識別子に従って、前記音声フィルタ列の中から前記入力音声データを与える前記音声フィルタを選択する、
ことを特徴とするコミュニケーションサーバー。 - 請求項6記載のコミュニケーションサーバーにおいて、
前記プロセッサは、
前記入力音声データに含まれる第1音声成分及び第2音声成分に対応する第1識別子及び第2識別子に従って、前記音声フィルタ列の中から前記入力音声データを与える第1音声フィルタ及び第2音声フィルタを選択する、
ことを特徴とするコミュニケーションサーバー。 - 請求項7記載のコミュニケーションサーバーにおいて、
前記プロセッサは、
前記第1音声フィルタから出力された前記第1音声成分を含む第1出力音声データを前記第2端末装置へ送り、
前記第2音声フィルタから出力された前記第2音声成分を含む第2出力音声データを第3端末装置へ送る、
ことを特徴とするコミュニケーションサーバー。 - 請求項1記載のコミュニケーションサーバーにおいて、
前記プロセッサは、
前記第1端末装置において録音モードが選択された場合に前記出力音声データを前記第1端末装置に送る、
ことを特徴とするコミュニケーションサーバー。 - 請求項1記載のコミュニケーションサーバーにおいて、
前記プロセッサは、
標本音声データに基づいて前記音声フィルタを生成又は修正する、
ことを特徴とするコミュニケーションサーバー。 - 請求項10記載のコミュニケーションサーバーにおいて、
前記プロセッサは、
修正モード実行条件が満たされた場合に修正モードを実行し、
前記修正モードの実行過程において取得された音声データを前記標本音声データとして用いる、
ことを特徴とするコミュニケーションサーバー。 - 音声データを処理するプロセッサであって、特定人の音声成分以外の成分を抑圧又は除外して前記特定人の音声成分を抽出する音声フィルタとして機能するプロセッサを含み、
前記プロセッサは、
第1端末装置からの入力音声データを前記音声フィルタに与え、
前記音声フィルタから出力された音声成分を含む出力音声データを前記第1端末装置とは異なる第2端末装置へ送り、
更に、前記プロセッサは、
前記入力音声データに含まれるキーワードデータを検出し、
前記キーワードデータが検出された場合に、前記入力音声データを標本音声データとして用いて前記音声フィルタを修正する、
ことを特徴とするコミュニケーションサーバー。 - 請求項10記載のコミュニケーションサーバーにおいて、
前記音声フィルタは、機械学習後のフィルタモデルを有し、
前記音声フィルタの修正には、前記フィルタモデルの再学習が含まれる、
ことを特徴とするコミュニケーションサーバー。 - 請求項1記載のコミュニケーションサーバーにおいて、
当該コミュニケーションサーバーはオンライン会議サーバーであり、
前記音声フィルタは複数のオンライン会議で共用される、
ことを特徴とするコミュニケーションサーバー。 - 音声データを処理するプロセッサであって複数の音声フィルタからなる音声フィルタ列として機能するプロセッサを含むコミュニケーションサーバーと、
ネットワークを介して前記コミュニケーションサーバーに対して接続される第1端末装置及び第2端末装置と、
を含み、
前記複数の音声フィルタは、それぞれ、特定人の音声成分以外の成分を抑圧又は除外して前記特定人の音声成分を抽出するものであり、
前記プロセッサは、
前記音声フィルタ列の中から、前記第1端末装置からの入力音声データを与える音声フィルタを選択し、
前記入力音声データを、選択された音声フィルタに与え、
前記選択された音声フィルタから出力された音声成分を含む出力音声データを前記第2端末装置へ送る、
ことを特徴とするコミュニケーションシステム。 - 情報処理装置において実行され当該情報処理装置をコミュニケーションサーバーとして機能させるプログラムであって、
前記情報処理装置は、複数の音声フィルタからなる音声フィルタ列として機能し、
前記複数の音声フィルタは、それぞれ、特定人の音声成分以外の成分を抑圧又は除外して前記特定人の音声成分を抽出するものであり、
前記プログラムは、
前記音声フィルタ列の中から、第1端末装置からの入力音声データを与える音声フィルタを選択する機能と、
前記入力音声データを、選択された音声フィルタに与える機能と、
前記選択された音声フィルタから出力された音声成分を含む出力音声データを前記第1端末装置とは異なる第2端末装置へ送る機能と、
を含むことを特徴とするプログラム。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021153741A JP7753747B2 (ja) | 2021-09-22 | 2021-09-22 | コミュニケーションサーバー及びコミュニケーションシステム |
| US17/711,515 US20230087553A1 (en) | 2021-09-22 | 2022-04-01 | Communication server, communication system, and non-transitory computer readable medium |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021153741A JP7753747B2 (ja) | 2021-09-22 | 2021-09-22 | コミュニケーションサーバー及びコミュニケーションシステム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2023045371A JP2023045371A (ja) | 2023-04-03 |
| JP7753747B2 true JP7753747B2 (ja) | 2025-10-15 |
Family
ID=85573311
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2021153741A Active JP7753747B2 (ja) | 2021-09-22 | 2021-09-22 | コミュニケーションサーバー及びコミュニケーションシステム |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US20230087553A1 (ja) |
| JP (1) | JP7753747B2 (ja) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN119339708B (zh) * | 2024-12-24 | 2025-03-14 | 四川参盘供应链科技有限公司 | 一种基于ai语音交互的下单方法 |
| JP7742969B1 (ja) * | 2025-05-01 | 2025-09-22 | 株式会社サイバーエージェント | 音声取得装置及び音声取得方法 |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2001339799A (ja) | 2000-05-29 | 2001-12-07 | Alpine Electronics Inc | 仮想会議装置 |
| JP2006203548A (ja) | 2005-01-20 | 2006-08-03 | Yamaha Corp | 複数話者の音声信号を処理する音声信号処理装置およびプログラム |
| US20080255842A1 (en) | 2005-11-17 | 2008-10-16 | Shaul Simhi | Personalized Voice Activity Detection |
| WO2020039571A1 (ja) | 2018-08-24 | 2020-02-27 | 三菱電機株式会社 | 音声分離装置、音声分離方法、音声分離プログラム、及び音声分離システム |
| US20210124929A1 (en) | 2019-10-23 | 2021-04-29 | Lg Electronics Inc. | Device and method for auto audio and video focusing |
Family Cites Families (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8209181B2 (en) * | 2006-02-14 | 2012-06-26 | Microsoft Corporation | Personal audio-video recorder for live meetings |
| JP4305509B2 (ja) * | 2006-12-26 | 2009-07-29 | ヤマハ株式会社 | 音声処理装置およびプログラム |
| US9502038B2 (en) * | 2013-01-28 | 2016-11-22 | Tencent Technology (Shenzhen) Company Limited | Method and device for voiceprint recognition |
| US8994781B2 (en) * | 2013-03-01 | 2015-03-31 | Citrix Systems, Inc. | Controlling an electronic conference based on detection of intended versus unintended sound |
| GB2517952B (en) * | 2013-09-05 | 2017-05-31 | Barclays Bank Plc | Biometric verification using predicted signatures |
| US9177567B2 (en) * | 2013-10-17 | 2015-11-03 | Globalfoundries Inc. | Selective voice transmission during telephone calls |
| US20150149173A1 (en) * | 2013-11-26 | 2015-05-28 | Microsoft Corporation | Controlling Voice Composition in a Conference |
| US9978374B2 (en) * | 2015-09-04 | 2018-05-22 | Google Llc | Neural networks for speaker verification |
| US10789959B2 (en) * | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
| US11200884B1 (en) * | 2018-11-06 | 2021-12-14 | Amazon Technologies, Inc. | Voice profile updating |
-
2021
- 2021-09-22 JP JP2021153741A patent/JP7753747B2/ja active Active
-
2022
- 2022-04-01 US US17/711,515 patent/US20230087553A1/en not_active Abandoned
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2001339799A (ja) | 2000-05-29 | 2001-12-07 | Alpine Electronics Inc | 仮想会議装置 |
| JP2006203548A (ja) | 2005-01-20 | 2006-08-03 | Yamaha Corp | 複数話者の音声信号を処理する音声信号処理装置およびプログラム |
| US20080255842A1 (en) | 2005-11-17 | 2008-10-16 | Shaul Simhi | Personalized Voice Activity Detection |
| WO2020039571A1 (ja) | 2018-08-24 | 2020-02-27 | 三菱電機株式会社 | 音声分離装置、音声分離方法、音声分離プログラム、及び音声分離システム |
| US20210124929A1 (en) | 2019-10-23 | 2021-04-29 | Lg Electronics Inc. | Device and method for auto audio and video focusing |
Also Published As
| Publication number | Publication date |
|---|---|
| US20230087553A1 (en) | 2023-03-23 |
| JP2023045371A (ja) | 2023-04-03 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US8791977B2 (en) | Method and system for presenting metadata during a videoconference | |
| JP7753747B2 (ja) | コミュニケーションサーバー及びコミュニケーションシステム | |
| JP7229821B2 (ja) | 情報処理装置、情報処理方法およびプログラム | |
| JP6618992B2 (ja) | 発言提示装置、発言提示方法およびプログラム | |
| US20060229873A1 (en) | Methods and apparatus for adapting output speech in accordance with context of communication | |
| US20240055015A1 (en) | Learning method for generating lip sync image based on machine learning and lip sync image generation device for performing same | |
| US10971168B2 (en) | Dynamic communication session filtering | |
| US20230231973A1 (en) | Streaming data processing for hybrid online meetings | |
| US20230245646A1 (en) | Time distributions of participants across topic segments in a communication session | |
| CN103026697B (zh) | 业务服务器装置和业务提供方法 | |
| CN112004050A (zh) | 一种去身份标识的远程会议处理方法、装置、智能终端 | |
| WO2011027475A1 (ja) | テレビ会議装置 | |
| CN111897931A (zh) | 对话设置方法和装置、服务器、计算机可读存储介质 | |
| US12432081B2 (en) | Digital assistant for detecting off-topic users in network-based group communication sessions | |
| Juvela et al. | Audio codec augmentation for robust collaborative watermarking of speech synthesis | |
| KR20210055235A (ko) | 생성적 적대 신경망 기반 수어 영상 생성 시스템 | |
| JP7313518B1 (ja) | 評価方法、評価装置、および、評価プログラム | |
| KR20200145776A (ko) | 음성보정 합성방법, 장치 및 프로그램 | |
| EP3905631B1 (en) | Systems and methods for speaker anonymization | |
| CN111415397B (zh) | 一种人脸重构、直播方法、装置、设备及存储介质 | |
| CN114125494A (zh) | 内容审核辅助处理方法、装置及电子设备 | |
| WO2022024371A1 (ja) | Web会議システムおよびWeb会議プログラム | |
| JP7325865B1 (ja) | ウェブ会議システムを用いた画面合成方法 | |
| JP7344612B1 (ja) | プログラム、会話要約装置、および会話要約方法 | |
| JP7409628B2 (ja) | 結婚式における音楽選曲のための自動選曲システム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240826 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20250519 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20250527 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250718 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250902 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250915 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7753747 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |