CN113919339A - 人工智能辅助写作方法 - Google Patents
人工智能辅助写作方法 Download PDFInfo
- Publication number
- CN113919339A CN113919339A CN202110670162.6A CN202110670162A CN113919339A CN 113919339 A CN113919339 A CN 113919339A CN 202110670162 A CN202110670162 A CN 202110670162A CN 113919339 A CN113919339 A CN 113919339A
- Authority
- CN
- China
- Prior art keywords
- word
- words
- sentences
- artificial intelligence
- writing method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/02—Input arrangements using manually operated switches, e.g. using keyboards or dials
- G06F3/023—Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
- G06F3/0233—Character input methods
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Machine Translation (AREA)
Abstract
本发明涉及推理方法或设备领域,公开了一种人工智能辅助写作方法,包括从用户处获取文字集;对文字集进行预处理,得到多个分词组;对每个分词进行语义关联得到相应的词组;将所有分词的词组进行组合关联得到多个语句;对语句进行显示。通过上述步骤可以在用户原有的语句基础上,结合分词组产生的关联词组得到多个关联的语句,从而可以极大地拓宽用户的写作思路,使得写作更加流畅,快速,提高工作效率。
Description
技术领域
本发明涉及推理方法或设备领域,尤其涉及一种人工智能辅助写作方法。
背景技术
人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。
现有技术中多是基于人工搜集的作文资源库和小型的字符匹配检索系统,这样生成效果不好,无法贴合具体的语境,降低了写作效率。
发明内容
本发明的目的在于提供一种人工智能辅助写作方法,旨在拓宽用户的写作思路,使得写作更加流畅,快速,提高工作效率。
为实现上述目的,本发明提供了一种人工智能辅助写作方法,包括从用户处获取文字集;对文字集进行预处理,得到多个分词组;对每个分词进行语义关联得到相应的词组;将所有分词的词组进行组合关联得到多个语句;对语句进行显示。
其中,所述从用户处获取文字集的具体步骤是:收集用户语音或者文本资料;将语音资料基于语音识别技术转换为文本资料;将文本资料上传上位机,得到文字集。
其中,所述对文字集进行预处理,得到多个分词组的具体步骤是:S21基于深度学习技术构建词语数据库;S22将文字进行排序,从序号1开始进行拆分,并和数据库中的词语进行匹配,若匹配成功则生成一个分词,并加入分词组;若匹配失败,则将序号为1和2的字组合为序号1;S23重复步骤S22直至文字集为空,得到多个分词组。
其中,所述词语包括实体词、时间词、领域概念、主语、谓语、宾语、动语,定语、状语,补语和中心语。
其中,所述对每个分词进行语义关联得到相应的词组的具体步骤是:从分词组中取出一个分词;基于词语数据库搜索分词的近义词;基于词语数据库搜索分词的拓展词;将近义词和拓展词组合成词组。
其中,所述拓展词包括联想信息、灵感激发信息、智能素材推荐信息、智能基础改写信息、智能润色改写信息。
其中,所述将所有分词的词组进行组合关联得到多个语句的具体步骤是: S41从所有分词的近义词组中抽取近义词;S42将所有近义词按与原词相同顺序组合成语句;S43将拓展词插入语句相应近义词前一位生成拓展语句;S44重复步骤S41~S43生成多个拓展语句。
其中,所述重复步骤S41~S43生成多个拓展语句之后,所述步骤还包括:基于深度学习技术对多个拓展语句进行语义分析评分,删除未达到评分的拓展语句。
本发明的一种人工智能辅助写作方法,包括从用户处获取文字集;对文字集进行预处理,得到多个分词组;对每个分词进行语义关联得到相应的词组;将所有分词的词组进行组合关联得到多个语句;对语句进行显示。通过上述步骤可以在用户原有的语句基础上,结合分词组产生的关联词组得到多个关联的语句,从而可以极大地拓宽用户的写作思路,使得写作更加流畅,快速,提高工作效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的一种人工智能辅助写作方法的流程图;
图2是本发明的从用户处获取文字集的流程图;
图3是本发明的对文字集进行预处理,得到多个分词组的流程图;
图4是本发明的对每个分词进行语义关联得到相应的词组的流程图;
图5是本发明的将所有分词的词组进行组合关联得到多个语句的流程图;
图6是本发明的将拓展词插入语句相应近义词前一位生成拓展语句的流程图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
请参阅图1~图6,本发明提供一种人工智能辅助写作方法,包括:
S1从用户处获取文字集;
用户在使用时需要输入一段最基本的语句,通过对语句的分析处理才可以生成后续的处理步骤。
具体步骤是:
S11收集用户语音或者文本资料;
用户可以通过语音输入的方式或者打字输入的方式输入计算机可识别的相应格式,比如语音可以是mp3或者aac,文字类可以是txt格式,方便通过计算机进一步进行处理。
S12将语音资料基于语音识别技术转换为文本资料;
语音识别技术,也被称为自动语音识别,其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。语音识别技术常用的方法有如下四种:1.基于语言学和声学的方法,2.随机模型法,3.利用人工神经网络的方法,4.概率语法分析。其中最主流的方法是随机模型法。随机模型法目前应用较为成熟,该方法主要采用提取特征、训练模板、对模板进行分类及对模板进行判断的步骤来对语音进行识别。该方法涉及到的技术一般有3种:动态时间规整(DTW),隐马尔科夫模型(HMM)理论和矢量量化(VQ)技术。其中,HMM算法相较于其他两者的优点是简便优质,在语音识别性能方面更为优异。也正因为如此,如今大部分语音识别系统都在使用HMM算法。目前国内直接可以使用的是百度、腾讯或者讯飞的语音识别平台,此步骤可以借助这些平台提供的功能进行处理。
S13将文本资料上传上位机,得到文字集。
上位机可以不受本地设备的限制以进行更加强大的计算处理。
S2对文字集进行预处理,得到多个分词组;
具体步骤是:
S21基于深度学习技术构建词语数据库;
所述词语包括实体词、时间词、领域概念、主语、谓语、宾语、动语,定语、状语,补语和中心语。
其中的实体词就是语句中的主动和被动的个体,比如各种动物,人,实体的物质对象等;时间词就是时间的各种格式组成的词语,领域概念就是各个领域的专有名词,而对于中文来说,在句子中,词与词之间有一定的组合关系,按照不同的关系,可以把句子分为不同的组成成分。句子成分由词或词组充当,现代汉语里一般的句子成分有八种,即主语、谓语、宾语、动语,定语、状语,补语和中心语。
S22将文字进行排序,从序号1开始进行拆分,并和数据库中的词语进行匹配,若匹配成功则生成一个分词,并加入分词组;若匹配失败,则将序号为1 和2的字组合为序号1;
将文字进行排序,以姓名是运动员为例。可以得到序号为123456,首先拆出“姓”,并非一个词语,因此匹配失败,需要将序号1和序号2的字组合成新的序号1“姓名”,后面依次为2345;数据库中可以识别姓名为一个词语,然后加入分词组。
S23重复步骤S22直至文字集为空,得到多个分词组。
重新对是运动员进行排序得到1234,首先拆出“是”,可以识别是一个单字词语,从而可以加入分词组,依照此办法可以继续拆出“运动”和“员”两个词语,从而可以以较快的方式对语句进行拆分。
S3对每个分词进行语义关联得到相应的词组;
在得到分词后,可以对分词进行关联以得到其他的词语,从而可以对语句进行变化和拓展。
具体步骤是:
S31从分词组中取出一个分词;
从分词组中取出一个分词,比如“姓名”。
S32基于词语数据库搜索分词的近义词;
姓名在数据库中可以识别为一个名字,从而没有近义词。
S33基于词语数据库搜索分词的拓展词;
基于姓名这个词,可以从互联网上爬取相关的数据标签以进行拓展,所述拓展词包括联想信息、灵感激发信息、素材推荐信息。
S34将近义词和拓展词组合成词组。
此处没有近义词,就可以将上述生成的拓展词加入词组便于后续组合使用。
S4将所有分词的词组进行组合关联得到多个语句;
具体步骤是:
S41从所有分词的近义词组中抽取近义词;
比如运动员的近义词有选手和健儿,此处可以选择选手。
S42将所有近义词按与原词相同顺序组合成语句;
按照同一个例子可以得到姓名是选手。
S43将拓展词插入语句相应近义词前一位生成拓展语句;
具体步骤是:
S431将拓展词插入语句相应近义词前一位;
比如冠军姓名、飞人姓名、100米栏姓名、雅典姓名等词语组合。
S432对拓展词和近义词的组合进行评分;
在日常使用中,有些词组明显是不符合日常习惯的,因此可以采用机器学习的方式输入多个词组进行学习,然后将上述得到的词组组合输入训练器中进行评分,可以发现雅典姓名、100米栏姓名是不符合要求的。
S433删除未达到预设评分的组合。
对雅典姓名、100米栏姓名这类不达到预设评分的词语进行删除。
S44重复步骤S41~S43生成多个拓展语句;
基于多个词语组合可以分别生成不同的拓展语句。
S45基于深度学习技术对多个拓展语句进行语义分析评分,删除未达到评分的拓展语句。
通过语义分析对拓展语句的上下文进行分析,并进行评分,然后删除未达到评分的拓展语句。
S5对语句进行显示。
具体方式是:基于语义分析评分从高到低显示语句。使得用户更加方便从中进行挑选。
本发明的一种人工智能辅助写作方法,包括从用户处获取文字集;对文字集进行预处理,得到多个分词组;对每个分词进行语义关联得到相应的词组;将所有分词的词组进行组合关联得到多个语句;对语句进行显示。通过上述步骤可以在用户原有的语句基础上,结合分词组产生的关联词组得到多个关联的语句,从而可以极大地拓宽用户的写作思路,使得写作更加流畅,快速,提高工作效率。
以上所揭露的仅为本发明一种较佳实施例而已,当然不能以此来限定本发明之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本发明权利要求所作的等同变化,仍属于发明所涵盖的范围。
Claims (8)
1.一种人工智能辅助写作方法,其特征在于,
包括从用户处获取文字集;
对文字集进行预处理,得到多个分词组;
对每个分词进行语义关联得到相应的词组;
将所有分词的词组进行组合关联得到多个语句;
对语句进行显示。
2.如权利要求1所述的一种人工智能辅助写作方法,其特征在于,
所述从用户处获取文字集的具体步骤是:
收集用户语音或者文本资料;
将语音资料基于语音识别技术转换为文本资料;
将文本资料上传上位机,得到文字集。
3.如权利要求1所述的一种人工智能辅助写作方法,其特征在于,
所述对文字集进行预处理,得到多个分词组的具体步骤是:
S21基于深度学习技术构建词语数据库;
S22将文字进行排序,从序号1开始进行拆分,并和数据库中的词语进行匹配,若匹配成功则生成一个分词,并加入分词组;若匹配失败,则将序号为1和2的字组合为序号1;
S23重复步骤S22直至文字集为空,得到多个分词组。
4.如权利要求3所述的一种人工智能辅助写作方法,其特征在于,
所述词语包括实体词、时间词、领域概念、主语、谓语、宾语、动语,定语、状语,补语和中心语。
5.如权利要求1所述的一种人工智能辅助写作方法,其特征在于,
所述对每个分词进行语义关联得到相应的词组的具体步骤是:
从分词组中取出一个分词;
基于词语数据库搜索分词的近义词;
基于词语数据库搜索分词的拓展词;
将近义词和拓展词组合成词组。
6.如权利要求5所述的一种人工智能辅助写作方法,其特征在于,
所述拓展词包括联想信息、灵感激发信息、智能素材推荐信息、智能基础改写信息、智能润色改写信息。
7.如权利要求1所述的一种人工智能辅助写作方法,其特征在于,
所述将所有分词的词组进行组合关联得到多个语句的具体步骤是:
S41从所有分词的近义词组中抽取近义词;
S42将所有近义词按与原词相同顺序组合成语句;
S43将拓展词插入语句相应近义词前一位生成拓展语句;
S44重复步骤S41~S43生成多个拓展语句。
8.如权利要求7所述的一种人工智能辅助写作方法,其特征在于,
所述重复步骤S41~S43生成多个拓展语句之后,所述步骤还包括:基于深度学习技术对多个拓展语句进行语义分析评分,删除未达到评分的拓展语句。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202110670162.6A CN113919339A (zh) | 2021-06-17 | 2021-06-17 | 人工智能辅助写作方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202110670162.6A CN113919339A (zh) | 2021-06-17 | 2021-06-17 | 人工智能辅助写作方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN113919339A true CN113919339A (zh) | 2022-01-11 |
Family
ID=79232746
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202110670162.6A Pending CN113919339A (zh) | 2021-06-17 | 2021-06-17 | 人工智能辅助写作方法 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN113919339A (zh) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN116992834A (zh) * | 2023-09-27 | 2023-11-03 | 国高信息技术产业研究院(山东)集团有限公司 | 基于人工智能的辅助写作方法、系统、介质及电子设备 |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN106650943A (zh) * | 2016-10-28 | 2017-05-10 | 北京百度网讯科技有限公司 | 基于人工智能的辅助写作方法和装置 |
| CN111883136A (zh) * | 2020-07-30 | 2020-11-03 | 潘忠鸿 | 一种基于人工智能的快速写作方法和装置 |
| CN112699663A (zh) * | 2021-01-07 | 2021-04-23 | 中通天鸿(北京)通信科技股份有限公司 | 一种基于多种算法结合的语义理解系统 |
-
2021
- 2021-06-17 CN CN202110670162.6A patent/CN113919339A/zh active Pending
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN106650943A (zh) * | 2016-10-28 | 2017-05-10 | 北京百度网讯科技有限公司 | 基于人工智能的辅助写作方法和装置 |
| CN111883136A (zh) * | 2020-07-30 | 2020-11-03 | 潘忠鸿 | 一种基于人工智能的快速写作方法和装置 |
| CN112699663A (zh) * | 2021-01-07 | 2021-04-23 | 中通天鸿(北京)通信科技股份有限公司 | 一种基于多种算法结合的语义理解系统 |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN116992834A (zh) * | 2023-09-27 | 2023-11-03 | 国高信息技术产业研究院(山东)集团有限公司 | 基于人工智能的辅助写作方法、系统、介质及电子设备 |
| CN116992834B (zh) * | 2023-09-27 | 2024-01-05 | 国高信息技术产业研究院(山东)集团有限公司 | 基于人工智能的辅助写作方法、系统、介质及电子设备 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN108363743B (zh) | 一种智能问题生成方法、装置和计算机可读存储介质 | |
| WO2008107305A2 (en) | Search-based word segmentation method and device for language without word boundary tag | |
| CN109949799B (zh) | 一种语义解析方法及系统 | |
| JPWO2018097091A1 (ja) | モデル作成装置、テキスト検索装置、モデル作成方法、テキスト検索方法、データ構造、及びプログラム | |
| CN107944027A (zh) | 创建语义键索引的方法及系统 | |
| CN102637192A (zh) | 一种自然语言问答的方法 | |
| CN114722174B (zh) | 提词方法和装置、电子设备及存储介质 | |
| CN112016320A (zh) | 基于数据增强的英文标点符号添加方法和系统及设备 | |
| CN108681574A (zh) | 一种基于文本摘要的非事实类问答答案选择方法及系统 | |
| CN114528919A (zh) | 自然语言处理方法、装置及计算机设备 | |
| CN113268576B (zh) | 一种基于深度学习的部门语义信息抽取的方法及装置 | |
| WO2025118396A1 (zh) | 自然语言处理模型的训练方法及生成对话下文的方法 | |
| CN113239666A (zh) | 一种文本相似度计算方法及系统 | |
| Harwath et al. | Zero resource spoken audio corpus analysis | |
| CN112905736A (zh) | 一种基于量子理论的无监督文本情感分析方法 | |
| CN109298796B (zh) | 一种词联想方法及装置 | |
| WO2025044865A1 (zh) | 跨领域问题处理方法、装置、电子设备及存储介质 | |
| CN109002540B (zh) | 一种中文通告文档问题答案对自动生成方法 | |
| Chen et al. | Automatic key term extraction from spoken course lectures using branching entropy and prosodic/semantic features | |
| Ihm et al. | Skip-gram-KR: Korean word embedding for semantic clustering | |
| CN112632272A (zh) | 基于句法分析的微博情感分类方法和系统 | |
| KR100479205B1 (ko) | 텍스트 문서집합에서 반복학습을 통한 개체명 인식 및의미범주 분류 장치 및 그 방법 | |
| CN113919339A (zh) | 人工智能辅助写作方法 | |
| CN112347786B (zh) | 人工智能评分训练方法和装置 | |
| CN116226677B (zh) | 平行语料构建方法及装置、存储介质及电子设备 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination |