CN113919339A

CN113919339A - 人工智能辅助写作方法

Info

Publication number: CN113919339A
Application number: CN202110670162.6A
Authority: CN
Inventors: 刘李宝; 韦文生; 张明鑫; 韦旭
Original assignee: Ningde Zhongwei Network Technology Co ltd
Current assignee: Ningde Zhongwei Network Technology Co ltd
Priority date: 2021-06-17
Filing date: 2021-06-17
Publication date: 2022-01-11

Abstract

本发明涉及推理方法或设备领域，公开了一种人工智能辅助写作方法，包括从用户处获取文字集；对文字集进行预处理，得到多个分词组；对每个分词进行语义关联得到相应的词组；将所有分词的词组进行组合关联得到多个语句；对语句进行显示。通过上述步骤可以在用户原有的语句基础上，结合分词组产生的关联词组得到多个关联的语句，从而可以极大地拓宽用户的写作思路，使得写作更加流畅，快速，提高工作效率。

Description

人工智能辅助写作方法

技术领域

本发明涉及推理方法或设备领域，尤其涉及一种人工智能辅助写作方法。

背景技术

人工智能(Artificial Intelligence)，英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器，该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。

现有技术中多是基于人工搜集的作文资源库和小型的字符匹配检索系统，这样生成效果不好，无法贴合具体的语境，降低了写作效率。

发明内容

本发明的目的在于提供一种人工智能辅助写作方法，旨在拓宽用户的写作思路，使得写作更加流畅，快速，提高工作效率。

为实现上述目的，本发明提供了一种人工智能辅助写作方法，包括从用户处获取文字集；对文字集进行预处理，得到多个分词组；对每个分词进行语义关联得到相应的词组；将所有分词的词组进行组合关联得到多个语句；对语句进行显示。

其中，所述从用户处获取文字集的具体步骤是：收集用户语音或者文本资料；将语音资料基于语音识别技术转换为文本资料；将文本资料上传上位机，得到文字集。

其中，所述对文字集进行预处理，得到多个分词组的具体步骤是：S21基于深度学习技术构建词语数据库；S22将文字进行排序，从序号1开始进行拆分，并和数据库中的词语进行匹配，若匹配成功则生成一个分词，并加入分词组；若匹配失败，则将序号为1和2的字组合为序号1；S23重复步骤S22直至文字集为空，得到多个分词组。

其中，所述词语包括实体词、时间词、领域概念、主语、谓语、宾语、动语，定语、状语，补语和中心语。

其中，所述对每个分词进行语义关联得到相应的词组的具体步骤是：从分词组中取出一个分词；基于词语数据库搜索分词的近义词；基于词语数据库搜索分词的拓展词；将近义词和拓展词组合成词组。

其中，所述拓展词包括联想信息、灵感激发信息、智能素材推荐信息、智能基础改写信息、智能润色改写信息。

其中，所述将所有分词的词组进行组合关联得到多个语句的具体步骤是： S41从所有分词的近义词组中抽取近义词；S42将所有近义词按与原词相同顺序组合成语句；S43将拓展词插入语句相应近义词前一位生成拓展语句；S44重复步骤S41～S43生成多个拓展语句。

其中，所述重复步骤S41～S43生成多个拓展语句之后，所述步骤还包括：基于深度学习技术对多个拓展语句进行语义分析评分，删除未达到评分的拓展语句。

本发明的一种人工智能辅助写作方法，包括从用户处获取文字集；对文字集进行预处理，得到多个分词组；对每个分词进行语义关联得到相应的词组；将所有分词的词组进行组合关联得到多个语句；对语句进行显示。通过上述步骤可以在用户原有的语句基础上，结合分词组产生的关联词组得到多个关联的语句，从而可以极大地拓宽用户的写作思路，使得写作更加流畅，快速，提高工作效率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明的一种人工智能辅助写作方法的流程图；

图2是本发明的从用户处获取文字集的流程图；

图3是本发明的对文字集进行预处理，得到多个分词组的流程图；

图4是本发明的对每个分词进行语义关联得到相应的词组的流程图；

图5是本发明的将所有分词的词组进行组合关联得到多个语句的流程图；

图6是本发明的将拓展词插入语句相应近义词前一位生成拓展语句的流程图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本发明，而不能理解为对本发明的限制。

请参阅图1～图6，本发明提供一种人工智能辅助写作方法，包括：

S1从用户处获取文字集；

用户在使用时需要输入一段最基本的语句，通过对语句的分析处理才可以生成后续的处理步骤。

具体步骤是：

S11收集用户语音或者文本资料；

用户可以通过语音输入的方式或者打字输入的方式输入计算机可识别的相应格式，比如语音可以是mp3或者aac,文字类可以是txt格式，方便通过计算机进一步进行处理。

S12将语音资料基于语音识别技术转换为文本资料；

语音识别技术，也被称为自动语音识别，其目标是将人类的语音中的词汇内容转换为计算机可读的输入，例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同，后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。语音识别技术常用的方法有如下四种：1.基于语言学和声学的方法，2.随机模型法，3.利用人工神经网络的方法，4.概率语法分析。其中最主流的方法是随机模型法。随机模型法目前应用较为成熟，该方法主要采用提取特征、训练模板、对模板进行分类及对模板进行判断的步骤来对语音进行识别。该方法涉及到的技术一般有3种：动态时间规整(DTW)，隐马尔科夫模型(HMM)理论和矢量量化(VQ)技术。其中，HMM算法相较于其他两者的优点是简便优质，在语音识别性能方面更为优异。也正因为如此，如今大部分语音识别系统都在使用HMM算法。目前国内直接可以使用的是百度、腾讯或者讯飞的语音识别平台，此步骤可以借助这些平台提供的功能进行处理。

S13将文本资料上传上位机，得到文字集。

上位机可以不受本地设备的限制以进行更加强大的计算处理。

S2对文字集进行预处理，得到多个分词组；

具体步骤是：

S21基于深度学习技术构建词语数据库；

所述词语包括实体词、时间词、领域概念、主语、谓语、宾语、动语，定语、状语，补语和中心语。

其中的实体词就是语句中的主动和被动的个体，比如各种动物，人，实体的物质对象等；时间词就是时间的各种格式组成的词语，领域概念就是各个领域的专有名词，而对于中文来说，在句子中，词与词之间有一定的组合关系，按照不同的关系，可以把句子分为不同的组成成分。句子成分由词或词组充当，现代汉语里一般的句子成分有八种，即主语、谓语、宾语、动语，定语、状语，补语和中心语。

S22将文字进行排序，从序号1开始进行拆分，并和数据库中的词语进行匹配，若匹配成功则生成一个分词，并加入分词组；若匹配失败，则将序号为1 和2的字组合为序号1；

将文字进行排序，以姓名是运动员为例。可以得到序号为123456，首先拆出“姓”，并非一个词语，因此匹配失败，需要将序号1和序号2的字组合成新的序号1“姓名”，后面依次为2345；数据库中可以识别姓名为一个词语，然后加入分词组。

S23重复步骤S22直至文字集为空，得到多个分词组。

重新对是运动员进行排序得到1234，首先拆出“是”，可以识别是一个单字词语，从而可以加入分词组，依照此办法可以继续拆出“运动”和“员”两个词语，从而可以以较快的方式对语句进行拆分。

S3对每个分词进行语义关联得到相应的词组；

在得到分词后，可以对分词进行关联以得到其他的词语，从而可以对语句进行变化和拓展。

具体步骤是：

S31从分词组中取出一个分词；

从分词组中取出一个分词，比如“姓名”。

S32基于词语数据库搜索分词的近义词；

姓名在数据库中可以识别为一个名字，从而没有近义词。

S33基于词语数据库搜索分词的拓展词；

基于姓名这个词，可以从互联网上爬取相关的数据标签以进行拓展，所述拓展词包括联想信息、灵感激发信息、素材推荐信息。

S34将近义词和拓展词组合成词组。

此处没有近义词，就可以将上述生成的拓展词加入词组便于后续组合使用。

S4将所有分词的词组进行组合关联得到多个语句；

具体步骤是：

S41从所有分词的近义词组中抽取近义词；

比如运动员的近义词有选手和健儿，此处可以选择选手。

S42将所有近义词按与原词相同顺序组合成语句；

按照同一个例子可以得到姓名是选手。

S43将拓展词插入语句相应近义词前一位生成拓展语句；

具体步骤是：

S431将拓展词插入语句相应近义词前一位；

比如冠军姓名、飞人姓名、100米栏姓名、雅典姓名等词语组合。

S432对拓展词和近义词的组合进行评分；

在日常使用中，有些词组明显是不符合日常习惯的，因此可以采用机器学习的方式输入多个词组进行学习，然后将上述得到的词组组合输入训练器中进行评分，可以发现雅典姓名、100米栏姓名是不符合要求的。

S433删除未达到预设评分的组合。

对雅典姓名、100米栏姓名这类不达到预设评分的词语进行删除。

S44重复步骤S41～S43生成多个拓展语句；

基于多个词语组合可以分别生成不同的拓展语句。

S45基于深度学习技术对多个拓展语句进行语义分析评分，删除未达到评分的拓展语句。

通过语义分析对拓展语句的上下文进行分析，并进行评分，然后删除未达到评分的拓展语句。

S5对语句进行显示。

具体方式是：基于语义分析评分从高到低显示语句。使得用户更加方便从中进行挑选。

以上所揭露的仅为本发明一种较佳实施例而已，当然不能以此来限定本发明之权利范围，本领域普通技术人员可以理解实现上述实施例的全部或部分流程，并依本发明权利要求所作的等同变化，仍属于发明所涵盖的范围。

Claims

1.一种人工智能辅助写作方法，其特征在于，

包括从用户处获取文字集；

对文字集进行预处理，得到多个分词组；

对每个分词进行语义关联得到相应的词组；

将所有分词的词组进行组合关联得到多个语句；

对语句进行显示。

2.如权利要求1所述的一种人工智能辅助写作方法，其特征在于，

所述从用户处获取文字集的具体步骤是：

收集用户语音或者文本资料；

将语音资料基于语音识别技术转换为文本资料；

将文本资料上传上位机，得到文字集。

3.如权利要求1所述的一种人工智能辅助写作方法，其特征在于，

所述对文字集进行预处理，得到多个分词组的具体步骤是：

S21基于深度学习技术构建词语数据库；

S22将文字进行排序，从序号1开始进行拆分，并和数据库中的词语进行匹配，若匹配成功则生成一个分词，并加入分词组；若匹配失败，则将序号为1和2的字组合为序号1；

S23重复步骤S22直至文字集为空，得到多个分词组。

4.如权利要求3所述的一种人工智能辅助写作方法，其特征在于，

5.如权利要求1所述的一种人工智能辅助写作方法，其特征在于，

所述对每个分词进行语义关联得到相应的词组的具体步骤是：

从分词组中取出一个分词；

基于词语数据库搜索分词的近义词；

基于词语数据库搜索分词的拓展词；

将近义词和拓展词组合成词组。

6.如权利要求5所述的一种人工智能辅助写作方法，其特征在于，

所述拓展词包括联想信息、灵感激发信息、智能素材推荐信息、智能基础改写信息、智能润色改写信息。

7.如权利要求1所述的一种人工智能辅助写作方法，其特征在于，

所述将所有分词的词组进行组合关联得到多个语句的具体步骤是：

S41从所有分词的近义词组中抽取近义词；

S42将所有近义词按与原词相同顺序组合成语句；

S43将拓展词插入语句相应近义词前一位生成拓展语句；

S44重复步骤S41～S43生成多个拓展语句。

8.如权利要求7所述的一种人工智能辅助写作方法，其特征在于，

所述重复步骤S41～S43生成多个拓展语句之后，所述步骤还包括：基于深度学习技术对多个拓展语句进行语义分析评分，删除未达到评分的拓展语句。