CN109716359A

CN109716359A - 用于计算机辅助地分析目标系统的至少一个第二输入矢量的方法和设备

Info

Publication number: CN109716359A
Application number: CN201680089552.1A
Authority: CN
Inventors: A.M.吉格勒; R.格罗斯曼; S.沃格; H-G.齐默尔曼
Original assignee: Siemens Corp
Current assignee: Siemens Corp
Priority date: 2016-07-25
Filing date: 2016-07-25
Publication date: 2019-05-03
Also published as: WO2018019355A1; EP3472759A1

Abstract

本发明涉及一种用于计算机辅助地分析目标系统的至少一个第二输入矢量的方法。该方法包括为所述目标系统提供（210）第二输入矢量的方法步骤。该方法包括提供（220）经训练的深度神经网络的方法步骤，其中该深度神经网络是前馈网络，所述前馈网络包括用于为所述目标系统输入第二输入矢量的输入层，包括多个连续的隐藏层，所述隐藏层对所述目标系统进行建模，以及包括用于为所述目标系统输出第二输出矢量的输出层。该方法包括用于评估（230）所述第二输入矢量的方法步骤，其中所述第二输入矢量分别经由所述输入层传输到所述隐藏层之一作为第二处理矢量，其中所述第二处理矢量分别在所述隐藏层之间传输，其中对于每个隐藏层执行所传输的第二处理矢量的相应的第一数据变换，其中在所述相应的第一数据变换时，对于每个所涉及的隐藏层执行所述第二处理矢量的降维，其中基于降维的第二处理矢量来确定所述第二输出矢量。该方法包括提供（240）所述第二输出矢量的方法步骤。

Description

用于计算机辅助地分析目标系统的至少一个第二输入矢量的方法和设备

技术领域

本发明涉及用于计算机辅助地分析目标系统的至少一个第二输入矢量的一种方法和一种设备。

背景技术

在很多应用领域中，希望以计算机辅助的方式分析目标系统的输入矢量，以便由此确定目标系统的特定属性。例如，在医学领域中经常需要能够做出关于（生物）组织的陈述。特别是在恶性肿瘤的手术时，至关重要的是从所涉及的区域中实际去除所有受影响的细胞，以阻止肿瘤的扩散或重新出现。在这种情况下，目标系统例如是组织，而输入矢量包括检测到的关于所述组织的信息。然而，由于这种输入矢量的分析或评估是困难和复杂的，因此希望基于输入矢量尽可能简单地确定目标系统的特性，例如是否涉及肿瘤组织。

发明内容

本发明的任务是提供允许尽可能简单地对目标系统的输入矢量建模的一种方法和一种设备。

该任务通过在独立权利要求中说明的特征解决。在从属权利要求中展示了本发明的有利改进。

根据第一方面，本发明涉及一种用于基于训练系统计算机辅助地配置深度神经网络的方法，具有以下方法步骤：

-为训练系统提供具有预给定的第一输入矢量和预给定的第一输出矢量的训练数据;

-提供深度神经网络，其中

-深度神经网络是前馈网络，该前馈网络

-包括用于输入第一输入矢量的输入层，

-包括多个连续的隐藏层，用于对训练系统进行建模;

-基于训练数据来训练深度神经网络，其中

-第一输入矢量分别经由输入层传输到隐藏层之一作为第一处理矢量，

-第一处理矢量分别在隐藏层之间传输，

-对于每个隐藏层执行所传输的第一处理矢量的相应的第一数据变换，

-在相应的第一数据变换时对每个所涉及的隐藏层进行第一处理矢量的降维，

-基于降维的第一处理矢量和相应的所属第一输出矢量来配置隐藏层。

除非在以下描述中另有说明，否则术语“执行”、“计算（berechnen）”、“计算机辅助”、“计算（rechnen）”、“确定”、“生成”、“配置”、“重建”等优选地涉及改变和/或产生数据和/或将数据转换成其他数据的动作和/或过程和/或处理步骤，其中数据特别是可以表示为物理变量或作为物理变量存在，例如作为电脉冲。特别地，表达式“计算机”应该被尽可能广泛地解释，以特别是涵盖具有数据处理特性的所有电子设备。因此，计算机可以是例如个人计算机、服务器、手持计算机系统、袖珍PC设备、移动无线电设备和其他能够以计算机辅助方式处理数据的通信设备、处理器和用于数据处理的其他电子设备。

与本发明相关联，“计算机辅助”可以例如理解为方法的实现，其中特别是处理器执行该方法的至少一个方法步骤。

与本发明相关联，处理器可以理解为例如机器或电子电路。处理器特别地可以是主处理器（英语：Central Processing Unit，中央处理单元，CPU）、微处理器或微控制器，例如专用集成电路或数字信号处理器，可能与用于存储程序指令的存储器单元等组合。处理器例如也可以是IC（集成电路，英语：Integrated Circuit），特别是FPGA（英语：FieldProgrammable Gate Array，现场可编程门阵列）或ASIC（专用集成电路，英语：Application-Specific Integrated Circuit），或DSP（数字信号处理器，英语：DigitalSignal Processor）。处理器也可以被理解为虚拟化的处理器或软CPU。它例如也可以是可编程处理器，其配备有用于执行根据本发明的所述方法的配置步骤，或者用配置步骤加以配置，使得可编程处理器实现所述方法、组件、安全模块或本发明的其他方面和部分方面的根据本发明的特征。

与本发明相关联，“存储器单元”可以理解为例如工作存储器（英语:Random-Access memory,随机存取存储器，RAM）形式的存储器或硬盘。

与本发明相关联，“模块”可以理解为例如处理器和/或用于存储程序指令的存储器单元。所述处理器例如被专门设计为执行程序指令，使得所述处理器执行功能以实现根据本发明的方法或根据本发明的方法的步骤。

与本发明相关联，“系统”、特别是训练系统和/或目标系统可以理解为例如技术系统、生物系统或化学系统。因此，系统可以特别是描述生物组织、油或润滑剂的行为或特性，其特别是可以借助于经训练的深度神经网络从系统的测量的参数（输入矢量）中计算出来。特别地，相应的系统可以是复杂系统，其中复杂系统的测量的特性的分析、特别是输入矢量的形式的分析非常难以执行。特别地，该系统可以是另外的系统，其行为可以基于深度神经网络的训练来加以学习，使得可以基于输入矢量（例如，测量的频谱）来做出关于系统的陈述。特别地，可以根据第一输入矢量对关于第一输出矢量的系统行为进行建模。

与本发明相关联，“实时”可以理解为例如在对患者进行手术期间执行分析，其中分析（第二）输入矢量优选地在检测到所述输入矢量之后直接进行，并且其中分析优选地不需要或仅需要最小程度地延长手术持续时间。特别地，“实时”可以理解为分析及分析的持续时间，其可以优选地在预定时间段内（例如在手术期间或在技术系统的操作期间）可靠地提供结果。

与本发明相关联，“输入矢量”可以理解为例如系统的测量的变量。特别地，训练系统的用于训练的输入矢量被称为第一输入矢量。特别地，待分析的输入矢量（例如目标系统的测量的特性）被称为第二输入矢量。

与本发明相关联，“分类”可以理解为例如关于所寻求的预给定特性分析输入矢量，特别是第二输入矢量。特别地，分类任务可以被理解为输入矢量或目标系统的所寻求的特性，例如“是涉及健康组织还是肿瘤组织”。特别地，分类结果可以被理解为在借助于经训练的深度神经网络分析第二输入矢量时产生的第二输出矢量。

与本发明相关联，“输出矢量”可以理解为例如输入矢量的分析结果。输出矢量特别是包括（目标）系统的至少一个分析结果或所寻求的特性，例如是涉及肿瘤组织还是健康组织，并且相应的输入矢量特别是包括影响所寻求的特性或分析结果的至少一个输入变量。特别地，训练系统的用于训练的输出矢量被称为第一输出矢量。换句话说，根据本发明的方法特别适用于确定组织类型，例如肿瘤组织或健康组织，或确定疾病概率，并且特别是以（第二）输出矢量的形式提供。特别地，特别是包括目标系统的或第二输入矢量的分析结果的输出矢量被称为第二输出矢量。

与本发明相关联，“第一数据变换”可以被分别理解为用于对深度神经网络的每个隐藏层的相应处理矢量进行降维的数据变换。换句话说，这意味着例如在四个隐藏层的情况下，特别是对于四个层中的每一个分别对相应层的相应处理矢量执行自身的第一数据变换。由此，特别是逐步地产生多倍降维的处理矢量。

与本发明相关联，“第二数据变换”可以被分别理解为用于对相应降维的处理矢量进行数据重建的数据变换，所述降维的处理矢量是针对深度神经网络的每个所涉及的隐藏层而计算的。换句话说，这意味着，例如在四个隐藏层的情况下，特别是对于四个层中的每一个执行自身的第二数据变换，用于从针对所涉及的隐藏层计算的降维的处理矢量中进行数据重建。特别地，对于相应的隐藏层的相应的降维的处理矢量，相应的第二数据变换分别产生重建的处理矢量。

与本发明相关联，“训练系统”可以被理解为例如一个或多个训练系统，所述多个训练系统具有特别是类似或相同的系统行为。特别地，训练系统已知第一输入矢量和所属的第一输出矢量，其中第一输出矢量包括已经针对第一输入矢量执行的分析结果。例如对于生物组织，光学频谱被用作第一输入矢量，并且以组织的细胞学/病理学发现的形式使用分析结果（第一输出矢量），所述分析结果例如是涉及健康组织还是肿瘤组织。特别地，在训练深度神经网络时，根据第一输出矢量对训练系统或其关于第一输入矢量的行为进行建模。特别地，不需要例如第一输出矢量包括相同模态的第一输入矢量的分析结果。这例如意味着，特别是NIR频谱可以用作第一输入矢量，但是对NIR频谱的直接分析不需要作为用于训练的第一输出矢量存在。相反，特别是对于相应的第一输入矢量（即例如NIR频谱），可以特别是分别以组织的组织分析形式存在第一输出矢量，例如活组织检查的病理学/细胞学分析，其中对该组织拍摄NIR频谱。

与本发明相关联，“目标系统”可以理解为例如待分析的系统。目标系统可以例如涉及生物组织，其中确定是涉及肿瘤组织还是健康组织。特别地，应当为目标系统而被分析的输入矢量被称为第二输入矢量。特别地，目标系统的第二输入矢量也可以称为伪数据集。特别地，训练系统和目标系统可以是不同的系统或相同的系统。

与本发明相关联，“模型”可以理解为例如特别是用于对系统建模的数据结构。

与本发明相关联，“提供”可以理解为例如初始化和/或计算和/或加载和/或存储，特别是在数据存储器上/由数据存储器进行。特别地，提供数据和/或数据结构，例如训练数据、经训练/未经训练的深度神经网络或输出矢量。

与本发明相关联，“前馈网络”可以理解为例如具有多个互相连接的层的神经网络。这些连接的层包括例如用于输入输入矢量的输入层、用于对系统（例如训练系统）建模或用于分析系统（例如目标系统）的输入矢量的至少一个隐藏层和用于输出分析结果的输出层。特别地，各个层分别包括一个或多个神经元，所述神经元例如在深度神经网络的训练时加以配置。

与本发明相关联，“深度神经网络”可以理解为例如神经网络，其与传统神经网络相比包括一个以上的隐藏层。特别地，信息处理（特别是输入矢量的分析）优选地在许多连续的隐藏层中进行。特别地，处理矢量在隐藏层之间的传输优选地仅与直接在后的隐藏层进行。例如，输入矢量的分析（特别是信息处理）可以在隐藏层中以级联或链接的方式执行。特别地，输入矢量或处理矢量的级联处理因此成为可能。因此，深度神经网络例如可以包括多个连续的隐藏层，这些隐藏层特别是执行级联的信息处理。由此可以特别是实现隐藏层中的分级信息处理。特别地，例如相应层的分析结果（例如，特征提取）可以被直接传送到输出层，或者例如特定层的具体分析结果被传送到输出层，所述特定层特别是满足预给定的标准（例如，达到处理矢量的特定维度）。

与本发明相关联，“级联”可以理解为例如隐藏层的串行连接或链接。特别地，所涉及的隐藏层的信息处理的结果用作用于在所涉及的层之后的隐藏层的输入矢量或处理矢量。

与本发明相关联，“级联的传输”或“级联的处理”可以理解为例如对输入矢量或处理矢量的链接式处理。为此目的，例如在第一隐藏层中对处理矢量进行处理，并且特别是利用第一隐藏层的对应第一数据变换执行降维。特别地，相应的第一数据变换可以是相应的所涉及的隐藏层（例如，第一隐藏层）的组成部分或是针对相应的所涉及的隐藏层的预处理步骤。特别地，降维的输入矢量或降维的处理矢量被传输到在相应的所涉及的隐藏层之后的隐藏层。由此，特别是在隐藏层中的分析或信息处理期间，逐步减少输入矢量或处理矢量的维度，使得特别是由于通过隐藏层来处理/分析处理矢量而产生多倍降维的处理矢量。此外，在相应的隐藏层中例如可以分别针对相应降维的输入矢量或降维的处理矢量执行特征提取。特别地，特征提取在深度神经网络的训练时或者在隐藏层的配置时可能有助于基于第一输出矢量来配置隐藏层。为此目的，针对相应的隐藏层的第一输出矢量可以包括已知特征。隐藏层可以例如基于相应的层的已知特征与所提取的特征的比较来加以执行。

与本发明相关联，“配置”，特别是隐藏层的“配置”可以理解为例如在隐藏层中的神经元的加权和/或删除和/或插入。特别地，在配置时也可以匹配神经元的对应连接器的权重。

该方法特别是在肿瘤发生在关键组织（例如脑）中的情况下是有利的。特别是如果通过去除健康细胞可能导致对患者的持久伤害（例如在脑肿瘤的情况下），则健康细胞/组织和受影响的细胞/组织之间的边界区域的正确分类是至关重要的。例如，在手术之前应用的成像诊断方法为手术规划提供了重要贡献，但是特别是在手术期间只能在有限的程度上用于显示和识别肿瘤。借助于例如近红外范围（NIR）中的频谱学，可以附加地分析组织特性，所述组织特性特别是在手术期间实时再现存在的组织的频谱特性，并且例如可以用于将肿瘤细胞与周围的健康组织区分开来。为了特别是针对该应用情况配置深度神经网络，例如可以将拍摄的频谱用作第一输入矢量，并且可以将说明是否涉及肿瘤组织的组织片段用作第一输出矢量。特别是经训练的深度神经网络可以用于不同细胞/组织类型的自动化区分，并从而在肿瘤细胞和非肿瘤细胞之间的分界时可以例如向手术医师提供附加的判断辅助。

换句话说，根据本发明的方法有利于分析健康细胞或组织和肿瘤细胞/肿瘤组织的频谱，所述健康细胞或组织和肿瘤细胞/肿瘤组织尤其是仅通过复杂的、难以识别的特性来加以区分。特别地，根据本发明的方法能够优选地精确地识别这些难以识别的特性，并且特别是用于解决实际的分类任务（分析是涉及健康组织还是肿瘤组织）。

特别地，根据本发明的方法能够补偿拍摄的频谱或第一输入矢量中的测量误差。特别地，由此避免了对输入矢量的长时间的测量误差校正。

特别地，根据本发明的方法能够一方面例如处理拍摄的NIR频谱的原始数据（输入矢量）而无需另外的预处理步骤（例如测量误差校正），另一方面例如以非常好的性能（例如在尽可能短的时间内直到实时地）解决复杂的分类任务（区分健康组织或肿瘤组织）。特别地，利用根据本发明的方法，例如可以用测试数据组来训练深度神经网络，以便在第二输入矢量上实现优选非常好的分类结果（输出矢量）。特别地，通过以合适的软件来实现，可以简单地实现经训练的深度神经网络作为纯输入-输出关系来应用于第二输入矢量。

根据本发明的方法优选不设定为脑肿瘤等，而是可以特别是扩大到另外的组织类型，例如骨。此外，利用根据本发明的方法例如还可以分析健康数据，以便例如基于遗传标记和/或药物摄入和/或预先存在的疾病和/或实验室值来确定特定疾病（例如糖尿病）发生的概率。

此外，该方法优选不限于医学应用，而是还可以特别是检查液体或气体的频谱数据或输入矢量。

在该方法的第一实施方式中，第一输入矢量是训练系统的测量的频谱，其中第一输出矢量是已经针对所述频谱执行的分析结果。

在该方法的另一实施方式中，测量的频谱包括组织的频谱，并且执行的分析结果说明频谱是分配给健康组织还是分配给肿瘤组织。

在该方法的另一实施方式中，测量的频谱包括油或润滑剂的频谱，并且执行的分析结果包括油或润滑剂的质量。

在该方法的另一实施方式中，对于针对隐藏层产生的降维的第一处理矢量，分别借助于第二数据变换重建用于每个所涉及的隐藏层的原始第一处理矢量，并且对于相应的所涉及的隐藏层，确定重建的原始第一处理矢量和传输的第一处理矢量之间的误差。

该方法特别是有利于能够例如关于隐藏层（例如所涉及的隐藏层）的降维的第一处理矢量的提取特征的质量、特别是关于预期误差做出陈述。

在该方法的另一实施方式中，所确定的误差被考虑用于配置相应的所涉及的隐藏层或相应的后续隐藏层，降维的第一处理矢量被传送给所述相应的后续隐藏层。

该方法特别有利于由此改善分类结果的准确性。特别地，训练系统被更精确地建模，并且特别地，可以改善例如通过隐藏层从一个或多个处理矢量中提取的特征的质量。由此例如可以减少在提取的特征中的错误。

在该方法的另一实施方式中，由降维的第一输入矢量的要达到的维度来确定隐藏层的数量。

该方法特别是有利于将用于特定分类任务的隐藏层的数量保持得尽可能地少，并且因此特别是避免不必要的计算步骤。

根据另一方面，本发明涉及一种用于计算机辅助地分析目标系统的至少一个第二输入矢量的方法，具有以下方法步骤：

-为目标系统提供第二输入矢量;

-提供经训练的深度神经网络，其中

-深度神经网络是前馈网络，该前馈网络

-包括用于为目标系统输入第二输入矢量的输入层，

-包括多个连续的隐藏层，所述隐藏层对目标系统进行建模，以及

-包括用于为目标系统输出第二输出矢量的输出层，

-评估第二输入矢量，其中

-将第二输入矢量分别经由输入层传输到隐藏层之一作为第二处理矢量，

-将第二处理矢量分别在隐藏层之间传输，

-针对每个隐藏层执行所传输的第二处理矢量的相应第一数据变换，

-在相应的第一数据变换时，对每个所涉及的隐藏层执行第二处理矢量的降维，

-基于降维的第二处理矢量确定第二输出矢量;

-提供第二输出矢量。

该方法特别是在肿瘤发生在关键组织（例如脑）中的情况下是有利的。特别是如果通过去除健康细胞可能导致对患者的持久伤害（例如在脑肿瘤的情况下），则健康的细胞/组织和受影响的细胞/组织之间的边界区域的正确分类是至关重要的。例如，在手术之前应用的成像诊断方法为手术规划提供了重要贡献，但是特别是在手术期间只能在有限的程度上用于显示和识别肿瘤。借助于例如近红外范围（NIR）中的频谱学，可以附加地分析组织特性，所述组织特性特别是在手术期间实时再现存在的组织的频谱特性，并且例如可以用于将肿瘤细胞与周围的健康组织区分开来。

特别是经训练的深度神经网络可以用于不同细胞/组织类型的自动化区分，并因此在肿瘤细胞和非肿瘤细胞之间的分界时可以例如向手术医师提供附加的判断辅助。

换句话说，根据本发明的方法有利于分析健康细胞或组织和肿瘤细胞/肿瘤组织的频谱，所述健康细胞或组织和肿瘤细胞/肿瘤组织尤其是仅通过复杂的、难以识别的特性来加以区分。特别地，根据本发明的方法能够优选地精确地识别这些难以识别的特性，并且特别是用于解决实际的分类任务（例如分析是涉及健康组织还是肿瘤组织）。

特别地，第二输入矢量或第二处理矢量为了分析而遍历多个隐藏层，其中特别是针对每个隐藏层分别执行相应的第二输入矢量的降维或相应的第二处理矢量的降维。然后可以在相应的隐藏层中例如分别执行第二处理矢量的分析。因此，在隐藏层之间传送时，特别是在级联的传送时，逐步减少第二处理矢量的维度，直到优选地第二处理矢量达到预给定的减少的维度并且作为第二输出矢量传输到输出层。

特别地，根据本发明的方法能够一方面例如处理拍摄的NIR频谱的原始数据（输入矢量）而无需另外的预处理步骤（例如测量误差校正），另一方面例如以非常好的性能解决复杂的分类任务（区分健康组织或肿瘤组织）。

特别地，通过以合适的软件来实现，可以简单地实现经训练的深度神经网络作为纯输入-输出关系来应用于第二输入矢量。

在该方法的另一实施方式中，第二输入矢量是目标系统的测量的频谱。

在该方法的另一实施方式中，测量的频谱是组织的频谱，其中第二输出矢量特别是说明是涉及健康组织还是肿瘤组织。

在该方法的另一实施方式中，测量的频谱是油和/或润滑剂的频谱，其中第二输出矢量特别是说明油或润滑剂的质量。

在该方法的另一实施方式中，对于针对隐藏层产生的降维的第二处理矢量，分别借助于第二数据变换重建用于每个所涉及的隐藏层的原始第二处理矢量，并且对于相应的所涉及的隐藏层，确定重建的原始第二处理矢量和传输的第二处理矢量之间的误差。

该方法特别有利于由此改善分类结果的准确性。特别地，目标系统及其行为被更精确地建模，并且特别地，可以改善例如通过隐藏层从一个或多个处理矢量中提取的特征的质量。由此例如可以减少在提取的特征中的错误。特别地，附加地同样可能的是，即使在分析目标系统的第二输入矢量期间也例如对经训练的深度神经网络进一步训练。

在该方法的另一实施方式中，由降维的第二处理矢量的要达到的维度确定隐藏层的数量。

根据另一方面，本发明涉及一种基于训练系统对深度神经网络进行计算机辅助配置的配置设备，该配置设备具有：

-第一提供模块，用于为训练系统提供具有预给定的第一输入矢量和预给定的第一输出矢量的训练数据;

-第二提供模块，用于提供深度神经网络，其中，

-该深度神经网络是前馈网络，该前馈网络

-包括输入层，用于输入第一输入矢量，

-包括多个连续的隐藏层，用于对训练系统进行建模;

-第一训练模块，用于基于训练数据来训练深度神经网络，其中，

-第一处理矢量分别在隐藏层之间传输，

-对每个隐藏层执行所传输的第一处理矢量的相应的第一数据变换，

-在相应的第一数据变换时，对每个所涉及的隐藏层执行第一处理矢量的降维，

根据另一方面，本发明涉及一种用于计算机辅助地分析目标系统的至少一个第二输入矢量的分析设备，具有：

-第三提供模块，用于为目标系统提供第二输入矢量;

-第四提供模块，用于提供经训练的深度神经网络，其中，

-该神经网络是前馈网络，所述前馈网络

-包括输入层，用于为目标系统输入第二输入矢量，

-包括输出层，用于为目标系统输出第二输出矢量，

-第一评估模块，用于评估第二输入矢量，其中，

-第二输入矢量分别经由输入层传输到隐藏层之一作为第二处理矢量，

-第二处理矢量分别在隐藏层之间传输，

-对每个隐藏层执行所传输的第二处理矢量的相应的第一数据变换，

-基于降维的第二处理矢量确定第二输出矢量;

-第五提供模块，用于提供第二输出矢量。

此外，要求保护具有用于执行上述根据本发明方法的程序指令的计算机程序产品，其中，借助于计算机程序产品可以分别执行根据本发明的方法之一、所有根据本发明的方法或根据本发明的方法的组合。

此外，要求保护计算机程序产品的变型，具有用于配置创建设备的程序指令，所述创建设备例如是3D打印机或用于创建处理器和/或设备，其中创建设备配置有程序指令，使得创建根据本发明的配置设备和/或分析设备。

此外，要求保护用于存储和/或提供计算机程序产品的提供设备。提供设备例如是存储和/或提供计算机程序产品的数据载体。替代地和/或附加地，提供设备例如是网络服务、计算机系统、服务器系统、特别是分布式计算机系统、基于云的计算机系统和/或优选以数据流的形式存储和/或提供计算机程序产品的虚拟计算机系统。

该提供例如以完整的计算机程序产品的程序数据块和/或指令数据块的形式下载，优选作为文件，特别是作为下载文件，或作为数据流，特别是作为下载数据流。然而，这种提供也可以例如作为部分下载进行，该部分下载由多个部分组成并且特别是经由对等网络下载或者作为数据流提供。这样的计算机程序产品例如在使用数据载体形式的提供设备的情况下被读入系统并执行程序指令，使得根据本发明的方法在计算机上执行，或者配置创建设备，使得该创建设备创建根据本发明的配置设备和/或分析设备。

附图说明

结合以下对结合附图更详细解释的实施例的描述，本发明的上述特性、特征和优点以及实现它们的方式将变得更明确和更清楚地理解。在此，以示意图的方式：

图1示出了根据本发明的方法的第一实施例的流程图，该方法用于基于训练系统计算机辅助地配置深度神经网络;

图2示出了根据本发明的方法的另一实施例的流程图，该方法用于计算机辅助地分析目标系统的至少一个第二输入矢量;

图3a-b示出了本发明的另外的实施例的深度神经网络的数据结构;

图4示出了本发明的另一实施例的配置设备;和

图5示出了本发明的另一实施例的分析设备。

在附图中，除非另有说明，否则功能相同的元件具有相同的附图标记。

具体实施方式

除非另有说明或已经说明，否则以下实施例具有至少一个处理器和/或存储装置，以便实现或执行该方法。

图1示出了根据本发明的方法的第一实施例的流程图，该方法用于基于训练系统来计算机辅助地配置深度神经网络。

具体地，图1示出了用于基于训练系统来计算机辅助地配置深度神经网络的方法，该方法具有第一方法步骤110，用于为训练系统提供具有预给定的第一输入矢量和预给定的第一输出矢量的训练数据。

该方法包括用于提供深度神经网络的第二方法步骤120，其中深度神经网络是前馈网络。前馈网络包括用于输入第一输入矢量的输入层和用于对训练系统建模的多个连续的隐藏层。

该方法包括第三方法步骤130，用于基于训练数据来训练深度神经网络，其中第一输入矢量分别经由输入层传输到隐藏层之一作为第一处理矢量。

在第三方法步骤130中，附加地分别在隐藏层之间传输第一处理矢量，并且对每个隐藏层执行所传输的第一处理矢量的相应的第一数据变换。

在第三方法步骤130中，附加地在相应的第一数据变换时，对每个所涉及的隐藏层进行第一处理矢量的降维，并且基于降维的第一处理矢量和相应的所属第一输出矢量来配置隐藏层。

在优选的变型中，处理器被具体设计为执行程序指令，使得处理器执行功能，以实现根据本发明的方法或根据本发明的方法的至少一个步骤。

图2示出了根据本发明的方法的另一实施例的流程图，该方法用于计算机辅助地分析目标系统的至少一个第二输入矢量。

具体地，图2示出了用于计算机辅助地分析目标系统的至少一个第二输入矢量的方法，该方法具有用于为目标系统提供第二输入矢量的第一方法步骤210。

该方法包括第二方法步骤220，用于提供经训练的深度神经网络，其中深度神经网络是前馈网络。前馈网络包括：输入层，用于为目标系统输入第二输入矢量；多个连续的隐藏层，所述隐藏层对目标系统建模；和输出层，用于为目标系统输出第二输出矢量。

该方法包括用于评估第二输入矢量的第三方法步骤230，其中第二输入矢量分别经由输入层传输到隐藏层之一作为第二处理矢量，并且第二处理矢量分别在隐藏层之间传输。

在第三方法步骤230中，附加地对每个隐藏层执行所传输的第二处理矢量的相应的第一数据变换，并且在相应的第一数据变换时，对每个所涉及的隐藏层进行第二处理矢量的降维。

在第三方法步骤230中，附加地，基于降维的第二处理矢量确定第二输出矢量。

降维的第二处理矢量可以是例如多倍降维的第二处理矢量。特别地，多倍降维的第二处理矢量因此是以下第二处理矢量，其曾被多个隐藏层逐步处理，直到例如多倍降维的第二处理矢量达到预给定的维度。

该方法包括第四方法步骤240，用于提供第二输出矢量。

换句话说，特别是在图1中和/或在图2解释的方法适用于在手术时，特别是在恶性肿瘤的手术时确定是否优选实际上从所涉及的区域中去除所有受影响的细胞。这具有特别是防止肿瘤扩散或重新出现的优点。这特别是在肿瘤发生在关键组织中的情况下是至关重要的，也就是说，在通过去除健康细胞可能导致对患者的持久伤害的情况下（例如，在脑肿瘤的情况下）。特别是，在这种状况中，健康细胞和受影响细胞之间的边界区域的正确分类是至关重要的。

尽管例如在手术之前应用的成像诊断方法可以为手术规划提供重要贡献，但是这些成像诊断方法在手术期间例如只能在有限的程度上用于显示和识别肿瘤。

特别地，借助于近红外（NIR）中的频谱学，可以在手术期间实时确定存在的组织的频谱特性并且例如用于将肿瘤细胞与周围的健康组织区分开来。

特别地，利用图1中和/或图2中解释的方法，拍摄的频谱可以作为（第二）输入矢量用于不同细胞类型的自动化区分。特别地，在肿瘤细胞（或组织）和非肿瘤细胞（或组织）之间的分界时本发明向手术医师提供额外的判断辅助。

具体地，特别是难以使用常规方法基于拍摄的NIR频谱区分肿瘤细胞和健康组织，因为NIR频谱中的区别特征难以识别。

特别地，利用图1中解释的方法和/或图2中解释的方法，例如可以基于训练集对测量的频谱进行分类，其中特别是也可以利用极为精细的频谱区分特征。特别地，由此可以确定是涉及肿瘤组织还是健康组织。该确定优选对应于分类任务。此外，特别是利用图1中和/或图2中解释的方法，也能够显示或识别在输入信号（例如第一或第二输入矢量）和输出（在这种情况下是分类）之间的复杂的非线性关系，所述输出例如是第一或第二输出矢量。

为了例如为用户实现所获得的结果或（第二）输出矢量的良好可解释性，特别是可以借助于深度神经网络的对应配置将输出矢量转换为预给定的形式。例如，可以将输出矢量转换为关于所测量的样本的所属性（例如健康或患病的组织）的概率陈述的形式。

一旦例如借助于适当的深度神经网络或深度神经网络的适当架构从训练数据中学习了针对分类任务的分配规范，如例如在图1中所解释的，则深度神经网络特别是可以作为输入/输出关系如图2所解释的借助于合适的软件实现优选实时地应用于第二输入矢量。特别地，深度神经网络的架构特别是通过用于对训练系统建模的多个连续的隐藏层而允许将分类任务也没有任何问题地扩展到其他组织类型。例如，还可以附加地想到引入骨材料或脂肪组织的分类。

特别地，根据本发明的方法能够特别是区分健康细胞和肿瘤细胞的频谱，所述频谱特别是区分难以识别的特性。特别地，基于相似性分析的传统聚类方法不适用于此目的。

图3a示出了本发明另一实施例的深度神经网络的数据结构，其中图3a特别示出了深度神经网络的一种可能的架构。

特别地，深度神经网络的此架构可以由图1的本发明方法或图2的本发明方法使用。

具体地，图3a示出了用于输入输入矢量的输入层E、多个连续的隐藏层以及用于输出输出矢量的输出层O。在该实施例中，多个隐藏层包括总共四个层，特别是第一隐藏层VS1、第二隐藏层VS2、第三隐藏层VS3和第四隐藏层VS4。

如果例如预给定的第一输入矢量为了训练深度神经网络而以第一处理矢量的形式从输入层传送到第一隐藏层VS1，则特别是针对第一隐藏层VS1执行第一处理矢量的第一数据转换（例如数据变换A），用于对第一处理矢量降维。第一隐藏层VS1分析降维的第一处理矢量并且借助于函数a从该降维的第一处理矢量提取例如特征y。然后将该特征y与预给定的第一输出矢量的已提取特征进行比较，并且基于所确定的差异（或者也称为误差）来配置第一层的神经元。

接下来，将降维的第一处理矢量传输到后续隐藏层（第二隐藏层VS2）。针对第二隐藏层VS2，借助于第一数据变换（例如数据变换B）执行由第一隐藏层VS1以降维的方式传送的降维的第一处理矢量的进一步降维。

第二隐藏层VS2分析多倍（两倍）降维的第一处理矢量，并且借助于函数b从该多倍降维的第一处理矢量再次提取例如特征y。然后将该特征y与预给定的第一输出矢量的另外的已提取的特征进行比较，并且基于所确定的差异来配置第二层VS2的神经元。

这些分析或配置的步骤然后类似地针对第三隐藏层用第一数据变换（例如数据变换C）执行，并且针对第四隐藏层用第一数据变换（例如数据变换D）执行。

在此，特别地，第一数据变换应该被理解为对应隐藏层的数据变换。

特别地，将多倍（四倍）降维的第一处理矢量传送到输出层O，与第一输出矢量进行比较，并且必要时确定多倍降维的第一处理矢量和第一输出矢量之间的差异。然后可以根据所确定的差异来配置输出层或输出层的神经元。

第二输入矢量的分析的不同之处特别是在于，在隐藏层中例如提取特征而不例如对隐藏层进行进一步的配置或确定所提取的特征和预给定的第一输出矢量之间的误差。

所提取的特征可以例如用于输出矢量中的分析，或者对于输出矢量例如仅考虑最后隐藏层（在该实施例中是第四隐藏层VS4）的所提取的特征。然而，还可以想到，例如一旦特别是达到了多倍降维的处理矢量的预给定维度，就将多倍降维的处理矢量作为输出矢量传送给输出层。

在该实施例中提出的深度神经网络的架构的情况下，特别是将用于深度神经网络的训练或用于输入矢量的分析的隐藏层、输入矢量或处理矢量优选地仅传送给后续直接相邻的层。在此，输入层可以将输入矢量直接传送给预给定的隐藏层，例如第一隐藏层VS1，或者选择与输入矢量的维度匹配的匹配隐藏层。特别是在隐藏层之间传送处理矢量时禁止隐藏层的跳跃。

特别是为了改善深度神经网络的配置/训练的精度和/或通过深度神经网络分析输入矢量的精度，例如可以扩展来自图3a的深度神经网络的架构。这例如在图3b中示出。

除了已经在图3a中解释的配置之外，在图3b中还从隐藏层的相应的降维的处理矢量中分别利用第二数据变换分别针对对应的隐藏层计算重建的处理矢量。换句话说，尝试利用第二数据变换来撤销针对相应隐藏层的降维。原始处理矢量，即针对对应隐藏层的尚未降维的处理矢量将与重建的处理矢量进行比较，并且必要时确定它们之间的差异或它们之间的误差。所确定的误差然后可以用于例如改善所涉及的隐藏层，针对该隐藏层对处理矢量降维了，其方式是例如基于误差来重新调整或配置所涉及的隐藏层，也就是特别是配置对应隐藏层的神经元和匹配神经元的对应连接器的权重。但是，也可以对后续隐藏层执行这种重新调整或配置。

具体地，图3b示出了如何借助于第二数据变换（例如数据变换AT）从降维的处理矢量中重建原始的处理矢量T1，也就是还未针对第一隐藏层VS1降维的处理矢量，所述降维的处理矢量是借助于第一数据变换而针对第一隐藏层VS1降维的。随后确定原始的处理矢量和重建的处理矢量之间的误差ld1。在该误差的基础上，例如可以更精确地配置所涉及的隐藏层，即第一隐藏层VS1，或后续隐藏层，即第二隐藏层VS2，并且可以更好地训练深度神经网络。由此特别是可以改善解决分类任务的精度。换句话说，特别是输出矢量的误差因此被尽可能地最小化。

然后，将隐藏层的配置的这种误差确定和改进类似地应用于其他隐藏层。根据不同的应用场景，可以将该方法例如应用于所有的隐藏层或例如仅应用于一部分隐藏层。

对于第二隐藏层VS2，这例如意味着，首先借助于第二数据变换（例如数据变换BT）从针对第二层VS2确定的多倍降维的处理矢量中重建第二隐藏层VS2的原始的处理矢量T2，也就是已针对先前的隐藏层（即第一隐藏层VS1）降维但尚未针对第二隐藏层VS2降维的处理矢量。这里也为所涉及的层再次确定误差ld2，基于所述误差进一步配置所涉及的层或所涉及的层的后续层或者改善现有配置。

图4示出了本发明另一实施例的配置设备。

具体地，图4示出了用于基于训练系统计算机辅助地配置深度神经网络的配置设备。所述配置设备包括：第一提供模块410、第二提供模块420和第一训练模块430，它们通过第一总线405通信地连接到彼此。

该配置设备可以例如附加地还包括一个另外的组件或多个另外的组件，例如，处理器、存储器单元、输入设备——特别是计算机键盘或计算机鼠标、或监视器。对应的一个或多个组件可以例如经由第一总线405可通信地连接到配置设备的其它模块。

第一提供模块410被设计用于为训练系统提供具有预给定的第一输入矢量和预给定的第一输出矢量的训练数据。

第一提供模块410可以例如借助于处理器、存储器单元和第一程序组件来实现，它们例如通过执行程序指令来提供训练数据。

第二提供模块420被设计用于提供深度神经网络，其中深度神经网络是前馈网络。前馈网络包括用于输入第一输入矢量的输入层和用于对训练系统建模的多个连续的隐藏层。

第二提供模块420可以例如借助于处理器、存储器单元和第二程序组件来实现，它们例如通过执行程序指令来提供深度神经网络。

第一训练模块430被设计用于基于训练数据来训练深度神经网络，其中第一输入矢量分别经由输入层被传输到隐藏层之一作为第一处理矢量，并且第一处理矢量分别在隐藏层之间传输。

此外，第一训练模块430被设计用于针对每个隐藏层执行所传输的第一处理矢量的相应的第一数据变换，并且在相应的第一数据变换时，针对每个所涉及的隐藏层进行第一处理矢量的降维。

此外，第一训练模块430被设计用于基于降维的第一处理矢量和相应的所属第一输出矢量来配置隐藏层。

第一训练模块430可以例如借助于处理器和第三程序组件来实现，它们例如通过执行程序指令来训练深度神经网络。

图5示出了本发明另一实施例的分析设备。

具体地，图5示出了用于计算机辅助地分析目标系统的至少一个第二输入矢量的分析设备。分析设备包括第三提供模块510、第四提供模块520、第一评估模块530和第五提供模块540，它们经由第二总线505可通信地彼此连接。

分析设备例如附加地还可以包括一个另外的组件或多个另外的组件，例如处理器、存储器单元、输入设备——特别是计算机键盘或计算机鼠标、或监视器。对应的一个或多个组件可以例如经由第二总线505可通信地连接到分析设备的其它模块。

第三提供模块510被设计用于为目标系统提供第二输入矢量。

第三提供模块510可以例如借助于处理器、存储器单元和第四程序组件来实现，它们例如通过执行程序指令来提供第二输入矢量。

第四提供模块520被设计用于提供经训练的深度神经网络，其中深度神经网络是前馈网络。前馈网络包括用于为目标系统输入第二输入矢量的输入层、对目标系统建模的多个连续的隐藏层、和用于为目标系统输出第二输出矢量的输出层。

第四提供模块520可以例如借助于处理器、存储器单元和第五程序组件来实现，它们例如通过执行程序指令来提供经训练的深度神经网络。

第一评估模块530被设计用于评估第二输入矢量，其中第二输入矢量分别经由输入层被传输到隐藏层之一作为第二处理矢量，并且第二处理矢量分别在隐藏层之间传输。

另外，第一评估模块530被设计用于针对每个隐藏层执行所传输的第二处理矢量的相应的第一数据变换，并且在相应的第一数据变换时，针对每个所涉及的隐藏层进行第二处理矢量的降维。

另外，第一评估模块530被设计用于基于降维的第二处理矢量来确定第二输出矢量。

第一评估模块530可以例如借助于处理器和第六程序组件来实现，它们例如通过执行程序指令来借助于经训练的深度神经网络分析第二输入矢量。

第五提供模块540被设计用于提供第二输出矢量。

第五提供模块540可以例如借助于处理器、存储器单元和第五程序组件来实现，它们例如通过执行程序指令来提供第二输出矢量。

尽管通过实施例详细地进一步说明和描述了本发明，但是本发明不受所公开的示例的限制，并且本领域技术人员可以在不脱离本发明的保护范围的情况下从中得出其他变型。

Claims

1.用于基于训练系统计算机辅助地配置深度神经网络的方法，具有以下方法步骤：

-为训练系统提供（110）具有预给定的第一输入矢量和预给定的第一输出矢量的训练数据;

-提供（120）所述深度神经网络，其中

-该深度神经网络是前馈网络，该前馈网络

-包括用于输入第一输入矢量的输入层，

-包括多个连续的隐藏层，用于对所述训练系统进行建模;

-基于所述训练数据来训练（130）所述深度神经网络，其中

-所述第一输入矢量分别经由所述输入层传输到所述隐藏层之一作为第一处理矢量，

-所述第一处理矢量分别在所述隐藏层之间传输，

-在所述相应的第一数据变换时，对于每个所涉及的隐藏层执行所述第一处理矢量的降维，

-基于降维的第一处理矢量和相应的所属第一输出矢量来配置所述隐藏层。

2.如权利要求1所述的方法，其中，所述第一输入矢量是所述训练系统的测量的频谱，并且其中，所述第一输出矢量是已经针对所述频谱执行的分析结果。

3.如权利要求2所述的方法，其中，

-所述测量的频谱包括组织的频谱，和

-所述执行的分析结果说明频谱是分配给健康组织还是分配给肿瘤组织。

4.如权利要求2所述的方法，其中，

-所述测量的频谱包括油或润滑剂的频谱，和

-所述执行的分析结果包括油或润滑剂的质量。

5.如前述权利要求中任一项所述的方法，其中，

-对于针对所述隐藏层产生的降维的第一处理矢量，分别借助于第二数据变换重建用于每个所涉及的隐藏层的原始第一处理矢量，

-对于相应的所涉及的隐藏层，确定重建的原始第一处理矢量和传输的第一处理矢量之间的误差。

6.如权利要求5所述的方法，其中，所确定的误差被考虑用于配置所述相应的所涉及的隐藏层或相应的后续隐藏层，所述降维的第一处理矢量被传送给所述相应的后续隐藏层。

7.如前述权利要求中任一项所述的方法，其中，由所述降维的第一输入矢量的要达到的维度确定隐藏层的数量。

8.用于计算机辅助地分析目标系统的至少一个第二输入矢量的方法，具有以下方法步骤：

-为所述目标系统提供（210）第二输入矢量;

-提供（220）经训练的深度神经网络，其中

-该深度神经网络是前馈网络，所述前馈网络

-包括用于为所述目标系统输入第二输入矢量的输入层，

-包括多个连续的隐藏层，所述隐藏层对所述目标系统进行建模，以及

-包括用于为所述目标系统输出第二输出矢量的输出层，

-评估（230）所述第二输入矢量，其中

-所述第二输入矢量分别经由所述输入层传输到所述隐藏层之一作为第二处理矢量，

-所述第二处理矢量分别在所述隐藏层之间传输，

-对于每个隐藏层执行所传输的第二处理矢量的相应的第一数据变换，

-在所述相应的第一数据变换时，对于每个所涉及的隐藏层执行所述第二处理矢量的降维，

-基于降维的第二处理矢量来确定所述第二输出矢量；

-提供（240）所述第二输出矢量。

9.如权利要求8所述的方法，其中，所述第二输入矢量是所述目标系统的测量的频谱。

10.如权利要求9所述的方法，其中，所述测量的频谱是组织的频谱，其中所述第二输出矢量特别是说明是涉及健康组织还是肿瘤组织。

11.如权利要求9所述的方法，其中，所述测量的频谱是油和/或润滑剂的频谱，其中所述第二输出矢量特别是说明油或润滑剂的质量。

12.如权利要求8-11中任一项所述的方法，其中，

-对于针对所述隐藏层产生的降维的第二处理矢量，分别借助于第二数据变换重建用于每个所涉及的隐藏层的原始第二处理矢量，

-对于相应的所涉及的隐藏层，确定重建的原始第二处理矢量和传输的第二处理矢量之间的误差。

13.如权利要求12所述的方法，其中，所确定的误差被考虑用于配置所述相应的所涉及的隐藏层或相应的后续隐藏层，所述降维的第一处理矢量被传送给所述相应的后续隐藏层。

14.如权利要求8-13中任一项所述的方法，其中，由所述降维的第二处理矢量的要达到的维度确定隐藏层的数量。

15.用于基于训练系统计算机辅助地配置深度神经网络的配置设备，具有：

-第一提供模块（410），用于为所述训练系统提供具有预给定的第一输入矢量和预给定的第一输出矢量的训练数据;

-第二提供模块（420），用于提供所述深度神经网络，其中，

-该深度神经网络是前馈网络，该前馈网络

-包括用于输入第一输入矢量的输入层，

-包括多个连续的隐藏层，用于对所述训练系统进行建模;

-第一训练模块（430），用于基于所述训练数据来训练所述深度神经网络，其中

-所述第一处理矢量分别在所述隐藏层之间传输，

16.用于计算机辅助地分析目标系统的至少一个第二输入矢量的分析设备，具有：

-第三提供模块（510），用于为所述目标系统提供第二输入矢量;

-第四提供模块（520），用于提供经训练的深度神经网络，其中，

-该深度神经网络是前馈网络，该前馈网络

-包括用于为所述目标系统输入第二输入矢量的输入层，

-包括用于为所述目标系统输出第二输出矢量的输出层，

-第一评估模块（530），用于评估所述第二输入矢量，其中

-所述第二处理矢量分别在所述隐藏层之间传输，

-基于降维的第二处理矢量来确定所述第二输出矢量;

-第五提供模块（540），用于提供所述第二输出矢量。

17.计算机程序产品，具有程序指令用于执行如权利要求1-7中任一项所述的方法和/或用于执行如权利要求8-14中任一项所述的方法。

18.计算机程序产品，具有用于创建设备的程序指令，该创建设备借助于所述程序指令被配置为创建如权利要求15所述的配置设备和/或如权利要求16所述的分析设备。

19.用于如权利要求17或18所述的计算机程序产品的提供设备，其中所述提供设备存储和/或提供所述计算机程序产品。