词汇表

谢谢!您提交的内容已收到!
哎哟!提交表单时出了点问题。

G

G

全球池化

全局池化是卷积神经网络 (CNN) 中使用的一种技术,通过对整个特征图应用聚合函数,将输入特征图的空间维度降低到单个值。最常见的全局池化类型是全局平均池化和全局最大池化,它们分别通过平均值或取特征图上的最大值来进行聚合。全局池化的含义对于减少参数数量和避免深度学习模型中的过度拟合至关重要,尤其是在图像分类等任务中。

G

图形处理单元 (GPU)

图形处理单元 (GPU) 是一种专门的电子电路,旨在加速图像和视觉数据的处理。GPU 最初是为在视频游戏和其他视觉应用程序中渲染图形而开发的,现在广泛用于各种计算任务,尤其是涉及并行处理的任务。图形处理单元的含义不仅限于图形渲染,因为 GPU 能够同时处理大量数据,因此在机器学习、科学计算和数据处理等领域变得至关重要。

G

图形式模拟

图形模型是一种概率模型,它使用图形式结构来表示随机变量之后的条件依赖关系。这些模组通过将变量描述为节点点,将依然是赖氏关系的模版,将依然是以图形式中的边缘,为理解数据中的复杂关系提供了视觉和数学框架。tigurefram 模型的含义对所涉及概率推理、推理和决心策划的任务至关重要,尤其是在统计、机器人学习和人体工智能等领域。

G

图神经网络 (GNN)

图神经网络 (GNN) 是一种旨在对图形结构数据进行操作的神经网络,其中数据点表示为由边连接的节点。GNN 用于对图中节点之间的关系和交互进行建模,这使得它们对于涉及网络数据的任务(例如社交网络、分子结构和推荐系统)特别有用。图神经网络的意义在于它能够捕获自然表现为图形的数据中的依赖关系和模式。

G

图表剪辑

Graph cut 是一种用于计算机视觉和图像处理的优化技术,通过将问题建模为图形,然后找到将图形 “切割” 成两个或更多不相交的子集的最佳方法,将图像分割成不同的区域。每个子集代表图像的一个片段。图形剪辑的含义对于图像分割等任务至关重要,这些任务的目标是将图像分成有意义的区域,例如前景和背景。

G

地理围栏

地理围栏是一种使用 GPS 或 RFID 在物理位置周围创建虚拟边界的技术。它允许企业、组织和设备在特定地理区域周围建立电子 “围栏”,当设备或物体进入或离开该区域时触发操作。Geofencing 广泛用于移动应用程序、车队管理、营销和安全系统,以监控行动和实时管理资产。

G

地面真相

地面真相是指用作基准的准确的真实数据或信息,用于验证或比较模型或算法的预测。它代表了衡量模型输出的实际观测结果。该术语通常用于机器学习、计算机视觉和遥感中,用于描述假定正确的参考数据。真实情况的含义对于评估模型的准确性和可靠性,确保它们按预期运行至关重要。

G

垃圾进,垃圾出

垃圾进出(GIGO)是计算和数据处理中的一项原则,它强调了数据质量的至关重要性。它指出,计算机程序或数据处理系统产生的输出质量由输入数据的质量决定。本质上,无论所使用的处理技术和算法的复杂程度或准确性如何,质量差的输入数据(垃圾)都将导致质量差的输出(垃圾)。GIGO强调质量控制在数据收集和准备中的作用,因为输入数据中的错误和不一致会导致误导性或不正确的结果,从而破坏计算和数据驱动应用程序的可靠性和实用性。

G

梯度下降

梯度下降是一种优化算法,用于最小化机器学习模型中的损失函数。它的工作原理是沿损失函数负梯度的方向迭代调整模型参数,目的是找到最小值。该算法是训练机器学习模型的基础,通过减少预测误差随时间推移而使它们能够从数据中学习。

G

梯度提升

梯度提升是一种用于回归和分类任务的机器学习技术,它通过组合多个弱学习者(通常是决策树)的输出,以顺序方式构建预测模型,以创建强大的预测模型。梯度提升背后的关键思想是通过添加纠正错误的新模型来最大限度地减少先前模型所犯的错误。梯度提升的含义对于构建高度准确的预测模型至关重要,对于模型性能至关重要的任务尤其如此。

G

梯度累积

梯度累积是一种用于训练神经网络的技术,在执行权重更新之前,梯度会在多个小批次上累积。即使可用硬件(如 GPU)存在内存限制,无法直接使用大批量,这种方法也可以有效地模拟更大批量的训练过程。梯度累积的含义对于提高模型性能至关重要,尤其是在需要大批量但由于硬件限制而不可行的场景中。

G

渐变胶带

梯度磁带是机器学习(尤其是在自动微分框架中)中使用的工具,用于记录神经网络向前传递期间对张量执行的操作。然后,使用这些记录的信息来计算损失函数在向后传递期间与模型参数相关的梯度。梯度带的含义对于启用反向传播至关重要,反向传播对于通过更新模型的权重以最大限度地减少损失来训练深度学习模型是必要的。

G

生成式对抗网络 (GAN)

生成式对抗网络 (GAN) 是一种机器学习模型,旨在生成模仿给定数据集的新数据。它由两个神经网络组成,即生成器和鉴别器,它们在竞争过程中同时进行训练。生成器创建类似于真实数据集的虚假数据,而鉴别器则评估数据是真实的还是生成的数据。生成器的目标是生成令人信服的数据,以至于鉴别器无法将其与真实数据区分开。在讨论生成对抗网络的含义时,它指的是两个网络之间的这种相互作用,这推动了高质量合成数据的生成。

G

生成模型

生成模型是一种机器学习模型,它学习生成与给定数据集相似的新数据样本。与侧重于区分不同类别的判别模型不同,生成模型捕获了数据的潜在分布,可以生成在统计学上与原始数据相似的新示例。生成模型的含义在数据增强、图像合成和自然语言生成等任务中至关重要,这些任务的目标是根据所学模式创建新的、真实的数据。

G

网格搜索

网格搜索是一种用于机器学习的超参数优化技术,用于为模型找到最佳的超参数组合。它通过对每种可能的组合进行训练和评估来系统地探索一组预定义的超参数值。网格搜索通常与交叉验证结合使用,以确保所选的超参数可以很好地推广到看不见的数据。在讨论网格搜索的含义时,它指的是详尽的搜索过程,旨在确定最有效的超参数以优化模型性能。

G

贪婪算法

贪婪算法是一种用于优化和决策问题的算法方法,在这种方法中,解决方案是通过一系列选择逐步建立的,每种选择都是目前可用的最佳(最为 “贪婪”)的选项。我们的想法是在每个步骤中做出局部最优选择,希望这些局部最优值能够带来全球最优的解决方案。贪婪算法的含义对于有效解决问题至关重要,尤其是在需要简单、快速的方法时。

G

通用数据保护条例 (GDPR)

通用数据保护条例(GDPR)是欧盟(EU)建立的法律框架,旨在保护欧盟和欧洲经济区(EEA)内个人的个人数据和隐私。该法规为收集、存储或处理欧盟居民个人数据的组织制定了严格的指导方针,旨在让个人更好地控制自己的数据。一般数据保护法规的含义对全球企业至关重要,因为违规行为可能导致巨额罚款和声誉受损。

G

遗传算法

遗传算法(GA)是一种优化技术,灵感来自生物进化中的自然选择过程。它用于通过模仿自然进化过程(包括选择、交叉和突变)来寻找复杂优化和搜索问题的近似解决方案。遗传算法的含义对于解决搜索空间大、复杂或知之甚少的问题至关重要,这使得传统优化方法的效率降低。

G

高斯混合模型 (GMM)

高斯混合模型 (GMM) 是一种用于机器学习和统计的概率模型,用于表示整个群体中存在多个亚群或聚类,即使观测值所属的特定亚群未知。每个子群都建模为高斯分布,整体模型是这些高斯分布的加权和。高斯混合模型的含义对于涉及聚类和密度估计的任务至关重要,在这些任务中,数据可能属于多个基础分布。

G

高斯过程

高斯过程 (GP) 是一种概率模型,用于机器学习,用于根据观测到的数据预测未知函数。它为数据建模提供了一种灵活的非参数方法,其中预测以拟合观测数据点的可能函数的分布来表示。高斯过程的含义对于回归和优化等任务至关重要,在这些任务中,量化不确定性并以有原则的方式做出预测非常重要。

See How our Data Labeling Works

Schedule a consult with our team to learn how Sapien’s data labeling and data collection services can advance your speech-to-text AI models