在当今高速发展的科技时代,深度学习已成为人工智能的心脏。而近日,壁仞科技的最新专利申请,再一次为这个领域注入了新鲜的血液。2024年11月22日,金融界报道,北京壁仞科技开发有限公司和上海壁仞科技股份有限公司新申请了一项名为“深度学习模型的训练过程中的数据处理方法、装置和介质”的专利,公开号CN118981344A。这项专利的核心,正是如何在训练深度学习模型时有效处理数据。

壁仞科技的深度学习新专利:如何改变AI训练的游戏规则?解锁训练过程中的数据处理

在该专利的摘要中,我们看到了一种颇具创意的数据处理方法。根据所述深度学习模型的第一处理器相关联的存储状态和通信状态,壁仞科技的技术团队能够从待卸载的候选激活数据集合中,精准地确定目标激活数据集合。这种方法实现了数据处理的智能化,让我们不禁想问:在这个由数据驱动的时代,谁不想拥有一种可以提升模型训练效率的工具呢?

特殊阶段的高效加载

该专利的过程可以分为两个阶段:前向传播和反向传播。在前向传播阶段,目标激活数据集合从第一存储装置卸载到关联的第二存储装置。而在反向传播阶段,这些数据在进行计算前,再被加载回到第一存储装置。这样的设计巧妙解决了训练过程中可能遇到的数据延迟问题,提升了整体训练效率。