金融界2025年5月15日消息,国家知识产权局信息显示。微软技术许可有限责任公司申请一项名为“通过最优传输插值的合成分类数据集”的专利,公开号CN119998818A,申请日期为2023年9月。
专利摘要显示,本文总体上讨论了用于生成合成数据集的设备、系统和方法。一种方法包括:获得第一训练标记数据集;获得第二训练标记数据集;确定从目标标记数据集到第一训练标记数据集的最优传输(OT)映射;确定从目标标记数据集到第二训练标记数据集的OT映射;基于OT映射,在由分布空间中第一训练标记数据集和第二训练标记数据集形成的广义测地线包中。标识分布空间中接近目标标记数据集的点;以及通过基于分布空间中第一训练标记数据集和第二训练标记数据集的概率分布表示与点之间的距离来组合第一训练标记数据集和第二训练标记数据集,产生合成标记ML数据集。
本文源自金融界