您的位置:首页 >精选知识 >

用多标签分类数据训练人工智能的方法

物联网(IoT)技术的进步使我们能够轻松、持续地获取大量不同的数据。人工智能技术作为利用这些大数据的工具而受到关注。

传统的机器学习主要处理单标签分类问题,其中数据和对应的现象或对象(标签信息)是一对一的关系。然而,在现实世界中,数据和标签信息很少是一对一的关系。

因此,近年来,注意力集中在多标签分类问题上,该问题处理数据与标签信息之间具有一对多关系的数据。例如,一张风景照片可能包含多个元素标签,例如天空、山脉和云彩。此外,为了有效地从不断获得的大数据中学习,还需要能够随着时间的推移学习而不破坏之前学到的东西。

由大阪都市大学信息学研究生院副教授增山直树和野岛裕介教授领导的研究小组开发了一种新方法,该方法将数据的分类性能与多个标签相结合,并具有持续学习数据的能力。对真实世界多标签数据集的数值实验表明,所提出的方法优于传统方法。

这种新算法的简单性使得设计一个可以与其他算法集成的进化版本变得容易。由于底层聚类方法根据数据条目之间的相似性对数据进行分组,因此有望成为持续大数据预处理的有用工具。

此外,使用基于贝叶斯方法的方法不断学习分配给每个集群的标签信息。通过分别对数据进行学习和对数据对应的标签信息进行连续学习,兼顾了高分类性能和持续学习能力。

“我们相信我们的方法能够从多标签数据中持续学习,并具有未来大数据社会中人工智能所需的能力,”Masuyama教授总结道。

免责声明:本文由用户上传,如有侵权请联系删除!