归纳偏置将在很大程度上弥补不准确的输入信息造成的不利影响。因此,从对象歧义性的角 度出发对多任务学习进行研究,不仅有望得到泛化能力更强的学习算法,还可能为探寻多任 务学习有效的根本原因提供线索。目前,国际机器学习界存在两种流行的歧义性对象学习框 架,分别为多示例学习(multi-instance learning)[42]与多标记学习125 (multi-label learning)[43]。 多示例学习框架是1997 年T. G. Dietterich 等人[42]基于药物活性预测问题的研究所提出 的。在该学习框架下,与传统的监督学习框架相比,虽然每个对象对应的概念标记是唯一的, 但其不再采用单一的示例来表示,而是采用多个示例构成的“包(bag)”的表示形式。因 此,多示例学习可以看作是从输入空间,也就是对象的内容表示上来处理歧义性。已有的研 130 究工作表明[44],对于歧义性对象而言,采用包的表示形式比采用单个示例的表示形式要显 得更加自然。因此,对于多任务学习而言,也许我们可以利用多示例学习技术来分析各个学 习任务在输入空间上可能存在的歧义性,通过合适的方式转换歧义性对象的内容表示,以更 好地进行问题求解。因此,设计基于多示例学习技术的多任务学习算法是一个值得进一步研 究的问题。 135 多标记学习的研究起源于文档分类研究中遇到的歧义性问题[43]。在该学习框架下,与 传统的监督学习框架相比,虽然每个对象仍然采用单一的示例进行表示,但其不再对应于一 个概念标记,而是同时对应于多个概念标记。因此,多标记学习可以认为是从输出空间,也 就是概念标记上来处理对象的歧义性。如果我们将学习系统对每个标记进行预测作为一个单 独的任务,那么就可以在某种程度上把多标记学习看作一类特殊的多任务学习问题,此时所 140 有的任务共享相同的示例表示。因此,多标记学习领域内已有的研究成果对于多任务学习的 研究者来说是十分具有借鉴意义的。因此,研制出结合了多标记学习和多任务学习技术的学 习算法,将有助于我们增加对上述两类技术本质的了解,从而进一步促进这两类学习技术的 发展。 学术论文网Tag:代写论文 论文发表 计算机论文 代发论文 职称论文发表 |