选文字的引入给当前规则带来的信息增益并返回拥有最大增益的文字。接着,在第8–9 行将增 益最大的文字加入规则的体中得到新规则,同时更新变量绑定集合。整个搜索过程的终止条件 为下面两种情况之一:1) 反例变量绑定的数量减小到0;2) 规则体中的文字数量超过预设的阈 值。根据认知心理学家George A. Miller 的研究[7],人类平均能够在大脑中同时处理的对象 的数量为7 2,所以这边将 默认值设定为7 以使返回的结果容易理解。 表1: 数据集统计信息 O1 类属性实例O2 类属性实例 Rest1 3 7 339 Rest2 3 7 2256 SwetoDBLP 17 46 83 ESWC2007 35 31 1261 Mondial 17 40 15398 Factbook 36 171 24990 2.2.2 构造变量绑定 算法评估一个映射是根据其正反例变量绑定情况而定的,并且倾向能够覆盖更多正例且更 少反例的映射。注意到,随着文字的增加正反例变量绑定集合在不断的变化。算法根据实例映 射集合构造正例变量绑定,同时通过事实中涉及的常量推理出反例变量绑定。对于源本体中的 每个实例,仅仅用描述它的局部事实来构造反例变量绑定,这样能够显著减少变量绑定的数 量。另外,当文字被逐一加入到映射的规则体中时,算法增量式修改相应的变量绑定集合。 2.2.3 评估新增文字的效能 将一个新文字L 加入到当前映射m 后得到新的映射mL。较m 而言,新映射mL 的变量 绑定也随着新文字的引入发生了变化。FOIL 算法对新文字带来的增益计算方法如下: Gain(L;m) = t (log Pos(mL) Pos(mL) + Neg(mL) 学术论文网Tag:代写硕士论文 计算机论文 代发论文 职称论文发表 |