290 与其它文本相似度比对方案相比,该方案表现出很大的优越性,有效解决了其他方案忽 略近义词因素、未考虑文本结构等缺陷,克服了矩阵处理造成的效率低下的问题。有较高的 匹配精确度和较满意的匹配效率。 4 结论 本文根据钓鱼网页的特点,提出了用于识别钓鱼网页的文本相似度比对算法,对钓鱼网 295 页仿冒对象的网页文字信息建立比对模板,通过比对输入页面与模板页面文本信息的相似 度,实现对钓鱼网页的识别和判定。本方案对文本进行结构化处理,抽象成具有层次结构的 语义描述对象,通过对描述对象的属性和关联信息两方面进行语义描述,为文本建立语义描 述模型,在这个模型构建基础上定义了一套比对方案,将对文本相似度的比对转化为两个文 本描述模型的比对过程,在这个理论基础上,本文对该方案在钓鱼网页识别中的应用进行了 300 验证,证明该方案能达到较高的识别率,通过调整比对过程中的影响因子,探究了构成语义 描述模型的各个因素对识别效果的影响,证实对关联规则限定条件越多,系统的匹配性能越 高,对PTE 关联规则的限定会使匹配效率降低,在此基础上增加PTU 关联规则限定会提升 匹配效率。 学术论文网Tag:代写论文 代写代发论文 代写职称论文 职称论文发表 |