admin 发表于 2014-10-11 18:42:08

大数据环境下用于实体解析的两层相关性聚类方法

[摘要] 数据量大、数据更新块、数据源多样和数据存在噪声是大数据的四大特点,这为数据集成提供了新的挑战。实体解析是数据集成的一个很重要的步骤,在大数据环境下,传统的实体解析算法在效率、质量上表现并不是很明显。所以为了解决大数据环境中因为数据噪声所导致的解析结果冲突,捡公共邻居引入相关性聚类问题上。







页: [1]
查看完整版本: 大数据环境下用于实体解析的两层相关性聚类方法