搜索结果: 1-15 共查到“工学 PageRank”相关记录15条 . 查询时间(0.071 秒)
传统的基于PageRank算法的网络爬虫在抓取网页时由于只考虑了网页的超链接,势必会使爬虫结果覆盖面广、冗余度高,聚焦爬虫由于其可以有效地过滤与主题无关的链接,只保留有用的链接并将其加入到待抓取的URL队列,因此能够有效地降低爬虫冗余;在分析PageRank算法的基础上,将网页的时间维数和页面的内容相关度融于其中,提出了基于Timed PageRank的改进算法,并将该算法应用于聚焦爬虫过程中,实...
基于加权PageRank算法的关键包识别方法
关键包 PageRank算法 软件网络 程序理解
2017/1/11
识别软件中的关键实体对于人们理解软件,控制和降低维护费用具有重要意义.然而现有的工作基本都是针对关键类识别的,针对关键包、方法/属性等的研究甚少;同时现有的工作也未能揭示关键类与软件外部质量属性间的关系.为丰富现有的工作,本文提出了一种基于加权PageRank算法的关键包识别方法.该方法用加权有向软件网络模型抽象包粒度软件系统,提出新度量PR(PackageRank)从结构角度量度节点重要性,并引...
应用Web结构挖掘的PageRank算法的改进研究
Web数据挖掘 Web结构挖掘 PageRank Google
2010/3/26
随着Internet技术的发展,Web网页成为人们获取信息的有效途径,Web数据挖掘逐渐成为研究的热点。基于Web结构挖掘的PageRank算法存在不足的情况下,提出了一种改进的算法,实验结果证明改进的算法较原算法具有较好的效果,具有一定的实用价值。
利用蚁群算法对PageRank算法的改进
PageRank算法 蚁群优化 PR值
2009/11/30
在PageRank算法的基础上应用蚁群算法的主要思想, 对网页按关键字检索后被点击的次数进行统计,根据其在初始排序结果中的位置对网页进行分类,通过给定的函数变换对按照以上两个因素统计分析所得的结果进行运算,将其作为网页与关键字关联度的一个评判依据。从而对网页的权值(PR值)进行迭代修正,并返回一个新的排序结果。通过模拟实验表明,此方法在使得返回结果中相关度较高的网页通过人们的自主选择获得了不同程度...
语义相似的PageRank改进算法
PageRank算法 主题漂移 语义相似度
2009/10/9
PageRank算法是一种用于网页排序的算法,它利用网页间的相互引用关系评价网页的重要性。但由于它只考虑网页与网页之间的链接结构,忽略了网页与主题的相关性,容易造成主题漂移现象。在分析了原PageRank算法基础上,给出了一种基于语义相似度的PageRank改进算法。该算法能够按照网页结构和网页主要内容计算出网页的PageRank值,既不会增加算法的时空复杂度,又极大地减少了“主题漂移”现象,从而...
领域相关自适应的PageRank算法搜索策略
搜索引擎 PageRank 排名
2009/9/18
针对Web链接结构模型的特点,提出了一种新的基于领域相关可自适应的PageRank算法。实验结果表明,改进后的算法有效节约了CPU资源,缩短了计算时间,同时较好地解决了主题漂移现象。
基于PageRank算法改进的元胞自动机模型
元胞自动机 PageRank算法 Web数据挖掘
2009/8/19
针对在线零售业务系统中用户要进入许多无关页面才能找到所需商品的问题,站点应能根据群体用户购买兴趣动态调整网页分配,即站点自适应。借用PageRank算法对元胞自动机模型进行改进,实现站点的自适应调整。与原模型相比,改进模型的演化规则简单、时间复杂度低、性能更优越。
一种基于本体的PageRank算法的改进策略
IPageRank算法 主题相关 本体
2009/8/12
介绍Google等搜索引擎应用的PageRank算法的定义、特点及缺陷。针对PageRank算法在基于Ontology的海洋文档检索系统应用中的问题对其加以改进,增加了文本文档的判断和主题相关性的判断,提出IPageRank算法。介绍海洋文档检索系统,并将改进的IPageRank算法应用于该系统中进行验证。
PageRank算法的优化和改进
PageRank 乘幂法 特征向量
2009/7/24
在PageRank算法中是使用乘幂法对网络链接图的Markov矩阵进行迭代计算,利用迭代矩阵A=[CP+(1-c)E]T中Google矩阵P的稀疏性,优化每次迭代的计算量并且减少空间存储量。在乘幂法证明理论基础上,提出了一种修正的外推方法称为线性外推法,并且利用Google矩阵的第二特征值的性质,使得在乘幂法的计算过程中达到快速收敛。从而在不增加空间存储的基础上缩短计算时间。最后结合实际数据测试,...
利用Sybil攻击提升PageRank值
女巫攻击 页级 信任系统
2009/7/14
最近的研究证明Google的页面等级策略PageRank容易受到Sybil攻击。着眼于对如何构造Sybil攻击来优化PageRank值。提出了构造Sybile攻击的策略模型,考虑节点生成成本和迭代收敛性的前提下,证明了攻击的有效性。最后在模拟环境下对攻击进行了量化分析。
基于网页链接和内容分析的改进PageRank算法
网页排序 链接分析 相关性分析
2009/7/2
结合网页链接分析和网页内容相关性分析提出一种改进的PageRank算法EPR(Extended PageRank),从分析网页内容相似性的角度解决相关性需求,从网页链接分析的角度解决权威性需求。算法为扩展PageRank提供了广阔的空间,并且实验证明,通过选择合适的参数EPR算法可以获得优于传统PageRank算法的排序结果。
基于PageRank算法的权威值不均衡分配问题
网页结构挖掘 网页排序 改进的PageRank
2009/4/23
PageRank对所链接的网页的“权威值”存在平均分配的思想,由于互联网的网页是千差万别的,因此这种方法存在一定的局限性。该文利用了Web链接结构,提出了一种权威值不均衡分配的方法(IPR),通过与PageRank算法相比,IPR的排序结果比PageRank提高了近90%的相关度。
Pagerank二维线性收敛方法
搜索引擎 网页排名 幂法 特征向量
2009/3/6
在幂法证明理论的基础上,利用特征向量二维线性表达的假设,给出了一种方法,使得当使用修正后的幂法计算Pagerank时,求特征向量的过程可以达到快速收敛,从而在不增加空间存储的基础上缩短时间消耗。最后结合测试数据,说明理论的推导结果实际上达到了很好的收敛效果。
dPageRank——一种改进的分布式PageRank算法
dPageRank 分布式 PageRank算法
2008/12/11
回顾了传统的PageRank计算方式,分析了等级泄漏和悬挂页面问题的解决方法。介绍了分布式PageRank的计算原理和评价原则,在分析两种现有分布式PageRank算法的基础上,提出了一种改进的分布式PageRank算法,通过实验对该算法的性能进行分析评价。