使用手册
工作流组件
计算
Pagerank

PageRank

分类:计算图遍历

描述

PageRank(页面排序)算法根据点之间的关系(边)计算点的相关性和重要性,通常使用在搜索引擎页面排名中。如果一个网页被很多其他网页链接,说明这个网页比较重要(PageRank 值较高);如果一个 PageRank 值很高的网页链接到其他网页,那么被链接到的网页的 PageRank 值会提高。

仅支持无向图。

参考论文:The PageRank Citation Ranking : Bringing Order to the Web (opens in a new tab)

输入

名称数据类型端口类型参数名描述
边表StringFolder Fileinput图数据输入路径,CSV 格式的边表

输出

名称数据类型端口类型参数名描述
输出路径StringFolderoutput默认值 ${OFNIL_DEFAULT_OUTPUT}

参数

名称数据类型参数名默认值描述
边表 SchemaStringinput_schemafrom:string,to:string输入图数据 (CSV 格式的边表) 的 Schema
有向图Booleanis_directedtrue是否为有向图。关闭表示无向图,自动添加反向边
切分图Booleanpart_by_intrue使用顶点入度切分图
AlphaIntegeralpha-1顺序平衡切分的 α 值
最大迭代次数Integeriterations100
阻尼系数Doubledamping0.85
收敛阈值Doubleeps0.0001当两轮迭代之间所有顶点的 Pagerank 值和小于收敛阈值时,计算停止

资源

名称数据类型默认值描述
CPU RequestsDouble0.5 CoreCPU 请求量,容器启动时最低需要的 CPU 资源
CPU LimitsDouble1 CoreCPU 限制,容器能够使用的最大 CPU 资源量
Memory RequestsInteger512 MB内存请求量,容器启动时最低需要的内存资源
Memory LimitsInteger512 MB内存限制,容器能够使用的最大内存资源量