PageRank
分类:计算
、图遍历
描述
PageRank
(页面排序)算法根据点之间的关系(边)计算点的相关性和重要性,通常使用在搜索引擎页面排名中。如果一个网页被很多其他网页链接,说明这个网页比较重要(PageRank
值较高);如果一个 PageRank
值很高的网页链接到其他网页,那么被链接到的网页的 PageRank
值会提高。
仅支持无向图。
参考论文:The PageRank Citation Ranking : Bringing Order to the Web (opens in a new tab)
输入
名称 | 数据类型 | 端口类型 | 参数名 | 描述 |
---|---|---|---|---|
边表 | String | Folder File | input | 图数据输入路径,CSV 格式的边表 |
输出
名称 | 数据类型 | 端口类型 | 参数名 | 描述 |
---|---|---|---|---|
输出路径 | String | Folder | output | 默认值 ${OFNIL_DEFAULT_OUTPUT} |
参数
名称 | 数据类型 | 参数名 | 默认值 | 描述 |
---|---|---|---|---|
边表 Schema | String | input_schema | from:string,to:string | 输入图数据 (CSV 格式的边表) 的 Schema |
有向图 | Boolean | is_directed | true | 是否为有向图。关闭表示无向图,自动添加反向边 |
切分图 | Boolean | part_by_in | true | 使用顶点入度切分图 |
Alpha | Integer | alpha | -1 | 顺序平衡切分的 α 值 |
最大迭代次数 | Integer | iterations | 100 | |
阻尼系数 | Double | damping | 0.85 | |
收敛阈值 | Double | eps | 0.0001 | 当两轮迭代之间所有顶点的 Pagerank 值和小于收敛阈值时,计算停止 |
资源
名称 | 数据类型 | 默认值 | 描述 |
---|---|---|---|
CPU Requests | Double | 0.5 Core | CPU 请求量,容器启动时最低需要的 CPU 资源 |
CPU Limits | Double | 1 Core | CPU 限制,容器能够使用的最大 CPU 资源量 |
Memory Requests | Integer | 512 MB | 内存请求量,容器启动时最低需要的内存资源 |
Memory Limits | Integer | 512 MB | 内存限制,容器能够使用的最大内存资源量 |