N Step Degrees
分类:计算
、图遍历
描述
对于一个图G(V, E)
,有两个顶点子集V1
、V2
,一个边子集E1
。这个算法会计算每个属于V1
的顶点,在只考虑 E1
的边的情况下,在 1,2,...,经过 k
条边能够访问多少个在V2
中的顶点。
输入
名称 | 数据类型 | 端口类型 | 参数名 | 描述 |
---|---|---|---|---|
边表 | String | Folder File | input_edge | CSV 格式的边表 |
点表 | String | Folder File | input_vertex | CSV 格式的点表 |
活跃顶点 | String | Folder File | actives | 记录活跃的顶点的 CSV 格式文件的路径,每行一个顶点 ID。如果提供了这个参数,只会计算活跃顶点的 N 阶度 |
输出
名称 | 数据类型 | 端口类型 | 参数名 | 描述 |
---|---|---|---|---|
输出路径 | String | Folder | output | 默认值 ${OFNIL_DEFAULT_OUTPUT} |
参数
名称 | 数据类型 | 参数名 | 默认值 | 描述 |
---|---|---|---|---|
边表 Schema | String | input_edge_schema | 无 | 边表的 schema,边类型支持'empty'、'float'、'string[]' |
点表 Schema | String | input_vertex_schema | 无 | 点表的 Schema,点属性类型必须为'string[]' |
有向图 | Boolean | is_directed | true | 是否为有向图。关闭表示无向图,自动添加反向边 |
切分图 | Boolean | part_by_in | true | 使用顶点入度切分图 |
Alpha | Integer | alpha | -1 | 顺序平衡切分的 α 值 |
统计步数 | Integer | step | 20 | |
Bits | Integer | bits | 6 | HyperLogLog 参数位宽(bit width),范围为[6,16],值越大精度越高 |
计算类型 | String | type | both | 'in','out','both'分别用于统计'入'度、'出'度和两者都统计 |
活跃点表 Schema | String | actives_schema | id:string | 活跃点表的 Schema,列 'id' 有效 |
Edge Constraint | String | edge_constraint | 无 | 过滤边,符合条件的边会构成 E1 |
Vertex Constraint | String | vertex_constraint | 无 | 过滤点,符合条件的点构成 V2 |
全部统计 | Boolean | show_all | false | 是否统计 1..step 所有的 N 阶度 |
资源
名称 | 数据类型 | 默认值 | 描述 |
---|---|---|---|
CPU Requests | Double | 0.5 Core | CPU 请求量,容器启动时最低需要的 CPU 资源 |
CPU Limits | Double | 1 Core | CPU 限制,容器能够使用的最大 CPU 资源量 |
Memory Requests | Integer | 512 MB | 内存请求量,容器启动时最低需要的内存资源 |
Memory Limits | Integer | 512 MB | 内存限制,容器能够使用的最大内存资源量 |