N Step Degrees Edge
分类:计算
、图度量
描述
对于一个图 G(V, E)
,一个顶点子集 V1
,一个边子集 E1
。这个算法会计算每个属于 V1
的顶点,经过1,2,...,k
条 E1
中的边分别能够访问多少条 E1
中的边。
输入
名称 | 数据类型 | 端口类型 | 参数名 | 描述 |
---|---|---|---|---|
边表 | String | Folder File | input_edge | CSV 格式的边表 |
活跃顶点 | String | Folder File | actives | 记录活跃的顶点的 CSV 格式文件的路径,每行一个顶点 ID。如果提供了这个参数,只会计算活跃顶点的 N 阶度 |
输出
名称 | 数据类型 | 端口类型 | 参数名 | 描述 |
---|---|---|---|---|
输出路径 | String | Folder | output | 默认值 ${OFNIL_DEFAULT_OUTPUT} |
参数
名称 | 数据类型 | 参数名 | 默认值 | 描述 |
---|---|---|---|---|
边表 Schema | String | input_edge_schema | from:string,to:string | 边表的 schema,边类型支持'empty'、'float'、'string[]' |
有向图 | Boolean | is_directed | true | 是否为有向图。关闭表示无向图,自动添加反向边 |
切分图 | Boolean | part_by_in | true | 使用顶点入度切分图 |
Alpha | Integer | alpha | -1 | 顺序平衡切分的 α 值 |
统计步数 | Integer | step | 20 | |
Bits | Integer | bits | 6 | HyperLogLog 参数位宽(bit width),范围为[6,16],值越大精度越高 |
计算类型 | String | type | both | in 、out 、both 分别用于统计入度 、出度 和两者都统计 |
活跃点表 Schema | String | actives_schema | id:string | 活跃点表的 Schema,列 'id' 有效 |
Edge Constraint | String | edge_constraint | 无 | 过滤边,符合条件的边会构成 E1 |
全部统计 | Boolean | show_all | true | 是否统计 1..step 所有的 N 阶度 |
资源
名称 | 数据类型 | 默认值 | 描述 |
---|---|---|---|
CPU Requests | Double | 0.5 Core | CPU 请求量,容器启动时最低需要的 CPU 资源 |
CPU Limits | Double | 1 Core | CPU 限制,容器能够使用的最大 CPU 资源量 |
Memory Requests | Integer | 512 MB | 内存请求量,容器启动时最低需要的内存资源 |
Memory Limits | Integer | 512 MB | 内存限制,容器能够使用的最大内存资源量 |