N Step Degrees
分类:计算、图遍历
描述
对于一个图G(V, E),有两个顶点子集V1、V2,一个边子集E1。这个算法会计算每个属于V1的顶点,在只考虑 E1 的边的情况下,在 1,2,...,经过 k 条边能够访问多少个在V2中的顶点。
输入
| 名称 | 数据类型 | 端口类型 | 参数名 | 描述 |
|---|---|---|---|---|
| 边表 | String | Folder File | input_edge | CSV 格式的边表 |
| 点表 | String | Folder File | input_vertex | CSV 格式的点表 |
| 活跃顶点 | String | Folder File | actives | 记录活跃的顶点的 CSV 格式文件的路径,每行一个顶点 ID。如果提供了这个参数,只会计算活跃顶点的 N 阶度 |
输出
| 名称 | 数据类型 | 端口类型 | 参数名 | 描述 |
|---|---|---|---|---|
| 输出路径 | String | Folder | output | 默认值 ${OFNIL_DEFAULT_OUTPUT} |
参数
| 名称 | 数据类型 | 参数名 | 默认值 | 描述 |
|---|---|---|---|---|
| 边表 Schema | String | input_edge_schema | 无 | 边表的 schema,边类型支持'empty'、'float'、'string[]' |
| 点表 Schema | String | input_vertex_schema | 无 | 点表的 Schema,点属性类型必须为'string[]' |
| 有向图 | Boolean | is_directed | true | 是否为有向图。关闭表示无向图,自动添加反向边 |
| 切分图 | Boolean | part_by_in | true | 使用顶点入度切分图 |
| Alpha | Integer | alpha | -1 | 顺序平衡切分的 α 值 |
| 统计步数 | Integer | step | 20 | |
| Bits | Integer | bits | 6 | HyperLogLog 参数位宽(bit width),范围为[6,16],值越大精度越高 |
| 计算类型 | String | type | both | 'in','out','both'分别用于统计'入'度、'出'度和两者都统计 |
| 活跃点表 Schema | String | actives_schema | id:string | 活跃点表的 Schema,列 'id' 有效 |
| Edge Constraint | String | edge_constraint | 无 | 过滤边,符合条件的边会构成 E1 |
| Vertex Constraint | String | vertex_constraint | 无 | 过滤点,符合条件的点构成 V2 |
| 全部统计 | Boolean | show_all | false | 是否统计 1..step 所有的 N 阶度 |
资源
| 名称 | 数据类型 | 默认值 | 描述 |
|---|---|---|---|
| CPU Requests | Double | 0.5 Core | CPU 请求量,容器启动时最低需要的 CPU 资源 |
| CPU Limits | Double | 1 Core | CPU 限制,容器能够使用的最大 CPU 资源量 |
| Memory Requests | Integer | 512 MB | 内存请求量,容器启动时最低需要的内存资源 |
| Memory Limits | Integer | 512 MB | 内存限制,容器能够使用的最大内存资源量 |