规则
通过规则选项卡,您可以对抓取页面规则进行添加、修改、查询等操作。
编辑规则
点击Add按钮或规则的编辑按钮可进入规则详细编辑界面
各字段属性对照表如下:
字段 | 描述 | 特性 |
---|---|---|
Url | 提取规则的原地址 | 支持关键词搜索,方便日后参考 |
Expression | 地址匹配表达式 | 支持关键词搜索,通配符*代表多个字符,?代表一个字符 |
Method | 请求方法 | GET POST |
UA | 浏览器User-Agent | 为空则随机使用 |
Hearders | 请求标头 | 以回车分割 |
Feature | 界面特征 | 在一个界面有多重规则时,需根据界面特征进行规则选取 |
Type | 地址返回值格式 | 仅记录,无实际用途 |
Ruiji Exp | Ruiji表达式 | 详情请参照Ruiji表达式介绍 |
Status | 是否开启 | |
RunJs | 是否执行页面JS | 如果选择ON,RuiJi.Net将会使用无头浏览器对目标页面进行访问 |
规则测试
点击Test按钮可测试提取结果,如下图所示
如果是伪分布式或全分布式模式,请先前往Setting > Node设置好抓取节点可用IP