选择题：整站采集的步骤一般是()。

题目分类：广东开放大学
题目类型：选择题
查看权限：VIP

题目内容：

A、匹配href连接地址;与原本地址拼接;读取网页中的A标签;找到关联网页并爬取

B、读取网页中的A标签;匹配href连接地址;与原本地址拼接;找到关联网页并爬取

C、找到关联网页并爬取;读取网页中的A标签;与原本地址拼接;匹配href连接地址

D、找到关联网页并爬取;与原本地址拼接;匹配href连接地址;读取网页中的A标签

参考答案：

在整站采集时,一般从源地址出发,使用()算法实现。

在整站采集时,一般从源地址出发,使用()算法实现。

分类：广东开放大学题型：选择题

因数据库本身限制,在采集海量数据时存在性能瓶颈,因此海量数据建议用()的方式保存,也方便与大数据底层交互。

因数据库本身限制,在采集海量数据时存在性能瓶颈,因此海量数据建议用()的方式保存,也方便与大数据底层交互。

分类：广东开放大学题型：选择题

使用正则表达式时,使用()设置匹配规则。

使用正则表达式时,使用()设置匹配规则。

分类：广东开放大学题型：选择题

网络数据采集一般是通过()或网站公开API等方式从网站上获取数据信息。

网络数据采集一般是通过()或网站公开API等方式从网站上获取数据信息。

分类：广东开放大学题型：选择题

在正则表达式中\d匹配()。

在正则表达式中\d匹配()。

分类：广东开放大学题型：选择题