选择题:追求高数据质量是对大数据的一项重要要求,要消除某些数据的不可预测性,去掉一些“杂乱”的“脏”数据,就涉及到()技术。

题目内容:
A、数据采集

B、数据统计

C、数据清洗

D、数据预测




参考答案:

如果要采集指定的数据,则需要使用到(),又称主题网络爬虫,是指选择性地爬行那些与预先定义好的主题相关页面的网络爬虫。

如果要采集指定的数据,则需要使用到(),又称主题网络爬虫,是指选择性地爬行那些与预先定义好的主题相关页面的网络爬虫。

查看答案

发送了一个HTTP请求后,客户端收到一个200的响应,这表示()。

发送了一个HTTP请求后,客户端收到一个200的响应,这表示()。

查看答案

通过HTTP或者HTTPS协议请求的资源由作()来标识。

通过HTTP或者HTTPS协议请求的资源由作()来标识。

查看答案

聚焦网络爬虫常用的爬行策略有深度优先策略、广度优先策略。()

聚焦网络爬虫常用的爬行策略有深度优先策略、广度优先策略。()

查看答案

实际的网络爬虫系统通常是几种爬虫技术相结合实现的。()

实际的网络爬虫系统通常是几种爬虫技术相结合实现的。()

查看答案