页面发送信息01在网易搜寻里输出qq内部空间,找出官方网站步入。 02步入后,若是笔记本电脑发送信息有qq,会自动检测,弹出方便快捷发送信息,点选两个要发送信息的qq。 ......
2023-10-24 170
新浪博客拥有很多博主,会发布很多高质量的文章,有时候,有些朋友看到这些文章之后想采集下来,但是一篇一篇文章去复制效率太慢了,这个时候该怎么办呢?使用八爪鱼采集器,只需做好规则,即可全自动地将我们的想要的文章采集下来。
步骤1:创建新浪博客文章采集任务
1)进入主界面,选择“自定义采集”
2)将要采集的网址URL复制粘贴到网站输入框中,点击“保存网址”
步骤2:创建翻页循环
1)打开网页之后,打开右上角的流程按钮,使制作的流程可见状态。点击页面下方的“下一页”,如图,选择“循环点击单个链接”,翻页循环创建完成。(可在左上角流程中手动点阅辞击“循环翻页”和“点击翻页”几次,测试是否正常翻页。)
2)由于进入详情页时网页加载很慢,网址一直在转圈状态,无法立即执行下一个步骤,因此在“循环翻页”的高级选项里设置“ajax加载数据”,超时时间设置为5秒,点击“确定”。
步骤3:创建列表循环
鼠标点击列表目录中第一个博文,选择操作提示框中的“选中全部”。
2)鼠标点击“循环点击每个链接”,列表循环就创建完成,并进入到第一个循环项的详情页面。
由于进入详情页时网页加载很慢,网址一直在转圈状态,无法立即执行下一个步骤,因此在“点击元素”的高级选项里设置“ajax加载数据”,AJAX超时设置为3秒,点击“确定”。
3)数据提取,接下来采集具体字段,分别选中页面标题、标签、分类、时间,点击“采集该元素的文本”,并在上方流程中修改字段名称。
鼠标点霜民五击正文所在的地方,点击提示框中的右下角图标,扩大选项范围,直至包括全部正文内容。(笔者测试点击2下就全部包括在内了)
同样选择“采集该元素的文本”,修改字段名称,数据提取完毕。
4)由于该网站网页加载速度非常慢,所以可在流程各个步骤的高级选项里设置“执行前等待”几秒时间,也可避免访问页面较快出现防采集问题。设置后点击“确定”。
步骤4:新浪博客数据采集及导出
1)点击左上角的“保存”,然后点击“开始采集”。
选择“启恩强动本地采集”
2)采集完成后,会跳出提示,选择“导出数据”,选择“合适的导出方式”,将采集好的数据导出, 这里我们选择excel作为导出为格式,这个时候新浪博客数据就导出来了,数据导出后如下图
以上方法由办公区教程网编辑摘抄自百度经验可供大家参考!
相关文章
页面发送信息01在网易搜寻里输出qq内部空间,找出官方网站步入。 02步入后,若是笔记本电脑发送信息有qq,会自动检测,弹出方便快捷发送信息,点选两个要发送信息的qq。 ......
2023-10-24 170
很多讨厌ACG的小伙伴们大体上单厢采用P站,不过有天数是P站会难以恒定登入,这时如果什么样是好呢?接下去他们一起来看一看如果什么样登入Pixiv站操作方式01具体来说他们须......
2023-10-24 151
随著北欧国家中国经济和信息技术的产业发展,天数就显得至关重要以是当他们在QQ应用程序里看某一页面时我甘心优先选择听而并非去看那你晓得什么样才能在QQ应用程序迈入......
2023-10-24 153