您尚未登录,请登录后查阅下载信息
本站所有RPA应用均全开源、全开放、自由编辑
| RPA适应平台系统类型 | 操作系统 | 默认浏览器 | 电脑分辨率 | 关注公众号 | 扫码分享 |
|---|---|---|---|---|---|
| 影刀RPA | Windows 10、Windows 11(佳) | Windows 10/11 Edge浏览器 | 1920*1080 |
|
|
| shadowbot-5.23之前版本 | 百度系列 | 完整代码可直接使用 | 含完整元素包 |
网站已经被百度收录了很多页面,但是针对已经收录的页面,如果出现大量打不开的页面则会导致网站在百度里面的信任感降低,甚至出现网站权重降低,所以要尽可能的减少异常页面;
但是针对已经收录的页面,或许有几十或者有几百、甚至上千、上万,在这种情况下,如果手工一个个去点击就完全不可能了;
解决批量获取页面,及对应页面打开的状态;若出现异常打不开的页面,则汇总至EXCEL表格;
当前详细步骤与技术执行流程,仅限会员查阅!!!
问题:这个工具具体是做什么用的?
回答:这个工具的主要功能是批量查询百度收录的网站页面是否存在404异常。它通过site:域名的方式在百度中批量获取已收录页面的真实URL链接,然后逐一检测这些链接是否能正常打开。如果页面返回404状态码或页面内容中包含404相关的错误提示文本,则自动将该异常链接记录到本地Excel文件中,方便站长集中排查和修复死链。
问题:如何修改本地Excel文件的名称?
回答:需要修改Excel文件名称时,请直接双击工具中的第一行来修改名称。修改完成后,还必须同步修改第8行中与Excel文件名称相关的配置项,确保两处的名称保持一致,否则工具在读写文件时可能会出现找不到文件的错误。
问题:如何自定义自己网站404页面的错误提示关键词?
回答:可以先手动打开自己网站的任意一个404页面,查看页面上显示的具体错误提示文本,例如"页面不存在""404 Not Found""您访问的页面已被删除"等。确认好这些关键词后,双击工具中的第12行,将相应的404错误提示文本输入进去,工具在检测时会根据这些关键词来判断页面是否为404页面。
问题:工具是如何判断一个页面是否为404页面的?
回答:工具判断一个页面是否为404页面主要基于两种方式。第一种方式是检测HTTP响应状态码,如果服务器返回404状态码则判定为异常。第二种方式是检测页面内容中是否包含您在第12行配置的404错误提示关键词,如果页面HTML源码中出现了这些关键词,也会被判定为异常页面。两种方式满足任意一种即会被记录。
问题:工具运行后生成的数据保存在哪里?
回答:工具检测到的所有404异常页面链接会自动汇总保存到本地的Excel文件中,文件默认名称为"百度404异常页面链接.xlsx"。该Excel文件会记录异常链接的具体URL地址以及相关的检测信息,方便您后续批量处理这些死链,比如提交死链文件给百度站长平台进行清理。
问题:工具在批量获取百度收录页面时,是否有限制?
回答:在使用site:域名方式获取百度收录页面时,百度对搜索结果有数量限制,通常单次最多显示约100条结果,且总收录量较大时可能需要分多次查询。
RPA应用链接:https://www.diezanrpa.com/Product/312.html
RPA应用标题:批量查询百度收录的网站页面是否为404页面并汇总异常链接数据
内容版权:RPA应用内容为本站100%原创内容,用户可以放心自由使用,所有会员资料享受本站商业授权合作!
本页内容最后更新于【2023-07-28】,某些内容具有时效性,若有错误或已失效,请会员中心提交工单反馈或联系客服
争议处理:针对本站内容若有异义,亦可直接与【法律顾问:易兴俊,律师联系电话:13825799821】直接联系沟通