使用shell脚本找出网站的空页面和404错误页面
- 软件编程
- 2026-01-11 18:58:16
早之前记的一个笔记了,之前只是记录了两句代码,放出来的话也是一个低质量的页面,于是设置为了仅自己可见,今晚抽空补充一下。

记得当的情景应该是提交sitemap时百度老提示有错误的URL,导致sitemap不能正常被抓取,于是在想办法解决这个问题,所以才有下面这些笔记:用shell批量找出网站空页面和404错误页面。
废话不多说,直接上shell代码:
复制代码 代码如下:
time cat sitemap.txt|while read line;do curl -l $line -m 5 --connect-timeout 5 -o /dev/null -s -w "$line "%{http_code}" "%{size_download}"\n";done
前面加了一个time是为了看看代码执行所花的时间
%{http_code}意思是返回HTTP状态码,通过这个状态码我们就能知道该链接是正常的200链接,还是404错误链接;
%{size_download}意思是返回当前页面的大小,如果值太小的话,说明这些页面很有可能是低质量的空页面,得想办法剔除掉。
# 被抓
# 多说
# shell
# 就能
# 是在
# 解决这个问题
# 是为了
# HTTP
# 应该是
# 才有
# 今晚
# 有错误
# 想办法
# 两句
# time
# 不能正常
# 太小
# 很有可能
# shell脚本
# sitemap
# 知道该
# 404错误页面
# 网站的空页面
相关栏目:
【
教研文案 】
【
日常文案 】
【
AI模型 】
【
网络运营 】
【
营销推广 】
【
云计算 】
【
技术教程 】
【
软件编程 】
【
汉字学习 】
【
歌词歌曲 】
【
精选文章 】
相关推荐:
详解Go内存模型
phpstorm最新激活码分享亲测phpstorm2025.3版可用
C语言中scanf函数与空格回车的用法说明
C++ 输入scanf()和输出printf()的操作
vue 基于abstract 路由模式 实现页面内嵌的示例代码
PHP连接MySQL数据库三种实现方法
Android LitePal的使用详解
Android Studio下载、安装和配置+SDK+tools下载(无敌超级详细版本)
解决docker日志挂载的问题
Java 网络编程之 TCP 实现简单的聊天系统
linux下利用Docker安装mysql的步骤
MySQL decimal unsigned更新负数转化为0
五句话帮你轻松搞定js原型链
C# WinForm调用Shell_NotifyIcon的示例代码
vue 获取到数据但却渲染不到页面上的解决方法
python中的对数log函数表示及用法
JS数据类型分类及常用判断方法
如何使用 vue-cli 创建模板项目
Python Pandas list列表数据列拆分成多行的方法实现
Spring定时服务QuartZ原理及代码案例
JS实现京东商品分类侧边栏
golang使用 gomodule 在公共测试环境管理go的依赖的实例详解
解决Docker启动Elasticsearch7.x报错的问题
pycharm实现猜数游戏
Java 跨域问题的处理方式
对docker中的overlay式网络详解
微信小程序实现左滑删除效果
PHP基于进程控制函数实现多线程
Python虚拟环境virtualenv创建及使用过程图解
C#中List集合使用Max()方法查找到最大值的实例
JS操作JSON常用方法(10w阅读)
java 格式化时间的示例代码
js实现弹幕墙效果
PHP基于ip2long实现IP转换整形
详解Scrapy Redis入门实战
详解Go 创建命令行工具的方法
SQLServer设置客户端使用IP地址登录的图文详解
python 实现数据库中数据添加、查询与更新的示例代码
.net core中的Authorization过滤器使用
Python爬虫教程之利用正则表达式匹配网页内容
如何向scrapy中的spider传递参数的几种方法
Spring Boot2读取配置常用方法代码实例
Mysql事务中Update是否会锁表?
Django搭建项目实战与避坑细节详解
Js实现粘贴上传图片的原理及示例
Mysql事务特性和级别原理解析
Pyqt助手安装PyQt5帮助文档过程图解
从零搭建SpringBoot2.X整合Redis框架的详细教程
浅谈shell 遍历数组的几种方法
解决Android Studio4.1没有Gsonfomat插件,Plugin “GsonFormat” is incompatible的问题
本文转自网络,如有侵权请联系客服删除。
热门内容推荐
C#使用虚拟方法实现多态
- 2026-01-11
JavaScript原生对象之String对象的属性和方法详解
- 2026-01-11
js实现DOM走马灯特效的方法
- 2026-01-11
轻松创建nodejs服务器(1):一个简单nodejs服务器例子
- 2026-01-11
php实现微信公众平台账号自定义菜单类
- 2026-01-11
