系统配置4
摄影作品3
图片展示3
摄影3
Ubuntu3
性能优化3
Python3
依赖管理3
Nginx配置3
自然风光2
佛山2
秋色2
文化活动2
风景2
旅行记录2
秋景2
BAE2
Intel RST2
性能测试2
Windows2
GRUB2
电源管理2
i7 77002
SSD2
代理配置2
服务器2
内网穿透2
图像处理2
MySQL2
Linux2
学习笔记2
CDN2
Gitment2
评论系统2
RSS订阅2
优化2
百度BAE2
HTTPS2
JavaScript2
安全性2
服务器优化2
服务器管理2
图床2
nginx2
分区管理2
配置教程2
Redis2
持久化2
插件2
版本管理2
订阅管理2
PlantUML2
LangGraph2
人机协作2
家乡1
照片1
CCTVlen1
雨1
天气现象1
自然景观1
好天气1
晴天1
蓝天白云1
春季天气1
户外活动1
心情愉悦1
传统节日1
旅游景点1
民俗1
广东1
Mentohust1
OpenWRT1
路由器1
网络认证1
南校区1
LEDE1
MIPS1
锐捷1
DHCP1
MAC地址过滤1
博客美化1
Canvas特效1
速度优化1
插件合并1
CDN加速1
多说插件1
PHP优化1
页面加载1
搜索模块1
SSD阵列1
4K读取1
高速缓冲区1
回写模式1
硬盘优化1
BIOS1
双系统1
BOOTMGR1
EASYBCD1
NeoGrub1
引导配置1
系统安装1
bash1
终端模拟器1
cmder1
powershell1
性能体验1
字体渲染1
虚拟机1
i7处理器1
W650DC1
黑苹果安装1
Kabylake1
HD6301
GTX950m1
驱动问题1
MacOSX1
PAC代理1
PiP安装1
Genepac1
SOCKS51
GFWList1
网络工具1
Ubuntu系统1
3735F1
平板1
Linux部署1
VirtualBox1
Android-ia1
Docker1
CPU升级1
i5 64001
硅脂1
散热1
XTU1
笔记本硬件1
UEFI1
Windows71
注册表修改1
GOP启用1
安装教程1
驱动管理1
配置单元1
花卉摄影1
摄影技巧1
DxO1
摄影器材1
溶洞1
地貌1
探险1
自然奇观1
地质景观1
旅游攻略1
内核1
编译1
双显卡1
DRM1
i9151
grub21
HEXO1
NexT主题1
简洁设计1
网站速度1
静态博客1
博客迁移1
主题美化1
Apache1
PHP安装1
phpmyadmin1
服务器环境1
apt-get1
数据库配置1
Web开发1
环境搭建1
pymysql1
UTF-81
数据库连接1
字符编码1
MySQL配置1
数据库操作1
emoji支持1
utf8mb41
SQL语句1
手机三脚架1
摄影辅助1
长曝光1
遥控拍摄1
生活实用1
数码配件1
拍照技巧1
健康使用1
JDC-AOSP1
Zygote1
白名单问题1
安卓源码修改1
寄存器优化1
Flyme61
Patchrom1
文件描述符表1
JNI错误处理1
方法寄存器1
FN按键1
亮度调节1
DSDT补丁1
EC查询1
Debug调试1
Hackintosh配置1
系统定制1
PS2K通知1
OEM2变量1
技术指南1
Selenium1
Blackboard1
作业订阅1
自动化脚本1
WebDriver1
PhantomJS1
Python编程1
教育平台1
作业更新1
网页爬虫1
ItChat1
Google Assistant SDK1
音频处理1
环境配置1
API调用1
音频识别1
自动回复1
技术教程1
Hexo1
Cloudflare1
sitemap1
VPS配置1
Nginx1
SSL证书1
Let's Encrypt1
Certbot1
自动续签1
Debian1
域名解析1
安全配置1
Node.js1
Hexo安装1
Sitemap1
非对称加密1
JSEncrypt1
RSA1
密码传输1
前端加密1
后端解密1
加密库1
413错误1
Request Entity Too Large1
客户端请求大小1
Content-Length1
错误处理1
文件上传1
uwsgi配置1
Flask部署1
系统服务1
脚本编写1
LSB规范1
PID文件1
跨域1
反向代理1
Mixed Content1
Rewrite规则1
aaencode1
base641
zip1
UltraEdit1
strings1
quipqiup1
词频分析1
Deepin源1
软件安装1
Ubuntu配置1
GPG密钥1
系统更新1
依赖问题1
源管理1
DDE1
软件源1
系统安全1
希捷1
2T硬盘1
机械硬盘1
存储空间1
硬盘评测1
SeaTools1
发热问题1
数码收藏1
frp1
加速优化1
kcp协议1
数据加密1
远程访问1
网络安全1
腾讯云1
Archlinux1
网络配置1
Grub引导1
静态IP1
DNS设置1
备份服务器1
Linux安装1
PinBox1
电脑串流1
3DS应用1
HomeBrew1
ViGEm1
Xbox360手柄1
WiFi连接1
虚拟手柄1
代码可读性1
命名规范1
注释技巧1
代码优化1
编程习惯1
代码结构1
代码风格1
代码维护1
代码审查1
重构1
最佳实践1
编程艺术1
KMS激活1
CrossOver1
Office 20101
Wine1
激活问题1
OSPP.VBS1
服务器配置1
跨平台解决方案1
Rock641
USB3.01
千兆网口1
下载机1
私有云1
NextCloud1
Aria21
deluge1
supervisor1
Scrapy1
分布式爬虫1
URL去重1
数据处理1
源码分析1
请求处理1
管道配置1
项目实践1
tesseract1
OCR1
验证码处理1
训练模型1
jTessBoxEditor1
字符识别1
开源工具1
Vue.js1
组件化开发1
前端框架1
实战项目1
Vue组件1
导航栏1
图片列表1
延迟加载1
ArchLinux1
Python3.61
TensorFlow1
编译安装1
虚拟环境1
开发环境1
Python版本1
CTF1
Pwn1
Web1
Crypto1
Reverse1
Misc1
安全技术1
编程挑战1
解题技巧1
NVMe1
系统转移1
rsync1
fstab1
mkinitcpio1
EFI1
GTX6701
CUDA1
cuDNN1
Git1
编译过程1
显卡兼容1
官方引导1
Python安装1
缓存1
NoSQL1
数据结构1
内存数据库1
高性能1
分布式1
集群管理1
Maven基础1
项目对象模型1
生命周期1
项目坐标1
依赖范围1
冲突解决1
多模块项目1
MongoTemplate1
Spring Data MongoDB1
配置1
主从复制1
备份恢复1
数据类型1
ObjectId1
查询1
插入1
更新1
乐观锁1
JUnit41
源码解析1
测试方法1
测试执行1
RunListener1
Statement1
测试流程1
异常处理1
Linux命令1
文件系统1
man命令1
ls命令1
cd命令1
ln命令1
pwd命令1
mkdir命令1
rm命令1
mv命令1
cp命令1
touch命令1
cat命令1
less命令1
head命令1
tail命令1
which命令1
whereis命令1
find命令1
文件类型1
文件系统标准1
管道1
进程通信1
Shell操作1
OneManager1
图床搭建1
OneDrive使用1
Heroku部署1
Nginx反代1
图片存储1
博客优化1
同步方案1
JSON支持1
主键索引1
TTL设置1
异步插入1
物化视图1
存储空间查询1
内存优化1
写入延迟1
并发查询1
飞书API1
tenant_access_token1
用户ID获取1
webhook1
机器人调用1
AT功能1
Markdown语法1
阿里云SLS1
消息发送1
交互式卡片1
IAP1
StoreKit1
内购配置1
服务器通知1
交易处理1
退款流程1
App Store Connect1
JWT1
JSON Web Token1
身份验证1
安全传输1
JWS1
JWE1
Base64URL1
签名算法1
负载1
头部1
HMAC1
加密解密1
Claims1
Web安全1
UML1
文本绘图1
自动布局1
代码生成1
类图1
时序图1
活动图1
组件图1
LLM1
智能体架构1
流式处理1
记忆管理1
工具调用1
多智能体1
ReAct智能体1
规划与执行1
状态管理1
循环控制1
LangChain1
智能体设计模式1
FModel1
UE1
Viewer1
UE4SS1
AES1
Key1
UnrealPak1
repak1
Blender1
psk1
游戏解包1
GPT-SoVITs1
游戏语音提取1
音频格式转换1
数据集准备1
ASR转文字1
语音校对1
模型微调1
推理合成1
参考音频1
数据优化1
GPT-SoVITS1
FunASR1
角色模仿1
Chainlit1
智能体1
声音识别1
提示词工程1
黑神话悟空1
八戒1
AI语音1
角色扮演1
博客更新1
VuePress1
vuepress-theme-hope1
腾讯云COS1
PicList1
Github Actions1
Github Pages1
Cloudflare CDN1
Obsidian1
自动部署1
幻灯片1
测试1
RevealJS1
演示文稿1
CSS样式1
响应式设计1
AG-UI1
协议解析1
AI Agent1
前端架构1
事件驱动1
实时交互1
流式传输1

我的思路是这样的，master跑redis，mysql,spider1。slave就只跑spider2。这样子能做到分布式处理。 spider1负责维护在redis上增量更新的待爬取队列。spider2则分布式的处理队列，爬取并处理每一个网页，处理完毕后上传数据到mysql。 master服务器性能羸弱，这样做其实是无奈之举，若学校能提供更强大的服务器就好了。

代码及需求

需求1：分布式处理spider1的item

scrapy-redis 默认是读取url 队列，而我要处理的是json队列。几番Google未果，故直接看源码。发现作者早就想到了这个问题。RedisMixin这个类里面就可以看到。

Guohao2018/5/17大约 2 分钟约 521 字

安装PHP环境

安装Apache

sudo apt install apache2

Guohao2017/4/7小于 1 分钟约 122 字