爬虫scrapy框架安装使用-白红宇

强烈建议你试试无所不能的chatGPT，快点击我

爬虫scrapy框架安装使用

阅读量：4691 次

发布时间：2019-06-09

本文共 558 字，大约阅读时间需要 1 分钟。

安装： pip install scrapy

安装可能会出现问题，此时需要下载一个依赖包

在这个网站： https://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted

下载对应版本，，注意，，python3.6 adm64位对应

　　　　pip install 文件的完成路径

安装成功后

开始使用：

　　创建项目：scrapy startproject 项目名

　　目录结构如下：

　　　　

　　生成爬虫文件：终端cd进入到 first目录下

　　　　　　执行命令：scrapy genspider 　文件名（name）网站网址（url）

　　运行爬虫：终端cd到spiders目录下

　　　　　　执行命令：scrapy crawl name

　　　　　　在此过程会遇到一些问题

　　　　　　　　　　（1）需要安装pywin32

　　　　　　　　　　（2）需要配置setting文件

　　　　　　　　　　　　（a）把True改为False，不遵从robots协议

　　　　　　　　　　　　　

　　　　　　　　　　　　（b）创建头部信息

现在可以执行了

　　　　

　　

转载于:https://www.cnblogs.com/airapple/p/9146190.html

你可能感兴趣的文章

Android 下拉刷新之ScrollView--PullToRefreshScrollView

在Servlet中使用JSON

子网掩码-网关

关于code reiview

git 提交顺序

ios9怎么设置6位密码 ios9设置6位密码图文教程

Python单元测试——深入理解unittest

python BaseManager中register()的描述

Windbg 脚本命令简介一

取得手机屏幕大小/style的应用技巧

Java中跳出多层循环的简单方法

类和对象：面向对象编程 - 零基础入门学习Python037

C/C++UNION中包含STRUCT

调试.方便调试的技巧_01

C# 导出 Excel 的各种方法总结

cocos Uniforms值的赋值

Npoi Web 项目中(XSSFWorkbook) 导出出现无法访问已关闭的流的解决方法

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2024-10-23 01:59:37 当前IP: 18.226.150.245 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我