Scrapy的调试

关于scrapy调试问题,较为麻烦,故在百度上搜索,再结合本人实践,有如下方法:

1.直接利用scrapy的cmdline.py执行文件进行调试。如下图:

C:\Python27\Lib\site-packages\scrapy\cmdline.py

crawl dmoz

D:\vipshop\crawls\tutorial\

在命令行执行的命令为:

scrapy crawl dmoz

工程文件目录结构:

方法二:

在scrapy.cfg目录下新建main.py文件,并填上如下代码:

from scrapy import cmdline

cmdline.execute(“scrapy crawl dmoz”.split())

然后就可直接调试该文件了。

方法三:

把scrapy\cmdline.py文件拷贝到与scrapy.cfg相同的目录下,直接调试运行,也是可行的。

此外这也方法也启发我们,我们可以自由地定制我们想要的运行方式,例如在该代码上增加套接字功能又或者增加调度器等,而在scrapy目录下所有关键py文件都支持这样的拷贝,是不是很神奇哦。