关于scrapy调试问题,较为麻烦,故在百度上搜索,再结合本人实践,有如下方法:
1.直接利用scrapy的cmdline.py执行文件进行调试。如下图:
C:\Python27\Lib\site-packages\scrapy\cmdline.py
crawl dmoz
D:\vipshop\crawls\tutorial\
在命令行执行的命令为:
scrapy crawl dmoz
工程文件目录结构:
方法二:
在scrapy.cfg目录下新建main.py文件,并填上如下代码:
from scrapy import cmdline
cmdline.execute(“scrapy crawl dmoz”.split())
然后就可直接调试该文件了。
方法三:
把scrapy\cmdline.py文件拷贝到与scrapy.cfg相同的目录下,直接调试运行,也是可行的。
此外这也方法也启发我们,我们可以自由地定制我们想要的运行方式,例如在该代码上增加套接字功能又或者增加调度器等,而在scrapy目录下所有关键py文件都支持这样的拷贝,是不是很神奇哦。