n0099 Wien 您为啥要爬网页版贴吧?我和鸡血神都是客户端接口 我看了下他这文,典型的培训班批发py中级爬虫高手复制人 他管这种js请求pi获取内容叫反爬我都不知道他是不是侮辱了真正的反爬 可能在scrapy调包侠眼中任何不能直接从首个url请求的response body的html字符串中提取的内容,而是需要请求某个api的场景他们都会无脑上selenium+headless chrome并将其称为反爬(本质是懒得去f12network里找到底是什么api)
Wien n0099 因为我只考虑过 。。手动精挑细选有价值的网页导入link批量保存https://chrome.google.com/webstore/detail/singlefile/mpiodijhokgodhhofbcjdecpffjipkle
n0099 Wien 建议 https://chrome.google.com/webstore/detail/wayback-machine/fpnmgdkabkmnadcjpehmlllkndpkmiak https://chrome.google.com/webstore/detail/web-archives/hkligngkgcpcolhcnkgccglchdafcnao