n0099 Wien 建议使用 https://n0099.net/tbm Wien 国内外的网页存档网站对有反爬机制的网站 但贴吧没有反爬,google web cache可以看,只不过贴吧域太多太乱seo做的不好所以google收录的少
n0099 Wien https://www.cnbeta.com/articles/tech/1323791.htm 暗影长廊吧干嘛的 https://www.zhihu.com/question/33987158
Wien n0099 是直球鉴证的圣地 V系贴吧全是鉴证的 记得是至少从09年大概就有了 如V杀吧 V仇吧上千个各种带V杀元素衍生品 被百度全方位打击猎魔 早期极其极端 某些图片把V字符号涂在了现实各种设施上 非常的哈人 您可以通过1984吧以及一些用户的关注列表知道一些分家 主人公V的住所就是暗影长廊所以取名暗影长廊吧!<
n0099 Wien 您为啥要爬网页版贴吧?我和鸡血神都是客户端接口 我看了下他这文,典型的培训班批发py中级爬虫高手复制人 他管这种js请求pi获取内容叫反爬我都不知道他是不是侮辱了真正的反爬 可能在scrapy调包侠眼中任何不能直接从首个url请求的response body的html字符串中提取的内容,而是需要请求某个api的场景他们都会无脑上selenium+headless chrome并将其称为反爬(本质是懒得去f12network里找到底是什么api)
Wien n0099 因为我只考虑过 。。手动精挑细选有价值的网页导入link批量保存https://chrome.google.com/webstore/detail/singlefile/mpiodijhokgodhhofbcjdecpffjipkle
n0099 Wien 建议 https://chrome.google.com/webstore/detail/wayback-machine/fpnmgdkabkmnadcjpehmlllkndpkmiak https://chrome.google.com/webstore/detail/web-archives/hkligngkgcpcolhcnkgccglchdafcnao