做爬虫的时候遇到这样一个网页,如图,把一部分网页标签和代码当成了网页内容写进去,比如<span>等,这和我之前见过的网页不一样,请问为什么要这样写呢?
很明显是爬到了技术网站,这是代码块...
你打开github看看代码部分的源码,不就是类似这种么...
1.4m articles
1.4m replys
5 comments
57.0k users