如图,全部是<span>构成的,里面的class都一样,而且html标签也当做内容,这样爬出来都混在一起了,比如我想抓取的是“41岁”,结果“<span>”“=”“>”这些也都爬出来了。
你使用HTML内容解析器再解析一遍,取出其中的文本
1.4m articles
1.4m replys
5 comments
57.0k users