如果从报错来看,那就是你要解析的xml
不符合要求呗,原因也说明白了,meta
标签没有被关闭或者是说没有结束标签
你从网页下载下来的应该是一个HTML
,而HTML
并不严格要求是否一定要有结束标签,但是你现在是用dom4j
按照xml
进行解析的,那就得按照xml
的要求来
因为不清楚mingspider.getrequestdata
这里面到底做了啥,也不排除你在其中做了一些什么骚操作。
不过这个网址https://gongshang.mingluji.com/beijing/diqu/%E4%B8%9C%E5%9F%8E
,去看了一下,本身它貌似就是只有一个meta
标签确实没有被关闭
至于mingspider.getrequestdata
里有底有没有其他操作不知道,只能说从现在获取到的信息得出以上的判断吧,希望能有所帮助
`
与恶龙缠斗过久,自身亦成为恶龙;凝视深渊过久,深渊将回以凝视…