调用com对象实现css表达式爬虫开源

易语言 2020-03-23 16:01:07

调用com对象实现css表达式爬虫开源

1,做一个爬虫,但是在解析html数据时,易语言表示非常无力,

2,后来也关注到论坛有人用c做了一个dll,易语言可以调用解析html,本人也有关注,但是由于自己是在不习惯一个exe带着一个dll到处跑,

3,于是本人就尝试着了解易语言能不能实现,

4,在经过一个星期的面向百度编程之后,本人惊奇的发现,com库有一个可以解析html的,连续一星期的测试,终于是成功可以用了,

5,本人也有想过做成模块自己用,后来一想算了,还是开源吧,让大家一起用

介绍一下源码吧
1) 源码本身很小,但是携带者一个用于测试的常量,后期可以删除的,
2) 源码本质是两个类,一个是dom对象,一个是dom对象数组,是模拟数组,
3) 由于css表达式抓取html本身需要一点css基础知识,所以恐怕很难照顾所有用户了
4) 懂前端的朋友都晓得,选择器抓取的数据,一般2两种,

一种是只有一个结果集的(例如 get by id 就是返回一个dom节点的),
一种是返回一个数组的(例如 css表达式,获取的结果就是一个数组,哪怕只有一个成员)