极速统计数组重复并自动分类

易语言 2020-06-23 15:36:06

感觉很有挑战意义,虽然有人已经接单完成了,但因为这种情况很典型,所以有必要跟易友交流互相促进
先讲下算法吧
主要里利用“节点”的特性优化速度,此法速度也许算不上最快的,但算法肯定是最简单的
节点特性1:节点类似与哈希表,当向节点内加入一个新属性时,返回成功,当向节点内加入一个已存在的同名属性时则返回失败,利用这个特性可以很容易判断数组成员是不是重复
节点特性2:虽然无法加入同名的属性,但却可以修同名属性的属性值,利用这点可以记录每个数组成员的重复次数
由此可见,只需要一次计次循环就能完成数组去重+分类统计重复次数,相对于嵌套多层循环比对的方法效率要高得多

根据反复测试的结果,发现一个重要的规律
当数组成员数一样时,统计耗时跟去重后的成员数成反比,也就是说同样为10万数组,去重后为1000个成员的耗时比去重后为100个成员耗时多8~10倍左右
为什么会有这种规律?应该是节点的另一个特性:加入新属性耗时修改已有的属性值要慢得多。