数据分析中借用熵的概念,其基本思想是什么?
将属性资料的事实频数分布与均匀分布作比较,若事实频数分布接近于均匀分布,则表明现象变化比较均衡。由于均匀分布的熵最大,离散程度也最大,因此熵的计算结果越大,意味着频数分布的离散程度也越大。