基于数值型和分类型混合属性数据集的聚类算法研究
  • 【摘要】

    介绍了数值型和分类型属性的概念以及处理分类型属性的方法,详细探讨了一种处理分类型和数值型的混合型属性数据集的算法(k-pmtotypes);在此算法的基础上,提出了一种基于分组选择法确定初始点的改进算法;并使用实际数据集对改进算法进行了测试,用详尽的数据证明改进算法的正确性和较强的可伸缩性,最后指出了聚类分析技术的进一步研究的方向.

  • 【作者】

    曹露燕  蒋晓云  孟凡荣 

  • 【作者单位】

    中国矿业大学计算机学院,江苏

  • 【会议名称】

    2006年全国数学技术应用科学学术论坛

  • 【会议时间】

    2006-03-01

  • 【会议地点】

    昆明

  • 【主办单位】

    云南大学

  • 【语种】

    chi

  • 【关键词】

    数值型  分类型  混合型属性数据集  分组选择法  k-prototypes  聚类算法