你的位置: 欧博会员 > 欧博会员 > 沙巴三公澳门博彩上_K-Means算法
热点资讯

沙巴三公澳门博彩上_K-Means算法

发布日期:2025-07-31 05:04    点击次数:55
沙巴三公澳门博彩上 一、什么是 聚类分析

聚类分析是数据挖掘中的一种错误步伐,不错匡助咱们发现数据对象中守秘的有价值信息。聚类分析的中枢想想是凭据一样性原则将具有较高一样度的数据对象分别到合并类簇,从而使得合并组中的数据点之间具有更高的一样性。

在聚类算法中,通常包括三个阶段:特征选定和特征索要、数据对象间一样度预备以及凭据一样度将数据对象分组。凭据不同的聚类神气,聚类算法不错分为两大类:端倪聚类算法和分别聚类算法。

端倪聚类算法试图构建一个高端倪的嵌套聚类树结构,通过不同类别间的数据对象的一样度来罢了。聚类树的构建有两种类型:凝合型端倪聚类(自底朝上的神气构竖立结构)和分裂型端倪聚类(自顶向下的神气构竖立结构)。

分别聚类算法需要预先指定聚类数量和聚类中心,通过优化一些耗损函数来将数据集分红若干互不相交的簇。这种步伐需要预先知谈聚类数量和聚类中心,因此在执行应用中需要严慎选定。

二、K-Means聚类算法01 K-Means聚类算法旨趣

K-Means算法是一种典型的基于分别的聚类算法,亦然一种无监督学习算法。K-Means算法的想想很纯粹,对给定的样本集,用欧氏距离行为揣度数据对象间一样度的目的,一样度与数据对象间的距离成反比,一样度越大,距离越小。

预先指定启动聚类数以及个启动聚类中心,按照样本之间的距离大小,把样本集分别为个簇凭据数据对象与聚类中心之间的一样度,抵制更新聚类中心的位置,抵制裁减类簇的纰谬普通和(Sum of Squared Error,SSE) ,当SSE不再变化或主见函数治理时,聚类闭幕,得到最终放胆。

K-Means算法的中枢想想:最初从数据市欢立时考中k个启动聚类中心 Ci(i≤1≤k),预备其尾数据对象与与聚类中心Ci的欧氏距离,找出离主见数据对象最近的聚类中心Ci,并将数据对象分派到聚类中心Ci所对应的簇中。然后预备每个簇中数据对象的平均值行为新的聚类中心,进行下一次迭代,直到聚类中心不再变化或达到最大的迭代次数时罢手。

空间中数据对象与聚类中心间的欧氏距离预备公式为:

入口展示

皇冠体育

在一场足球比赛中,著名球星梅西因为对裁判的不满而冲上场对裁判进行辱骂,结果被直接红牌罚下,让他的球队在比赛中处于劣势地位,引发了球迷们的热议和不满。

图片

自灵活就业社保补贴工作开展以来,区人社局工作人员紧密联系村(社区)就业专干,开展业务培训,详细解读政策细节,重点解答工作开展时易出现的问题。多形式加强与就业专干的日常沟通,保障灵活就业社保补贴初审工作顺利开展,为后续工作打下坚实基础。同时,紧盯资料收取、金额计算、系统录入等易出错环节,压实工作责任,扎实开展灵活就业社保补贴复审工作,对于被补贴人出生年月、认定灵活就业时间、往年享受政策情况、社保缴纳比例与金额进行详细了解,切实做到应补尽补、应享尽享、应帮尽帮。截至目前,区人社局已成功发放2023年首批灵活就业社保补贴资金618.6万元,政策红利惠及688名灵活就业人员。

检察日报讯(记者戴小巍 通讯员姜一帆 陆成雄)多次从国外购买假冒减肥药,再以代购身份销售给他人牟利,近日,经湖北省汉川市检察院提起公诉,被告人张某因犯销售假药罪被法院判处有期徒刑一年二个月,缓刑二年,并处罚金36万元。

其中,X为数据对象;Ci为第i个聚类中心;m为数据对象的维度;Xj,Cij为X和Ci的第j个属性值。

通盘数据集的纰谬普通和SSE预备公式为:

图片

其中,SSE的大小示意聚类放胆的厉害;k为簇的个数。

02 K-Means聚类算法体式

K-Means聚类算法体式骨子是EM算法(最大期许算法(Expectation-Maximization algorithm, EM))的模子优化历程,具体魄式如下:

(1)立时选定k个样本行为启动簇类的均值向量;

(2)将每个样本数据集分别离它距离最近的簇;

(3)凭据每个样本所属的簇,更新簇类的均值向量;

(4)调换(2)(3)步,当达到确立的迭代次数或簇类的均值向量不再更变时,模子构建完成,输出聚类算法放胆。

03 K-Means算法迭代历程

K-Means聚类算法是一个抵制迭代的历程,如图所示,原始数据集有4个簇,图中庸分别代表数据点的横纵坐标值,使用K-Means算法对数据集进行聚类,在对数据集经过两次迭代后得到最终的聚类放胆,迭代历程如下图所示。

图片

(a)原始数据

图片

菠菜网上平台

(b)立时选定启动中心

图片

澳门博彩上

(c)第一次迭代

图片

www.huangguantiyuviplink.vip

(d)第二次迭代

图片

(e)最终放胆

K-Means聚类算法的颓势

该算法卓绝纯粹且使用庸俗,然而主要存在以下四个颓势:

1. K值需要预先给定 ,属于预先常识,很厚情况下K值的算计黑白常艰辛的,关于像预备一齐微信用户的贸易圈这么的场景就皆备的没看法用K-Means进行。关于不错详情K值不会太大但不解确精准的K值的场景,不错进行迭代运算,然后找出对应的K值,这个值通常能较好地描绘有若干个簇类;

2.K-Means算法对启动考中的 聚类中心点是敏锐 的,不同的立时种子点得到的聚类放胆皆备不同;

3.该算法并不适当悉数的数据类型。它不行治理非球形簇、不同尺寸和不同密度的簇;

4.易堕入局部最优解。

皇冠网址188金宝博登录K-Means 聚类算法的纠正

基于萤火虫优化的加权K-Means算法,愚弄萤火虫优化算法的全局搜索才智强,易治理的特质考中K-Means算法的启动聚类中心。

由于数据属性对聚类放胆的影响进度不同,在传统欧式距离的基础上引入权重值,加大了数据的不同属性间的区分进度,摈斥了数据市欢噪声点的影响。该算法很好地克服了传统K-Means算法中启动聚类中心难考中和噪声点对聚类放胆的影响,援助了聚类的性能。

还有基于纠正丛林优化算法的K-Means算法,引入衰减因子行为自顺应步长加速算法聚类速率,市欢算术交叉操作,纠正传统丛林优化算法易堕入局部最优解、治理慢的污点,提高聚类精度和聚类准确率。

将遗传算法与K-Means算法相市欢,提高K-Means算法的聚类效力与精准度。该算法最初使用隔邻排序算法对原始数据市欢的调换数据进行计帐,将去重后的数据进行归一化,预备数据市欢各个数据对象之间的欧氏距离,然后使用公式

图片

求数据集的平均欧氏距离,其中,Dis(Si,Sj)为数据对象Si和Sj之间的欧氏距离,An为数据对象的数量。数据市欢的每个数据对象要是与主见点的距离在AvgDis之内,那么觉得该数据对象为主见点的周边点,并统计其周边点的数量。将数据市欢各个数据对象的周边点的数量按降序枚举,取其前k个数据对象行为启动聚类中心进行K-Means聚类。然后愚弄遗传算法对K-Means聚类后的放胆进行计帐,启动种群是由50个01字符生成的基因序列,选定每个基因对应的特征行为K-Means 聚类算法的放胆。顺应度函数公式为

图片

皇冠客服飞机:@seo3687

其中,fi为基因i的顺应度,N为数据市欢数据对象的数量,aik为基因i在聚类放胆被分错的数量,l为种群中个体的数量,k为簇的数量。为了预备愈加方便,需要将顺应度进行归一化:

图片

其中,fmax和fmin分别代表了种群中顺应度的最大值与最小值。凭据个体的顺应度的大小选定轮盘对赌区域进行交叉操作和突变操作,摈斥数据市欢无谓的属性特征,要是达到最大迭代次数则输出新种群和最优放胆,不然愚弄遗传算法接续进行迭代。

皇冠api接口三、追念

(1)援助K-Means算法治理海量或多维数据集的才智。跟着大数据时期的到来,咱们所能得到的信息量呈指数式爆炸,奈何将K-Means更好地用于治理指数级数据的聚类,亦然咱们需要参谋的标的。

玩家

(2)裁减K-Means算法的本领复杂度。纠正的K-Means聚类算法有着精雅的聚类成果皇冠管理端手机网址,但这是在死心了本领的前提下换来的,奈何能更好更快地援助聚类才智,需要咱们作念更进一步优化。

本站仅提供存储干事,悉数内容均由用户发布,如发现存害或侵权内容,请点击举报。

----------------------------------