聚合国内IT技术精华文章,分享IT技术精华,帮助IT从业人士成长

  • 599 views阅读

    美团内部讲座|清华大学莫一林:信息物理系统中的安全控制算法

    【Top Talk/大咖说】由美团技术学院主办,面向全体技术同学,定期邀请美团各技术团队负责人、业界大咖、高校学者及畅销书作者,为大家分享最佳实践、互联网热门话题、学术界前沿技术进展等内容,从而建立工程师文化、提升技术视野。2020年9月10日,Top T...

    分类:技术文章 时间:2020-10-09 16:28 我要评论(0个)

  • 1109 views阅读

    层次聚类改进算法之BIRCH

    BIRCH算法简介 BIRCH算法的全称是Balanced Iterative Reducing and Clustering using Hierarchies,它使用聚类特征来表示一个簇,使用聚类特征树(CF-树)来表示聚类的层次结构,算法思路也是“自...

    分类:技术文章 时间:2020-05-24 21:20 我要评论(0个)

  • 1342 views阅读

    层次聚类改进算法之CURE

    CURE(Clustering Using Representatives)是一种针对大型数据库的高效的聚类算法。基于层次的传统的聚类算法得到的是球状的,相等大小的聚类,对异常数据比较脆弱。CURE采用了用多个点代表一个簇的方法,可以较好的处理以上问题。并...

    分类:技术文章 时间:2020-05-24 21:20 我要评论(0个)

  • 1425 views阅读

    层次聚类改进算法之Chameleon

    Chameleon简介 Chameleon(变色龙)算法是一种两阶段层次聚类算法。在进行两个类簇合并时使用更高的标准,同时考虑了类簇之间的互连性(连接两个子簇的边的权重之和)和近似性(连接两个子簇的边的平均权重),具有发现任意形状和大小的簇的能力。算法的过...

    分类:技术文章 时间:2020-05-24 21:20 我要评论(0个)

  • 2775 views阅读

    浅析微软小冰算法和决策模型

    文 李红涛 微软小冰,从2014年5月发布版本小冰一代,到2019年5月发布小冰七代; 概要: 1.小冰的训练数据,来源是全网数据 2.给用户打情绪标签 3.情绪数据来源:emoji数据表情 4.问答+情绪渲染 学习无情绪的表达 然后加上情绪的渲染 算法...

    分类:技术文章 时间:2020-04-22 03:45 我要评论(0个)

  • 1886 views阅读

    机器学习入门5:KNN近邻算法-图像检索-NN最近邻检索和ANN近似最近邻检索

    本文是机器学习入门的基础版,学习对象产品经理同学; 目前图像检索中最基础的检索能力: NN检索-最近邻检索(Nearest Neighbor Search) ANN检索-近似最近邻检索Approximate Nearest Neighbor。区别于ANN ...

    分类:技术文章 时间:2020-04-18 10:51 我要评论(0个)

  • 2208 views阅读

    机器学习入门1:算法概述

    本文是机器学习入门的基础版,学习对象产品经理同学; 机器学习,简言之:一堆数据,用算法模型进行训练,再用于使用。 似乎算法看上去是最重要的,但这里也需要强调下:数据来源,数据处理,特征选取,在特定场景下算法优劣的衡量和算法一样重要。  1.算法 算法满意度...

    分类:技术文章 时间:2020-03-25 04:03 我要评论(0个)

  • 2048 views阅读

    机器学习入门2:第一个算法-决策树DecisionTree

    本文是机器学习入门的基础版,学习对象产品经理同学; 决策树学习三个过程:1.特征选择。2.构建决策树。3.剪枝   1.决策树是什么? 决策树DecisionTree是机器学习中相当经典的一种算法,既可以用作分类,也可以用作回归,同时还适合做集成...

    分类:技术文章 时间:2020-03-25 04:03 我要评论(0个)

  • 3243 views阅读

    时间序列异常检测算法梳理

    异常的分类 时间序列的异常检测问题通常表示为相对于某些标准信号或常见信号的离群点。虽然有很多的异常类型,但是我们只关注业务角度中最重要的类型,比如意外的峰值、下降、趋势变化以及等级转换(level shifts)。 常见的异常有如下几种: 革新性异常:i...

    分类:技术文章 时间:2020-03-24 23:22 我要评论(0个)

  • 2333 views阅读

    信息熵在会员营销中的应用思考

    在短信营销场景中,常常会遇到有些用户你给他发多少条促销短信他都无动于衷。针对这样的情况,通常我们会将这类用户称为营销不敏感用户。然而如何区分出这些用户会是一个挺头疼的问题,最常用的手段是通过营销反应次数的技术进行划分。比如定义营销5次都没有任何反馈的用户。...

    分类:技术文章 时间:2020-03-05 11:42 我要评论(0个)

  • 2436 views阅读

    深入理解最大互信息系数

    最大互信息系数简介 互信息Mutual Information(MI)是用来评价一个事件的出现对于另一个事件的出现所贡献的信息量。在先前聚类算法的评估指标中有过简单的介绍。抛开公式,通俗的理解:原来我对X有些不确定(不确定性为H(X)),告诉我Y后我对X不...

    分类:技术文章 时间:2020-02-27 18:24 我要评论(0个)

  • 2050 views阅读

    [原]用eBPF写TCP拥塞控制算法

    其实不想用这个题目的,只因为TCP相关的东西比较吸引人的眼球,这篇文章的主题还是eBPF,而不是TCP。 用eBPF写TCP拥塞控制算法只是本文所讲内容的一个再平凡不过的例子。 先看两个问题,或者说是两个痛点: 内核越来越策略化。 内核接口不稳定。 ...

    分类:技术文章 时间:2020-02-21 19:01 我要评论(0个)