聚合国内IT技术精华文章,分享IT技术精华,帮助IT从业人士成长

  • 210 views阅读

    机器学习入门1:算法概述

    本文是机器学习入门的基础版,学习对象产品经理同学; 机器学习,简言之:一堆数据,用算法模型进行训练,再用于使用。 似乎算法看上去是最重要的,但这里也需要强调下:数据来源,数据处理,特征选取,在特定场景下算法优劣的衡量和算法一样重要。  1.算法 算法满意度...

    分类:技术文章 时间:2020-03-25 04:03 我要评论(0个)

  • 256 views阅读

    机器学习入门2:第一个算法-决策树DecisionTree

    本文是机器学习入门的基础版,学习对象产品经理同学; 决策树学习三个过程:1.特征选择。2.构建决策树。3.剪枝   1.决策树是什么? 决策树DecisionTree是机器学习中相当经典的一种算法,既可以用作分类,也可以用作回归,同时还适合做集成...

    分类:技术文章 时间:2020-03-25 04:03 我要评论(0个)

  • 231 views阅读

    时间序列异常检测算法梳理

    异常的分类 时间序列的异常检测问题通常表示为相对于某些标准信号或常见信号的离群点。虽然有很多的异常类型,但是我们只关注业务角度中最重要的类型,比如意外的峰值、下降、趋势变化以及等级转换(level shifts)。 常见的异常有如下几种: 革新性异常:i...

    分类:技术文章 时间:2020-03-24 23:22 我要评论(0个)

  • 300 views阅读

    信息熵在会员营销中的应用思考

    在短信营销场景中,常常会遇到有些用户你给他发多少条促销短信他都无动于衷。针对这样的情况,通常我们会将这类用户称为营销不敏感用户。然而如何区分出这些用户会是一个挺头疼的问题,最常用的手段是通过营销反应次数的技术进行划分。比如定义营销5次都没有任何反馈的用户。...

    分类:技术文章 时间:2020-03-05 11:42 我要评论(0个)

  • 521 views阅读

    深入理解最大互信息系数

    最大互信息系数简介 互信息Mutual Information(MI)是用来评价一个事件的出现对于另一个事件的出现所贡献的信息量。在先前聚类算法的评估指标中有过简单的介绍。抛开公式,通俗的理解:原来我对X有些不确定(不确定性为H(X)),告诉我Y后我对X不...

    分类:技术文章 时间:2020-02-27 18:24 我要评论(0个)

  • 341 views阅读

    [原]用eBPF写TCP拥塞控制算法

    其实不想用这个题目的,只因为TCP相关的东西比较吸引人的眼球,这篇文章的主题还是eBPF,而不是TCP。 用eBPF写TCP拥塞控制算法只是本文所讲内容的一个再平凡不过的例子。 先看两个问题,或者说是两个痛点: 内核越来越策略化。 内核接口不稳定。 ...

    分类:技术文章 时间:2020-02-21 19:01 我要评论(0个)

  • 322 views阅读

    RSA 背后的算法

    这篇文章我本来是想写了放到极客时间上我写的专栏里面的,但是专栏的内容是需要仔细斟酌的。这篇文章我认为还是偏难,不适合整个专栏的内容和难度的定位,因此我把它稍微加工了一下,放到我这个博客上。 在专栏中的第 36 讲的选修课堂中,我介绍了 Diffie–Hel...

    分类:技术文章 时间:2020-02-09 22:25 我要评论(0个)

  • 843 views阅读

    聚类算法之Affinity Propagation(AP)

    Affinity Propagation算法简介 AP(Affinity Propagation)通常被翻译为近邻传播算法或者亲和力传播算法。AP算法的基本思想是将全部数据点都当作潜在的聚类中心(称之为exemplar),然后数据点两两之间连线构成一个网络...

    分类:技术文章 时间:2020-01-24 11:30 我要评论(0个)

  • 658 views阅读

    关联规则算法Apriori 学习笔记

    Apriori简介 集体智慧(Collective Intelligence) 单一个体所做出的决策往往会比起多数决的决策来的不精准,集体智慧是一种共享的或者群体的智能,以及集结众人的意见进而转化为决策的一种过程。它是从许多个体的合作与竞争中涌现出来的。通...

    分类:技术文章 时间:2020-01-21 23:34 我要评论(0个)

  • 743 views阅读

    BP神经网络学习笔记

    神经网络简介 神经网络的结构模仿生物神经网络,生物神经网络中的每个神经元与其他神经元相连,当它“兴奋”时,向下一级相连的神经元发送化学物质,改变这些神经元的电位;如果某神经元的电位超过一个阈值,则被激活,否则不被激活。 神经网络中最基本的单元是神经元模型(...

    分类:技术文章 时间:2020-01-21 23:30 我要评论(0个)

  • 651 views阅读

    关联分析算法FP-Growth学习笔记

    在Apriori算法的学习中,我们了解到Apriori算法需要不断生成候选项目队列和不断得扫描整个数据库进行比对,I/O是很大的瓶颈。为了解决这个问题,FP-Growth利用了巧妙的数据结构,无论多少数据,只需要扫描两次数据集,大大降低了Aproir挖掘算...

    分类:技术文章 时间:2020-01-21 23:30 我要评论(0个)

  • 718 views阅读

    频繁项集算法Eclat学习笔记

    Equivalence Class Transformation(Eclat)是频繁项挖掘和关联性分析的另外一种常用的算法,与Apriori和FP-growth不同的是,Eclat采用垂直数据格式。所谓的垂直数据格式,就是从对原有数据进行倒排。 Aprio...

    分类:技术文章 时间:2020-01-21 23:30 我要评论(0个)