聚合国内IT技术精华文章,分享IT技术精华,帮助IT从业人士成长

  • 393 views阅读

    机器学习/数据分析之缺失值处理

    在机器学习数据预处理阶段经常需要对数据进行缺失值处理。关于缺失值的处理并没有想象中的那么简单。以下为一些经验分享。 数据缺失类型 完全随机丢失(MCAR,Missing Completely at Random):某个变量是否缺失与它自身的值无关,也与其...

    分类:技术文章 时间:2021-01-29 23:15 我要评论(0个)

  • 532 views阅读

    风险控制:信用评分卡模型

    什么是信用评分卡模型? 评分卡模型又叫做信用评分卡模型,最早由美国信用评分巨头FICO公司于20世纪60年代推出,在信用风险评估以及金融风险控制领域中广泛使用。银行利用评分卡模型对客户的信用历史数据的多个特征进行打分,得到不同等级的信用评分,从而判断客户的...

    分类:技术文章 时间:2021-01-27 21:03 我要评论(0个)

  • 1292 views阅读

    特征工程数据预处理之抽样

    在分析数据或进行算法模型训练前有时需要先对数据进行抽样,这里整理了抽样的一些知识点。 什么情况下需要会用到抽样? 数据量太大,计算能力不足。 抽样调查,小部分数据即可反应全局情况。 时效要求,通过抽样快速实现概念验证。 定性分析的工作需要。 无法实现全...

    分类:技术文章 时间:2020-12-01 22:08 我要评论(0个)

  • 2335 views阅读

    调戏了一番度娘"最先进"的PLATO-2预训练模型之后,我还是回到了和人类交谈...

    (莫慌,这图是拿出来撑场面的,我可能和你一样看不懂) 前言:这是一篇很不严肃的实验文章。每一个会修电脑的人,都可以很容易地照着本文的描述,自己去操作一遍。 大概一周前,百度不是发布了一个“取得重要进展”的对话生成网络 PLATO-...

    分类:技术文章 时间:2020-07-14 02:25 我要评论(0个)

  • 2938 views阅读

    机器学习入门5:KNN近邻算法-图像检索-NN最近邻检索和ANN近似最近邻检索

    本文是机器学习入门的基础版,学习对象产品经理同学; 目前图像检索中最基础的检索能力: NN检索-最近邻检索(Nearest Neighbor Search) ANN检索-近似最近邻检索Approximate Nearest Neighbor。区别于ANN ...

    分类:技术文章 时间:2020-04-18 10:51 我要评论(0个)

  • 3143 views阅读

    机器学习入门1:算法概述

    本文是机器学习入门的基础版,学习对象产品经理同学; 机器学习,简言之:一堆数据,用算法模型进行训练,再用于使用。 似乎算法看上去是最重要的,但这里也需要强调下:数据来源,数据处理,特征选取,在特定场景下算法优劣的衡量和算法一样重要。  1.算法 算法满意度...

    分类:技术文章 时间:2020-03-25 04:03 我要评论(0个)

  • 2961 views阅读

    机器学习入门2:第一个算法-决策树DecisionTree

    本文是机器学习入门的基础版,学习对象产品经理同学; 决策树学习三个过程:1.特征选择。2.构建决策树。3.剪枝   1.决策树是什么? 决策树DecisionTree是机器学习中相当经典的一种算法,既可以用作分类,也可以用作回归,同时还适合做集成...

    分类:技术文章 时间:2020-03-25 04:03 我要评论(0个)

  • 6166 views阅读

    回归树的原理及其 Python 实现

    提到回归树,相信大家应该都不会觉得陌生(不陌生你点进来干嘛[捂脸]),大名鼎鼎的 GBDT 算法就是用回归树组合而成的。本文就回归树的基本原理进行讲解,并手把手、肩并肩地带您实现这一算法。 完整实现代码请参考 github: https://github....

    分类:技术文章 时间:2018-08-10 16:45 我要评论(0个)

  • 8115 views阅读

    直白介绍卷积神经网络(CNN)

    什么是卷积神经网络,它为何重要? 卷积神经网络(也称作 ConvNets 或 CNN)是神经网络的一种,它在图像识别和分类等领域已被证明非常有效。 卷积神经网络除了为机器人和自动驾驶汽车的视觉助力之外,还可以成功识别人脸,物体和交通标志。 图1 如图1...

    分类:技术文章 时间:2018-04-09 04:45 我要评论(0个)

  • 7100 views阅读

    如何实现一个基本的微信文章分类器

    微信公众号发布的文章和一般门户网站的新闻文本类型有所不同,通常不能用现有的文本分类器直接对这些文章进行分类,不过文本分类的原理是相通的,本文以微信公众号文章为对象,介绍朴素贝叶斯分类器的实现过程。 文本分类的科学原理和数学证明在网上有很多,这里就不做赘述,...

    分类:技术文章 时间:2018-04-04 16:46 我要评论(0个)

  • 7367 views阅读

    AI 从业者都会用到的 10 个深度学习方法

    过去十年里,人们对机器学习的兴趣经历了爆炸式的整长。我们几乎每天都可以在计算机程序、行业会议和媒体上看到机器学习的身影。很多关于机器学习的讨论都混淆了“机器学习能做什么”和“人类希望机器学习能做什么”。从根本上讲,机器学习是运用算法从原始数据中提取信息,并...

    分类:技术文章 时间:2018-03-12 21:45 我要评论(0个)

  • 7727 views阅读

    做 ML 有关的工作,需要哪些技能?

    【导读】:有位网友在 Quora 上提问:做与机器学习有关的工作,需要些什么技能呢? 我是一个自学者,现在家中自学线性代数。希望有天能在机器学习领域工作,但是我不太确定: a) 这种工作/面试需要什么技术上的技能? b) 有没有什么(做这种工作)必须的相...

    分类:技术文章 时间:2018-01-31 04:45 我要评论(0个)