聚合国内IT技术精华文章,分享IT技术精华,帮助IT从业人士成长

  • 1581 views阅读

    终于有人把云计算、大数据和人工智能讲明白了

    我今天要讲这三个话题,一个是云计算,一个大数据,一个人工智能,我为什么要讲这三个东西呢?因为这三个东西现在非常非常的火,它们之间好像互相有关系,一般谈云计算的时候也会提到大数据,谈人工智能的时候也会提大数据,谈人工智能的时候也会提云计算。所以说感觉他们又相...

    分类:技术文章 时间:2018-05-19 21:45 我要评论(0个)

  • 2666 views阅读

    计算机如何感知大数据——聚类算法

    看看下面这张图片。这是一个不同形状大小的昆虫的集合。花点时间按照相似程度将它们分成几组。 这不是什么很有技巧性的问题。 我们从把蜘蛛分到一起开始。 图片来自Google图片搜索,标记以便重用 做完了吗?虽然这里没有必要有所谓的正确答案,不过你极有可能...

    分类:技术文章 时间:2018-03-12 21:45 我要评论(0个)

  • 2621 views阅读

    BDTC2017北京大数据技术大会参会心得

    12月7、8、9号三天在北京参加了BDTC大会,主题是人工智能与大数据,除了第一天的全员大会外,我参加了第二天上午的大数据云服务、下午的知识图谱、第三天的机器学习论坛。在此做一个回顾,也希望能为未参加大会的朋友们分享从我个人角度思考的心得。禇晓文教授的《基...

    分类:技术文章 时间:2017-12-13 20:30 我要评论(0个)

  • 5868 views阅读

    大数据搜索选开源还是商业软件?ElasticSearch 对比 Splunk

    本文就架构,功能,产品线,概念等方面就ElasticSearch和Splunk做了一下全方位的对比,希望能够大家在制定大数据搜索方案的时候有所帮助。 简介 ElasticSearch (1)(2)是一个基于Lucene的开源搜索服务。它提供了一个分布式多用...

    分类:技术文章 时间:2017-06-21 14:10 我要评论(0个)

  • 4483 views阅读

    ES系列之Elasticsearch-2.3安装笔记

    一、安装规划 背景: 某个项目需要三台物理机搭建一个ES集群。 机器大概为24核,128G内存,考虑到ES是纯java项目,存在32G内存限制的问题,所以堆内内存一般分配小于等于32G,非堆内内存一般是和堆内内存size一致。 假如我们一个实例堆内内存分配...

    分类:技术文章 时间:2017-06-14 11:25 我要评论(0个)

  • 4901 views阅读

    用Apache Spark做大数据处理——第五部分:Spark机器学习数据流水线

    关键点: 了解机器学习数据流水线有关内容。 怎么用Apache Spark机器学习包来实现机器学习数据流水线。 数据价值链处理的步骤。 Spark机器学习流水线模块和API。 文字分类和...

    分类:技术文章 时间:2017-01-19 07:55 我要评论(0个)

  • 4921 views阅读

    腾讯游戏大数据解密:DevOps持续改进之道-布道【原创】

            2016年12月3日,在深圳圣淘沙酒店,运维帮、云技术、Linux中国三大社区联合主办主办了运维世界大会OpsWorld,演讲内容全程无广告,只谈技术,受到了广...

    分类:技术文章 时间:2016-12-27 02:20 我要评论(0个)

  • 4666 views阅读

    当今世界最NB的25位大数据科学家

    引言 在大数据技术飞速发展的今天,谁才是我们大数据科研与工业界中最有威望的科学家呢?下面我们来进行梳理,共罗列了25位当今世界,无论是在学术与工业界都产生巨大影响的数据科学家(Data Scientists)。他(她)们推动了整个领域的发展,毫无疑问,无论...

    分类:技术文章 时间:2016-12-21 23:55 我要评论(0个)

  • 5121 views阅读

    腾讯游戏大数据数解密:DevOps持续改进之道-布道【原创】

            我分享的主题是“DevOps持续改进之道——布道”。我刚才已经做了简单的介绍,这里再罗嗦一下,我叫刘天斯,现在是在腾讯互动娱乐负责大数据的运营。在互联网行业已经...

    分类:技术文章 时间:2016-12-19 18:55 我要评论(0个)

  • 5413 views阅读

    Apache Spark:大数据处理统一引擎

    工业和研究中数据的大幅增长为计算机科学带来了巨大的机会与挑战。由于数据大小超过了单台机器的能力,用户需要新的系统将计算扩展到多个节点。因此,针对不同计算工作负载的新集群编程模型已呈爆炸式增长。 这些模型相对专业化。例如支持批处理的MapReduce,支持...

    分类:技术文章 时间:2016-12-06 18:20 我要评论(0个)

  • 3684 views阅读

    漫画:什么是大数据?

    大数据是具有海量、高增长率和多样化的信息资产,它需要全新的处理模式来增强决策力、洞察发现力和流程优化能力。 Big data is high volume, high velocity, and/or high variety informatio...

    分类:技术文章 时间:2016-11-07 10:10 我要评论(0个)

  • 4200 views阅读

    自己动手做聊天机器人 二十八-脑洞大开:基于美剧字幕的聊天语料库建设方案 大数据

    本文转载自:www.shareditor.com 原文链接: 自己动手做聊天机器人 二十八-脑洞大开:基于美剧字幕的聊天语料库建设方案 大数据 要让聊天机器人进行学习,需要海量的聊天语料库,但是网上的语料库基本上都是有各...

    分类:技术文章 时间:2016-10-19 23:50 我要评论(0个)