聚合国内IT技术精华文章,分享IT技术精华,帮助IT从业人士成长

  • 3311332 views阅读

    大数据基础:Google GFS

    GFS系统简介 Google 文件系统(Google File System,缩写为 GFS 或 GoogleFS),一种由 Google 公司开发专有分布式文件系统。 它与传统文件系统的的区别在于: 分布式 – 提供很高的横向扩展性 使用大量廉价的普通机器组成网络 – 允许单机故障 不允许任意更改已有文件 (No Random Write) Google并没...

    分类:技术文章 时间:2022-01-01 16:52 我要评论(0个)

  • 4131619 views阅读

    大数据基础:Google BigTable

    Bigtable是2005年谷歌的论文:《Bigtable: A Distributed Storage System for Structured Data》中介绍的一种分布式存储系统,后来被Hadoop社区实现为HBase。读懂这篇论文,那么理解HBase也就非常容易了。 摘要(Abstract) Bigtable是一个分布式存储系统,它被设计来为近万台商用服务器规模的、PB级别的数...

    分类:技术文章 时间:2022-01-01 16:52 我要评论(0个)

  • 2938667 views阅读

    图计算应用:京东JoyGraph

    图计算简介 图计算中的图英文是Graph,用英文完整的表达就是Graph Computing。图计算是研究客观世界当中的任何事物和事物之间的关系,对其进行完整的刻划、计算和分析的一门技术。简单概括一下,就是,图计算是人工智能的一个使能技术。我们可以大致将人工智能的基本能力分成三个部分,第一部分就是理解的能力,第二部分是推理的能力,第三部分就是学习的能力,简称URL(Understandin...

    分类:技术文章 时间:2021-12-30 09:09 我要评论(0个)

  • 3283564 views阅读

    图数据库应用:蚂蚁金服GeaBase

    图数据库最大的优点是通过节点和关联的数据模型去快速解决复杂的关系问题。它非常善于处理大量的、复杂的、关联的、多变的网状数据,而且具备奇高的效率。由于图数据库拥有独一无二的特性,因此它非常适合在社交网络、实时推荐、银行交易环路、金融征信系统等领域应用。蚂蚁金服在2015年成立了专门研发图数据库的技术团队,在仅仅3年多时间里,成功研发出具有高性能、高可用性、扩展能力强和极佳移植性的GeaBas...

    分类:技术文章 时间:2021-12-30 09:09 我要评论(0个)

  • 5146830 views阅读

    iOS代码是否越狱判断方法

    “越狱”在评估有Appstore时就已经存在,当时很多人越狱的目的是为了安装收费的应用或游戏。随着Appstore应用的丰富及免费APP的增多,已经很少有用户为了牺牲手机的安全性来的进行越狱了。另外一方面,越狱的设备可以随意安装任何软件或脚本,也给黑产带来了方便之门。 有时我们的应用希望知道安装的设备是否已经越狱了,显然,苹果官方不会给出解决方案来的,那么我们怎么办呢?以下是整理的一些判...

    分类:技术文章 时间:2021-12-30 09:09 我要评论(0个)

  • 3474303 views阅读

    数据人的修养:次第乞已,还至本处

    金刚经的开头部分(法会因由)有这样一句话:“尔时世尊食时,着衣持钵,入舍卫大城乞食。于其城中,次第乞已,还至本处。”,其中印象比较深的是“次第乞已,还至本处。”这八字。 次第乞已 佛经中的次第乞已 次第乞已,指的是出家人外出乞食时,要不择贫富,按顺序一家家行乞。 传说须菩提尊者出家后,每天上午外出托钵乞食,下午随佛陀修行。但须菩提尊者行乞和大众不同,乞富不乞贫,总是一个人威仪齐整、行止安...

    分类:技术文章 时间:2021-11-09 00:35 我要评论(0个)

  • 5233222 views阅读

    淘口令的技术实现

    类似淘口令的还有支付宝的“吱口令”。口令码分享除了淘宝系之外的应用并不广泛,一是其本身就需要一套完整的口令产生与识别系统,同时还涉及加密等,本身是较为复杂的,开发难度大;二是其限制了受众必须进入相同的APP内才能访问对应内容,等同于用户分享的并不是内容本身,而是打开内容的钥匙,这很大程度上限制了用户的使用。 阿里使用口令方式进行分享,也完全是基于腾讯对其商品分享的制约,口令分享这种方式,...

    分类:技术文章 时间:2021-10-28 09:50 我要评论(0个)

  • 7611133 views阅读

    用户画像TGI指标

    什么是TGI 对于TGI指数,百科是这样解释的——TGI指数,全称Target Group Index,可以反映目标群体在特定研究范围内强势或者弱势。 TGI指数计算公式 = 目标群体中具有某一特征的群体所占比例 / 总体中具有相同特征的群体所占比例 * 标准数100 举个例子,假设一家外语学校里面有家烧烤店,每天晚上男生和女生顾客都是50%,你觉得男生还是女生更倾向于光顾这个烧烤店呢?...

    分类:技术文章 时间:2021-10-26 09:50 我要评论(0个)

  • 3463180 views阅读

    APP卸载量统计方案

    APP统计过程中看的最多的要属激活,但随着运营成本的不断上升,一定程度上我们期望获得有多少用户卸载了APP。分析App卸载情况是刚需,但如何对卸载情况进行统计却没有非常成熟的解决方案。以下整理的是一些实现方案: 基于系统底层的卸载统计 华为分析服务的统计逻辑 华为分析服务中包含了卸载分析服务。具体实现方案为通过分析服务系统的广播行为,准确捕捉App卸载事件。当用户卸载App之后,将卸载信息...

    分类:技术文章 时间:2021-10-19 14:30 我要评论(0个)

  • 11562190 views阅读

    用户体系搭建之ID-Mapping

    ID-Mapping简介 在推进用户画像和风险控制时,遇到的最大的问题是用户身份信息的混乱: 相同设备,不同账号间切换 相同用户,不同渠道下账号不相同,如微信小程序和APP 同个用户,在不同的设备商登录 … ID-Mapping是大数据分析中非常基本但又关键的环节,ID-Mapping通俗的说就是把几份不同来源的数据,通过各种技术手段识别为同一个对象或主题,例如同一台设备(直接),同一...

    分类:技术文章 时间:2021-09-28 11:36 我要评论(0个)

  • 5837550 views阅读

    使用SQL统计箱形图数据

    箱形图常用于数据的可视化,先前的文章中介绍过使用Python生成箱形图。箱形图中通常包含的数据有: 最小值(不包含异常值)Lower Whisker = Q1-1.5(Q3-Q1) 最大值(不包含异常值)Upper Whisker = Q3+1.5(Q3-Q1) 平均值(可通过设置显示) 中位数 下四分位Q1 上四分位Q3 除了可视化外,箱型图有时也会用于异常检测等场景。今天主要介绍...

    分类:技术文章 时间:2021-09-06 11:35 我要评论(0个)

  • 2877473 views阅读

    Python自动化之定时任务

    在日常工作中,我们常常会用到需要周期性执行的任务,一种方式是采用Linux系统自带的crond结合命令行实现。另外一种方式是直接使用Python。接下里整理的是常见的Python定时任务的实现方式。 利用while True: + sleep()实现定时任务 位于 time 模块中的 sleep(secs) 函数,可以实现令当前执行的线程暂停 secs 秒后再继续执行。所谓暂停,即令当前...

    分类:技术文章 时间:2021-09-03 15:29 我要评论(0个)