聚合国内IT技术精华文章,分享IT技术精华,帮助IT从业人士成长

  • 1572591 views阅读

    我看ChatGPT: 为啥谷歌掉了千亿美金

    两个月前,我试着想用 ChatGPT 帮我写篇文章《eBPF 介绍》,结果错误百出,导致我又要从头改一遍,从那天我觉得 ChatGPT 生成的内容完全不靠谱,所以,从那天开始我说我不会再用 ChatGPT 来写文章(这篇文章不是由 ChatGPT 生成),因为,在试过一段时间后,我对 ChatGTP 有基于如下的认识: ChatGPT 不是基于事实,是基于语言模型的,事实对他来说不重要...

    分类:技术文章 时间:2023-02-13 22:33 我要评论(0个)

  • 4407679 views阅读

    大数据基础:Google MapReduce

    Google,作为全球最大的搜索引擎公司,其伟大之处不仅在于建立了一个强大的搜索引擎,还在于它创造了3项革命性的技术,即:GFS、MapReduce 和 BigTable。作为 Google 早期三驾马车,这三项革命性的技术不仅在大数据领域广为人知,更直接或间接性的推动了大数据、云计算、乃至如今火爆的人工智能领域的发展。 2004年12月5日,Google 在美国旧金山召开的第6届操作系统...

    分类:技术文章 时间:2022-01-05 13:00 我要评论(0个)

  • 3319903 views阅读

    大数据基础:Google GFS

    GFS系统简介 Google 文件系统(Google File System,缩写为 GFS 或 GoogleFS),一种由 Google 公司开发专有分布式文件系统。 它与传统文件系统的的区别在于: 分布式 – 提供很高的横向扩展性 使用大量廉价的普通机器组成网络 – 允许单机故障 不允许任意更改已有文件 (No Random Write) Google并没...

    分类:技术文章 时间:2022-01-01 16:52 我要评论(0个)

  • 4134764 views阅读

    大数据基础:Google BigTable

    Bigtable是2005年谷歌的论文:《Bigtable: A Distributed Storage System for Structured Data》中介绍的一种分布式存储系统,后来被Hadoop社区实现为HBase。读懂这篇论文,那么理解HBase也就非常容易了。 摘要(Abstract) Bigtable是一个分布式存储系统,它被设计来为近万台商用服务器规模的、PB级别的数...

    分类:技术文章 时间:2022-01-01 16:52 我要评论(0个)

  • 3416844 views阅读

    Google Protocol Buffers使用指南

    Protocol Buffers简介 Protocol Buffers 是一种语言中立,平台无关,可扩展的序列化数据的格式,可用于通信协议,数据存储等。序列化是将结构数据或对象转换成能够被存储和传输(例如网络传输)的格式,同时应当要保证这个序列化结果在之后(可能在另一个计算环境中)能够被重建回原来的结构数据或对象。 在序列化结构化数据的机制中,ProtoBuf是灵活、高效、自动化的,相对常...

    分类:技术文章 时间:2021-11-19 00:35 我要评论(0个)

  • 1955724 views阅读

    通过Google Search Appliance了解Google

    什么是Google Search Appliance Google Search Appliance是先前Google销售的一款小型搜索服务器,可以帮助你快速的搭建一套搜索引擎系统。它实际了一款个小型的Google,里面包含的Google的搜索算法等,你可以用它来做自己的站内搜索引擎,但更加有用的是你可以通过这台机器去研究Google蜘蛛的运行规律,去改变网页上的内容来达到最佳的SEO效果...

    分类:技术文章 时间:2021-06-19 10:11 我要评论(0个)

  • 3526281 views阅读

    常见分布式应用系统设计图解(九):协同编辑系统

    这里讲的 “协同编辑”,指的是 “Collaborative Editing”,多个人同时一起编辑同一个文件,比如说 Google Docs,国内的有有道云协作、石墨文档之类的。这样的系统倒不如我们前面提到的那些应用系统那么 “火”,但是,依然具备相当的典型性。 第一印象,这样的一个系统,我们可以简单做出如下归类: 这是一个文件编辑系统,这是最最基础的一个功能性需求,它就好像是...

    分类:技术文章 时间:2020-11-13 03:45 我要评论(0个)

  • 2473298 views阅读

    常见分布式应用系统设计图解(七):爬虫搜索系统

    互联网搜索引擎都有爬虫系统,无论是 Google 还是百度。当然这里我们讨论的只是一个极其简单的版本。 对于爬到的资源,我们这里其实讨论的只是文本而已,还有图片、音频、视频这些媒体,如果我们也需要存下来,那就需要专门的媒体服务。对于媒体文件的存放,在之前的文中已经讨论过,这里就不再覆盖了。 上半部分是爬取的过程,Page Fetcher 根据 URL 队列里面的事件来去...

    分类:技术文章 时间:2020-10-01 00:07 我要评论(0个)

  • 2808402 views阅读

    常见分布式应用系统设计图解(四):输入提示系统

    输入提示系统,指的就是 “typeahead”,比如 Google 搜索,输入一个单词的前几个字母,后面最常用的几个搜索词会被联想出来。有时,它也需要具备一定程度的字符拼写错误自动更正能力。 比如上面这张截图,我输入了 “goog”,在输入框的下方列出了最常见的几个以 goog 开头的搜索短语。 这个功能可以说不是搜索系统的核心功能,而且要求响应一定要非常迅速,...

    分类:技术文章 时间:2020-09-13 01:05 我要评论(0个)

  • 1893802 views阅读

    开源巨献:2017 年 Google 开源了这些超赞的项目

    春节小长假,走亲访友之余,还可以利用一些零碎的时间收集学习资料,给自己充充电,好在 2018 年成为更优秀的自己。我们知道在开源和贡献开源方面,Google 一直是行业的典范。2017 年它开源了哪些优秀的软件,有哪些值得我们借鉴学习呢?让我们一起来看下:   1、硬件加速的机器学习 JavaScript 库 DeepLearn.js DeepLearn.js 是 Google...

    分类:技术文章 时间:2018-02-22 16:45 我要评论(0个)

  • 3501895 views阅读

    CentOS 使用谷歌身份验证器做二次认证

    文章转自http://www.he11oworld.com/system/2883.html向原作者标识感谢本文部分内容有所变更进行了修正处理。谷歌身份验证器生成的是动态验证码,默认30秒更新。修改配置,SSH登录必须在输入密码之前输入动态验证码。即使账号和密码泄露,验证码输入错误,仍然无法登录。苹果或者安卓手机端可以安装身份验证器App读取验证码。谷歌身份认证器也有其它PHP,JAVA等...

    分类:技术文章 时间:2017-05-20 10:55 我要评论(0个)

  • 2024713 views阅读

    全球分布式数据库:Google Spanner(论文翻译)

    【伯乐在线转注:】Google Spanner 论文发布于 2012 年。这个版本的论文翻译,出自厦门大学计算机系教师林子雨。翻译质量很高,linbindong 对改版极少数翻译得不太恰当的地方做了修改。以下是正文。 【摘要】Spanner 是谷歌公司研发的、可扩展的、多版本、全球分布式、同步复制数据库。它是第一个把数据分布在全球范围内的系统,并且支持外部一致性的分布式事务。本文描述了 ...

    分类:技术文章 时间:2017-02-16 23:55 我要评论(0个)