聚合国内IT技术精华文章,分享IT技术精华,帮助IT从业人士成长

  • 1246713 views阅读

    Linux树型结构文件系统

    对于每一个Linux学习者来说,了解Linux文件系统的目录结构,是学好Linux的至关重要的一步。深入了解Linux文件目录结构的标准和每个目录的详细功能,对于我们用好Linux系统非常重要。 文件系统的是用来组织和排列文件存取的,所以它是可见的,在Linux中,我们可以通过ls等工具来查看其结构,在Linux系统中,我们见到的都是树形结构;比如操作系统安装在一个文件系统中,他表现为由/...

    分类:技术文章 时间:2022-08-06 23:29 我要评论(0个)

  • 951432 views阅读

    开源分布式查询引擎Presto

    h2>Presto是什么? Presto是Facebook开源的MPP(Massive Parallel Processing)SQL引擎,其理念来源于一个叫Volcano的并行数据库,该数据库提出了一个并行执行SQL的模型,它被设计为用来专门进行高速、实时的数据分析。Presto是一个SQL计算引擎,分离计算层和存储层,其不存储数据,通过Connector SPI实现对各种数据源(Sto...

    分类:技术文章 时间:2022-03-30 00:44 我要评论(0个)

  • 1237616 views阅读

    使用zimg搭建图片服务器

    一般的大型网站都会将图片存放在专门的服务器,这样可以很好的提升网站的性能。比较简单的方式是采用云厂商提供的服务,比如七牛云、又拍云等。今天要介绍的是一款开源的实现方案zing。 zimg简介 zimg是一套国人针对图片处理服务器而设计开发的开源程序,目的是解决图片服务中如下三个问题: 大流量:对于一些中小型网站来说,流量问题就是成本问题,图片相对于文本来说流量增加了一个数量级,省下的每一...

    分类:技术文章 时间:2021-11-20 09:08 我要评论(0个)

  • 863244 views阅读

    Python图形界面框架PyQt5

    使用Python开发图形界面的软件其实并不多,相对于GUI界面,可能Web方式的应用更受人欢迎。但对于像我一样对其他编程语言你如C#或WPF来说未必不是一个好的工具。 常见GUI框架 PyQt5:Qt是一个跨平台的 C++图形用户界面库。QT一度被诺基亚拥,后出售给芬兰的软件公司Digia Oyj。PyQt5是基于Digia公司Qt5的Python接口,由一组Python模块构成。PyQ...

    分类:技术文章 时间:2021-10-10 18:21 我要评论(0个)

  • 953900 views阅读

    Python Word处理文档:python-docx

    python-docx 是用于创建可修改微软 Word(.docx) 的一个 Python 库。个人觉得平时使用的场景不多,最近在学习自动化办公看到的内容,仅做一些简单的梳理。 python-docx的文档拆解 python-docx将整个文档看做是一个Document对象,其基本结构如下: 每个Document包含许多个代表“段落”的Paragraph对象,存放在paragraphs...

    分类:技术文章 时间:2021-09-23 23:14 我要评论(0个)

  • 1043670 views阅读

    规则引擎在哔哩哔哩的应用

    最近在整理规则引擎相关的知识点,看到Bilibi的相关文章,稍微整理出来供参考。Bilibili目前已经将其开发的规则引擎gengine开源了,有兴趣的朋友可以深入研究下。 由于自己对Golang不了解,所以这里不会涉及到具体的代码实现层面的内容,这里主要整理的是其开发思路。 规则引擎在B站的应用场景 随着对业务理解的不断深入和抽象,很多业务场景的功能(代码)都可以抽象成“规则+指标”的模...

    分类:技术文章 时间:2021-09-10 11:35 我要评论(0个)

  • 526607 views阅读

    Python自动化之定时任务

    在日常工作中,我们常常会用到需要周期性执行的任务,一种方式是采用Linux系统自带的crond结合命令行实现。另外一种方式是直接使用Python。接下里整理的是常见的Python定时任务的实现方式。 利用while True: + sleep()实现定时任务 位于 time 模块中的 sleep(secs) 函数,可以实现令当前执行的线程暂停 secs 秒后再继续执行。所谓暂停,即令当前...

    分类:技术文章 时间:2021-09-03 15:29 我要评论(0个)

  • 918715 views阅读

    自然语言分析之汉字转拼音

    在自然语言的处理中语义分析中,除了需要拆解字形外,字音有时也能表示含义。另外,在搭建搜索引擎时在搜索词query分析是也会的用到汉字转拼音或拼音转汉字的场景。 Python已经有很多包支持类似的功能,整理出来供后续使用。 pypinyin 主要有三个方法: pinyin() 将汉字转换为拼音,返回汉字的拼音列表。 def pinyin(hans, style=Style.TONE, he...

    分类:技术文章 时间:2021-08-07 15:34 我要评论(0个)

  • 973771 views阅读

    WordPress LaTeX插件的安装与使用

    LaTeX简介 LaTeX 是一个强大的排版工具,一般场景很少会接触,但是在数学领域却用的非常的多,主要原因是他可以非常方便的生成各种数学公式。想要学会怎么使用LaTeX只需学会几个简单的概念即可。 显示模式 显示模式主要控制你是否需要将公式内容显示在正文行间还是单独的一行,采用的方法非常简单,就是公司内容放入$符号当中。 行内模式:$ … $ 行间模式:$$ … $$ 上下标 使用...

    分类:技术文章 时间:2021-08-07 15:34 我要评论(0个)

  • 829424 views阅读

    自然语言分析之汉字拆解

    汉字是记录汉语的文字。汉字对发展中华民族的优秀文化起了重大的作用。汉字是世界上最古老的文字之一。汉字以象形字为基础,形、音、义、结合于一体,成为独特的方块形的表意体系的文字。 汉字的特点: 汉字的主要特点是它属于表意体系的文字。 一个汉字的读音是一个音节,但汉字不是一节文字。从汉字的象形、指事、会意等造字法可以证明汉字是从意义入手创造出来的。从甲骨文到楷书,一脉相承,字体改变了,但文字...

    分类:技术文章 时间:2021-07-23 22:02 我要评论(0个)

  • 1278286 views阅读

    比t-SNE更好的降维算法UMAP

    针对高维数据的降维,先前使用的是t-SNE。无意中接触到umap,发现还是蛮有啥意思的。整理了一些资料供以后深入研究。 UMAP简介 UMAP ,全称uniform manifold approximation and projection,统一流形逼近与投影,是基于黎曼几何和代数拓扑的理论框架结构构建的。在处理大数据集时,UMAP优势明显,运行速度更快,内存占用小。UMAP是一种降维技术...

    分类:技术文章 时间:2021-07-08 00:13 我要评论(0个)

  • 766749 views阅读

    分布式全局唯一ID生成方案

    在复杂分布式系统中,往往需要对大量的数据和消息进行唯一标识。对数据分库分表后需要有一个唯一ID来标识一条数据或消息,数据库的自增ID显然不能满足需求此时一个能够生成全局唯一ID的系统是非常必要的。概括下来,那业务系统对ID号的要求有哪些呢? 全局唯一性:不能出现重复的ID号。 趋势递增:在MySQL InnoDB引擎中使用的是聚集索引,由于多数RDBMS使用B-tree的数据结构来存储索...

    分类:技术文章 时间:2021-06-10 16:58 我要评论(0个)