聚合国内IT技术精华文章,分享IT技术精华,帮助IT从业人士成长

  • 2792334 views阅读

    CentOS 7.2 安装 PHP 7 记录

    PHP 7 极大地改进了性能,在一些WordPress基准测试当中,性能可以达到PHP 5.6的3倍。为了体验到更好的性能,尝试在自己的VPS使用最新的PHP 7,以下为整理的安装方法,期望对需要安装的小伙伴们有所帮助。 使用Yum安装PHP 7 php 7.0有两个源可以选择,一个是webtatic提供的,也就是php70w,那个w指得就是webtatic,另一个可以使用remi源。这里...

    分类:技术文章 时间:2016-12-02 08:50 我要评论(0个)

  • 2798491 views阅读

    MongoDB在Windows上的安装及使用

    MongoDB作为非关系型数据库的代表,非常适合存储一些非结构化数据,本着以了解及研究为目的,在Windows机器上尝试了安装,发现中间还是有许多可以分享的点。 MongoDB的安装 本以为安装是一件非常简单的事,但执行过程中却卡在了下载安装包。在官方的下载中心:https://www.mongodb.com/download-center 选择对应版本下载时,下载页面一直返回404。没有...

    分类:技术文章 时间:2016-11-26 15:55 我要评论(0个)

  • 2627948 views阅读

    使用Python连接PostgreSQL

    Python中可以用来连接PostgreSQL的模块很多,这里比较推荐psycopg2。psycopg2安装起来非常的简单(pip install psycopg2),这里主要重点介绍下如何使用。 连接数据库:import psycopg2 conn = psycopg2.connect(host="10.100.157.168",user="postgres",password="po...

    分类:技术文章 时间:2016-11-26 15:55 我要评论(0个)

  • 2730698 views阅读

    CentOS 7.2 安装 Nginx 1.10.2 记录

    最近由于要切换VPS,所以打算使用最新的系统进行搭建LNMP,以下为CentOS 7.2安装Nginx 1.10.2的安装记录,记录下以便下次再使用。先前的文章中已经介绍过阿里的Tengine的安装流程,也可以参考下。 使用Yum安装(推荐) 使用Yum安装是推荐的方式,整体的流程非常的简单,也不容易出错,如果不需要什么特殊配置,建议使用Yum尽进行安装。 1、安装epel-release...

    分类:技术文章 时间:2016-11-23 19:40 我要评论(0个)

  • 3248428 views阅读

    Centos 7.2安装Percona记录

    针对MySQL衍生版本选择MariaDB还是Percona目前还有很多不一致的观点,上一篇文章讲了如何在Centos 7.2系统上安装最新的MariaDB 10.1.19,这篇文章再来讲解下如何在CentOS 7.2上安装最新的 Percona 5.7。 方案一:通过yum安装 安装Percona源:yum install http://www.percona.com/downloads/...

    分类:技术文章 时间:2016-11-22 20:50 我要评论(0个)

  • 2690915 views阅读

    Linux下文件的压缩与解压缩

    Linux下文件的压缩与解压缩与Windows环境下有较大的区别,在Windows下只需要安装类似Winrar工具就能解压缩大部分文件,而在Linux命令行下每一种文件都有不同的压缩和解压缩方法。 使用tar打包文件 Linux下最常用的打包程序就是tar(注意tar是打包,不是压缩!),使用tar程序打出来的包我们常称为tar包,tar包文件的命令通常都是以.tar结尾的。生成tar包后...

    分类:技术文章 时间:2016-11-22 20:50 我要评论(0个)

  • 3464450 views阅读

    Centos 7.2 安装MariaDB笔记

    MariaDB是MySQL的一个衍生版,关于MariaDB的介绍,可以回顾下:MySQL分支的选择:Percona还是MariaDB CentOS 7.2源中自带的MariaDB版本是5.5系列,该系列的innodb引擎依然不支持full-text,这次要安装的是支持full-text的最新稳定版本10.1.19。 首先先是常规操作:yum update yum install epel...

    分类:技术文章 时间:2016-11-20 23:30 我要评论(0个)

  • 2749808 views阅读

    自然语言处理之词性标注集

    词性标注(Part-of-Speech tagging 或POS tagging),又称词类标注或者简称标注,是指为分词结果中的每个单词标注一个正确的词性的程序,也即确定每个词是名词、动词、形容词或其他词性的过程。词主要可以分为以下2类: 实词:名词、动词、形容词、状态词、区别词、数词、量词、代词 虚词:副词、介词、连词、助词、拟声词、叹词。 这篇文章梳理的不是如何进行词性标注,而是介...

    分类:技术文章 时间:2016-10-30 06:20 我要评论(0个)

  • 3530506 views阅读

    在Python中调用Java扩展包:HanLP

    最近在研究中文分词及自然语言相关的内容,关注到JAVA环境下的HanLP,HanLP是一个致力于向生产环境普及NLP技术的开源Java工具包,支持中文分词(N-最短路分词、CRF分词、索引分词、用户自定义词典、词性标注),命名实体识别(中国人名、音译人名、日本人名、地名、实体机构名识别),关键词提取,自动摘要,短语提取,拼音转换,简繁转换,文本推荐,依存句法分析(MaxEnt依存句法分析、...

    分类:技术文章 时间:2016-10-30 06:20 我要评论(0个)

  • 2609095 views阅读

    Quora在自然语言处理上的所做的工作

    问答网站最核心的内容是提供给优质的内容,如何让内容更加优质,处理分析大量的文本数据也是必不可少的工作。Quora有大量的文本数据,分布在Quora的数百万个问题、答案和评论中。不仅如此,还有大量的元数据来补充我问答,包括”赞”和”踩”,用户对话题的兴趣或擅长与否,问题和话题的关系,话题去重合并,用户的社交和关系和影响力幅射,以及用户在Quor...

    分类:技术文章 时间:2016-10-20 12:20 我要评论(0个)

  • 3513784 views阅读

    Elasticsearch分词插件的安装

    Elasticsearch分析器原理 在安装分词工具前我们需要先了解下一个概念:分析器(Analyzer)。分析器是三个顺序执行的组件的结合(字符过滤器,分词器,标记过滤器)。即分词器包含在分析器中。分析器的内部就是一条流水线: Step 1 字符过滤器(Character filters) Step 2 分词器 (Tokenization) Step 3 标记过滤器(Token fil...

    分类:技术文章 时间:2016-10-06 08:10 我要评论(0个)

  • 2795192 views阅读

    使用余弦定理计算文本相似度

    什么是余弦定理 学过向量代数的人都知道,向量实际上是多维空间中有方向的线段。如果两个向量的方向一致,即夹角接近零,那么这两个向量就相近。而要确定两个向量方向是否一致,这就要用到余弦定理计算向量的夹角了。 余弦定理对我们每个人都不陌生,它描述了三角形中任何一个夹角和三个边的关系,换句话说,给定三角形的三条边,我们可以用余弦定理求出三角形各个角的角度。假定三角形的三条边为 a, b 和 c,对...

    分类:技术文章 时间:2016-09-30 16:35 我要评论(0个)