聚合国内IT技术精华文章,分享IT技术精华,帮助IT从业人士成长

  • 8787 views阅读

    CentOS 7.2 安装 PHP 7 记录

    PHP 7 极大地改进了性能,在一些WordPress基准测试当中,性能可以达到PHP 5.6的3倍。为了体验到更好的性能,尝试在自己的VPS使用最新的PHP 7,以下为整理的安装方法,期望对需要安装的小伙伴们有所帮助。 使用Yum安装PHP 7 php ...

    分类:技术文章 时间:2016-12-02 08:50 我要评论(0个)

  • 5437 views阅读

    MongoDB在Windows上的安装及使用

    MongoDB作为非关系型数据库的代表,非常适合存储一些非结构化数据,本着以了解及研究为目的,在Windows机器上尝试了安装,发现中间还是有许多可以分享的点。 MongoDB的安装 本以为安装是一件非常简单的事,但执行过程中却卡在了下载安装包。在官方的下...

    分类:技术文章 时间:2016-11-26 15:55 我要评论(0个)

  • 5945 views阅读

    使用Python连接PostgreSQL

    Python中可以用来连接PostgreSQL的模块很多,这里比较推荐psycopg2。psycopg2安装起来非常的简单(pip install psycopg2),这里主要重点介绍下如何使用。 连接数据库:import psycopg2 conn =...

    分类:技术文章 时间:2016-11-26 15:55 我要评论(0个)

  • 7582 views阅读

    CentOS 7.2 安装 Nginx 1.10.2 记录

    最近由于要切换VPS,所以打算使用最新的系统进行搭建LNMP,以下为CentOS 7.2安装Nginx 1.10.2的安装记录,记录下以便下次再使用。先前的文章中已经介绍过阿里的Tengine的安装流程,也可以参考下。 使用Yum安装(推荐) 使用Yum安...

    分类:技术文章 时间:2016-11-23 19:40 我要评论(0个)

  • 6064 views阅读

    Centos 7.2安装Percona记录

    针对MySQL衍生版本选择MariaDB还是Percona目前还有很多不一致的观点,上一篇文章讲了如何在Centos 7.2系统上安装最新的MariaDB 10.1.19,这篇文章再来讲解下如何在CentOS 7.2上安装最新的 Percona 5.7。 ...

    分类:技术文章 时间:2016-11-22 20:50 我要评论(0个)

  • 4754 views阅读

    Linux下文件的压缩与解压缩

    Linux下文件的压缩与解压缩与Windows环境下有较大的区别,在Windows下只需要安装类似Winrar工具就能解压缩大部分文件,而在Linux命令行下每一种文件都有不同的压缩和解压缩方法。 使用tar打包文件 Linux下最常用的打包程序就是tar...

    分类:技术文章 时间:2016-11-22 20:50 我要评论(0个)

  • 7668 views阅读

    Centos 7.2 安装MariaDB笔记

    MariaDB是MySQL的一个衍生版,关于MariaDB的介绍,可以回顾下:MySQL分支的选择:Percona还是MariaDB CentOS 7.2源中自带的MariaDB版本是5.5系列,该系列的innodb引擎依然不支持full-text,这次要...

    分类:技术文章 时间:2016-11-20 23:30 我要评论(0个)

  • 4462 views阅读

    自然语言处理之词性标注集

    词性标注(Part-of-Speech tagging 或POS tagging),又称词类标注或者简称标注,是指为分词结果中的每个单词标注一个正确的词性的程序,也即确定每个词是名词、动词、形容词或其他词性的过程。词主要可以分为以下2类: 实词:名词、动...

    分类:技术文章 时间:2016-10-30 06:20 我要评论(0个)

  • 6104 views阅读

    在Python中调用Java扩展包:HanLP

    最近在研究中文分词及自然语言相关的内容,关注到JAVA环境下的HanLP,HanLP是一个致力于向生产环境普及NLP技术的开源Java工具包,支持中文分词(N-最短路分词、CRF分词、索引分词、用户自定义词典、词性标注),命名实体识别(中国人名、音译人名、...

    分类:技术文章 时间:2016-10-30 06:20 我要评论(0个)

  • 4838 views阅读

    Quora在自然语言处理上的所做的工作

    问答网站最核心的内容是提供给优质的内容,如何让内容更加优质,处理分析大量的文本数据也是必不可少的工作。Quora有大量的文本数据,分布在Quora的数百万个问题、答案和评论中。不仅如此,还有大量的元数据来补充我问答,包括”赞”和&#...

    分类:技术文章 时间:2016-10-20 12:20 我要评论(0个)

  • 8960 views阅读

    Elasticsearch分词插件的安装

    Elasticsearch分析器原理 在安装分词工具前我们需要先了解下一个概念:分析器(Analyzer)。分析器是三个顺序执行的组件的结合(字符过滤器,分词器,标记过滤器)。即分词器包含在分析器中。分析器的内部就是一条流水线: Step 1 字符过滤器...

    分类:技术文章 时间:2016-10-06 08:10 我要评论(0个)

  • 4441 views阅读

    使用余弦定理计算文本相似度

    什么是余弦定理 学过向量代数的人都知道,向量实际上是多维空间中有方向的线段。如果两个向量的方向一致,即夹角接近零,那么这两个向量就相近。而要确定两个向量方向是否一致,这就要用到余弦定理计算向量的夹角了。 余弦定理对我们每个人都不陌生,它描述了三角形中任何一...

    分类:技术文章 时间:2016-09-30 16:35 我要评论(0个)