聚合国内IT技术精华文章,分享IT技术精华,帮助IT从业人士成长

  • 335 views阅读

    CentOS 7安装Docker记录

    目前很多开源的工具与软件都可以使用Docker进行部署测试,比如先前写的使用Docker安装多用户版的JupyterHub 今天主要分享的是CentOS 7环境下安装Docker CE的过程,非常简单,具体流程如下:# 卸载旧版本Docker sudo ...

    分类:技术文章 时间:2020-05-24 21:20 我要评论(0个)

  • 603 views阅读

    使用Python检测符号及乱码字符

    最近在进行关键词的分析,中间涉及到对一些特殊的字符进行过滤的需求。包括带符号的(有部分还是SQL注入),并且存在一部分乱码的问题。梳理下来供后续使用。 检测字符串是否包含特殊符号 方案一:通过字符匹配的方式进行判定def if_contain_symbol...

    分类:技术文章 时间:2020-05-18 23:48 我要评论(0个)

  • 1091 views阅读

    WordPress LaTeX插件更换记录

    由于自己的博客要插入很多的公式,所以需要依赖LaTeX插件来帮忙实现。先前一直使用的是WP QuickLaTeX。但经过使用发现其性能随着文章量的增加越来越慢。 原因是WP QuickLaTeX会将公式提前生成图片,图片存储在 /wp-content/ql...

    分类:技术文章 时间:2020-02-21 18:56 我要评论(0个)

  • 1386 views阅读

    Docker容器内多用户版JupyterHub支持GPU

    前一篇文章介绍了Docker下安装多用户版的JupyterHub,但安装完毕后会遇到一个问题:Docker内无法使用GPU,这对JupyterHub来说是致命的。今天就来一起梳理下如何解决这个问题。 nvidia-docker 原以为nvidia dock...

    分类:技术文章 时间:2019-12-28 23:30 我要评论(0个)

  • 1674 views阅读

    使用Docker安装多用户版的JupyterHub

    宿主服务器使用的是Ubuntu 18.04,需要注意的是Docker目前不支持Ubuntu 19.10。如要在19.10中使用Docker需要在Docker源配置时设置Ubuntu 18.04的版本标识:bionic。deb [arch=amd64] ht...

    分类:技术文章 时间:2019-12-15 23:30 我要评论(0个)

  • 1556 views阅读

    使用tqdm显示Python代码执行进度

    在使用Python执行一些比较耗时的操作时,为了方便观察进度,通常使用进度条的方式来可视化呈现。Python中的tqdm就是用来实现此功能的。 先来看看tqdm的进度条效果: tqdm的基本用法 tqdm最主要的用法有3种,自动控制、手动控制或者用于脚本...

    分类:技术文章 时间:2019-12-07 11:30 我要评论(0个)

  • 1448 views阅读

    WordPress又被黑了,解决方案记录

    过了一个周末,今天整个网站打开无样式,后台无法打开,直接跳转到其他网站,才意识到网站可能被黑了。查看源代码: 初步分析是WordPress的站点设置被修改: 由于当前状况下后台无法登录,所以解决办法是登录服务器,修改主题文件夹下的function.ph...

    分类:技术文章 时间:2019-11-18 23:50 我要评论(0个)

  • 2137 views阅读

    Python数据可视化之词云wordcloud

    Wordcloud是一个生成词云的Python包,可以以词语为基本单位更加直观和艺术的展示文本,呈现效果类似标签云。这里主要讲解下如何使用。 wordcloud使用文档 所有函数均封装在WordCloud类里: WordCloud([…]) ...

    分类:技术文章 时间:2019-10-23 23:30 我要评论(0个)

  • 1948 views阅读

    条件随机场(CRF)及CRF++安装使用

    CRF简介 CRF是用来标注和划分序列结构数据的概率化结构模型。言下之意,就是对于给定的输出,标识序列Y和观测序列X,条件随机场通过定义条件概率P(Y | X),而不是联合概率分布P(X, Y)来描述模型。 设G = (V, E)为一个无向图,V为结点集合...

    分类:技术文章 时间:2019-10-23 23:30 我要评论(0个)

  • 2062 views阅读

    Python短文本分类:LibShortText和TextGrocery

    LibShortText LibShortText是一个开源的Python短文本(包括标题、短信、问题、句子等)分类工具包。它在LibLinear的基础上针对短文本进一步优化,主要特性有: 支持多分类 直接输入文本,无需做特征向量化的预处理 二元分词(B...

    分类:技术文章 时间:2019-10-23 23:30 我要评论(0个)

  • 2571 views阅读

    Python因子分解库:fastFM

    FastFM简介 FastFM的主要特点是将是将因子分解封装成scikit-learn API接口,核心代码使用C编写,性能有一定的保障。fastFM主要提供了回归、分类、排序三种问题的解决方法。其中对于优化器,有als,mcmc,sgd三种,Loss f...

    分类:技术文章 时间:2019-10-18 23:15 我要评论(0个)

  • 1552 views阅读

    使用Python进行中文繁简转换

    中文繁体、简体的差异,在NPL中类似英文中的大小写,但又比大小写更为复杂,比如同样为繁体字,大陆、香港和台湾又不一样。先前写过一篇中文繁简转换的文章,感觉写的不太详细,今天就针对Python下如何使用做进一步的记录。 OpenCC(Open Chinese...

    分类:技术文章 时间:2019-10-18 23:15 我要评论(0个)