聚合国内IT技术精华文章,分享IT技术精华,帮助IT从业人士成长

  • 357 views阅读

    过劳死和穷死,你希望哪一个先来?(二)

    「努力活着」 当你有一个机会可以过上朝九晚五的轻松生活,我劝你考虑清楚要不要抓住,打鸡血并不适合每一个人。 ♫ 前言       当几位拼多多员工悲伤离世、拼多多退出央视春晚红包合作项目的新闻已经...

    分类:技术文章 时间:2021-01-31 02:15 我要评论(0个)

  • 591 views阅读

    过劳死和穷死,你希望哪一个先来?(一)

    最近又有两位拼多多的员工去世,而这距离上一个商汤科技的一位技术岗员工英年早逝才刚过了几周。 你没看错,是两个拼多多的员工!其中最近的一个,是昨天(2021年1月9日)才跳楼自杀的! 拼多多的工作强度就不说了,只要你是一个互联网人,一定会听说有多可怕。99...

    分类:技术文章 时间:2021-01-10 04:16 我要评论(0个)

  • 847 views阅读

    这都快一年了,英美等一众西方国家还停留在第一集

    这几天看了一些新闻,真是让人感慨。当我们在中国大陆这边岁月静好的时候,英美等一众西方国家正陷入COVID-19的新一轮狂暴之中。 伦敦大逃亡 比如,在12月19日星期六,英国政府宣布重新封锁伦敦和英国东南部一些地区,希望能够减...

    分类:技术文章 时间:2020-12-21 05:28 我要评论(0个)

  • 1372 views阅读

    如何把别人共享的Google Drive目录完整拷贝到自己的Google Drive里

    假设别人共享了一个Google云端硬盘(Google Drive)的目录,里面有很多大文件,你想把这个目录拷贝到自己的Google Drive里,那么,把它们全部下载到本地、再上传到自己的Google Drive里的做法未免太傻了一点—&...

    分类:技术文章 时间:2020-12-09 23:10 我要评论(0个)

  • 876 views阅读

    使用Apache DataFu中的Coalesce()简化Apache Pig的三元运算符

    来看这个例子。有数据文件 1.txt,内容为: a[t][t]c [t]f[t]g h[t]k[t] [t][t][t] 其中 [t] 表示制表符(tab),并不是真的在文件中写了 [t]。 在Pig命令...

    分类:技术文章 时间:2020-12-04 11:53 我要评论(0个)

  • 1669 views阅读

    推荐一款编写数学公式的国产神器:AxMath,可与LATEX双向转换

    我一直都很佩服那些可以直接用LATEX语法打出各种复杂数学公式的人,反正我是记不住,而且也真的不想去记LATEX语法。 比如这个公式: 有的人能直接用LATEX手写出来: left( sum_{i=1}^n{a_ib_i} right) ^2leq...

    分类:技术文章 时间:2020-10-25 10:24 我要评论(0个)

  • 2108 views阅读

    selenium-java的wait.until(ExpectedConditions)编译出错问题

    代码示例: wait.until(ExpectedConditions.alertIsPresent()); Alert alert = driver.switchTo().alert(); alert.accept...

    分类:技术文章 时间:2020-08-25 18:45 我要评论(0个)

  • 1987 views阅读

    Java以追加内容(append)的方式写HDFS文件

    首先要Hadoop版本支持,其次要配置hdfs-site.xml文件: <property>     <name>dfs.support.append</name> &...

    分类:技术文章 时间:2020-08-10 18:15 我要评论(0个)

  • 1678 views阅读

    使用 fastText 做中文文本分类(2)

    查看本系列文章合集,请看这里。 做好文本预处理,才能输入fastText训练一个效果好的模型出来。 ✓ 原文示例 有时我们拿到的源数据是很粗糙的,带有很多会影响模型效果的内容,例如下面这样: <p>罗望子,是豆科酸豆属唯一的种,是...

    分类:技术文章 时间:2020-07-29 21:02 我要评论(0个)

  • 1725 views阅读

    使用 fastText 做中文文本分类(3)

    查看本系列文章合集,请看这里。 为 training 数据做标注,这可能是一个艰巨的任务,也可能是一个有捷径的任务。 有时候,我们可以依据一些已知的规则来标注文本,比如不同的数据是从不同的来源获取到的,从来源可以知道它们所属的类别,这是一个捷径。不过我这里...

    分类:技术文章 时间:2020-07-29 21:02 我要评论(0个)

  • 1750 views阅读

    使用 fastText 做中文文本分类(4)

    查看本系列文章合集,请看这里。 ✓ 开始训练第一个文本分类模型 标注好的数据,其格式为: __label__科技 月 10 日 网通 社从 高合 汽车 获悉 华人 运通 微软 2020 世界 人工智能 大会 云端 峰会 WAIC 2020...

    分类:技术文章 时间:2020-07-29 21:02 我要评论(0个)

  • 2000 views阅读

    使用 fastText 做中文文本分类(5)

    查看本系列文章合集,请看这里。 前面说的模型训练、预测过程,是用 fastText 可执行程序完成的。fastText提供了Python的接口,同样的功能也可以用Python实现。如果数据量比较小,单机做文本分类没啥问题。但我的数据量比较大,几十G的文本数...

    分类:技术文章 时间:2020-07-29 21:02 我要评论(0个)