最好的学习方式就是输入之后再输出,分享一个自己学习scrapy框架的小案例,方便快速的掌握使用scrapy的基本方法。本想从零开始写一个用Scrapy爬取教程,但是官方已经有了样例,一想已经有了,还是不写了,尽量分享在网上不太容易找到的东西。自己近期在封闭培训,更文像蜗牛一样,抱歉。Scrapy简介Scrapy是一个为了爬取网站数据,提取结构性数据而编...

初入象牙塔时乘坐了 60 多个小时的火车,后面基本都选择了飞机作为出行交通工具,毕业时再次选择了火车这一交通工具回家,再看一次从东北到西南的沿途风景,无奈火车居然能晚点两小时,这篇文章是在火车上为打发时间写的,希望对您有所帮助。记得大一入学前,买了一本覃彪喜写的《读大学,究竟读什么》,那时候对于里面有一些观点不赞同,觉得大学这么神圣的地方,怎么被作者写...

关于写作的重要性,你可能在其他地方也见过一些描述,大致的说法都差不多,如果本文某些字句与你已经见过的文章有雷同,那纯属巧合,我仅从个人这几个月的感受出发来说。我从三月份开始,在公众号上面发一些文章,其实从这几个月的表现来看,是把公众号当作博客来用了,我的初衷没有想着靠公众号赚钱,所以我的分享很随意,主要是技术、认知、阅读方面的东西。如果不喜欢,主动权在...

参考:HanLP 自然语言处理基于依存分析的开放式中文实体关系抽取方法命名实体三元组抽取参考自fact_triple_extraction这一段时间一直在做知识图谱,卡在实体关系抽取这里几个月了,在 Github 上面看到有人使用卷积神经网络训练模型进行抽取,自己也尝试了一下,但是一直苦于没有像样数据去训练,而标注训练集又太费时间了,我不太愿意干体力活...

这两天一直在时不时的和 Neo4j 图数据库打交道。它的查询语句可以使用正则表达式,有一段时间没有自己写过正则表达式了,现在处于能看懂别人写的正则表达式,但是自己写不出来,语法规则都忘了。为了方便接下来的工作,所以特地复习复习正则表达式的语法。正则表达式简介正则表达式是用来匹配字符串的一系列匹配符,具备简介高效的特点,在很多语言中都有支持(java、p...

文章内容是刘欣大大(《码农翻身》作者,公众号:码农翻身)的直播课内容,主要是了解一下分布式文件系统,学习FastDFS的一些设计思想,学习它怎么实现高效、简洁、轻量级的一个系统的FastDFS分布式文件系统简介国内知名的系统级开源软件凤毛菱角,FastDFS就是其中的一个,其用户包括我们所熟知的支付宝、京东商城、迅雷、58同城、赶集网等等,它是个人所开...
.