自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Together_CZ的博客

种一棵树,最好的时间是十年前,其次是现在

原创 基于豆瓣影评数据的文本分析系统【数据爬取+数据清洗+数据库存储+LDA主题挖掘+词云可视化】

本分析中很多的工作都是基于评论数据来进行的,比如:滴滴出行的评价数据、租房的评价数据、电影的评论数据等等,从这些语料数据中能够挖掘出来客户群体对于某种事物或者事情的看法,较为常见的工作有:舆情分析、热点挖掘和情感分析。 如果想要了解关于文本分类或者是情感分析相关的工作内容,可以阅读我的《数...

2019-12-17 16:26:15 4311 11

原创 基于机器学习和深度学习的推荐系统实战【图书推荐、电影推荐、音乐推荐】

推荐系统在我们日常生活中发挥着非常重要的作用,相信实际从事过推荐相关的工程项目的人或多或少都会看多《推荐系统实战》这本书,我也是读者之一,个人感觉对于推荐系统的入门来说这本书籍还是不错的资料。很多商场、大厂的推荐系统都是很复杂也是很强大的,大多是基于深度学习来设计强有力的计算系统,本文是笔者在公司...

2019-12-17 14:37:33 2154 0

原创 基于文本数据的情感分析系统

在自然语言处理里面,情感分析大类上归属于文本分类领域,是NLP非常常见也是很重要的一种任务类型,在大多数已开展的分析研究工作中,主要是基于评论数据集,诸如:滴滴打车评论数据集、豆瓣猫眼影评数据集;或者是一些社交媒体数据集,诸如:Twitter数据集、微博数据集、人人网数据集等等。 在开始本文...

2019-12-17 11:05:46 3106 0

原创 Python猫眼电影数据采集与可视化分析实战

在国内比较知名的电影数据平台应该就是豆瓣、猫眼了,别的使用的不是很多,这两个平台就我们来说,平时的实践依赖还是比较多的,今天主要是想基于猫眼电影数据做一点分析性的工作,在我之前的文章中,基于豆瓣影评数据的采集、处理、存储、分析、可视化整个流程已经做了详细的介绍与实现了,感兴趣的话可以去参考一下我之...

2019-12-29 15:33:11 1105 0

原创 Python实现 N*N 乘法表

一个简单的小实践: #!usr/bin/env python #encoding:utf-8 """ __Author__:沂水寒城 功能: N*N 乘法表 """ import sys reload(sys) sys.s...

2019-12-29 14:04:54 302 0

翻译 构建一个简单的Keras +深度学习REST API

在本教程中,我们将介绍一种简单的方法来采用Keras模型并将其部署为REST API。 这篇文章中涵盖的示例将作为构建您自己的深度学习API的模板/起点–您将能够扩展代码并根据您的API端点的可扩展性和健壮性对其进行自定义。 具体来说,我们将学习: 如何(以及如何不)将Ker...

2019-12-28 14:35:37 417 0

原创 基于感知哈希算法的图像相似匹配计算实战

Google之前上线了“以图搜图”的功能,吸引了一大批人员的使用, 体验之后不得不说还是很强大,谷歌背后的黑科技还是很强大的。感知哈希本质上是哈希算法中的一类算法,最初被提出来就是用来做相似图片的匹配与计算的,以图搜图的本质也是在做详细图片的计算与匹配,不同的算法会有不同的计算精度和计算速度。 ...

2019-12-27 18:05:12 358 0

原创 Python爬虫之51job招聘数据信息爬取实战

数据爬虫对于数据分析从业者来说是必不可少的一项基础能力,学习Python的首选我也是从编写一个合格的爬虫开始的,实际的工作中经常也会遇到需要从网络上采集数据进行分析的需求,这时候就需要自己动手编写爬虫了。 在我之前的文章《BOSS直聘数据采集、解析处理、分析与可视化实战》中,详细地讲解了基...

2019-12-25 20:41:26 3561 6

原创 基于seaborn的相关性热力图可视化分析

seaborn本质上是对matplotlib模块的高级封装,所以要想使用seaborn的功能,首先需要安装好matplotlib的基础环境,现在的安装方式已经极大地简化了,只需要pip安装即可,这里就不再多说明了。 今天主要是想对手里的一个数据集进行简单的分析,分析不同属性特征之间的相关程...

2019-12-22 12:26:10 1242 4

原创 基于差分分级和关联规则挖掘的气象数据关联性分析实战

本文的主要研究主要是基于一批历史的气象数据来挖掘不同天气形势下的关联性,对空气质量的管控和分析提供合理的指导意见,技术是通用性的,问题是具体业务场景里面的,最初接触到这个任务的时候着实没有特别清晰的实现思路,就我以往的实践经验来水,数据之间的关联性往往会借助于关联规则挖掘算法来实现固有关联规则或者...

2019-12-21 17:10:40 473 2

原创 基于机器学习的恶意网站/仿冒网站检测实战

恶意网站是我们生活中多少都会遇上到的一种网页集合,大多是包含病毒或者是一些非法获取个人信息的页面,本文所指的恶意网站主要指的是我们生活中遇到过的钓鱼网站,也就是仿冒网站。 我们先来看一份简短的月报: 如果想要简单来了解一下网络钓鱼背后的操作原理的话,推荐你看这篇...

2019-12-18 19:50:19 1783 0

翻译 编解码器长短期记忆神经网络

编码器-解码器LSTM是一个循环神经网络,旨在解决序列到序列问题,有时称为seq2seq。 序列到序列的预测问题具有挑战性,因为输入和输出序列中的项数可能会发生变化。 例如,文本翻译和学习执行程序就是seq2seq问题的示例。 在这篇文章中,您将发现用于序列到序列预测的Enc...

2019-12-18 15:28:35 286 2

翻译 Keras中的时间分布层TimeDistributed Layer使用教程

TimeDistributed官方文档在这里。 长短期网络(LSTM)是一种流行且功能强大的递归神经网络(RNN)。 即使使用像Python的Keras深度学习库中提供的那样定义明确且“易于使用”的接口,它们也很难配置并应用于任意序列预测问题。 Keras中出现此困难的原因...

2019-12-18 15:10:38 1220 0

翻译 基于LSTM及其变种网络的时序数据建模实战教程

本文翻译自大神【Jason Brownlee】的实战教程《How to Develop LSTM Models for Time Series Forecasting》。 长短期记忆网络或简称LSTM可以用于时间序列预测。 有很多类型的LSTM模型可用于每种特定类型的时间序列预测问...

2019-12-18 13:51:08 843 6

原创 基于Python的《庆余年》评论分析

最近有一部热剧《庆余年》,可以说关注度很高,之前看到社区里面有人基于微博的评论数据对其评论信息做了分析,我这里简单地基于豆瓣的评论数据来对其进行分析。 首先是评论数据的采集,代码实现在我之前的文章里面都有,需要的话可以直接使用,部分数据展示如下: 评论人:红骷髅 评论时间:2019-11...

2019-12-11 13:51:43 943 2

原创 强大高可用的数据可视化神器plotly_express实践记录

在正式将自己的主要绘图模块转移到plotly之前,我相信绝对大数的数据分析相关的从业者都是主要基于matplotlib来进行数据探索分析或者是可视化展示相关的工作的,着实,matplotlib也是真的十分强大。对于我而言,matplotlib算得上是最早使用到的库,早在14年的时候就接触到了,但是...

2019-12-09 16:17:07 981 0

原创 一个有趣手绘风格的Python绘图库使用

今天无意间刷到了一个跟Python可视化相关的头条,就点进去看看,这是一位作者编写的手绘风格的绘图工具,对可视化工作一直都是比较感兴趣的,所以这里就想直接上手使用一下。 GitHub地址在这里。首页截图如下: 最下方也给出了安装方式,应该是以Python3为基础编写的,所以Py...

2019-12-06 09:59:57 553 0

原创 当孙子兵法遇上词云,会有怎样的碰撞?

这里先贴一下孙子兵法的文本内容,如下所示: 孙子曰:凡治众如治寡,分数是也;斗众如斗寡,形名是也;三军之众,可使必受敌而无败者,奇正是也;兵之所加,如以碫投卵者,虚实是也。    凡战者,以正合,以奇胜。故善出奇者,无穷如天地,不竭如江海。终而复始,日月是也。死而更生,四时是也。声不过五,...

2019-12-03 17:45:41 635 0

原创 Python爬取百度指数搜索结果,查看你想了解的热点信息吧

今天无意间搜索问题的时候跳转到了百度指数这里,索性就打开来看看,下面是首页截图: 这里你可以自己输入自己想要查询的人物、事件等等,anything,只要是你感兴趣的都可以,有一种感觉就是你认为是热点的就是热点。。。。 闲话不多说了,这里直接进入实践,先看代码,完整的实现如下: ...

2019-12-03 15:08:51 935 0

提示
确定要删除当前文章?
取消 删除