• 设为首页
  • 点击收藏
  • 手机版
    手机扫一扫访问
    迪恩网络手机版
  • 关注官方公众号
    微信扫一扫关注
    迪恩网络公众号

kunkun1230/Data-analysis: 用 jupyter notebook做的一些机器学习项目

原作者: [db:作者] 来自: 网络 收藏 邀请

开源软件名称:

kunkun1230/Data-analysis

开源软件地址:

https://github.com/kunkun1230/Data-analysis

开源编程语言:

Jupyter Notebook 94.4%

开源软件介绍:

Data-analysis

Data analysis through jupyter notebook

18年计划转能源方面的数据挖掘岗位,准备了一些项目。

1. 光伏Pr衰减分析

1.分析历年的光伏发电量数据与辐照度,气温等因素的关系;
2.获得光伏组件的功率衰减曲线并计算组件的Pr值

2. Titanic survived predict from kunkun (Classfy)

1.常规的数据分析流程(观察数据,数据预处理,特征工程,建立模型,结果分析等)
2.预测Titanic生还者的数据

3. renewable_Solar_wind_power_predict(Regression)

1.以德国16年的光伏和风电发电量为结果,分析其与天气,风速等一系列因素的关系;
2.构建线性回归模型,旨在通过17年和18年的气象数据,预测这两年的发电量信息

4. 国内某地产中介的销售分组信息(替地产领域的朋友做的分析)

1.给定44个地产楼盘,按照销量,库存率等信息划分成10组
2.分配给不同的销售组进行销售工作

5. AB测试验证两种键盘打字的错误率(双样本独立检验)

1.设计实验,获取数据
2.描述统计分析,获得一般特征
3.推论统计分析,确定置信区间,进行假设检验及效应量
4.编制分析报告

6. 斯特鲁普效应存在分析(相关配对检验)

1.设计实验,获取数据(流程与5一致)
2.描述统计分析,获得一般特征
3.推论统计分析,确定置信区间,进行假设检验及效应量
4.编制分析报告

7. 基于K-means聚类的用户用电行为分析

1.通过Python中的SQL模块读取数据
2.分析数据结构,并对时间列进一步细化处理
3.通过数据透视表的形势对时间进行分列处理
4.导入K-means模块,并构建聚类可视化类,进行可视化处理
5.数据量略大,分享到云盘:链接:https://pan.baidu.com/s/1ydLyqyQGZe4ouQrtWnwR7g 提取码:0sc6

8. 叶片运输问题总结

1.基于运筹学中的运输问题,调用python的pulp模块进行线性优化
2.依据叶片运输问题,构建数据集
3.建立数学模型,添加约束条件
4.求解各个路径分配的运输量,并总结一般问题的结题思路

9. 稀疏矩阵转化与压缩

1.基于用户对商品的评分,获得用户-商品评分矩阵
2.对于数据量巨大的矩阵,必定需要压缩来减少空间占用
3.因此调用了python的scipy.parse模块对矩阵分别进行了COO、CSR、CSC三种形式的压缩

10. Sharebike

1.常规的数据分析流程(观察数据,数据预处理,特征工程,建立模型,结果分析等)
2.预测未来一段时间共享单车的使用量

11. LSTM时间序列分析

1.基于Keras框架,介绍了LSTM模型的参数设置
2.案例说明,在已知过去一段时间发货量的基础上,预测未来某天的发货量




鲜花

握手

雷人

路过

鸡蛋
该文章已有0人参与评论

请发表评论

全部评论

专题导读
热门推荐
阅读排行榜

扫描微信二维码

查看手机版网站

随时了解更新最新资讯

139-2527-9053

在线客服(服务时间 9:00~18:00)

在线QQ客服
地址:深圳市南山区西丽大学城创智工业园
电邮:jeky_zhao#qq.com
移动电话:139-2527-9053

Powered by 互联科技 X3.4© 2001-2213 极客世界.|Sitemap