Go to file
2022-02-12 20:16:39 +08:00
AdaBoost Update AdaBoost.py 2020-01-23 01:29:03 +08:00
Clustering Merge pull request #30 from Harold-Ran/patch-2 2021-09-13 14:55:11 +08:00
DecisionTree #10 2020-05-23 17:11:55 +08:00
EM fix wrong output 2020-03-05 19:54:01 +08:00
HMM fix a bug 2019-12-07 13:11:58 -06:00
KNN Update KNN.py 2020-01-23 01:31:20 +08:00
LDA Add LDA.py 2021-01-27 15:53:09 +08:00
Logistic_and_maximum_entropy_models Update logisticRegression.py 2020-01-23 01:32:09 +08:00
LSA Add LSA.py 2021-01-27 15:52:01 +08:00
Mnist add dataSet 2018-11-16 21:24:45 +08:00
NaiveBayes Update NaiveBayes.py 2020-01-23 01:33:08 +08:00
Page_Rank Add Page_Rank.py 2021-01-27 15:53:39 +08:00
PCA Add PCA.py 2021-01-27 15:50:47 +08:00
perceptron Update perceptron_dichotomy.py 2020-01-23 01:33:55 +08:00
PLSA Add PLSA.py 2021-01-27 15:52:31 +08:00
SVM add SVM 2018-12-03 13:27:50 +08:00
transMnist add Mnist dataset 2018-11-16 00:00:27 +08:00
CodePic.png Add files via upload 2018-11-17 21:34:03 +08:00
README.md Update README.md 2022-02-12 20:16:39 +08:00

前言

力求每行代码都有注释,重要部分注明公式来源。具体会追求下方这样的代码,学习者可以照着公式看程序,让代码有据可查。

image

如果时间充沛的话,可能会试着给每一章写一篇博客。先放个博客链接吧:传送门

其中Mnist数据集已转换为csv格式由于体积为107M超过限制改为压缩包形式。下载后务必先将Mnist文件内压缩包直接解压。

【Updates】

书籍出版:目前已与人民邮电出版社签订合同未来将结合该repo整理出版机器学习实践相关书籍。同时会在book分支中对代码进行重构欢迎在issue中提建议同时issue中现有的问题也会考虑进去。Feb 12 2022

线下培训:女朋友计划近期开办ML/MLP/CV线下培训班,地点北上广深杭,目标各方向快速入门正在筹备。这里帮她打个广告可以添加微信15324951814备注线下培训。本人也会被拉过去义务评估课程质量。。。Feb 12 2022

无监督部分更新:部分无监督算法已更新!!! 该部分由Harold-Ran提供,在此感谢! 有其他算法补充的同学也欢迎添加我微信并prJan 27 2021

实现

监督部分

第二章 感知机:

博客:统计学习方法|感知机原理剖析及实现
实现:perceptron/perceptron_dichotomy.py

第三章 K近邻

博客:统计学习方法|K近邻原理剖析及实现
实现:KNN/KNN.py

第四章 朴素贝叶斯:

博客:统计学习方法|朴素贝叶斯原理剖析及实现
实现:NaiveBayes/NaiveBayes.py

第五章 决策树:

博客:统计学习方法|决策树原理剖析及实现
实现:DecisionTree/DecisionTree.py

第六章 逻辑斯蒂回归与最大熵模型:

博客:逻辑斯蒂回归:统计学习方法|逻辑斯蒂原理剖析及实现
博客:最大熵:统计学习方法|最大熵原理剖析及实现

实现:逻辑斯蒂回归:Logistic_and_maximum_entropy_models/logisticRegression.py
实现:最大熵:Logistic_and_maximum_entropy_models/maxEntropy.py

第七章 支持向量机:

博客:统计学习方法|支持向量机(SVM)原理剖析及实现
实现:SVM/SVM.py

第八章 提升方法:

实现:AdaBoost/AdaBoost.py

第九章 EM算法及其推广

实现:EM/EM.py

第十章 隐马尔可夫模型:

实现:HMM/HMM.py

无监督部分

第十四章 聚类方法

实现:K-means_Clustering.py

实现:Hierachical_Clustering.py

第十六章 主成分分析

实现:PCA.py

第十七章 潜在语意分析

实现:LSA.py

第十八章 概率潜在语意分析

实现:PLSA.py

第二十章 潜在狄利克雷分配

实现:LDA.py

第二十一章 PageRank算法

实现:Page_Rank.py

联系

欢迎pr有疑问也可通过issue、微信或邮件联系。
此外如果有需要MSRA实习内推的同学,欢迎骚扰。
Wechat: lvtengchao备注“blog-学校/单位-姓名”)
Email: lvtengchao@pku.edu.cn