Go to file
2021-01-27 15:52:31 +08:00
AdaBoost Update AdaBoost.py 2020-01-23 01:29:03 +08:00
Clustering Add K-means_Clustering.py 2021-01-27 15:50:01 +08:00
DecisionTree #10 2020-05-23 17:11:55 +08:00
EM fix wrong output 2020-03-05 19:54:01 +08:00
HMM fix a bug 2019-12-07 13:11:58 -06:00
KNN Update KNN.py 2020-01-23 01:31:20 +08:00
LDA Add LDA file 2021-01-26 17:06:12 +08:00
Logistic_and_maximum_entropy_models Update logisticRegression.py 2020-01-23 01:32:09 +08:00
LSA Add LSA.py 2021-01-27 15:52:01 +08:00
Mnist add dataSet 2018-11-16 21:24:45 +08:00
NaiveBayes Update NaiveBayes.py 2020-01-23 01:33:08 +08:00
Page_Rank Add PageRank file 2021-01-26 17:09:38 +08:00
PCA Add PCA.py 2021-01-27 15:50:47 +08:00
perceptron Update perceptron_dichotomy.py 2020-01-23 01:33:55 +08:00
PLSA Add PLSA.py 2021-01-27 15:52:31 +08:00
SVM add SVM 2018-12-03 13:27:50 +08:00
transMnist add Mnist dataset 2018-11-16 00:00:27 +08:00
CodePic.png Add files via upload 2018-11-17 21:34:03 +08:00
README.md Update README.md 2020-07-28 17:32:19 +08:00

前言

力求每行代码都有注释,重要部分注明公式来源。具体会追求下方这样的代码,学习者可以照着公式看程序,让代码有据可查。

image

如果时间充沛的话,可能会试着给每一章写一篇博客。先放个博客链接吧:传送门

其中Mnist数据集已转换为csv格式由于体积为107M超过限制改为压缩包形式。下载后务必先将Mnist文件内压缩包直接解压。
有意向为这个repo补充第二版无监督部分的大佬下拉到最下方联系我只要求注释完善即可。我们可以成为好朋友一起冲鸭

实现

第二章 感知机:

博客:统计学习方法|感知机原理剖析及实现
实现:perceptron/perceptron_dichotomy.py

第三章 K近邻

博客:统计学习方法|K近邻原理剖析及实现
实现:KNN/KNN.py

第四章 朴素贝叶斯:

博客:统计学习方法|朴素贝叶斯原理剖析及实现
实现:NaiveBayes/NaiveBayes.py

第五章 决策树:

博客:统计学习方法|决策树原理剖析及实现
实现:DecisionTree/DecisionTree.py

第六章 逻辑斯蒂回归与最大熵模型:

博客:逻辑斯蒂回归:统计学习方法|逻辑斯蒂原理剖析及实现
博客:最大熵:统计学习方法|最大熵原理剖析及实现

实现:逻辑斯蒂回归:Logistic_and_maximum_entropy_models/logisticRegression.py
实现:最大熵:Logistic_and_maximum_entropy_models/maxEntropy.py

第七章 支持向量机:

博客:统计学习方法|支持向量机(SVM)原理剖析及实现
实现:SVM/SVM.py

第八章 提升方法:

实现:AdaBoost/AdaBoost.py

第九章 EM算法及其推广

实现:EM/EM.py

第十章 隐马尔可夫模型:

实现:HMM/HMM.py

联系

项目未来短期内不再更新如有疑问欢迎使用issue也可添加微信或邮件联系。
此外如果有需要MSRA实习内推的同学,欢迎骚扰。
Wechat: lvtengchao备注“blog-学校/单位-姓名”)
Email: lvtengchao@pku.edu.cn