cnzero/scikit-learn-zero

我想干什么？

自己动手实现一遍大部分的机器学习的算法。

目前初步已经理解与推导了部分机器学习的相关公式，能够调用一定的sklearn API进行数据分析；但是仍然不满足，希望在公式推导之余，能够增加编程的活动，这样也不至于把推公式看成是一件枯燥无味的事情。

期待实现什么目标？

告诉自己：

我一直觉得机器学习或深度学习，是一种Application导向的任务，只有在实际运用、处理的过程中才能够形成对数据的感觉与Insight。
虽然很多人说，编程只是工具的问题，也无所谓编程语言与框架的问题，但其在机器学习或深度学习过程中绝不可以轻视之。至少目前需要做到几点：
1. 熟练掌握一门编程语言，目前而言毫无疑问就是Python；
2. 熟练掌握一些开源框架，毫无疑问Sklearn、TensorFlow等的优先级较高；并不是其他开源框架如Caffe，Torch等并不好，至少结合理论部分，先干好一件事情，其他的会去学习的。
没必要纠结要求自己的代码一步到位而苦思冥想地迟迟不敢动手编程，要有一种迭代优化的**：先去做，发现问题，修改；发现问题，再修改 . . .

所有代码存放在远程服务器上，位于T450/scikit-learn-zero/文件夹内
并进行GitHub的代码托管，Repository的名字为：scikit-learn-zero
以 Logistic Regression 算法为例，针对相关文件，给文件编写顺序与出命名的一般规则：
1. selfLogisticRegressionDoc.ipynb 善加利用Jupyter Notebook。文档部分为，对算法的理论与公式的推导——知其然知其所以然；后续代码部分为自己代码实现的检验。
2. learn-sklearnLogisticRegression.ipynb ，在完成算法或模型的理论部分后，先利用sklearn的API进行数据的初步分析与API参数理解，是一个快速加深理论理解，并在部分调参过程中深入理解的过程。
3. selfLogisticRegression.py 有关 Logistic Regression 相关的类或函数都将在该文件中进行代码实现，并在1中的Jupyter Notebook文件中进行检验。

cnzero / scikit-learn-zero