次优示例强化学习实验总结

前言

跟着科大老师搞了一段时间的强化学习研究,论文投出去我这边也算是可以收尾了,不管后面怎么样,还是有不少收获和成就感的。论文方面实验还是很多瑕疵,有些图表也没来得及做,有点可惜。总之,这段时间很有意思,也没有很累,倒还得了不少称赞。

也许但行好事莫问前程,或是东风吹送好运来。在校期间似乎从来没争取过什么,自己凭兴趣随便散散步,有认真搞学习,倒也谈不上很努力。傻傻的自释觉悟者,工作都没有认真找,主打一个无所谓。以至于我总是不理解为什么很多事情像安排好一样,等着我走过去给我一个reward,可我真的只是在散步。钝鸟随便飞,大器无须成。

sorry,跑题了。回到主题,研究设定是在极端稀疏且奖励滞后的环境下通过次优示例学习到最优策略。下面做了一个简单的总结,希望后面还有深入研究的机会吧。

阅读更多

图像处理之深度学习

前言

图像方面的处理是人工智能发展的一个主要分支,同时具备极高的应用价值,在此总结一些工业上学术上使用较为广泛的模型,或是较为经典,或是个人熟悉。

阅读更多

关于深度学习的片面总结

前言

Deep Learning 一书被成为AI圣经,中文译者张志华老师说道:它告诉我们深度学习集技术、科学与艺术于一体,涉及统计、优化、矩阵、算法、编程、分布式计算等多个邻域。

这也意味着深度学习的门槛,当我作为一个萌新学者看这本书的时候,实在是难读和枯燥,但通过一年的学习再回来看这本书,收获颇丰,所以我决定再次研读“圣经”,并结合相应邻域的论文学习,同时我会尽可能的实践,然后根据拙见逐步的写完这篇总结,毕竟行万里路读万卷书嘛。

阅读更多

机器学习和深度神经网络的发展

前言

(来自两年后的自己:在神经网络大力出奇迹的今天,再过两年是什么样我想都不敢想,不只是AI,我说政治。国内这研究环境真让人心寒,算了还是码头整点薯条吧,无所谓了。)

在我了解机器学习和深度神经网络之前,它已被称为第四次工业革命的引擎。抱着对人工智能的好奇和向往,我很果断的抛弃了原先的嵌入式和控制编程,也很顺利的把机器学习作为了我的学业课题。

那么正巧是毕业季,我在人工智能邻域也学了近一年,现在看来,神经网络和任何编程一样都是老笨蛋了,但是神经网络效果好是真的好,以至于大牛们都一边看不起神经网络一边真香。

最近任务不是很重,想着做个总结,于是我结合 Advances in Machine Learning and Deep Neural Networks 等多文章和我自己的理解写下了这篇博客。

阅读更多