LCY Blog

我爱学习,学习使我快乐

网络压缩与噪音数据处理讲座笔记

整理自某lamda实验室大佬的讲座

训练技巧 使用加噪音的数据训练后,使用原始数据fine-tuning http://arxiv.org/pdf/1707.02968.pdf 网络结构压缩 CNN压缩 ThiNet ThiNet是ICCV2017的文章,主要通过prune方式达到模型压缩和加速,prune以filter(卷积核)为单位,根据该层filter的输出来判断该filter是否对结果有贡献,如果没有贡...

绘图常用代码&算法总结

做个汇总

[TOC] 画图 plot参数 线条和点 character description ’-‘ solid line style ’–’ dashed line style ’-.’ dash-dot ...

python高级用法及编码规范

开发过程常见问题笔记

反射 反射是在只知道类名或者函数名的情况下调用其对应的函数 对于本文件内的全局变量,可以使用globals()函数获取全局变量 名称-值 的键值对 # return a dict name -> value glodict = globals() def foo(): dosomething() pass # run `foo()` globals()...

《Deterministic Policy Gradient Algorithms》阅读笔记(or 翻译)

阅读笔记(or 翻译)

《Deterministic Policy Gradient Algorithms》阅读笔记(or 翻译) 原论文&附录 Deterministic Policy Gradient Algorithms Deterministic Policy Gradient Algorithms: Supplementary Materia(论文附录) 论文摘要(Abstract) 在本...

reinforcement公式整理

烧锅炉烧累了,整理一波

Monte Carlo Methods 有策略迭代如下: : 策略评估(policy evaluation),即利用样本估计行动值 : 策略提升(policy improvement), 按照更新 探索(exploration) 在线(on-policy): 更新值函数时使用当前策略产生的样本 policy is soft: ...

Diffusion Convolutional Recurrent Neural Network: Data-Driven Traffic Forecasting 阅读笔记

本人正式看的第一篇论文

论文链接: Diffusion Convolutional Recurrent Neural Network: Data-Driven Traffic Forecasting 简介 时空数据的预测目前来说是有一定难度, 本文通过将GCN和RNN相结合, 对道路上的交通流量问题进行预测, 并取得了比较好的效果. 数据 采用一系列传感器采集道路上的交通流量, 那么这些传感器所在的位置可以...

图编码算法汇总

没错, 全是外链

写在前面 近期看了好多图编码的算法,做个小小的总结. (知乎是个好东西) 图卷积(GCN) GCN是一种类比图片卷积操作,而产生的图编码算法. 关于GCN的推导,知乎上有个回答已经很详细了如何理解 Graph Convolutional Network(GCN) 首先是拉普拉斯矩阵, 最简单的定义为: 其中, 为图的对角阵, 为图的邻接矩阵. 在机器学习中,为了简化计算的复杂度(...

python networkx 笔记

至少比自己手写迪杰斯特拉强

基本操作 添加图 import networkx as nx g = nx.Graph() g.add_edge(u,v,**kwargs) networkx中的图,可以随意的添加附加信息, g.node&g.edge返回的是一个包含有给与信息的字典。 度 g.degree() # or nx.degree(g) 返回字典,节点id —-> 节点的度 图论...

google 地图数模常用接口

国外的地图就是详细

简介 要使用Google地图的接口,必须申请google的key。Google Maps API获取密钥/身份验证 数模中常用的有在图上标点,绘制热力图,范围图等。[可视化数据:绘制地震图 ](https://developers.google.com/maps/documentation/javascript/earthquakes) 热力图 <!DOCTYPE html&...

基于keras的增强学习实战

用DQN来玩游戏

什么是DQN 深度增强学习(Deep Reinforcement Learning)是将深度学习与增强学习结合起来从而实现从Perception感知到Action动作的端对端学习End-to-End Learning的一种全新的算法。简单的说,就是和人类一样,输入感知信息比如视觉,然后通过深度神经网络,直接输出动作,中间没有hand-crafted engineering的工作。深度增强学习...