LCY Blog

我爱学习,学习使我快乐

reinforcement公式整理

烧锅炉烧累了,整理一波

Monte Carlo Methods 有策略迭代如下: : 策略评估(policy evaluation),即利用样本估计行动值 : 策略提升(policy improvement), 按照更新 探索(exploration) 在线(on-policy): 更新值函数时使用当前策略产生的样本 policy is soft: ...

python高级用法及编码规范

开发过程常见问题笔记

反射 反射是在只知道类名或者函数名的情况下调用其对应的函数 对于本文件内的全局变量,可以使用globals()函数获取全局变量 名称-值 的键值对 # return a dict name -> value glodict = globals() def foo(): dosomething() pass # run `foo()` globals()...

Diffusion Convolutional Recurrent Neural Network: Data-Driven Traffic Forecasting 阅读笔记

本人正式看的第一篇论文

论文链接: Diffusion Convolutional Recurrent Neural Network: Data-Driven Traffic Forecasting 简介 时空数据的预测目前来说是有一定难度, 本文通过将GCN和RNN相结合, 对道路上的交通流量问题进行预测, 并取得了比较好的效果. 数据 采用一系列传感器采集道路上的交通流量, 那么这些传感器所在的位置可以...

图编码算法汇总

没错, 全是外链

写在前面 近期看了好多图编码的算法,做个小小的总结. (知乎是个好东西) 图卷积(GCN) GCN是一种类比图片卷积操作,而产生的图编码算法. 关于GCN的推导,知乎上有个回答已经很详细了如何理解 Graph Convolutional Network(GCN) 首先是拉普拉斯矩阵, 最简单的定义为: 其中, 为图的对角阵, 为图的邻接矩阵. 在机器学习中,为了简化计算的复杂度(...

python networkx 笔记

至少比自己手写迪杰斯特拉强

基本操作 添加图 import networkx as nx g = nx.Graph() g.add_edge(u,v,**kwargs) networkx中的图,可以随意的添加附加信息, g.node&g.edge返回的是一个包含有给与信息的字典。 度 g.degree() # or nx.degree(g) 返回字典,节点id —-> 节点的度 图论...

google 地图数模常用接口

国外的地图就是详细

简介 要使用Google地图的接口,必须申请google的key。Google Maps API获取密钥/身份验证 数模中常用的有在图上标点,绘制热力图,范围图等。[可视化数据:绘制地震图 ](https://developers.google.com/maps/documentation/javascript/earthquakes) 热力图 <!DOCTYPE html&...

数模编程常用代码总结

做个汇总

[TOC] 画图 plot参数 线条和点 character description ’-‘ solid line style ’–’ dashed line style ’-.’ dash-dot ...

基于keras的增强学习实战

用DQN来玩游戏

什么是DQN 深度增强学习(Deep Reinforcement Learning)是将深度学习与增强学习结合起来从而实现从Perception感知到Action动作的端对端学习End-to-End Learning的一种全新的算法。简单的说,就是和人类一样,输入感知信息比如视觉,然后通过深度神经网络,直接输出动作,中间没有hand-crafted engineering的工作。深度增强学习...

神经网络的入门教程

上周技术沙龙的某些总结

线性回归 引子 忽略那条线,现在,我们有这样的一些数据。可以清楚的看到,这些数据点,似乎呈现一个线性分布。而高中的时候(数学统计那块的),我们学过,有一个叫最小二乘法的东西,带一下公式,就可以把这条拟合的曲线画出来。 然而,我们不用那个公式,(一步出结果多麻烦啊,还要公式推导证明。。。)有没有一个简单的通法呢?答案当然是有的(虽然计算量有点多,不过,我们有计算机啊)。 什么情况算拟合程度...

BP 算法

还是不懂

连接:一文弄懂BP算法