zhkmxx930 blog

  • 首页

  • 排行榜

  • 标签18

  • 分类0

  • 归档39

  • 日程表

  • 友情链接

  • 读书

  • 电影

  • 游戏

  • 搜索

强化学习专题笔记(一) 强化学习基础

发表于 2019-01-22 | 更新于 2019-05-07 | 评论数:
本文字数: 5.3k | 阅读时长 ≈ 5 分钟

一、长期回报

对于问题的简化,采用理想的MDP,简化问题到具有马尔科夫性,对于马尔科夫决策过程而言,在理想状态下,每一个行动都要为最终的目标最大化长期回报 而努力。

但是很多情况下,仿真的时间维度较大,步数较多,甚至可以无限循环下去,这样的情况下我们需要引入一个可以和收敛的无穷数列,来替代我们最原始的长期回报公式。即对未来的回报乘以一个折扣率,使得长期回报变得更有意义:

由此我们引出长期回报的概念,即从当前状态开始对之后的所有回报,运用上式进行累加的折扣率计算:

但是长期回报需要知道未来的行动情况,我们需要对上式进行一个合理的估计,因而我们定义了策略的价值。

阅读全文 »

MPC控制笔记(一)

发表于 2019-01-18 | 更新于 2019-01-25 | 评论数:
本文字数: 6.6k | 阅读时长 ≈ 6 分钟

笔记参考1:Understanding Model Predictive Control(Youtube 带自动生成字幕)
笔记参考2:Understanding Model Predictive Control(B站 生肉)

一、什么是MPC模型预测控制

MPC(Model Predict Control)是一种反馈控制(feedback control)算法, 使用模型来预测过程的未来输出。

举例:
[场景] 车道保持
[已知模型] 车辆模型,比如速度控制, 转向控制对应的偏航量
[预测] 根据已知模型和所选的控制策略(action),进行轨迹预测
[优化] 通过优化控制策略,来尽可能的拟合预测的轨迹。

如下图所示为一个MIMO系统u1,u2输入与y1,y2输出相互影响。如果使用PID控制的话,每一个子系统单独设计一个PID控制器,两个相互影响的子系统没有任何的交联,使得系统难以设计,如果像图二一样设计一个较大的系统,则参数较多难以实现,而使用MPC控制器的话可以较好的解决两种问题,综合相互间的影响来设计参数。
MIMO

阅读全文 »

Generative Adversarial Imitation Learning(GAIL) 论文阅读笔记

发表于 2019-01-05 | 更新于 2019-01-25 | 评论数:
本文字数: 819 | 阅读时长 ≈ 1 分钟

GAIL优点

相较于IRL,可以省略很多中间步骤,比如通过IRL来学习Reward系统,再通过Reward系统来进行RL学习policy,GAIL可以直接通过expert trajectory 来直接学习policy。

阅读全文 »

无外网情况下RPM方式安装MySQL5.6

发表于 2019-01-05 | 更新于 2019-01-25 | 评论数:
本文字数: 9.3k | 阅读时长 ≈ 8 分钟

RPM方式安装MySQL5.6
a. 检查MySQL及相关RPM包,是否安装,如果有安装,则移除(rpm –e 名称)

1
2
3
[root@localhost ~]# rpm -qa | grep -i mysql
mysql-libs-5.1.66-2.el6_3.x86_64
[root@localhost ~]# yum -y remove mysql-libs*

b. 下载Linux对应的RPM包,如:CentOS6.4_64对应的RPM包,如下:这里给出我下载好的包,官网下载巨慢。。有可能还需要一个perl库的依赖,这里一并给出。链接: http://pan.baidu.com/s/1skFrEK9 密码: apza

1
2
3
4
5
[root@localhost rpm]# ll
total 74364
-rw-r--r--. 1 root root 18442536 Dec 11 20:19 MySQL-client-5.6.15-1.el6.x86_64.rpm
-rw-r--r--. 1 root root 3340660 Dec 11 20:06 MySQL-devel-5.6.15-1.el6.x86_64.rpm
-rw-r--r--. 1 root root 54360600 Dec 11 20:03 MySQL-server-5.6.15-1.el6.x86_64.rpm

阅读全文 »

Docker给运行中的容器添加映射端口

发表于 2019-01-05 | 更新于 2019-01-25 | 评论数:
本文字数: 2.2k | 阅读时长 ≈ 2 分钟

声明

​ 这篇文章选自[教程技巧] DOCKER 给运行中的容器添加映射端口

正文

Docker 给运行中的容器添加映射端口方法1  

  1. 获得容器IP

    1
    $ docker inspect `container_name` | grep IPAddress

    比如我的容器叫mysqlserver么就输入下列代码来获取该容器的ip地址

    1
    $ docker inspect mysqlserver | grep IPAddress

    执行完之后会发现我的mysqlserverdocker容器的ip地址为192.168.0.2

    ​

    阅读全文 »

使用Scala基于词法单元的解析器定制EBNF范式文法解析

发表于 2019-01-05 | 更新于 2019-01-25 | 评论数:
本文字数: 15k | 阅读时长 ≈ 14 分钟

前言

近期在做Oracle迁移到Spark平台的项目上遇到了一些平台公式翻译为SparkSQL(on Hive)的需求,而Spark采用亲妈语言Scala进行开发。分析过大概需求过后,拟使用编译原理中的EBNF范式模式,进行基于词法的文法解析。于是拟采用传统的正则词法解析到EBNF文法解析的套路来实现,直到发现了StandardTokenParsers这个Scala基于词法单元的解析器类。

平台公式及翻译后的SparkSQL

平台公式的样子如下所示:

1
if (XX1_m001[D003]="邢おb7肮α䵵薇" || XX1_m001[H003]<"2") && XX1_m001[D005]!="wed" then XX1_m001[H022,COUNT]

这里面字段值”邢おb7肮α䵵薇”为这个的目的是为了测试各种字符集是否都能匹配满足。
那么对应的SparkSQL应该是这个样子的,由于是使用的Hive on Spark,因而长得跟Oracle的SQL语句差不多:

1
SELECT COUNT(H022) FROM XX1_m001 WHERE (XX1_m001.D003='邢おb7肮α䵵薇' OR  XX1_m001.H003<'2')  AND  XX1_m001.D005<'wed'

总体而言比较简单,因为我只是想在这里做一个Demo。

阅读全文 »

Linux内存占用过高?非也

发表于 2019-01-05 | 更新于 2019-01-25 | 评论数:
本文字数: 3k | 阅读时长 ≈ 3 分钟

前言

今天在我的RPi2上测试GPIO程序,忽然发现机器超卡,重启之后依然如此。于是我top了一下发现了一个问题就是内存爆满!!可我还啥都没干呢这是咋了?于是我呵呵地开始查资料,终于找到了问题所在。

正文

  • 先来在阿里的ECS上top一下感受内存爆满的感觉,终端输入top
1
#top

图片标题

阅读全文 »

在raspbian-jessie上搭建nat123自启动

发表于 2019-01-03 | 更新于 2019-01-25 | 评论数:
本文字数: 9.6k | 阅读时长 ≈ 9 分钟

前言

什么是nat123?
现在我们的树莓派都是在路由器内网里面的,需要使用nat123来实现外网映射(类似花生壳),但是nat123免费好用,这个原理在计算机网络中叫做隧道或者叫穿透。那么本文主要讲述如何在树莓派上配置nat123。

必要环境

​ 现在本文所用的平台是树莓派2代b+,其实那个版本的RPi都OK,主要是raspbian-jessie的系统,不过貌似是raspbian的系统都适合使用,这里主要是nat123的环境必须配置好。

  • 安装好mono环境
  • 安装好nat123客户端

本文中我的nat123客户端安装在了官网所指示的/mnt 目录下,如图。
图片标题

阅读全文 »

我的博客

发表于 2019-01-03 | 更新于 2019-01-24 | 评论数:
本文字数: 0 | 阅读时长 ≈ 1 分钟
1…34
zhkmxx930

zhkmxx930

39 日志
18 标签
GitHub 远方的家
Links
  • Free Will
  • 老喵家小喵
  • eason-yang的博客
  • utils4s
  • Blog of Kami Wan
  • musi-tianshuang
  • Shuan JM
0%
© 2022 zhkmxx930 | 122k | 1:51
本站总访问量次
|
星际战舰 Hexo 强力驱动 v3.8.0
|
主题 – NexT.Pisces v6.7.0
你是我的第 位三体朋友, 共有 个三体星人来到该星球