博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
【pytorch】优化器
阅读量:2225 次
发布时间:2019-05-09

本文共 2446 字,大约阅读时间需要 8 分钟。

优化器的参数有待进一步了解

import torchfrom torch.autograd import Variableimport torch.nn.functional as Fimport matplotlib.pyplot as pltimport torch.utils.data as Data# super paramLR = 0.01BATCH_SIZE=32EPOCH=12x = torch.unsqueeze(torch.linspace(-1,1,1000),dim = 1)  #压缩为2维,因为torch 中 只会处理二维的数据y = x.pow(2) + 0.2 * torch.rand(x.size())print(x.numpy(),y.numpy())torch_dataset = Data.TensorDataset(x, y)loader = Data.DataLoader(    dataset = torch_dataset,    batch_size = BATCH_SIZE,    shuffle = True,# true表示数据每次epoch是是打乱顺序抽样的    num_workers = 2, # 每次训练有两个线程进行的????? 改成 1 和 2 暂时没看出区别)class Net(torch.nn.Module):  # 继承 torch 的 Module    def __init__(self):        super(Net, self).__init__()     # 继承 __init__ 功能        # 定义每层用什么样的形式        self.hidden = torch.nn.Linear(1,20)   # 隐藏层线性输出        self.predict = torch.nn.Linear(20,1)   # 输出层线性输出    def forward(self, x):   # 这同时也是 Module 中的 forward 功能        # 正向传播输入值, 神经网络分析出输出值        x = F.relu(self.hidden(x))      # 激励函数(隐藏层的线性值)        x = self.predict(x)             # 输出值        return xnet_SGD = Net()net_Momentum = Net()net_RMSProp = Net()net_Adam= Net()nets = [net_SGD,net_Momentum,net_RMSProp,net_Adam] # 一个比一个高级opt_SGD = torch.optim.SGD(net_SGD.parameters(),lr=LR)opt_Momentum = torch.optim.SGD(net_Momentum.parameters(),lr = LR,momentum=0.8) # 是SGD的改进,加了动量效果opt_RMSProp = torch.optim.RMSprop(net_RMSProp.parameters(),lr=LR,alpha=0.9)opt_Adam= torch.optim.Adam(net_Adam.parameters(),lr=LR,betas=(0.9,0.99))optimizers = [opt_SGD, opt_Momentum, opt_RMSProp, opt_Adam]# 比较这4个优化器会发现,并不一定越高级的效率越高,需要自己找适合自己数据的优化器loss_func = torch.nn.MSELoss()losses_his = [[],[],[],[]]if __name__ == '__main__': # EPOCH + win10 需要if main函数才能正确运行,    for epoch in range(EPOCH):        print(epoch)        for step,(batch_x,batch_y) in enumerate(loader):            b_x = Variable(batch_x)            b_y = Variable(batch_y)            for net,opt,l_his in zip(nets, optimizers, losses_his):                output = net(b_x)  # get_out for every net                loss = loss_func(output,b_y)  # compute loss for every net                opt.zero_grad()                loss.backward()                opt.step() # apply gradient                l_his.append(loss.data[0]) # loss recoder    labels = ['SGD','Momentum','RMSProp','Adam']    for i,l_his in enumerate(losses_his):        plt.plot(l_his,label=labels[i])    plt.legend(loc='best')    plt.xlabel('Steps')    plt.ylabel('Loss')    plt.ylim = ((0,0.2))    plt.show()

这里写图片描述

你可能感兴趣的文章
搞懂分布式技术1:分布式系统的一些基本概念
查看>>
搞懂分布式技术2:分布式一致性协议与Paxos,Raft算法
查看>>
搞懂分布式技术3:初探分布式协调服务zookeeper
查看>>
搞懂分布式技术4:ZAB协议概述与选主流程详解
查看>>
搞懂分布式技术5:Zookeeper的配置与集群管理实战
查看>>
搞懂分布式技术6:Zookeeper典型应用场景及实践
查看>>
搞懂分布式技术10:LVS实现负载均衡的原理与实践
查看>>
搞懂分布式技术11:分布式session解决方案与一致性hash
查看>>
搞懂分布式技术12:分布式ID生成方案
查看>>
搞懂分布式技术13:缓存的那些事
查看>>
搞懂分布式技术14:Spring Boot使用注解集成Redis缓存
查看>>
搞懂分布式技术15:缓存更新的套路
查看>>
搞懂分布式技术16:浅谈分布式锁的几种方案
查看>>
搞懂分布式技术17:浅析分布式事务
查看>>
搞懂分布式技术18:分布式事务常用解决方案
查看>>
搞懂分布式技术19:使用RocketMQ事务消息解决分布式事务
查看>>
搞懂分布式技术20:消息队列因何而生
查看>>
搞懂分布式技术21:浅谈分布式消息技术 Kafka
查看>>
后端技术杂谈1:搜索引擎基础倒排索引
查看>>
后端技术杂谈2:搜索引擎工作原理
查看>>