不仅畅销还有还口碑联想S5已成国货代表

前段时间,联想带来了一款价格千元的全面屏手机联想S5,很多人都说,这款手机无论是工艺还是创新方面都可以代表新国货,尤其是秉承了中国工匠精神,虽然只是一款千元价位的手机,但却有着旗舰手机的工艺,让联想S5这款手机更时尚和上档次,这对于追求时尚的年轻人来说,确实是不错的选择。前几天,联想S5举行了首销,因为手机本身的优势,外加上联想老品牌的影响,让这部手机瞬间售罄,绝对是目前千元价位热度最高的一部手机了。

就计算资源而言,在Google不会因GPU或CPU的数量而受限,所以如何扩大训练的规模便成为该项目的另一个目标——因为即便采用这些小型的数据集,在单个GPU上完成训练也要花上数周的时间。

另一个难题是如何量化评估结果。如何才能证明我们的图像比基准模型更好?衡量超分辨率效果的传统方法,是对比输出图像与原始图像在对应像素点之间的距离(峰值信噪比,PSNR)。

用名人脸部图像数据集训练出来的超分辨率像素递归模型所生成的高分辨率图像。

你需要的只是几种颜色。顶行是原始彩色图像;中间是降低并采样后的色度图像,尺寸缩小至28像素;底行是双线性提高中间行的采样率并结合原始灰度图像的结果。

去年,在通过对TensorFlow的研究得出一点点心得之后,我申请并入选了谷歌大脑举办的的首届见习项目(Google Brain Residency Program)。该项目共邀请了24名在机器学习领域有着不同背景的人士,受邀者将在为期一年的时间里和Google的科学家及工程师们在位于山景城的Google深度学习研究实验室中共同探索最前沿的深度学习科技。

PixelCNN和传统的卷积神经网络十分不同,它将图像生成问题转化成了一个像素序列选择问题。核心思想借鉴与于LSTM(长短时记忆网络)这样的门控递归网络,尽管他们通常被应用于单词或字符序列的生成上,但无可否认效果是非常好的。PixelCNN巧妙地构建出一个卷积神经网络(CNN),它能基于先前的像素的概率分布来生成下一个像素,也就是说同时具备了序列模型和卷积神经网络的特点。

通过以上所有技巧,不论是通过大众评估还是颜色直方图交叉测量,我们能够在ImageNet的训练集上实现最佳的结果。事实证明,一个训练好的PixelCNN模型产生的图像具有良好的数据分布性,而且没有发生过任何模型崩溃的问题。

起初,我们打算用条件型生成对抗网络(conditional GAN)来解决这个问题,但经过几次失败的尝试后,我们换成了另一种有望解决该问题的新型生产式模型——PixelCNN。(换成PixelCNN不久,SRGAN就发布了,它用GAN来解决超分辨率问题并能输出相当不错的结果。)

这个为期一年的项目已经结束了,在此我将就这一年的经历作一个总结与分享。

这一现象表明,着色问题可以简化成低分辨率颜色预测问题。我原本已准备好彻底放弃PixelCNN了,因为显然它无法输出大尺寸的图像,但转念一想其用来生成28×28×2的图像还是很可行的,并最终通过使用4位颜色数值而非8位,进一步的简化了着色问题。

对于用PixelCNN解决超分辨率问题的首次尝试,我试图用ImageNet提供的图片进行训练,但事实证明这个目标还是有些太高了。(相较于很多生成式模型使用的CIFAR-10、CelebA或LSUN数据集,ImageNet更加的复杂)我很快地就发现——像素来序列生成图像的过程极其缓慢。

为了更好地实现这个目标,以科技之名,我再一次搬离了布鲁克林来到了湾区。几天后我的日常生活就变成了与Google的机器学习专家进行讨论以及在庞大的软件架构中四处探索。

对我们而言,理想模型应该针对不同区域做出一个最佳的选择,尽可能的对细节做出全方位的优化。比如说,输入一张模糊的树的图片,我们希望我们的模型能分别对树的躯干、树枝、树叶进行优化,哪怕原图中没有相应的细节也没有关系。

最初拟定的目标是“修正”老电影或电视剧的画面。想象一下,上世纪90年代电视剧的粗糙画面或60年代的黑白电影,在色彩华丽的4K屏幕上播放的情景。

对于一部手机好不好,并不是某个人说来算的,那么联想S5到底还有哪些特色深得年轻消费者喜欢呢?还是来看看用户对于这部手机的评价了。

从数学的角度看,它与随机梯度下降算法是一样的,既机器越多,批处理能力越强。但同步随机梯度下降算法(Sync SGD)的优势是,它允许各线程使用更小、更快的批尺寸,从而来增加每秒训练的次数。

另一个方法,是用同步随机梯度下降算法(Synchronous SGD)。使用这一方法,所有线程在每个时间步长内进行同步,每次下降的梯度会被平均,这保证不会出现权重过期的问题。

拥有大量计算能力的另一好处是可以对超参数的优化进行大规模的暴力搜索。不确定该使用什么样的批尺寸进行训练?挨个试一遍!在找到论文中所用的配置前,我曾尝试过数百种配置。

在文献中,这一问题被称之为“超分辨率”问题,是一个科学家们尝试了很久都没有解决的难题。

根据以往的经验,我们认识到只是训练一个卷积模型最小化低分辨率图像与高分辨率图像的平均像素差值无法彻底地解决这一问题。因为这一类模型训练的目的是平均化输入图像和目标图像的整体差值,这就导致了生成的图片非常模糊。

超分辨率的像素递归论文:

除此之外,用户对于这款手机的拍照也是非常满意的,作为千元价位的手机还使用了后置双摄方案,重要的是拥有F/2.2光圈,黑白摄像头负责记录画面细节,彩色摄像头负责捕捉色彩,支持人像模式、黑白模式等,对于一些环境比较复杂的情况下,必然暗光,逆光以及夜间下都能轻松拍摄出满意的照片来。除此之外,前置摄像头自拍表现也很出色,除了搭载1600万像素之外,还支持 100 级 AI 美颜美肤相机和 24 种实时滤镜,让你轻松拍摄出美而自然的照片来。

在用户评价中,对于联想S5的人脸识别的评价也很高,不仅速度快而且准确率也高,重要的是安全系数让人很满意,有人拿着照片进行测试,发现是无法使用人脸识别技术解锁的,就技术方面来看,联想的实力确实很强。从这么多的用户评价来看,基本上可以确定联想S5是目前千元价位口碑最好的一部手机,这是大部分用户都认同的。如今这部手机在3月30日又开启了新的一轮销售,销量依旧很火爆。如果你动心了,可以多关注一下!

这应该是完全可行的:把4K视频转换成满是颗粒感的、低分辨率的、甚至是只有黑白两色的视频并不难,之后再通过某个训练出的监督模型来反转这个过程就可以“修正”了。而且,有数不尽的数据训练集,很棒不是吗!

如果你想跳过技术细节,可以直接跳到总结部分。

Slim的创造者Sergio Guadarrama一直在研究图像着色问题,他曾和我描述过这样一个试验:获取一张224×224×3的图像,将其置于YPbPr色彩空间中(该空间图像的灰度、颜色相互分离),首先将颜色通道降至28×28×2的超低分辨率,再用双线性插值法再把颜色通道放大,所得图像与高色彩分辨率的原始图像相比几乎没有差别。

本文作者Ryan Daul是Node.js的创始人,应该算是软件工程领域当之无愧的大犇了。他和我们分享了自己在谷歌大脑见习项目一年中的工作,成果,失败和思考。

本文作者Ryan Daul开发了Node.js,一个流行的前端框架

对于联想S5这部手机,各方面都让人很满意,正面使用了一块5.7英寸全面屏,分辨率为2160×1080,同时采用了全金属机身设计,最薄处只有3mm,在外观上给人的第一眼就是非常时尚漂亮,这是联想S5深得消费者喜欢的一大原因。

权重参数被托管在一台单独的“参数服务器”上,该服务器在每个时间步长内都进行“远程过程调用(RPC)”,以获得最新数值并发送梯度更新。

众所周知,在美剧《CSI犯罪现场》中使用的缩放技术在现实中并不存在,你无法将照片放大到任意倍数。但可行的是,在放大照片的同时将像素可能构成的合理图形进行推测并呈现,这也是实现我目标的第一步–逆向提高图片的分辨率。

异步随机梯度下降(Asynchronous SGD)是最理想的分布式训练方法。使用这种方法,你可以用N台机器,每一台都独立训练同一模型,并在每个时间步长共享一次权重参数。

当然了联想 S5在游戏方面的表现也让人很喜欢,因为搭载了AI游戏加速引擎,通过用户行为预判进行资源分配实现游戏不卡顿,另设置500Gbps+游戏专线,新增游戏免打扰功能,游戏的同时也可以电话、抢红包,并可通过悬浮键盘,游戏的同时实时回复重要信息,这也是为什么游戏爱好者对于这款手机也非常喜欢的原因。

除了材质方面,联想S5工艺方面表现也很出色,机身则是由一整块6系航空级铝合金板材制作而成,通过7道CNC工艺+纳米注塑,再经过打磨、喷砂、钻石切边、阳极氧化等十几道工序完成,这样的工艺技术就算是旗舰手机也未必有。不仅让手机更上档次,最重要的还是还带来了更好的握感,年轻人出街很拉风。

PixColor:着色问题的另一次尝试

Sergio构建了一个“美化”神经网络,它能美化低分辨率颜色的图像,并将溢出边界的颜色推回至正确位置–构造仅仅是使用L2损失函数将图片与图片进行比较。我们还用一个预训练好的ResNet作为辅助神经网络,以避免需要额外添加一个新的损失函数的需求,这中做法我们在超分辨率项目中就使用过。

目前联想S5正在京东,天猫和官网进行再次开卖,从京东评价来看,好评率高达98%,这在目前手机行业中来说,也是非常高的了,更何况还是一款价格千元的手机。从消费者评价的关键字来看,流畅简洁、超高性价比、高端人士必备、物有所值、颜致高,值得买、吃鸡无压力、拍照清晰以及反应比较快,虽然评价的关键字并不是很多,但每一个词都体现出了联想S5的不凡之处,可以说是一款全方面表现都让人很满意的手机。

先别急着兴奋——因为能做这事儿的技术还没有出现......不过我们确实离目标越来越近了。

当输出图像的尺寸大于64x64时,生成一张图片的耗时超过数个小时!但当我降低了输出图像的尺寸并使用脸部或卧室类的小型数据集后,就开始慢慢得到了一些振奋人心的结果了。

从京东购买用户的评价来看,有人说这款手机外形设计超酷,物有所值,高大上的不像千元机,拍照清晰,游戏流畅,还有人说是良心之作,千元机标杆。其中系统流畅是最多人提到的,就系统而言,因为联想S5搭载的是ZUI 3.7,在即将推送ZUI 4.0中会带来独创的“进程速冻”技术,将后台资源智能分配给前台应用,也就是说它拥有AI智能,可以让手机自行监测和清理后台应用,释放更多的运行内存,让手机长时间使用都不会卡顿。

如果整个数据流非常顺畅,就可以通过增加线程的方式线性增加模型每秒内的训练次数。但因为每个线程都是独立训练的,随着线程数的增加会越来越容易导致在当前线程还没有完成一次训练或更新时,它所使用的权重就已经过期了。

左侧为测试数据集所用的8x8低分辨率输入图像。中间为PixelCNN模型所输出的32x32高分辨率图像,右侧是原始的32x32分辨率图像。我们的模型优先整合脸部特征,而后去合成较为逼真的头发与皮肤方面的细节。

但同步随机梯度下降算法也有自己的问题:首先,它需要大量的机器经常进行同步,这就无可避免的会导致停机时间的增加;其次,除非将每台机器的批尺寸设为1,否则它无法通过增加机器的数量来增加每秒训练的次数。最终,我发现对我而言最简单有效的设置是用一台8GPU的机器使用同步随机梯度下降算法进行训练,即便如此每次训练仍需花上数天的时间。

如果是为了解决分类问题,这对神经网络的影响不大,把训练的规模扩增到几十台机器不难。但PixelCNN却对过时的梯度极其敏感,这就导致了通过增加硬件的数量来使用异步随机梯度下降算法所带来收益微乎其微。

让我没想到的是,通过PixelCNN生成的图像看起来非常自然。与对抗网络试图在生成与鉴别中找到一个精确的平衡不同,PixelCNN的目标只有一个,所以面对超参数的变化,它有更好的稳健性,也更容易被优化。

虽说我们的模型输出的脸部图像在质量上明显更好,但在像素对比上,平均看来还不如基准模型所输出的模糊图像。我们还尝试用PixelCNN本身的相似度测量来证明我们的样本比基准版本有着更佳的像素分布,但同样失败了。最后,我们把这项任务交给了大众——询问参与调查的人哪些图像看上去更真实,这才证明了我们模型的价值。

加盟热线:

vwin官网_德赢vwin官网_vwin.com德赢网【官方唯一指定网站】