layout
default

嵌入式AI简报 (2019-05-30)

关注模型压缩、低比特量化、移动端推理加速优化、部署
注：PC端微信链接打不开请用手机打开

业界新闻

谷歌限制华为安卓合作，余承东透露华为欲布局自研操作系统 | 新智元
摘要：谷歌宣布，将限制与华为在安卓方面的合作。在美国将华为列入“实体名单”后，任正非回应表示“华为没问题，已做好准备”。此前华为消费者业务CEO余承东曾提及华为打造操作系统的核心能力，这意味着或许离华为自研的操作系统问世不远了；
ARM发布全新架构CPU、GPU及AI内核，华为或将无缘 | 新智元
摘要：全球领先半导体知识产权(IP)提供商ARM重磅发布了下一代架构设计方案，其中包括：Cortex-A77 CPU；Mali-G77 GPU；ARM ML处理器；
瑞芯微发布面向RK3399Pro/RK1808芯片平台的全新三大开发套件 | cnBeta
摘要：福州瑞芯微电子Rockchip宣布旗下AI平台重大升级，正式面向全球AI开发者发布三大开发套件：AI开发工具包RKNN-Toolkit、AI SDK软件开发工具包Rock-X SDK，以及AI人工智能计算棒RK1808 AI Compute Stick。
RK3399Pro与RK1808 AI芯片平台为瑞芯微旗下最新旗舰芯，均带有独立硬件NPU加速器。RK3399Pro能为AI人工智能开发者提供一站式Turnkey解决方案，片上NPU（神经网络处理器）运算性能达3.0TOPs，具有高性能、低功耗、开发易等优势，已应广泛应用于智能驾驶、图像识别、安防监控、无人机、语音识别等AI应用领域;RK1808 AI芯片平台内置的NPU算力强大，可实现语音唤醒、语音识别、人脸检测及属性分析、人脸识别、姿态分析、目标检测及识别、图像处理等一系列功能，可广泛应用于安防、教育、清扫、车载、穿戴、家电、存储等各场景中；
获高通阿里投资后，耐能推出首颗为3D人脸识别定制的AI芯片 | 机器之能
摘要：耐能——这是一家由前高通华人工程师组建的芯片团队，成立于2015年，聚焦在终端 AI 芯片解决方案，主攻智能手机、智能安防、智能物联网等领域。成立三年，推出两代六款IP，基于和高通、知名家电厂商的合作经验，两代IP的开发实战，耐能终于底气十足地踏出了关键一步，基于第二代IP标准版本推出首颗自家品牌的系统级AI芯片，同时也是市面上首颗专为3D人脸识别进行优化的终端芯片。
耐能发布AI芯片KL520，专为智能物联网应用所设计，兼顾语音和图像不同数据类型处理，支持2D、3D图像识别，适用于结构光、ToF、双目视觉等3D传感技术并计算不同神经网络模型，可应用于智能门锁/门禁、扫地机器人等智能家居场景，无人机、智能玩具、机器人等智能硬件产品线。
值得一提的是，该颗芯片目前已经量产，并且已经与中国大陆和台湾两地的数家客户达成合作。在深圳媒体沟通会现场，耐能宣布了与大唐半导体、奥比中光、蓦然认知等厂商的合作计划；
平头哥新动态：蓄势待发，RISC-V必有一席之地 | EETOP
摘要：今年，平头哥半导体团队将进一步发布更多面向不同应用的嵌入式CPU处理器，积极参与RISC-V开源生态建设，以及二十余项技术标准小组的工作，推动RISC-V技术持续演进；
英伟达首款边缘计算AI平台EGX重磅发布！实时处理，高性能、可扩展 | 新智元
摘要：英伟达最新发布首款面向边缘设备的AI平台Nvidia EGX，将 AI 带到了网络的边缘。该平台可以实时感知、理解和处理数据，而无需先将数据发送到云端或数据中心；
0.5秒闪译，12倍速转写，科大讯飞一口气发布五款超强AI产品 | 量子位
摘要：算法无限接近极限，场景千树万树梨花开，但如何真正让AI之能触达用户？科大讯飞的答案：终端硬件，而且是算法定义的硬件：
讯飞翻译机3.0内置了高通骁龙八核处理器，支持普通话与粤语、东北话、河南话、四川话等方言之间的翻译，还新增了维汉、藏汉等民族语言翻译，翻译速度也再度提升，达到“0.5秒闪译”，并提升了图像拍照翻译水平。此外还有讯飞转写机，讯飞智能录音笔，讯飞智能办公本，讯飞学习机等；

论文

深度压缩感知，新框架提升GAN性能 | 新智元
摘要：DeepMind提出一种全新的“深度压缩感知”框架，将压缩感知与深度学习相结合，显著提高了信号恢复的性能和速度，并提出一种改进GAN的新方法；
速度提升17.5倍！百度提出语音合成新模型ParaNet，一个完全并行的神经TTS系统 | 量子位
摘要：百度提出了一种非自回归序列到序列的模型ParaNet，引入了一个完全并行的神经TTS系统，将文本转换成光谱图。和此前百度提出的实时语音合成系统Deep Voice 3相比，ParaNet可在保证准确率相当的情况下，将速度提升到17.5倍；
UIUC联合IBM、Inspirit IoT推出最新DNN/FPGA协同设计方案，助力物联网终端设备AI应用 | 机器之心
摘要：UIUC、IBM 和 Inspirit IoT, Inc（英睿物联网）的研究人员提出 DNN 和 FPGA 加速器的协同设计方案（DNN/FPGA co-design），通过首创的「Auto-DNN」网络搜索引擎 +「Auto-HLS」加速器生成技术，自动生成适用于终端设备的 DNN 模型及 FPGA 加速器设计。在使用相同的终端设备，由该协同设计自动生成的物体检测方案在检测精度、速度和效能方面均大幅领先现时最优的 DAC'18 System Design Contest 冠军方案。

开源项目

登顶五大数据集！最强目标跟踪算法SiamRPN++开源了，商汤出品 | CVPR 2019 Oral | 量子位
摘要：商汤SiamRPN++几乎不受复杂场景的影响。不止如此，它已经在多个数据集上成为了State-of-the-Art。同时也成了商汤Siam家族的骄傲。现在，整个家族都开源了：
· SiamMask (CVPR 2019)
· SiamRPN++ (CVPR 2019 oral)
· DaSiamRPN (ECCV 2018)
· SiamRPN (CVPR 2018)
· SiamFC (ECCV 2016)
XiaoMi/kaldi-onnx: Kaldi model converter to ONNX
摘要：kaldi到onnx的转换工具开源了，可以配合mace在设备端运行语音nnet模型推理，对语音领域感兴趣可以关注；
TensorFlow官方发布剪枝优化工具：参数减少80%，精度几乎不变 | 量子位
摘要：去年TensorFlow官方推出了模型优化工具，最多能将模型尺寸减小4倍，运行速度提高3倍；最近现又有一款新工具加入模型优化“豪华套餐”，这就是基于Keras的剪枝优化工具：https://github.com/tensorflow/model-optimization；

博文

CPU体系结构之手排流水线专题（一） | 知乎
摘要：arm底层汇编优化。关于流水线我打算分三个篇幅来讲，尽量做到系统全面：第一篇讲背景以及理论知识；第二篇是ARM具体的架构信息以及在手机上做的一些实验；第三篇就是讲如何花式操作流水线，举例子；本文是第一篇；
CUDA 并行计算入门视频 | 机器之心
摘要：什么是 CUDA？CUDA 并行计算包括哪些方面？CUDA 的线程层次有哪些？如何更加高效的调用线程来执行程序命令？如何在实际应用中利用 GPU 加速我们的应用程序？如何在深度学习中使用 CUDA？英伟达开发者社区经理暨高级讲师何琨带你入门 CUDA 并行计算；
华为方舟编译器做了些什么，让安卓有了“丝滑”的感觉 | 码农翻身
摘要：作者基于无虚拟机运行、多语言联合优化、更搞笑的内存回收机制来分析方舟编译器，不过作者也提到这些都是猜测，还是等方舟编译器开源了，再一探究竟吧；
模块设计之 SKNet, GCNet, GloRe, Octave | 极市平台
摘要：本文对SKNet, GCNet, GloRe, Octave4篇较新较火的网络模块设计与优化相关文章进行了对比总结，含两篇CVPR2019的工作；
用代码模拟CPU | 机器之心
摘要：芯片的设计到底有多难？想要回答这个问题最好还是先自己实践一下。最近，来自 BBC 的一名资深软件工程师 Daniel Harper 使用 Go 语言成功模拟出了一个 CPU 的所有功能，并把自己的经历写成了博客，引起了人们的热议。这篇文章也告诉我们：完整地了解计算机的工作原理是多么重要；
美国禁令与华为极限生存简析 | 知乎

往期回顾

2019-05-15
2019-04-27
2019-04-13
2019-03-31

Wechat ID: NeuroMem
Editor: https://github.com/ysh329
Project: https://github.com/ysh329/awesome-embedded-ai

本作品采用知识共享署名-相同方式共享 2.0 通用许可协议进行许可。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

2019-05-30.md

2019-05-30.md

嵌入式AI简报 (2019-05-30)

业界新闻

论文

开源项目

博文

往期回顾

Files

2019-05-30.md

Latest commit

History

2019-05-30.md

File metadata and controls

嵌入式AI简报 (2019-05-30)

业界新闻

论文

开源项目

博文

往期回顾