layout |
---|
default |
关注模型压缩、低比特量化、移动端推理加速优化、部署
注:PC端微信链接打不开请用手机打开
- 谷歌限制华为安卓合作,余承东透露华为欲布局自研操作系统 | 新智元
摘要:谷歌宣布,将限制与华为在安卓方面的合作。在美国将华为列入“实体名单”后,任正非回应表示“华为没问题,已做好准备”。此前华为消费者业务CEO余承东曾提及华为打造操作系统的核心能力,这意味着或许离华为自研的操作系统问世不远了; - ARM发布全新架构CPU、GPU及AI内核,华为或将无缘 | 新智元
摘要:全球领先半导体知识产权(IP)提供商ARM重磅发布了下一代架构设计方案,其中包括:Cortex-A77 CPU;Mali-G77 GPU;ARM ML处理器; - 瑞芯微发布面向RK3399Pro/RK1808芯片平台的全新三大开发套件 | cnBeta
摘要:福州瑞芯微电子Rockchip宣布旗下AI平台重大升级,正式面向全球AI开发者发布三大开发套件:AI开发工具包RKNN-Toolkit、AI SDK软件开发工具包Rock-X SDK,以及AI人工智能计算棒RK1808 AI Compute Stick。
RK3399Pro与RK1808 AI芯片平台为瑞芯微旗下最新旗舰芯,均带有独立硬件NPU加速器。RK3399Pro能为AI人工智能开发者提供一站式Turnkey解决方案,片上NPU(神经网络处理器)运算性能达3.0TOPs,具有高性能、低功耗、开发易等优势,已应广泛应用于智能驾驶、图像识别、安防监控、无人机、语音识别等AI应用领域;RK1808 AI芯片平台内置的NPU算力强大,可实现语音唤醒、语音识别、人脸检测及属性分析、人脸识别、姿态分析、目标检测及识别、图像处理等一系列功能,可广泛应用于安防、教育、清扫、车载、穿戴、家电、存储等各场景中; - 获高通阿里投资后,耐能推出首颗为3D人脸识别定制的AI芯片 | 机器之能
摘要:耐能——这是一家由前高通华人工程师组建的芯片团队,成立于2015年,聚焦在终端 AI 芯片解决方案,主攻智能手机、智能安防、智能物联网等领域。成立三年,推出两代六款IP,基于和高通、知名家电厂商的合作经验,两代IP的开发实战,耐能终于底气十足地踏出了关键一步,基于第二代IP标准版本推出首颗自家品牌的系统级AI芯片,同时也是市面上首颗专为3D人脸识别进行优化的终端芯片。
耐能发布AI芯片KL520,专为智能物联网应用所设计,兼顾语音和图像不同数据类型处理,支持2D、3D图像识别,适用于结构光、ToF、双目视觉等3D传感技术并计算不同神经网络模型,可应用于智能门锁/门禁、扫地机器人等智能家居场景,无人机、智能玩具、机器人等智能硬件产品线。
值得一提的是,该颗芯片目前已经量产,并且已经与中国大陆和台湾两地的数家客户达成合作。在深圳媒体沟通会现场,耐能宣布了与大唐半导体、奥比中光、蓦然认知等厂商的合作计划; - 平头哥新动态:蓄势待发,RISC-V必有一席之地 | EETOP
摘要:今年,平头哥半导体团队将进一步发布更多面向不同应用的嵌入式CPU处理器,积极参与RISC-V开源生态建设,以及二十余项技术标准小组的工作,推动RISC-V技术持续演进; - 英伟达首款边缘计算AI平台EGX重磅发布!实时处理,高性能、可扩展 | 新智元
摘要:英伟达最新发布首款面向边缘设备的AI平台Nvidia EGX,将 AI 带到了网络的边缘。该平台可以实时感知、理解和处理数据,而无需先将数据发送到云端或数据中心; - 0.5秒闪译,12倍速转写,科大讯飞一口气发布五款超强AI产品 | 量子位
摘要:算法无限接近极限,场景千树万树梨花开,但如何真正让AI之能触达用户?科大讯飞的答案:终端硬件,而且是算法定义的硬件:
讯飞翻译机3.0内置了高通骁龙八核处理器,支持普通话与粤语、东北话、河南话、四川话等方言之间的翻译,还新增了维汉、藏汉等民族语言翻译,翻译速度也再度提升,达到“0.5秒闪译”,并提升了图像拍照翻译水平。此外还有讯飞转写机,讯飞智能录音笔,讯飞智能办公本,讯飞学习机等;
- 深度压缩感知,新框架提升GAN性能 | 新智元
摘要:DeepMind提出一种全新的“深度压缩感知”框架,将压缩感知与深度学习相结合,显著提高了信号恢复的性能和速度,并提出一种改进GAN的新方法; - 速度提升17.5倍!百度提出语音合成新模型ParaNet,一个完全并行的神经TTS系统 | 量子位
摘要:百度提出了一种非自回归序列到序列的模型ParaNet,引入了一个完全并行的神经TTS系统,将文本转换成光谱图。和此前百度提出的实时语音合成系统Deep Voice 3相比,ParaNet可在保证准确率相当的情况下,将速度提升到17.5倍; - UIUC联合IBM、Inspirit IoT推出最新DNN/FPGA协同设计方案,助力物联网终端设备AI应用 | 机器之心
摘要:UIUC、IBM 和 Inspirit IoT, Inc(英睿物联网)的研究人员提出 DNN 和 FPGA 加速器的协同设计方案(DNN/FPGA co-design),通过首创的「Auto-DNN」网络搜索引擎 +「Auto-HLS」加速器生成技术,自动生成适用于终端设备的 DNN 模型及 FPGA 加速器设计。在使用相同的终端设备,由该协同设计自动生成的物体检测方案在检测精度、速度和效能方面均大幅领先现时最优的 DAC'18 System Design Contest 冠军方案。
- 登顶五大数据集!最强目标跟踪算法SiamRPN++开源了,商汤出品 | CVPR 2019 Oral | 量子位
摘要:商汤SiamRPN++几乎不受复杂场景的影响。不止如此,它已经在多个数据集上成为了State-of-the-Art。同时也成了商汤Siam家族的骄傲。现在,整个家族都开源了:
· SiamMask (CVPR 2019)
· SiamRPN++ (CVPR 2019 oral)
· DaSiamRPN (ECCV 2018)
· SiamRPN (CVPR 2018)
· SiamFC (ECCV 2016) - XiaoMi/kaldi-onnx: Kaldi model converter to ONNX
摘要:kaldi到onnx的转换工具开源了,可以配合mace在设备端运行语音nnet模型推理,对语音领域感兴趣可以关注; - TensorFlow官方发布剪枝优化工具:参数减少80%,精度几乎不变 | 量子位
摘要:去年TensorFlow官方推出了模型优化工具,最多能将模型尺寸减小4倍,运行速度提高3倍;最近现又有一款新工具加入模型优化“豪华套餐”,这就是基于Keras的剪枝优化工具:https://github.com/tensorflow/model-optimization;
- CPU体系结构之手排流水线专题(一) | 知乎
摘要:arm底层汇编优化。关于流水线我打算分三个篇幅来讲,尽量做到系统全面:第一篇讲背景以及理论知识;第二篇是ARM具体的架构信息以及在手机上做的一些实验;第三篇就是讲如何花式操作流水线,举例子;本文是第一篇; - CUDA 并行计算入门视频 | 机器之心
摘要:什么是 CUDA?CUDA 并行计算包括哪些方面?CUDA 的线程层次有哪些?如何更加高效的调用线程来执行程序命令?如何在实际应用中利用 GPU 加速我们的应用程序?如何在深度学习中使用 CUDA?英伟达开发者社区经理暨高级讲师何琨带你入门 CUDA 并行计算; - 华为方舟编译器做了些什么,让安卓有了“丝滑”的感觉 | 码农翻身
摘要:作者基于无虚拟机运行、多语言联合优化、更搞笑的内存回收机制来分析方舟编译器,不过作者也提到这些都是猜测,还是等方舟编译器开源了,再一探究竟吧; - 模块设计之 SKNet, GCNet, GloRe, Octave | 极市平台
摘要:本文对SKNet, GCNet, GloRe, Octave4篇较新较火的网络模块设计与优化相关文章进行了对比总结,含两篇CVPR2019的工作; - 用代码模拟CPU | 机器之心
摘要:芯片的设计到底有多难?想要回答这个问题最好还是先自己实践一下。最近,来自 BBC 的一名资深软件工程师 Daniel Harper 使用 Go 语言成功模拟出了一个 CPU 的所有功能,并把自己的经历写成了博客,引起了人们的热议。这篇文章也告诉我们:完整地了解计算机的工作原理是多么重要; - 美国禁令与华为极限生存简析 | 知乎
Wechat ID: NeuroMem
Editor: https://github.com/ysh329
Project: https://github.com/ysh329/awesome-embedded-ai
本作品采用知识共享署名-相同方式共享 2.0 通用许可协议进行许可。