特斯拉自研的AI芯片来了

 特斯拉自研的AI芯片来了

如果问你特斯拉是一家什么公司,也许很多人的印象中这是一家车厂,做电动车的,他家的老板伊隆·马斯克还开了一家发射火箭的公司,然后还有一家名为SolarCity的太阳能发电公司,是美国最大的光伏企业。又是新能源汽车,又是光伏发电,又是发射火箭,你咋不上天呢?该不会是炒作高科技概念骗补的吧?你还别说,上天真是他的终极目标,记得之前看过一篇报道,在接受Axios采访时马斯克说过,有70%的可能他能在有生之年乘自己的SpaceX火箭登上火星。

从今天起,老wu觉得需要对特斯拉进行重新认识,就像以前玩游戏,老wu一直以为暴雪是一家游戏公司,后来才发现是一家CG公司 😂 其实暴雪家的CG才🐂🍺,为了做游戏的开场CG才顺带把游戏也做了而已。
现在,特斯拉是一家AI芯片公司了,造车谁都会,国内的互联网超车企业更是多如牛毛,以前我们说特斯拉的核心技术是其独家的电池管理系统和电池冷却系统,为其在电动车核心领域构筑起了护城河。

现在,有了护城河,特斯拉还要为其在电动车核心领域构筑起长城–AI芯片,也许以后真是为了展示他家的AI芯片和自动驾驶系统的威力顺便造了辆车而已。
特斯拉作为自动驾驶技术的先驱,其自动驾驶系统Autupilot最早于2014年10月推出,成为率先实现自动驾驶技术量产的车企。5年来,特斯拉收集了数以十亿公里计的驾驶数据,领先其他厂商相当多的距离,路测数据作为自动驾驶领域的宝贵财富,成为了特斯拉一大竞争优势。
长期以来,特斯拉的自动驾驶方案一直基于NVIDIA硬件平台,Autopilot 1.0数据处理单元是1颗Nvidia Tegra3+1颗Mobileye Q3,Autopilot 1.0需要处理的传感器数据有:

  • 一个前置摄像头
  • 12个超声波传感器
  • 一个前置雷达
  • 一个后置倒车摄像头(目前不参与自动辅助驾驶)

到了Autopilot 2.0数据处理单元则是NVIDIA Drive PX2,相当于40倍的Autopilot 1.0 处理速度
处理的传感器数据有:

  • 3个前置摄像头(不同视角广角、长焦、中等)
  • 2个侧边摄像头(一左一右)
  • 3个后置摄像头
  • 12个超声波传感器(传感距离增加一倍)
  • 一个前置雷达(增强版)
  • 一个后置倒车摄像头

Autopilot 2.5则是搭载了3可Nvidia家的主芯片,2颗Tegra Parker芯片和1颗Pascal架构GPU。
Autopilot 3.0的目标是完全自动驾驶,需要更加庞大的处理能力,综合考虑了功耗以及体积因素,更重要的是关键时刻不能被别人卡脖子,一定要在自动驾驶领域掌握核心技术,特斯拉觉得与苹果一样,走上了自研芯片的道路,即使这样很烧钱。

在8月18-20号举行的第31届Hot Chips大会上,特斯拉也对外展示了其自研的AI芯片成果,展示了搭载特斯拉自研的AI芯片的产品,称之为Full Self-Driving Computer”,中文为“全自动驾驶电脑”,该全自动驾驶电脑就是特斯拉Autopilot 3.0硬件。全新的Autopilot 3.0硬件上搭载了两颗由特斯拉自主研发的全自动驾驶芯片,该芯片采用14nm工艺制造,由三星德克萨斯州工厂生产。

AI芯片为1个12核心ARM A72架构的64位处理器,运行频率为2.2GHz;图像处理器能够提供0.6TFLOPS计算能力,运行频率为1GHz;2个神经网络处理器运行在2.2GHz频率下能提供72TOPS的处理能力。为了提升神经网络处理器的内存存取速度以提升计算能力,每颗芯片内部还集成了32MB高速缓存。
在Hot Chips 会议上,特斯拉AI芯片的设计人员介绍了特斯拉是如何优化提升这款定制 AI 芯片的性能的。与旧款英伟达芯片相比,其性能提升可达 21 倍、且成本仅为Nvidia家的 80% 。
“为了实现全自动驾驶的目标,显然需要更好更强大的硬件,不然只能停留在路况简单的高速巡航、以及停车标志和交通信号灯的识别层面。” 特斯拉AI芯片设计师之一、前 AMD雇员 Ganesh Venkataramanan 表示:“我们深知,要在功率和体积因素的限制下达到设计所需的性能产品,就只能亲自动手自研AI芯片了” 有钱就是任性啊,哈哈哈
这项重大努力,反映在了庞大的晶体管数量上(60 亿)。特斯拉为其投入了许多独家的技术积累,涵盖从处理器、软件、到电池制造、以及充电桩在内的所有内容,当然,还有老wu前边提到的5年来,特斯拉收集到的数以十亿公里计的驾驶数据。
我们看Hot Chips上展示的这块搭载了特斯拉自研AI芯片的主板,有个有趣的亮点,就是PCB上搭载了两颗一样的特斯拉AI芯片,这是为了提高安全性,特斯拉为车载计算机采用了两组 AI 芯片的冗余设计,芯片的供电和数据输入组件也考虑了冗余。即便是摄像头,也都挂接在两组独立的电源上,以避免发生故障。
特斯拉的AI 芯片耗费了14 个月的时间来设计,目前正在由三星来代工其处理器,虽然是说耗费了14个月的时间来设计,但其早在2016年1月就挖来了Jim Keller担任AutoPilot硬件工程副总裁,就是为这块AI芯片做架构设计工作,完成特斯拉AI芯片的架构设计工作之后,2018年4月Jim Keller又跳到了Intel,不知道Jim Keller能否打破Intel的挤牙膏传统,明年上到10纳米工艺之后给我们撸上一整管的牙膏?不过可能Jim Keller去Intel并不是打磨挤牙膏工艺啦,有可能继续发力AI,或者帮助Intel独显的开发。

说起CPU架构狂魔Jim Keller,其人生也是开挂般的存在了。
Jim Keller在上世纪九十年代曾在DEC工作, 在上个世纪六七十年代,DEC推动的小型机曾在市场上掀起了巨大风潮
,在DEC工作期间,Jim Keller涉足了Alpha处理器项目的设计。这段经历让他对Alpha处理器获得了深入了了解,并为后面的开挂经历埋下了伏笔。
到了八十年代后期,在SUN的工作站和IBM小型机的双重攻击下,DEC开始走向了九十年代的大溃败。DEC也在1998年被康柏收购了。
DEC被收购之后,便有大批的人才出走,当时求贤若渴的AMD CEO Jerry Sanders 立即展开了招揽,当中就包括了 Jim Keller。
进入了AMD之后,Jim Keller参与了ADM K7处理器的设计,并成为后来K8的主架构师,当年的AMD K8也算得上是让Intel翻车的一代神U了,这也让Jim Keller在业界打响了名号。
Jim Keller主导了K8架构核心的研发之后,他在离开了AMD,加入了SiByte。该公司是下一代互联网系统中高速数据、音频与视频传输所使用的硅产品解决方案领域内的首要提供商,Keller在其中则负责MIPS处理器的研发。到了2000年,SiByte被博通收购,他也到了博通公司担任首席架构师,直到2004年,转战PA Semi,担任工程VP。
在加入PA-Semi工作的几年里,Jim Keller在Daniel W. Dobberpuhl的领导下,继续积累了低功耗RISC处理器的设计经验。直到2008年,苹果将PA-Semi收归囊中。
Jim Keller也因此转入苹果的战队,被委以重任的他带领团队开拓了苹果A系列处理器中的开山之作A4、 A5,开启苹果的辉煌“造芯”之路。
在划时代的iPhone 4发布之前,苹果每一代iPhone产品使用的都是第三方的处理器,直到iPhone 3GS,采用ARM Cortex-A8架构的Samsung S5PC100处理器性能让乔老爷子极不满意,这也可能与三星自家工厂的制程工艺落后于台积电有关,然后乔老爷子就决定自研芯片了,由台积电代工。
随着Jim Keller的离开,AMD在K8的成功过后,又陷入了被Intel摁在地上摩擦的境地,Intel甚至都懒得费精力去摩擦了,只顾玩起了挤牙膏工艺。
直到Jim Keller离开苹果重返AMD,在Jim Keller的主导下,AMD推出了全新的ZEN架构处理器 Ryzen。凭借全新的设计了优越的性能,该产品的推出,就引致了市场的热捧。
大神就是大神,完成了Zen处理器的架构设计之后,就又离开了AMD,都还未等处理器上市销售呢。
从AMD离职后Jim Keller来到了特斯拉,领导一个 50 人组成的小组为特斯拉开发专用的 AI 芯片,这样就有了老wu这篇文章介绍的特斯拉AI芯片了。
但有意思的是,在8月18-20号举行的Hot Chips大会上特斯拉所展示的搭载自研AI芯片的全自动驾驶电脑产品,但人家Jim Keller在完成架构设计之后,2018年4月Jim Keller就已经跳到Intel了。
从ADM到博通,然后转战苹果,在AMD危难之际又重回AMD干翻Intel,然后去到特斯拉开发AI芯片,接着有去到曾被他干翻在地的Intel去主导面向未来10年的CPU架构设计。
大神就是大神,弄个处理器架构跟玩儿似的 😂

吴川斌

吴川斌