专注于可靠性和芯片长期健康的工具和生态系统开始为汽车电子行业融合。从芯片生命周期(设计、验证、测试、制造和现场操作)收集的数据将成为实现新一代汽车寿命、可靠性、功能安全和安全性的关键。
在一个平台上拥有足够数量的良好数据意味着汽车公司及其供应链可以对其进行分析并采取行动,从而有可能及早预测故障,以便对设计、制造和现场操作进行更改。
“这是一个完整的生态系统。Synopsys数字设计部研发部总监 Fadi Maamari 表示,许多事情需要共同努力,才能在可靠性和芯片设计方面建立一个积极的反馈循环。
这比看起来更难。其中一些生态系统由单独工作的实体组成。它们可以包括来自多个供应商或内部开发的工具或平台,以从各种工具中提取数据。在某些情况下,这涉及从多个设备中收集数据,这些设备以前不被认为对芯片至关重要,因为汽车应用中使用的大多数芯片是执行器、MCU 或可编程设备。
随着自动驾驶的发展,发生了很大变化,现在需要收集、关联和结构化数据,以便在验证、测试、产量和现场监控过程中对其进行评估和采取行动。数据需要清理、转换成一致的格式并进行分析。虽然反馈循环中的这些步骤对于某些市场来说并不是全新的,但它们代表了汽车行业的重大转变,汽车行业多年来一直在相对缓慢和手动的层面上工作。现在的挑战是实现从设计到制造等整个供应链的现代化,并比以往任何时候都更快地从更多来源提供更详细的信息。
“原始设备制造商正在寻找可扩展的方法来支持先进软件技术不断增长的性能范围,同时保持先进节点的电子可靠性。但他们需要的是数据来了解何时以及如何优雅地发生故障,并在故障安全机制中平衡可用性与安全性,” proteanTecs汽车部门总经理 Gal Carmel 说。“这是一种权衡,今天不存在完美。但我们正在努力通过准确了解这些系统的健康状况来改变这种等式。”
当然,并非所有这些都会同时发生。“这是分阶段交付。Synopsys 硅生命周期管理营销总监 Randy Fish 说。“我们今天提供一些内容。”
其余的将需要时间,因为这需要改造庞大的全球供应链,并且会影响从原材料采购到最终测试等各个阶段。“鉴于自动驾驶汽车技术和通信标准的广度和深度,不会有一两家公司联合起来为汽车提供整体的端到端测试解决方案,”杰夫菲利普斯说,转到National Instruments 在运输方面的市场领先地位。“生态系统中的不同人员将一起工作,就如何互操作和集成我们的解决方案进行协作。使用云和基础设施处理,制造和测试分析将具有应用于雷达、激光雷达和 I/O 的优势。但也有许多不同的技术载体必须结合在一起。”
AV、EV 推动
一些汽车芯片变得越来越复杂和精致。对于车辆中的中央逻辑尤其如此,它需要管理所有其他系统以防止车辆出现故障。当前的设计使用 7nm 和 5nm 逻辑,处于芯片制造的前沿,但这些设备必须能够承受恶劣的环境,并且比消费类芯片至少能正常工作 10 年。
尽管成熟的节点仍然是中流砥柱,但汽车芯片已经成长为大型复杂的 SoC。这些包括集成到异构包和配置中的高级节点设备,这些设备相对未经尝试。过去,电子控制单元通常只有一个处理器或存储单元。情况不再如此,从验证到各种类型的测试,包括合规性测试,一切都变得更加严格。
部分原因是更多的驾驶员辅助和向完全自主的发展。Synopsys 的 Maamari 表示:“自动驾驶汽车和最新节点正在塑造目前正在做的很多事情。”
部分原因还在于更高的效率和可靠性。“第二个大趋势是通过排放控制实现电气化,”proteanTecs 的 CSO Uzi Baruch 说。“在向市场推出需要完全自主和完全电气化的新车时,他们可以同时做很多事情。”
功能安全与可靠性
在任何有关汽车电子的讨论中都会提到可靠性和功能安全之间的紧密关系。功能安全的重点是避免受伤,而可靠性则是汽车是否工作,不需要维修。但是随着自主权的增加,有很多重叠。
“如果石头撞击传感器会发生什么?除了可靠性本身,我们还必须考虑自动驾驶汽车的功能安全性,其中一些活动的标准驾驶是ISO 26262。这是我们在设计阶段所做的许多事情的核心,”Maamari 说。“只要芯片安全失效,它就可以失效。这是功能安全的纯粹关注点。如果在自动驾驶汽车中,无论是芯片故障还是雷击,汽车不撞车都是至关重要的。不会造成伤害。当然,可靠性很重要。你宁愿让芯片一开始就不会失败。因此,这对于功能安全和质量都是可取的。”
了解故障对于汽车行业至关重要。“失败的机会很多,”巴鲁克说。“达到可以以受控方式重复该过程并在这些生产线内部、工厂或不同供应商之间找到根本原因问题的地步,正在为可靠性带来重大挑战。无论您生产什么,都需要可重复,并且您需要能够信任它。这导致这些公司的运营方式发生重大转变。”
汽车电子产品的可靠性要求已由汽车电子委员会(AEC)定义和分级,AEC Q-100/200 是汽车 IC 压力测试的首选标准。热量、湿度和振动都是可能损坏芯片的风险因素,但材料、设计和制造工艺也会使芯片或多或少地受到风险因素的影响。这变得复杂,细节很重要。
“在整个开发和认证过程中都需要明智地使用热机械模型,” Amkor 的R. Dias 等人在 2019 年的研究论文“开发汽车级 1/0 FCBGA 封装能力的挑战和方法”中写道。“聚合物材料在长时间处于高温下时会发生永久性变化。根据环境的不同,这可能包括材料氧化以及导致脆化的机械性能变化。湿度的存在还会导致芯片钝化和基板阻焊层界面处的附着力丧失。”
除了材料科学之外,随机误差(例如阿尔法粒子撞击关键组件)可能会导致可靠性问题。然后是软件可靠性问题。
“软件具有挑战性,因为它不遵循任何物理规则,” PDF Solutions高级解决方案副总裁 Dennis Ciplikas 说。“硬件听起来很难,但它实际上遵循一些边界条件。使用软件,你可以改变一件事,但会产生巨大的意外成本,”
一种解决方案是冗余,但这会增加费用和重量。冗余通常是在航空领域实现可靠性的方式,但对于汽车而言,冗余需要限于车辆内的特定系统。
“我来自航空背景,冗余是我们通常处理可靠性问题的方式——三台飞行计算机投票决定谁是正确的。但是我们在汽车中没有那种奢侈,我们正在努力节省一分钱,” KLA战略合作高级总监杰伊拉特说 。
在汽车中,冗余是平衡的。“对于更大的 SoC,冗余有多种形式,”Maamari 说。这些技术是“在更高级别上复制一些 CPU 或一些功能较差。您复制它们,检查输出,并确保两者获得相同的输出,然后如果两者中的任何一个显示出不一致的内容,则标记一个问题。那是相当昂贵的,所以它是为了功能差而做的,它实际上起到了双重作用。您可以不断检查它们是否一致,但这也允许您在操作期间进行一定程度的自检。您可以将两者之一关闭,在系统仍然运行时对其进行自检,然后再将其恢复。这很昂贵,因为您要复制整个块或处理器。”
其他冗余设计得更精确。“有时它只是在存储器寄存器级别出现,就像逻辑设计中的触发器,您可以在其中识别一些发挥关键功能的寄存器。要么用更宽容的部分替换它,要么放入三种模块化冗余,其中有三个,这是三个的投票。所以是细粒度、粗粒度等多种技术。为了降低成本,这完全是一种平衡行为。”
并非所有对反馈循环都很重要
的数据从汽车中收集有用的数据并将其发送到设计反馈循环中是行业在未来 5 到 10 年内会变得更好的例行程序。“汽车公司、芯片设计公司、半导体公司是我们需要更详细的分析来获得反馈的地方——正反馈循环——这样我们就可以做出适当的调整和使用的设计技术和库,”马马里说。
完成这项工作的关键要素之一是从汽车传输最少的数据。这意味着汽车本身必须能够整理相关数据和事件。“其中一些可能在监视器本身上,位于连接到电源的芯片内,或连接到热传感器或总线活动类型监视器,”Fish 说。“您可以根据触发因素做出决定。我是否想费心保留这些信息?或者您可能只想要地址而不是您正在监控的数据部分。可以做出很多本地决策,非常本地化。”
管理所有这些数据将是至关重要的。“关于过多的数据以及如何以一种干净的方式将它们组合在一起,我们开发了一种称为语义模型的概念,”PDF Solutions 的 Ciplikas 说。“语义不同于结构。它不同于语法和模式。模式是一种可以关联所有不同数据源之间的键的方式。但是当你把一些语义放在上面时,虽然它们来自不同的来源,有自己的键,你可以看到数据实际上非常相似或相同。因此,对于不同类型的工具或不同类型的传感器,即使它们在物理上不同且来自不同的供应商,但它们在逻辑上是相同的。通过识别所有不同数据源的语义相似之处,您可以更轻松地将其转换为格式,然后提取出一些有用的结果。通过在链中上下推动语义概念,它可能会提供某种方式将所有内容放在一起以进行相关性分析,或者我们需要对其进行任何处理。
关键是了解什么对可靠性很重要,而这本身就是一项复杂的任务。“当您查看跨时间构建的组件时,可能有 10、15 甚至 100 个流程步骤,”Baruch 说。“能够从多个层(不同层、不同流程、不同传感器、不同设备类型)中提取数据并将它们组合在一起的想法,如果您不采用描述性方法,最终要么返回每次你需要做某事,或者因为你会卡在不同的领域而无法真正实现那个用例时,给你的工程团队。”
简而言之,从汽车中提取数据并不是免费的数据。“只收集有价值的信息非常重要,”费什说。“我知道这很难量化,但你不能一直发送所有数据。” 查找重要数据意味着对汽车或零件具有分析能力。“从非常简单的任何可以有效进行分析的地方开始,您应该这样做以基本上最大限度地减少最终传输回云的数据。”
获取从芯片生命周期收集的数据并将其重新插入反馈回路是可靠性和功能安全的关键。“设计中的反馈循环有很多不同的方式,”Maamari 说。“对于功能安全,我们可以做的一件事是,当您测量老化时,我们可以在某个时间点得出结论,设备已经老化到不再安全的程度。然后我们可以举起旗帜并说这辆车在受伤或故障发生之前需要维修。您可以在一定程度上进行预防性维护。”
预测性维护是反馈回路的一个好处。“如今,预测性维护功能正被设计到车辆架构中;关键是数据。可以从大量来源收集数据,从运行 ML 算法的微型 MCU(例如振动传感器)到大型中央计算节点,”Arm 汽车和物联网业务线产品管理总监 Tom Conway 说。“这些数据可以在本地进行解释,然后通过汽车网络进行通信。这些车辆级数据可以在传输到云端(车辆边缘处理)之前进行汇总和进一步解释。然后,汽车原始设备制造商(或车队经理、物流公司等)可以在云端将车辆数据聚合到车队或车辆模型数据中,以实现预测性维护,例如:'车轮轴承上的微小振动 [在这种车辆类型的总和,在这种地理环境下,在这种天气下] 会导致 1000 英里的故障。建议在 500 英里内对这辆车进行维护。'”
当然,传统汽车时代的一些假设正在打破它,老化就是其中之一。当汽车停放和关闭时,汽车电子设备不会停止老化。“即使它坐在车库里,自动驾驶汽车也永远不会熄火,”Maamari 说。“他们可能坐在车库里,但他们还活着,他们仍然通过手机通信,他们更新,他们在后台进行自我检查。即使您的汽车在车库中,软件更新也会发生。”
Synopsys 拥有一个生命周期管理平台,可从过程/电压/温度 (PVT) 传感器、测试设计 (DFT)、内置自测 (BiST) 资源、结构和功能监视器、嵌入式片上分析以及数据传输。目标是将信息从芯片获取到进行进一步分析、控制和优化的位置。
“这里的想法是使用传感器——这些往往是与路径相关的过程、电压、温度和老化测量(例如,路径延迟)——然后是进入芯片的控制 IP,以管理所有对此,”马马里说。“您还可以将这些数据与分析结合使用,以找出异常值。这就是以多种不同方式进入设计的反馈循环。例如,我们可以先找到敏感和失败的路径,然后在我们进行设计时使用这些信息来实际增加余量,让我们在这些方面有更多的松懈,这样我们就可以有一个芯片这将工作 15 年而不是 10 年。”
同时,proteanTecs 使用通用芯片遥测 (UCT) 监控每个 SoC 的深度数据。通过为每个芯片编译跨阶段测量,机器学习分析软件为任何特定芯片和整个芯片组的预期行为制定了基线。使用这种方法监控系统以检测由磨损、老化或随机故障引起的潜在异常行为。目标是为任务中的预防行动获得深入的数据可见性,其中包括动态适应和性能优化,这是机器学习的主要问题之一。随着这些系统的适应,并不总是清楚这会如何影响其他系统。
“即使在车辆部署到现场之前,我们也必须确保已采取所有可靠性和安全措施,”proteanTecs 的内容营销经理 Rafi Spiewak 说。“通过将从生命周期不同阶段提取的 UCT 数据结合起来,并用其他数据源对其进行扩充,价值链上的制造商可以将质量提高十倍,防止质量逃逸或‘行走受伤’。这是通过高度先进的异常值检测方法获得的,该方法可以剔除未检测到的缺陷,而不会影响良好的产量。即使在表征和鉴定期间,也会对性能限制进行调整和优化,以确保有足够的可靠性裕度。”
数据的所有权现在也使反馈循环和生命周期管理成为可能。“我们正在谈论从汽车内部芯片内部收集数据,我们认为市场正在解决这个问题,”费什说。“今天,数据是从汽车中收集的,并在汽车公司内部共享。随着时间的推移,根据地区、合法性、收集数据的一般舒适程度,以及保护数据的保密性和我们对数据的不同用途的能力,数据的所有权将成为我们的推动力在整个设计生命周期中进行更深入的分析。当客户购买汽车或租赁汽车时,问题就会出现。他们对发送的数据感到满意吗?市场对此进行了投票并说,'是的,我们是。
结论
有一件事是肯定的——不可靠不是一种选择。“在过去的几十年里,汽车行业在质量方面取得了巨大进步,客户喜欢它,”Maamari 观察到。“今天没有人会买一辆不可靠的汽车。因此,可靠性仍然至关重要。”
用于监控的生态系统、平台和工具才刚刚开始改进,以帮助确保可靠性。“其中一些技术已经存在,而且不仅仅是在未来。我们今天已经在生产中使用了许多这些组件。我们正在快速添加其他部分,与客户合作伙伴合作以突破极限,”他说。
但是将数据输入设计反馈循环的各种选择和方法将继续存在。“我们相信解决方案是一种多方面的方法。没有一种方法可以解决所有问题,”KLA 德拉特说。“精心设计、精心打造、低缺陷的设备,采用严格的工艺精心制造,是构建的基础。但我们认为这不是唯一的答案。我们也不认为测试本身是唯一的答案。这些的合并,以及实时诊断和查看整个供应链并发现从设计到最终系统的弱点的能力——所有这些结合在一起是业界创造零缺陷解决方案的最佳希望。这不仅仅是我们中的一个。”
更多芯片相关知识,请搜索“众壹云”