TwinCAT Chat 助力实现 AI 辅助工程
通过 TwinCAT Chat,可在 TwinCAT XAE 开发环境中方便地使用以 OpenAI 开发的 ChatGPT 为代表的大型语言模型(LLM)进行项目开发,在此次访谈中,TwinCAT 产品经理 Fabian Bause 博士和 Jannis Doppmeier 介绍了从控制编程到企业管理等各个方面最重要的应用考虑以及潜在的效率提升。
自 ChatGPT 推出以来,每个人都在谈论大型语言模型(LLM)。通过 TwinCAT Chat,倍福成为在 2023 年汉诺威工业博览会上展示大语言模型在自动化领域应用的首批供应商之一。客户在展会上以及展会后的反馈如何?
Jannis Doppmeier:客户的反馈始终都是积极正面的。管理层和直接用户都表现出了浓厚的兴趣。大部分客户都看到了这项技术在自动化领域的巨大应用潜力。有些客户甚至表示有兴趣在将来测试版推出后立即试用。这表明该领域对先进解决方案的需求正不断增长。随着 TwinCAT Chat 的推出,倍福为将 LLM 集成到工业应用中做出了重要贡献。
大型语言模型能为自动化工程师和企业管理层带来哪些根本优势?
Jannis Doppmeier:大型语言模型可为自动化工程师以及企业管理层带来许多好处。对于自动化工程师来说,通过 LLM 的自动生成和补全代码功能有可能彻底改变开发流程。这将加快整个流程。您甚至可以让 LLM 创建个人专题,针对遇到的问题给出具体的解决方案,加快解决问题的过程。另一个优势是能够始终如一地执行和遵守自动化领域的规范和最佳实践。从企业管理的角度来看,LLM 可以推动企业内部的知识传递。它们可以作为一个中央知识库,存储有价值的信息,并在需要时提供。此外,LLM 还可以作为客户咨询时的第一接触点,减轻技术支持团队的工作压力。这不仅能缩短响应时间,还能提升客户满意度。总之,LLM 为应对现代商业领域的众多挑战提供了高效、创新的解决方案。
LLM 在使用方面是否仍存在技术上的不确定性?
Fabian Bause 博士:答案显然是肯定的。技术上确实存在很多不确定性,但考虑到目前的发展速度,这也不足为奇。目前,自动化行业面临的一个主要挑战是 LLM 的“幻觉”,即 LLM 会反复生成用户不一定能识别出的“编造”的答案。例如,在早期开发阶段,我们发现 TwinCAT Chat 生成的 PLC 代码中的一些运动函数根本不存在,至少在 TwinCAT 中不存在。但这些问题都是可以解决的,并且会随着时间的推移得到显著改善。
从法律的角度来看,是否也存在不确定性?
Fabian Bause 博士:确实如此!欧盟的《人工智能法案》目前仍存在不确定性。该法案尚未获得最终通过,仅这一点就给行业带来了极大的不确定性。政策制定者在监管人工智能应用方面面临的一个主要挑战是,政策的推进过程比通用人工智能领域的快速发展速度要慢得多。通用的法律法规将如何适用于很多尚不可知的人工智能发展,我们拭目以待。但毫无疑问,必须完善监管措施。
像 TwinCAT Chat 这样的 AI 应用程序将来是否能够完全取代控制编程人员以及他们的创造力吗?
Fabian Bause 博士:当然不会。我们的目标并不是要完全取代程序员,目前的技术发展也并不意味着会出现这种情况。相反,我们的目标是为程序员提供更好用的工具,帮助他们提高工作效率,这一切都是为了提高程序员的生产力 — 不仅仅是作为解决技能短缺的关键方法之一。如果因为找不到合格的专业人员而无法填补岗位空缺,就必须使用 AI 保持竞争力。
TwinCAT Chat 有哪些技术特点?
Jannis Doppmeier:倍福开发 TwinCAT Chat 的主要目的是为用户提供比在网络浏览器中使用 ChatGPT 等传统方式优势更明显的软件工具。主要附加值在于其深度集成,尤其是针对自动化行业的专业化需求。其核心功能包括将聊天功能直接集成到开发环境(IDE)中。由于它将通信和代码交互无缝集成在一起,因此能够大大简化开发过程。我们的模型的基本初始化已专门针对 TwinCAT 的要求进行了定制。因此,您可以直接提出具体问题,不必告诉模型您首先使用的是 TwinCAT,也不必告诉模型您希望以结构化文本形式提供代码示例。另一个亮点是能够轻松地使用生成的代码,这不仅能够节省开发人员的时间,还能避免手动传输代码时出现的错误。与 TwinCAT Chat 交互设计极大地减少了命令输入需求。相反,用户只需点击鼠标,即可使用专门为改善用户工作流程而设计的、经过预先测试的请求。这些请求包括以下操作:
- 代码优化:系统可以提出建议,以提高代码的性能或效率。
- 代码文档化:TwinCAT Chat 可帮助创建注释和文档,可以帮助团队其他成员更容易地理解代码。
- 代码补全:如果代码片段缺失或不完整,我们的系统可以生成代码补全建议,以确保功能性。
- 代码重构:TwinCAT Chat 可根据特定规范和策略重构代码,使其更加符合公司的规范。
总之,该系统提供了一个高效、直观的用户界面,极大地方便了开发过程。
除了目前重点关注的支持 PLC 代码生成之外,未来还有哪些领域将变得更加重要?
Fabian Bause 博士:LLM 的玄妙之处在于,只需要一点儿想象力,就能普遍使用。除了 PLC 代码生成工具之外,我们还在开发一款可以自动创建 TwinCAT HMI 项目的聊天机器人。目标是用户只需告诉聊天机器人他们想要的 HMI 结构,TwinCAT 就会在后台生成整个 HMI 项目。因此,客户可以立即收到可视化 HMI 的反馈。只需向 LLM 说明 HMI 编程接口即可实现,因为事实上,这也只是另一种 LLM 可以轻松掌握的“语言”。另一个项目涉及到我们文件编制系统的聊天机器人界面,该系统以文档的形式包含了数千兆字节的知识。这正是我们的客户所面临的挑战:我们以文本形式提供大量知识。为什么呢?因为这是让数百人能够同时获得信息的唯一方式,换句话说,书面文本只是一种工具。语言是人类最重要的信息传递手段。一个人提出问题,另一个人理解或者解释问题,并根据自己的经验得出答案。这就是我们可以使用 LLM 完成的事,即我们提出一个问题,LLM 就能解释这个问题。无需使用特定的关键词,因为系统可以处理措辞可能不够准确的问题。如果现在允许 LLM 访问倍福庞大的软件库,模型就能生成有针对性的答案。今后,我们将不再需要使用关键字来搜索答案,而是可以提出具体的问题。
TwinCAT Chat 还可帮助用户开启新的工作模式。这究竟意味着什么?在实际应用中有什么优势?
Jannis Doppmeier:我们的工具是一种创新的解决方案,通过充当数字化助手显著提高开发人员的工作效率。代码不再需要逐行手动输入。这个助手会接管耗时且重复的常规任务。这样,开发人员就有更多的时间和能力专注于他们的核心任务,即软件的实际设计和构思。在这个需要抓住每一个优势的市场中,我们的工具让企业能够在人员短缺的情况下依然保持竞争优势,并满足客户日益增长的需求。
所使用的语言模型有何重要性?
Fabian Bause 博士:目前,多家知名 IT 巨头的语言模型正在激烈竞争,如 openAI 的 ChatGPT、谷歌的 PaLM 和 Bard,以及百度的 ERNIE。这些主流模型的共同点是,它们都以 API 云服务的形式提供。除了技术上的差异,还有区域性挑战。例如,在中国无法访问 ChatGPT 和谷歌的 LLM。这对倍福来说是一个挑战,因为中国市场对我们非常重要。此外,将第三方云服务集成到我们的产品中意味着我们在很大程度上依赖于该供应商。该服务在技术上将如何发展?其稳定性和向后兼容性如何?使用成本如何?以及该服务的隐私策略将如何变化?考虑到这些不确定性,我们正在努力训练我们自己的模型,当然不是从零开始,而是基于用于商业用途的开放式 LLM。这样,我们就不需要与 ChatGPT 等通用模型竞争,而是专注于一个明确定义、范围小得多的应用领域。