NVIDIA 的新指南解释了如何构建基于 Transformer 的交易基础模型,这是用于欺诈检测和金融情报的关键 AI 工具。
NVIDIA 发布了由人工智能主导的开发者蓝图,用于构建交易基础模型 (TFM),这是一类经过优化以分析金融交易数据的人工智能系统。这些模型旨在为欺诈检测、信用评分和个性化财务洞察等用例提供支持,标志着人工智能在结构化财务数据中的应用向前迈出了一步。
TFM 使用转换器架构,类似于大型语言模型 (LLM) 背后的架构,但针对表格和顺序事务数据进行了定制。 NVIDIA 的指南引导开发人员对数十亿交易的模型进行预训练,并使其适应下游任务。据该公司称,与传统模型相比,遵循此工作流程可以将欺诈检测的平均精度 (AP) 提高近 50%。
为什么重要
金融机构越来越多地利用 TFM 从交易数据中获取更丰富的见解。与传统的基于规则的系统不同,TFM 可以学习大量交易序列中的关系,捕获可能表明欺诈、信用度或消费者行为的上下文。例如,一系列小额购买和随后的高额交易可能会标志着潜在的欺诈行为,而旧型号很容易错过这种模式。
TFM 的推动正在加速。 Mastercard 和 Plaid 等主要参与者最近推出了自己的交易基础模型,Adyen 透露在 51 万亿代币上训练人工智能模型以增强欺诈检测。 NVIDIA 的蓝图标准化了该流程,使其可供更广泛的金融公司使用。
工作流程
NVIDIA 的 TFM 指南概述了五个步骤的过程:
- 数据准备:使用 NVIDIA cuDF 库等 GPU 加速工具高效处理交易数据集。
- 自定义标记化:将交易标记为语义单元,减少冗余,同时保留关键行为信号。
- 模型预训练:使用 NVIDIA 的 NeMo 框架训练 Transformer 解码器,该框架针对大规模 AI 开发进行了优化。
- 嵌入提取:为下游任务生成交易历史的固定长度向量表示。
- 任务微调:将嵌入与传统功能相结合,以提高欺诈检测等任务的性能。
在使用 IBM TabFormer 欺诈数据集的基准测试中,NVIDIA 报告称,与单独使用传统功能相比,将 TFM 嵌入与传统功能相结合时,AP 提高了 41.76%。
变压器和财务数据
Transformers 擅长分析序列,这使得它们特别适合交易历史。例如,像“工资存款、租金支付、杂货购买”这样的简单序列提供了静态表格数据无法提供的行为背景。 Transformer 中的自注意力机制使模型能够突出显示相关模式,例如旅行期间的不规则支出。
TFM 补充了其他金融人工智能方法,例如图神经网络 (GNN),它可以分析帐户和商家等实体之间的关系。这些方法共同提供了更全面的金融活动视图。
行业影响
随着 TFM 越来越受欢迎,它们代表了向统一人工智能系统的转变,该系统可以在金融运营中服务于多种目的。这反映了人工智能的更广泛趋势,即在海量数据集上训练的基础模型针对特定任务进行了微调。对于金融机构来说,这意味着效率的提高——一个模型可以处理欺诈预防、客户细分和合规性监控。
通过提供这一蓝图,NVIDIA 将自己定位为金融人工智能生态系统的关键基础设施提供商。随着采用率的增长,成功实施 TFM 的公司可以在欺诈检测和运营扩展等领域获得竞争优势。
下一步是什么?
NVIDIA 的指南现已发布,开发人员可以通过 GitHub 或 NVIDIA 的 Launchable 平台访问完整的工作流程。随着 Mastercard、Plaid 和 Adyen 等主要参与者已经在这一领域进行了大量投资,在整个金融领域部署 TFM 的竞争可能会加剧。对于交易者和投资者来说,这一趋势标志着对人工智能驱动的金融技术的信心增强,这可能会重塑行业的竞争动态。
