人工智能如何找到我的模型？考虑数据格式、嵌入和检索策略的模型发现实验研究

arXiv cs.AI 2026/07/01 04:00 论文

simulation-models model-discovery retrieval embeddings data-representation reranking natural-language-queries

摘要

本文介绍了一项关于使用人工智能通过自然语言查询查找仿真模型的实验研究，评估了数据表示、嵌入模型和检索策略，发现开源嵌入和重排序方法显著提高了性能。

arXiv:2606.30846v1 公告类型: 新摘要: 发现可重用的仿真模型仍然是建模与仿真（M&S）中的一个基本挑战。当许多模型共存时，识别与给定建模意图相匹配的模型仍然困难。人工智能（AI）的最新进展，特别是基于检索的方法，为在这一语义层操作提供了一条有希望的途径。在本文中，我们介绍了一项实验研究，调查数据表示、基于Transformer的嵌入模型和检索策略对使用自然语言查询发现仿真模型的影响。我们使用标准信息检索指标（包括recall@5和nDCG@5）评估了多种查询类型的性能。结果表明，数据表示很重要，开源嵌入模型可以达到高性能，并且重排序方法很重要，尤其是在查询复杂度增加时。这项工作为AI驱动的模型发现提供了基准，并讨论了其在推动AI驱动的可组合性和互操作性方面的作用。

查看原文

查看缓存全文

缓存时间: 2026/07/01 05:36

# AI如何找到我的模型？考虑数据格式、嵌入与检索策略的模型发现实验研究
来源：https://arxiv.org/abs/2606.30846
查看PDF (https://arxiv.org/pdf/2606.30846)

> 摘要：发现可复用的仿真模型仍是建模与仿真（M&S）领域的一项根本性挑战。当众多模型共存时，识别出与给定建模意图相符的模型仍然困难。人工智能（AI）的最新进展，特别是基于检索的方法，为在这一语义层面进行操作提供了一条有希望的途径。本文通过实验研究了数据表示、基于Transformer的嵌入模型以及检索策略对使用自然语言查询发现仿真模型的影响。我们使用标准信息检索指标（包括recall@5和nDCG@5）评估了多种查询类型的性能。结果表明：数据表示很重要，开源嵌入模型能够实现高性能，并且重排序方法非常关键，尤其是在查询复杂度增加时。本工作为AI驱动的模型发现提供了基线，并讨论了其在推动AI驱动的组合性与互操作性方面的作用。

## 提交历史

来自：Jhon G. Botello [查看邮件 (https://arxiv.org/show-email/d256b68b/2606.30846)] **[v1]** 2026年6月29日 星期一 19:23:32 UTC (1,078 KB)

人工智能如何找到我的模型？考虑数据格式、嵌入和检索策略的模型发现实验研究

相似文章

BEAMS: AI在建模与仿真中的基准测试与评估

ModelLens：从海量模型中为特定任务甄选最优解

@dbreunig: 推理模型擅长理解细微差别和自然语言。但这种细微之处尚未渗透到检索系统…

Ketch - 本地模型的最佳搜索工具

RealityTest：人们如何探询AI身份及模型是否披露身份

提交意见反馈