structured-data

#structured-data

根据阅读者身份变化的PDF

Hacker News Top ↗ · 2天前缓存

本文介绍了一种技术，利用PDF规范中的替换文本属性，在PDF内部嵌入隐藏的Markdown结构，使得LLMs能够提取干净、结构化的数据，而人类看到的仍然是相同的视觉文档。

0 人收藏 0 人点赞

#structured-data

用机器重建我的博客，为机器服务·

Lobsters Hottest ↗ · 4天前缓存

作者重建了博客，加入了完整的结构化数据标记（JSON-LD、微格式），并配备了一个由提示词引导的AI协作写作助手，该提示词避免了常见的LLM模式，同时通过CI验证防止数据损坏。

0 人收藏 0 人点赞

#structured-data

向系统推销你的业务以被选中

Reddit r/AI_Agents ↗ · 4天前

本文认为，AI代理无法通过人类情感策略进行营销；相反，品牌必须提供结构化、机器可读的数据。文章指出了被AI提及（引用）与被AI选中（选择）之间的差距，并提出了一个由五个文件组成的框架，用于提供代理可读的品牌信息。

0 人收藏 0 人点赞

#structured-data

CRAFT：面向表格问答与事实验证的统一反事实推理框架

arXiv cs.CL ↗ · 2026-06-08 缓存

CRAFT是一个统一的反事实推理框架，通过构建原始陈述和反事实变体，从双向推理路径中提取证据，并通过加权机制进行整合，从而提升了表格问答和事实验证的效果。在WikiTQ和TabFact数据集上的实验表明，该框架持续优于基线方法。

0 人收藏 0 人点赞

#structured-data

@gkxspace: 发现一个很疯狂的开源工具，你输一句话描述你要什么数据，它派出一群 AI Agent 并行跑到各个网站上调研，几分钟后汇总成一张结构化表格给你其实数据都摆在网上，但想变成一张能用的表格，历来都是苦力活，过去这是一个工程项目：拼搜索、写爬…

X AI KOLs Timeline ↗ · 2026-06-03 缓存

BigSet 是一个开源工具，输入一句话描述所需数据，它会派出多个 AI Agent 并行在网络上调研，自动推断 schema、去重、验证并生成结构化表格，支持定时刷新。

0 人收藏 0 人点赞

#structured-data

现在AI代理需要RSS的功能

Hacker News Top ↗ · 2026-06-02 缓存

长期用于播客的RSS订阅源，正变得对AI代理至关重要——它们需要确定性的、结构化的内容访问，且不受算法干预或速率限制。

0 人收藏 0 人点赞

#structured-data

从结构化临床数据预测心血管风险的大语言模型

arXiv cs.CL ↗ · 2026-06-02 缓存

本文提出了一种混合框架，将结构化临床数据与LLM生成的叙述相结合，用于冠状动脉疾病预测，在变量提取方面实现了高保真度，并比较了机器学习模型与基于LLM的零样本和少样本分类。

0 人收藏 0 人点赞

#structured-data

我正在构建一个旅行生态系统，让人工智能代理能够真正使用经过验证的旅行数据

Reddit r/AI_Agents ↗ · 2026-05-26

作者分享了他们对Orizn的愿景，这是一个旨在为AI代理提供经过验证的结构化数据和API的旅行生态系统，用于可靠的旅行规划、签证信息和行程组织。

0 人收藏 0 人点赞

#structured-data

DodoForm

Product Hunt ↗ · 2026-05-25

DodoForm 是一款将语音、图片或手写笔记转化为整洁结构化数据的工具。

0 人收藏 0 人点赞

#structured-data

我不再让代理浏览Hacker News

Reddit r/AI_Agents ↗ · 2026-05-20

作者解释了为什么他们不再使用基于浏览器的LLM代理来浏览Hacker News，而是构建了一个插件（MediaUse），直接获取结构化数据，从而节省令牌，并将模型的重点放在分析而非导航上。

0 人收藏 0 人点赞

#structured-data

AI代理应如何理解产品与服务？

Reddit r/AI_Agents ↗ · 2026-05-14

文章认为，AI代理需要超越营销口号的结构化、准确的产品描述，才能做出可靠的推荐，并质疑应由谁提供和验证此类数据。

0 人收藏 0 人点赞

#structured-data

双层引导的自描述结构化数据：大规模 LLM 知识导航中精准检索的轻量级 RAG 替代方案

arXiv cs.CL ↗ · 2026-04-23 缓存

SDSR 提出轻量级自描述结构化数据，并辅以双层引导，利用 LLM 的首位偏差，在无向量数据库的情况下实现 100% 路由准确率。

0 人收藏 0 人点赞

structured-data

提交意见反馈