@RealYDT: https://x.com/RealYDT/status/2065641164016120201

X AI KOLs Timeline 工具

摘要

微软推出MarkItDown工具,旨在将各种文档格式(如PDF、Word、Excel)转换为Markdown,以方便大模型和RAG系统处理企业数据。

https://t.co/WQQPlLrGlA
查看原文
查看缓存全文

缓存时间: 2026/06/13 15:01

微软 MarkItDown 深度拆解:为什么大模型时代我们需要“万物皆可 Markdown”?

在大模型(LLM)和检索增强生成(RAG)如火如荼的今天,开发者面临的最大痛点之一,往往不是算法和模型本身,而是如何优雅地处理企业的“脏数据”。 PDF 格式的论文、排版复杂的 Word 报告、多工作表的 Excel

相似文章

更多QAT内容以及毛茸茸的tick

Reddit r/LocalLLaMA

作者发布了Gemma 4模型(12B和31B)改进后的GGUF量化版本,采用了更精确的量化感知训练过程,相比原版量化实现了更低的KLD和更高的同top百分比。

跨领域操作序列抽象为可解释工作流

arXiv cs.AI

本文介绍WorkflowView,一个利用大语言模型将低层次、嘈杂的用户操作序列抽象为可解释的高层次活动的框架,并在浏览器日志、MOOC辍学预测和隐私保护的文档工作流分析中展示了其有效性。