de-identification

标签

Cards List
#de-identification

650多个Apache-2.0许可的生物医学NER/去标识化模型,在MLX中设备端运行。相同fp32权重,输出一致:临床NER模型在3年前的M3 Max上比PyTorch-CPU快30-40倍。内部可复现。

Reddit r/LocalLLaMA · 12小时前

650多个Apache-2.0许可的生物医学NER和去标识化模型集合,通过MLX在设备端运行,在M3 Max上实现比PyTorch-CPU快30-40倍的推理速度,且输出一致。

0 人收藏 0 人点赞
#de-identification

移除还是保留?用于教育对话去标识化的全本地AI级联

arXiv cs.CL · 6天前 缓存

本文提出了一种用于教育对话去标识化的全本地AI级联框架,结合了先召回候选生成器与上下文感知的移除/保留评审器。该方法在不将数据发送到外部API的情况下实现了高精度,在数学辅导记录上优于更小的本地模型和商业API。

0 人收藏 0 人点赞
#de-identification

Meddies PII:用于临床文本的开源多语言去标识化模型

Reddit r/LocalLLaMA · 2026-06-08

Meddies PII 是一个用于临床文本去标识化的开源多语言模型及数据集,旨在移除患者标识符的同时保留临床事实。它利用动态提示生成的合成数据,以处理多样化的真实世界格式。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈