标签
650多个Apache-2.0许可的生物医学NER和去标识化模型集合,通过MLX在设备端运行,在M3 Max上实现比PyTorch-CPU快30-40倍的推理速度,且输出一致。
本文提出了一种用于教育对话去标识化的全本地AI级联框架,结合了先召回候选生成器与上下文感知的移除/保留评审器。该方法在不将数据发送到外部API的情况下实现了高精度,在数学辅导记录上优于更小的本地模型和商业API。
Meddies PII 是一个用于临床文本去标识化的开源多语言模型及数据集,旨在移除患者标识符的同时保留临床事实。它利用动态提示生成的合成数据,以处理多样化的真实世界格式。