标签
本文开发了一个几何框架,利用句子嵌入来衡量文本的语义内容,提出了一个三维语义轮廓(新颖性、广度、整合性)和一个标量权衡三角形,并在合成类别和小说中进行了验证。
本文提出了embeddingmagibu-200m,一个专注于土耳其语的句子嵌入模型,通过跨语言分词器手术和离线蒸馏构建,在土耳其语基准测试中取得了强劲性能,同时实现了成本与质量的平衡。