Carbon:解码生命语言
摘要
Hugging Face 发布了 Carbon,一个开放的 DNA 基础模型系列,在匹配 Evo2-7B 最先进性能的同时,速度快 275 倍,采用 6-mer 分词、分解损失和精选的基因组数据。
相似文章
@lvwerra:我们正在发布Carbon:一个快得离谱的DNA模型。Carbon比第二好的模型快275倍。快到你可以处理……
HuggingFace发布了Carbon,一个DNA模型,比之前的最先进模型(Evo2)快275倍,使得在单个GPU上不到两天就能处理整个人类基因组。该模型使用了独特的tokenizer,将序列分割成6碱基的块,同时保持单碱基分辨率,并附带一个交互式演示。
@ClementDelangue: 生物学的未来不应被黑盒API所束缚,尤其是当涉及个人健康时。无论你是……
Hugging Face 发布 Carbon,一个开源DNA基础模型,比同类模型快275倍,可在单个GPU上本地处理整个基因组。
@adithya_s_k: 醒醒吧大家 Huggingface 刚刚开源了基因组基础模型
Huggingface 开源了基因组基础模型,包括 Carbon,一个 DNA 模型,其速度比次优模型快 275 倍,并且可以在单个 GPU 上不到两天内处理整个人类基因组。
LDARNet:用于基因组建模的具有可学习分词的DNA自适应表示网络
LDARNet 是一个拥有1.2亿参数的层次化基因组基础模型,引入了可学习的自适应分词机制(灵感来源于 H-Net 的动态分块),用于DNA序列的掩码语言建模。该模型在5项组蛋白修饰任务上取得了最先进的结果,并在多项基因组基准测试中超越了参数量多达其20倍的模型。其学习到的分词边界与启动子motif和剪接位点等生物学特征高度吻合。
用 OpenAI o1 解码遗传学
# 用 OpenAI o1 解码遗传学 来源: [https://openai.com/index/o1-genetics/](https://openai.com/index/o1-genetics/) 2024年9月12日 ChatGPT ## Catherine Brownstein: OpenAI o1 与遗传学 认识一下 OpenAI o1——新系列 AI 模型,设计用于在响应前花更多时间思考。这个新系列 AI 模型能够推理复杂任务,并在科学、编码和数学方面解决比之前模型更难的问题。