@Snow_Wo1f: 很难想象这么个小东西能运行70B的模型,然后在无限token的环境下轻松生成各种AI被封禁的内容以及黄片

X AI KOLs Timeline 产品

摘要

A user comments on a small device that can run a 70B model and generate uncensored AI content including pornography.

很难想象这么个小东西能运行70B的模型,然后在无限token的环境下轻松生成各种AI被封禁的内容以及黄片🤔 https://t.co/CKsgvGw4oV
查看原文
查看缓存全文

缓存时间: 2026/06/03 03:41

很难想象这么个小东西能运行70B的模型,然后在无限token的环境下轻松生成各种AI被封禁的内容以及黄片🤔 https://t.co/CKsgvGw4oV

相似文章

@NFTCPS: 4GB显存跑70B大模型?这事儿真成了! AirLLM玩了个骚操作——分层推理,不一次性把模型怼进显存,而是一层层加载、算完就扔,硬生生把巨无霸塞进小破卡。 最骚的是:100%开源,白嫖警告 https://github.com/0xSo…

X AI KOLs Timeline

AirLLM 是一个完全开源的工具,通过分层推理技术(逐层加载并立即释放显存),使得 70B 大语言模型可在仅 4GB 显存的 GPU 上运行,无需量化、蒸馏或剪枝,并已支持 Llama3.1 405B 在 8GB 显存上运行。