Ask HN: 你正在做什么项目?(2026 年 5 月)

Hacker News Top 事件

摘要

这是一个 Hacker News 社区讨论串,开发者在此分享他们当前的项目,包括名为 Clipper 的 Docker 镜像优化工具、名为 RVW 的持续学习 Transformer 变体、名为 Rankr 的排名应用,以及名为 Webhound 的 AI 深度研究工具。

你正在做什么项目?有什么新点子正在构思吗?
查看原文
查看缓存全文

缓存时间: 2026/05/10 21:45

# Ask HN: 你们在做什么?(2026年5月) 来源: https://news.ycombinator.com/item?id=48085993 https://news.ycombinator.com/vote?id=48088401&how=up&goto=item%3Fid%3D48085993 我正在构建 https://clipper.dev/ Docker 处理大镜像时……速度相当慢。我构建了一个包含注册中心 + 拉取客户端 + Buildkit 构建器的系统来改善这一点。它将层分离,允许相关文件在相关镜像之间共享。在机器人领域,这可以将拉取速度提高 10 倍。而在云端环境中,该格式允许在 15 或 20 秒内拉取镜像,而不是 60 秒,且无需使用 FUSE 进行惰性拉取。构建速度更快,由于更好的去重机制,我存储的数据减少了 7 倍;由于无需解包 tarball 层,我可以更快地运行安全扫描,等等。我希望在未来成为所有机器学习相关工作的默认注册中心。 https://news.ycombinator.com/vote?id=48088370&how=up&goto=item%3Fid%3D48085993 我一直在研究 RVW,这是我对标准 Transformer 模型的一种改编,能够进行在线持续学习而不会出现灾难性遗忘。我终于发表了早期实验的首篇预印本:https://doi.org/10.5281/zenodo.20064617 现在,我正致力于扩展这项研究,增加参数规模并提升性能。我刚刚完成了一项对 Nemotron 风格 RVW 模型的极其严苛的测试,该测试由各种随机领域的片段与长段单一领域数据交替组成。在整个过程中,模型没有遗忘(实际上在一些更具挑战性的领域上表现有所提升)。在 SmolTalk 上的困惑度(PPL)仍在 ~18 左右,我希望将其进一步降低,但这仅仅是在只有 40 亿参数的情况下实现的。 目前,我正在训练一个基于 Llama 3.2 风格的 RVW 模型,仅约 20 亿参数,看看效果如何。根据结果,我接下来可能会尝试 Gemma 4。 https://news.ycombinator.com/vote?id=48088374&how=up&goto=item%3Fid%3D48085993 我制作了 https://rankr.click/ 这是一个小型 Web 应用程序,允许对各类抽象实体进行排名。可以将其看作是书籍领域的 Goodreads、葡萄酒领域的 Vivino、电影领域的 Letterboxd 等的结合体。这将允许你在一个地方对任何你想要的内容在不同类别中进行排名。 利用你在这些不同领域的排名,你可以分析自己的喜好;未来我计划添加一个小型的个人(非广告)推荐引擎,根据你在众多不同类别中的实际兴趣帮你发现新事物。 从技术角度来看,这是一个绝佳的学习机会,让我了解到如何使用一个有明确意见导向但跨平台的编排工具来完全托管整个技术栈,使我能够快速在任何地方(裸金属 VPS、自搭建系统、云提供商)托管它。 https://news.ycombinator.com/vote?id=48088385&how=up&goto=item%3Fid%3D48085993 我们正在开发 Webhound —— 一种预算控制的长期深度研究工具。你设定一个预算,Webhound 将使用相应的计算资源/LLM Token 来研究你的提示,内置验证周期,并可选添加额外的验证预算。每一个主张都附有证据和指向产生该主张的工具调用的直接链接。 我们的目标是为一位真正的研究人员构建深度研究产品,因为我们相信这是一种极其强大但目前仍处于萌芽阶段且拥有巨大潜力的产品 —— 我们已经在一些早期用户身上看到了这一点。 https://webhound.ai/ https://news.ycombinator.com/vote?id=48088371&how=up&goto=item%3Fid%3D48085993 我最近转向开发 VST 音频插件,我非常喜欢它。已经完成了 3 个 [0][1][2],如果能从中获得一些收入,我打算继续做下去。我用 TypeScript 开发它们,然后通过 Webview 转换为 C++,这样我就有了一个与 DAW 中获得的插件几乎相同的 Web 演示版本。 [0]: https://technokick.com/ (Techno Kick 合成器) [1]: https://riviera-demo.surge.sh/ (混响效果器) [2]: https://ya3.surge.sh/ (TB-303 合成器克隆版) https://news.ycombinator.com/vote?id=48088356&how=up&goto=item%3Fid%3D48085993 https://surmai.app/ 我正在开发一款个人/家庭旅行组织工具。起初它是一个让我和我伴侣共同规划旅行的工具。在过去几年中进展平稳。注重隐私和自托管能力。当然,如果你不介意我访问你的数据,也有托管版本可用。 https://news.ycombinator.com/vote?id=48087657&how=up&goto=item%3Fid%3D48085993 我们正在开发 Drawers(https://drawers.computer/),一款 macOS 应用,为你的每个项目提供专属的 Dock、空间和工作区。 我们与 macOS 空间集成,以便在每个空间中切换出专属于该项目的 Dock,其中仅包含该项目所需的资源。我们实现了向 Dock 添加细粒度资源(例如特定的 Slack 频道而不是整个 Slack 应用)的功能,以保持 Dock 高度聚焦于你所需的内容。 我们构建这个工具是为了在使用电脑工作时保持专注,因为我们认为原生的界面将所有项目混合在一起,导致我们分心。 正在寻找测试人员!免费下载地址:https://drawers.computer/ https://news.ycombinator.com/vote?id=48087796&how=up&goto=item%3Fid%3D48085993 太棒了!!自从我拿到 Mac 以来一直想构建类似的东西 —— 从未动手 —— 很高兴你们做到了。 它是否支持应用内的项目上下文(如默认文件夹和设置)? https://news.ycombinator.com/vote?id=48087908&how=up&goto=item%3Fid%3D48085993 是的!每个抽屉(项目)都有其自己的文件夹路径。我们已经集成了如 Figma、WhatsApp、Messages 和 Slack 等应用,使它们专注于单一项目。 非常想听听你认为我们接下来应该添加什么功能! https://news.ycombinator.com/vote?id=48088239&how=up&goto=item%3Fid%3D48085993 我正在开发 https://engine.build/ 这是一个用于 AI 代码生成的持久化编排系统,解决了无法信任 LLM 在没有人工监视和监控的情况下完成长时间(且高质量)实现的问题,而我认为这正是使用 AI 编程中最令人疲惫的部分。 你从规范或程序化任务列表开始,引擎运行整个工作流:实现、验证、审查、修复和最终定稿。 它将代理式编码视为一个持久化的 CI 风格过程,内置状态、重试、审查者反馈、提交和可审计性。它是外部编排的,这意味着不是代理在运行循环,而是简单地将代理用作工具,并在需要时在循环中生成,而代理本身对循环没有感知。 它即将开源,旨在不替代你现有的 IDE 或首选的代理框架。你可以继续使用 codex/claude code/open code/cursor/pi 等任何你喜欢的工具,只需通过 MCP/CLI 和其他集成点将实际实现委托给引擎。 它支持任何 LLM 提供商,因此例如你可以让 GPT 5.5 进行实现,并在每个阶段混合使用 Opus 4.7 / Deepseek v4 Pro / GPT 5.5 进行审查。 在网站上注册或关注我们在 https://x.com/enginedotbuild 或我个人在 https://x.com/aljosa 上的动态,迫切需要更多粉丝 :D https://news.ycombinator.com/vote?id=48088364&how=up&goto=item%3Fid%3D48085993 我正在开发 https://fdeploy.com/ fDeploy 是一个自托管的 Windows 部署自动化工具 —— 一种轻量级的本地替代 Octopus Deploy 的方案。它由一个服务器(带有 Web UI 的 Windows 服务)组成,用于编排发布,以及安装在目标 Windows 机器上的代理,用于跨环境执行部署步骤(IIS 站点、文件复制、脚本等)。 https://news.ycombinator.com/vote?id=48087749&how=up&goto=item%3Fid%3D48085993 正在开发 tsz(https://tsz.dev/) 这是一个注重性能的 TypeScript 检查器,用 Rust 编写。始于 5 个月前,代码主要由 AI 生成。今天 tsc 一致性测试通过率为 99.8%。单文件基准测试比 tsgo 快 3-5 倍。 https://news.ycombinator.com/vote?id=48086783&how=up&goto=item%3Fid%3D48085993 [无 AI] 作为一名拥有 20 多年经验的举重运动员,我正在开发一种基于较新 IMU 硬件技术的杠铃速度和路径跟踪传感器,这使得它比基于摄像头或执行器的系统更精确且成本更低。最终,它有助于你更安全、更好地举重和训练。 它是工业设计、硬件、固件和软件(当然还有一些运动科学)的交汇点。这个交汇点尚未被 LLM 主导,因此感觉焕然一新。 目前处于早期原型阶段,即“将树莓派绑在杠铃上”,但前景看好,我很乐意推进,同时也利用我之前在中国 12 多年的联系。 https://news.ycombinator.com/vote?id=48087211&how=up&goto=item%3Fid%3D48085993 这里有一个约 20 年历史的举重爱好者。这听起来像是一个很棒的项目!杠铃路径是安全和“更好”举重的主要指标吗?我很久以前曾想过做一个自动化的“姿势检查周五”项目,使用 Pi + 网络摄像头。 https://news.ycombinator.com/vote?id=48088092&how=up&goto=item%3Fid%3D48085993 谢谢!我认为对于“标准”举重动作(深蹲、硬拉、划船,以及在某种程度上军姿推举),垂直杠铃路径在数学上是最优的,而对于各种横向或矢状面运动,你会用较弱的稳定肌做更多工作,并对关节施加横向负荷。这是能增强核心力量的生产性工作吗?可能吧,但很难量化。它会导致受伤吗?绝对会。 对于更复杂的举重动作,如卧推(J 形)或抓举(S 形),例如,我更愿意与教练一起设定一个“黄金样本”路径并与之比较。 它不太可能是唯一指标,特别是考虑到不同体型的人的反向运动学(长/短股骨等),但结合杠铃速度,*随着时间的推移*,它可以提供很多良好的反馈。 https://news.ycombinator.com/vote?id=48088275&how=up&goto=item%3Fid%3D48085993 我正在开发 https://www.certkit.io/。它最初是作为处理我的其他 SaaS 产品的 TLS 证书自动化的解决方案而诞生的,但我们意识到运行本地工作负载的其他人可能会从中受益。 它默认使用 Let's Encrypt。我们使用委托 DNS 来处理 ACME 挑战验证(我们运行 DNS,你只需要 CNAME 指向我们)。这意味着你不需要向我们提供 DNS 凭据或任何其他内容。对于高可用性工作负载来说,这非常棒,因为有一个中央证书清除中心 —— 所以你 Web 农场(或任何地方)中的所有机器都获得相同的证书,但你不会因为 LE 的速率限制而遇到问题。 我们是前 Windows Server 技术人员,因此我们确保我们的自动化也能处理痛苦的 Windows 工作负载,如 IIS、Exchange 等。 我们收到了足够的兴趣,因此正在认真构建它。上个月刚刚退出测试阶段。 https://news.ycombinator.com/vote?id=48087260&how=up&goto=item%3Fid%3D48085993 我每周进行 3 次体操训练,外加 Ironman 70.3 的准备,这意味着我的训练分布在 Garmin、Polar、Withings + FIT 文件以及主流应用无法建模的前水平(front-lever)会话中。所以我构建了一个同时支持这两者的应用(并且已经使用了 4 年多):记录自定义力量动作(前水平、FLAC、3/4 引体向上),将连接的设备(Polar、Garmin、Suunto、Withings、Apple Health)聚合到一个每周视图中。目前正尝试看看是否可以将一些 AI 洞察整合到我的训练常规中。应用目前免费,因为它对我而言成本不高(目前仅为服务器成本),欢迎评论/用例:https://obitrain.com/ https://news.ycombinator.com/vote?id=48087350&how=up&goto=item%3Fid%3D48085993 为什么需要这么多不同的设备?(假设这是导致这种分散的唯一原因) 基于设备的强度追踪对我来说仍然非常奇怪。 https://news.ycombinator.com/vote?id=48087669&how=up&goto=item%3Fid%3D48085993 你看过那个梗图模板吗,中等智力的人想用一千种复杂的东西来优化他们的体验,但原始人和天才都保持简单? 我认为这是一个完美的例子……某个地方,一个天才和一个原始人正快乐地一起锻炼,仅仅为了享受运动的乐趣并感受身体的良好状态,而附近有一个中等智力的人,佩戴着价值一个小村庄 GDP 的可穿戴电子设备,哀叹自上次装备跑步以来 VO2MAX 下降了 0.1%,不知道快乐去哪儿了。 https://news.ycombinator.com/vote?id=48088043&how=up&goto=item%3Fid%3D48085993 在这种情况下,它可能并没有看起来那么复杂,他们可能使用 Polar 设备进行锻炼追踪,Suunto 用于马拉松训练/徒步,Garmin 作为日常手表(支付、音乐等)。再加上 Withings 秤和 iPhone,你正在处理一个应用程序的大熔炉。 https://news.ycombinator.com/vote?id=48087785&how=up&goto=item%3Fid%3D48085993 我没有为 Ironman 训练过,但为马拉松训练过。我认为某些面向指标的工作确实有帮助!但我被你这篇帖子逗笑了。很高兴看到两面性。 https://news.ycombinator.com/vote?id=48088244&how=up&goto=item%3Fid%3D48085993 我目前正在与 Garmin *出色的* Connect IQ 手表应用平台搏斗(它太糟糕了)。 我正在开发 <https://untether.watch/>。试图每天将 20-30 次微小的手机交互转移到手腕上,以最终减少手机使用。傻瓜手机太极端了 —— 你需要智能手机来进行某些日常活动(银行事务等)。 手表是一个很好的形态 —— 它的屏幕很烂(MIP),人体工学别扭(旋转并向下看),功能有限。但这正是重点!执行必要的快速操作,让手机不在视线范围内。 需要 Android 伴侣应用来承担繁重的工作。使用(头)戴式电话麦克风和 STT 回复任何 Android 通知并做笔记。更多功能即将推出。 Garmin 的 SDK 真的很有挑战性。API 经常在不同固件之间断裂,开发工具有限,测试也很困难。 https://news.ycombinator.com/vote?id=48087684&how=up&goto=item%3Fid%3D48085993 精美的套件。从外观上看,我完全不知道它是如何工作的,太棒了。请发布一篇完整的介绍文章。 https://news.ycombinator.com/vote?id=48088323&how=up&goto=item%3Fid%3D48085993 这是一个相当直接的技术,显示屏位于底部,玻璃立方体内有一个以 45 度角面对你的镜子(你可以在侧墙上看到镜子的边缘),它将来自底部显示屏的图像反射出来,使其看起来像全息图。 https://news.ycombinator.com/vote?id=48086277&how=up&goto=item%3Fid%3D48085993 在提出和实施了许多“好主意”但无法跟进使其成为产生收入的产品之后,这是我目前最好的尝试。 我一直想构建一个现实生活中的拼图游戏,由应用/移动设备辅助。我又经历了一次顿悟时刻,并构建了一个可用的原型(后端加 iOS 应用)。从小圈子中获得良好的反馈。 有一段时间,我注意到某人(我见过面)从事类似的主题(但是非技术性的)。我接近她,我们喝了咖啡,我推销了这个想法以及她如何将其实现,因为我负责技术方面。她加入了。 我们已经投入了两个半星期,全速前进,正在为(我们的受众)打造一些很棒的东西。我未来的联合创始人非常棒,见解深刻,有主见,有动力。我们可能在几周内发布,一款拼图游戏的免费/MVP 版本。 我经历了许多次试图起步的迭代。尝试过技术联合创始人,以及过去几年的单打独斗(在完成编码后非常艰难)。但现在感觉对了。一款为普通人提供乐趣的拼图应用/游戏。以及一个

相似文章

Show HN: 上下文工程的完整参考实现

Hacker News Top

上下文工程的完整参考实现——这是一门设计、检索和向 AI 系统注入组织上下文的学科,用于生成准确的、特定领域的输出。该仓库展示了五个组件(语料库、检索、注入、输出、执行)与 Amazon Bedrock 和 Claude 的整合。

@yoheinakajima: 全新的 http://di.gg 看起来很棒!

X AI KOLs Following

这是来自 Digg 的热门 AI 新闻汇总,涵盖了 Neuralink 脑机接口植入物、NVIDIA 针对 Claude Code 的性能修复、Anthropic 的政策立场以及 Flowception 视频建模代码的发布等话题。