标签
一款命令行工具和基于浏览器的工具,使用Go和WebAssembly,将PDF转换为仅包含图像的PDF,并模拟扫描效果,如倾斜、灰度、噪点和JPEG伪影。
作者描述了自己通过拍摄多张相似照片意外创建wigglegram(立体GIF)的过程,并编写了一个使用感知哈希的脚本,自动从其iCloud照片库中检测并拼接这些照片。
Deconvolution 是一个用于图像去卷积与恢复的 Rust 库,提供已知 PSF 与盲恢复方法、PSF/OTF 转换、预处理及模拟工具。
Apple 宣布推出适用于 Core Image 的 RAW 9,这是一项重大更新,它使用分块的 CoreML 模型,在 Apple Neural Engine 上结合了去马赛克和降噪,从而显著提升了 Apple 平台上的 RAW 图像质量。
一份详细的技术指南,解释 Exif 元数据结构、它如何存储在 JPEG 及其他图像格式中,以及针对处理图像像素数据的开发者的实用注意事项。
文章比较了归一化RGB值的两种方法(除以255 vs 除以256),并解释了浮点数转换和舍入的后果,包括在极端值处不均匀的区间宽度。
FaceFusion 是一个拥有 28.5k star 的开源人脸融合/Deepfake 平台,支持本地高精度人脸交换、唇形同步,以及图片、视频和批量处理,提供完整的任务管理系统。
Bun.Image 是一个零依赖的可链式图像处理管道,用于解码、调整大小、旋转和重新编码 JPEG、PNG、WebP、HEIC 和 AVIF 格式,在后台线程运行,灵感来自 Sharp。
一个CLI和库,用于移除由各种AI模型生成的图像中的可见和不可见AI水印,包括元数据剥离和基于扩散的再生。
Arthur Pastel 优化了 Rust image-rs crate 中的 fast_blur 函数,通过使用盒式模糊近似实现更快速的高斯模糊效果,在处理 u8 图像时速度提升最高达 5.9 倍。
Maxime Rivest 指出,面向图像的复合 AI 系统目前被严重低估,他建议借助 DSPy 和 GEPA 等优化框架,实现涉及 SAM 与分类器的流水线自动化构建。
一种单次方法将在线 k-means 调色板优化与 Bayer 有序抖动结合,省去了独立的像素映射步骤,带来轻微提速并生成视觉上更有趣的结果。
对 24 张图像的柯达 PCD0992 图集进行首次逐图 PCA 分解,发现其在通道间冗余度上跨越两个数量级的精心策划。
OpenAI 发布了 o3 和 o4-mini 模型,这些模型能够在链式思维过程中对图像进行推理,通过裁剪和缩放等原生图像操作工具实现视觉理解,无需额外的专用模型。这些模型在包括 STEM 问题、图表阅读和视觉搜索任务在内的多模态基准上达到了最先进的性能。
851-labs/background-remover 是一个开源AI模型,用于移除图像背景。可在Replicate上使用,在Nvidia T4 GPU上推理成本低且速度快。