Skip to main content

技术周刊二十六

· 7 min read
fengjutian

AI Engineering Hub

alt text

这是一个专注于AI工程实践的GitHub仓库,提供关于大语言模型(LLMs)、检索增强生成(RAGs)和真实AI应用场景的详细教程。无论你是初学者还是专业人士,都能在这里找到实用的代码示例和资源,帮助你快速上手和扩展AI项目。仓库鼓励大家参与贡献,还提供免费的数据科学电子书和最新资讯订阅。所有内容采用MIT开源协议,欢迎一起交流学习!

地址:https://github.com/patchy631/ai-engineering-hub

Depixelization_poc

alt text

这是一个能够从马赛克图片中还原出原始文字的工具。它的原理是利用马赛克生成时相邻像素块之间的颜色关联性,通过比对特殊字符序列的样本图片,来推测被模糊的文字内容。这个项目特别适用于处理用简单马赛克方式模糊的文字截图,比如聊天记录或文档中被打码的部分。

地址:https://github.com/spipm/Depixelization_poc

Gooey

alt text

它是一个用 Go 语言编写的 WebAssembly 框架,主要用于构建 Web 应用。

地址:https://github.com/cookiengineer/gooey

htmldocs.js

alt text

一个现代化的 LaTeX 替代方案,使用 React、JSX 和 Tailwind CSS 来创建 PDF 文档模板

地址:https://github.com/htmldocs-js/htmldocs

【星辰Agent】【https://github.com/iflytek/astron-agent?tab=readme-ov-file】

alt text

星辰Agent是一个企业级、商业友好的 Agentic Workflow开发平台,融合了 AI 工作流编排、模型管理、AI 与 MCP 工具集、RPA 自动化和团队空间等特性。 平台支持高可用部署,帮助企业快速构建可规模化落地的智能体应用,打造面向未来的 AI 基座。

地址:https://github.com/iflytek/astron-agent?tab=readme-ov-file

qscan

alt text

一个速度极快的内网扫描器,具备端口扫描、协议检测、指纹识别,暴力破解,漏洞探测等功能。支持协议1200+,协议指纹10000+,应用指纹20000+,暴力破解协议10余种

地址:https://github.com/qi4L/qscan

Skill Seekers

alt text

一个自动化工具,用于将文档网站、GitHub 仓库和 PDF 文件转换为 Claude AI 可用的技能包。

地址:https://github.com/yusufkaraaslan/Skill_Seekers

ladybird

alt text

Ladybird是一个真正独立的网页浏览器,采用全新的引擎并基于现代网页标准开发。它采用多进程架构,包括独立的渲染进程、图像解码进程和网络请求进程,以提高安全性和稳定性。目前项目处于预发布阶段,适合开发者参与。Ladybird可在Linux、macOS和Windows等系统运行,并继承了SerenityOS的多个核心组件。该项目采用2-clause BSD开源协议,欢迎开发者加入社区共同建设。

地址:https://github.com/LadybirdBrowser/ladybird

Public APIs

alt text

这是一个收集了各种免费API的GitHub仓库,里面包含了大量不同领域的公共接口,比如天气、股票、动物、动漫、书籍等。你可以直接使用这些API来开发自己的应用或项目,无需付费。这个仓库由社区成员和APILayer团队共同维护,相当于一个免费API的宝藏库,方便开发者快速找到需要的接口。

地址:https://github.com/public-apis/public-apis

Goose

alt text

Goose是一个开源的AI助手,专门为开发者设计,能帮你自动完成各种编程任务。它不只是简单的代码补全,还能从头开始构建项目、编写执行代码、调试错误、管理复杂的工作流程,甚至和外部API交互。你可以把它当作一个本地AI小助手,支持各种大语言模型,还能通过桌面应用或命令行使用,让开发更高效。无论是快速原型设计还是优化现有代码,Goose都能帮你节省时间,专注于创新。

地址:https://github.com/block/goose

System Design Primer

alt text

系统设计

地址:https://github.com/donnemartin/system-design-primer?tab=readme-ov-file

Olmocr

alt text

这是一个由艾伦人工智能研究所开发的OCR工具包,专门将PDF和图片文档转换成干净易读的纯文本格式。它能智能处理复杂的排版布局,包括表格、公式和多栏内容,还能自动去除页眉页脚,让文档保持自然的阅读顺序。这个工具特别适合为大型语言模型准备训练数据,处理百万页文档的成本不到200美元。

地址:https://github.com/allenai/olmocr

mem0ai

alt text

为 AI 提供可扩展的长期记忆,使其能记住用户偏好、适应个性化需求,并持续学习。

地址:https://github.com/mem0ai/mem0

cpp-httplib

这是一个用C++写的超轻量级HTTP库,只需要包含一个头文件就能让你的程序变身Web服务器或客户端。它特别适合快速搭建简单的网络服务,比如写个接口测试工具或者小型网站后端。用它写个返回"Hello World"的服务器只需要几行代码,而且同时支持HTTP和HTTPS协议,用起来非常方便。

地址:https://github.com/yhirose/cpp-httplib

MONAI

alt text

地址:https://github.com/Project-MONAI/MONAI

OpenTelemetry Collector

alt text

地址:https://github.com/open-telemetry/opentelemetry-collector

oxdraw

alt text

一个 Rust 语言编写的 Web 服务,用来可视化生成图表,同时给出对应的 Mermaid 语法代码。

地址:https://github.com/RohanAdwankar/oxdraw

docs

alt text

一个开源的内容管理系统,支持多人实时协作,需要自搭建。

地址:https://github.com/suitenumerique/docs

Shadcn Themer

alt text

这个网站收集 ShadCN UI 的各种主题。

地址:https://shadcnthemer.com/