Skip to main content

9月1日内容汇总

· 6 min read
加菲猫

alt text

封面图:Safe by construction - Roberto Clapis

🌟 AI 相关

一个开源、清晰、强大且可定制的RAG UI

🌟 LRP4RAG、RAGLAB、PermitQA、LegalBench-RAG:本周10余篇论文讨论RAG,有兴趣的可以看看

AgentMove、DrugAgent、AppAgent:本周智能体应用相关论文

Mamba作者新作:将Llama3蒸馏成混合线性 RNN

Meta-Knowledge RAG:显著提升传统RAG的6大性能指标

校招生做大模型,选预训练还是SFT

Concise Thoughts:仅通过长度限制,获取更简明的CoT能大幅度提升效果

从RAG到TAG:探索AI与数据库的完美结合

【LLM模型微调】LLMs-微调经验-LLaMA微调指南v7.0

大模型摘要的姿势,prompt chain还是stepwise

🌟 Qwen2-VL发布,支持复杂推理与决策的可视化Agent!

🌟 一本详解15种高级RAG技术的使用手册

Qwen2-VL开源,让我感觉新的时代要来了!

🌟 大模型SFT的局限性

🌟 Qwen2-VL 全链路模型体验、下载、推理、微调实战!

贾扬清点赞,马斯克XAI发贺电:SGLang v0.2推理Llama 3.1 405B秒杀vLLM、TensorRT-LLM

OpenRLHF:大规模分布式RLHF训练系统介绍

斯坦福、伯克利大学新思路:TAG,结合了Text2SQL和RAG的新设计范式,效果更好、速度更快

🌟 Agents时代的Workflow,用AgWf重塑流程挖掘,CrewAI实现

PUA 大模型之后,效果起飞了!

🌟 【小白必备】Meta祭出三篇最详尽的LLaMA微调指南

大模型微调终极指南

多模态大模型--任意模态大一统处理

GraphRAG重走西游路,看悟空那些年历经的劫难!

Windows、Mac只是装了个夸克,整个电脑都AI了!

Flux第四弹-秒级生图,字节开源Hyper-sd支持Flux,支持多LoRA叠加!

RAG效果优化:高质量文档解析详解

浅谈cuda graph在llm推理中的应用

8岁女孩玩转AI编程,45分钟打造聊天机器人,Karpathy都看呆了

从Think-on-Graph(ToG)到ToG 2.0:用知识图谱Prompt让LLM实现深度推理,ICLR2024

RecLLM-Gen:将LLM应用于推荐系统

LLM 剪枝+蒸馏:NVIDIA 的最佳实践

RAGLAB:又来一个RAG框架,还是模块化的

又见惊雷,结构化Prompt格式小小变化竟能让LLM性能波动高达76%,ICLR2024

ggml 简介

这段时间搞大模型的血和泪

⭐️ Go & 云原生 & Rust 相关

New unique package

用 Go 语言构建轻量级 ChatGPT 网页版

微服务该如何应对过量请求

Go 1.23 新特性:slices 和 sync 等核心库的微调,大幅提升开发体验

用 Rust 和 Tide 框架快速构建 CRUD API

Go 1.23 新特性解读:unique 包及其应用

一文读懂10种最经典的设计模式

使用 go trace 优化 Golang 中的 GC

Rust 错误处理:thiserror vs. anyhow

128核CPU就有罪了?channel并发变慢的锅CPU可背不起

Go必知必会:Go RPC揭秘构建高效远程服务的指南

Go 语言函数的幕后:从符号表到栈帧

Go 入门指南:5.6. 标签与 goto

Go必知必会:协程(下):协程和通道的使用时机

Go 总负责人 rsc 即将卸任,回顾他的光与暗!

写给go开发者的gRPC教程-拦截器

IEEE Spectrum 2024排行榜:Rust和TypeScript崛起,Go语言表现如何

Go 入门指南:5.5. Break 与 continue

📒 后端相关

看了Redis高手心法,我现在强的可怕!

如何从实验中获得更多?——AB实验的异质性分析实践

SRE 必备知识 - Kafka 探秘之零拷贝技术

万字详解缓存一致性协议与内存屏障(漫画风)

RocketMQ为什么这么快?我从源码中扒出了10大原因!

通过实验深入了解 TCP 连接的建立和关闭

使用 SpanMetrics Connector 将 OpenTelemetry 跟踪转换为指标

📒 前端相关

GitHub + VitePress,或许是你做笔记的新路子

写给懒人的Vue3快速查阅宝典