Skip to main content

8月11日内容汇总

· 15 min read
加菲猫

alt text

封面图:Safe by construction - Roberto Clapis

🌟 AI 相关

技术资讯

最新研究:大语言模型使用Json格式输出会降低模型性能吗

太卷了,本周新鲜出炉的RAG论文都在这了

🌟 95% 向量资源节省,火山引擎云搜索 RAG 技术体系演进

LLaMA3.1为什么选择405B作为最大参数量

Karpathy观点惹争议:RLHF不是真正的强化学习,谷歌、Meta下场反对

XetHub 加入 Hugging Face!

Qwen2-Math开源!初步探索数学合成数据生成!

没有等来Qwen2.5,但等来了Qwen2-Math

看完MindSearch源码,这就是我想要的Agent Plan!

Llama3训练每3小时崩一次?豆包大模型、港大团队为脆皮万卡训练提效

GLM大模型的机器翻译能力测试

从头预训练一只迷你 LLaMA 3

最高优化529倍!豆包大模型团队&港大提出ByteCheckpoint提效LLM训练

GPT-4o新版本突然上线:丝滑解决9.11和9.9谁大,更强也更便宜了

泄露!Apple Intelligence提示词原来是这样,还告诉大模型:别幻觉

大模型推理优化实践:KV cache复用与投机采样

特定领域的模型微调是否有意义?BioRAG,一个大型 RAG 实际应用案例告诉您

Agentic RAG Golden-Retriever:显著提升企业知识库问答准确性、检索效率!

AIGC大模型实践总结

多图、视频首上端!面壁「小钢炮」 MiniCPM-V 2.6 模型重磅上新!魔搭推理、微调、部署实战教程来啦!

图解大模型计算加速系列:vLLM源码解析1,整体架构

SFT Packing数据拆分和4D mask详解

🌟 错误率从10%降至0.01%,领英全面分享LLM应用落地经验

LLM101n 硬核代码解读:Micrograd,一个轻量级的自动微分引擎

如何把 PyTorch 的 GPU 利用率提升到 100%

大模型微调到底有没有技术含量

量化方法怎么选?如何评估量化后的大模型LLM

如何用FP8训练大模型

Mem0唱罢,Memary登场!

🌟 CUDA性能简易优化(一)背景知识

一文看尽LLM对齐技术:RLHF、RLAIF、PPO、DPO……

LLM可解释性的未来希望?稀疏自编码器是如何工作的,这里有一份直观说明

MindSearch技术详解,本地搭建媲美Perplexity的AI思·索应用!

【LLM数据工程】LLMs-开源数据-微调数据集总结v2.0

Meta与伯克利最新:元奖励Prompt,让LLM作为元法官能自我改进(包含Prompt模板)

⭐️ Go & 云原生 & Rust 相关

技术资讯

从源代码中窥探 Go 的 WaitGroup 实现和应用

Golang 中对时间控制的方法和技巧

Golang面试题: Go 性能说明

利用go trace优化垃圾回收

Kubernetes 中的 Sidecar 模式:Go 语言实战指南

没有什么不可能:修改 Go 结构体的私有字段

Golang面试题:常量 const

Rust 迭代器并非速度致胜

go-sqlbuilder:灵活强大的Go语言SQL语句构建库,兼具零配置ORM功能

Go 1.22.6 和 Go 1.21.13 刚刚发布,未包含 security fix

Go1.23 新特性:slices、panic、cookie 等函数改进,效率提高了!

Go的GMP模型真的“简单”

Golang面试题:GC 触发时机

🌟 Golang 并发的 fork/join 模式

go-chi:用于构建 Go HTTP 服务的轻量级且可组合的路由器

学习 Kubernetes 源码的过程中,我沉淀的笔记方法

Golang面试题:Redis 的回收策略(淘汰策略)

深入探究 K8S Pod 安全策略与准入控制器:构建坚不可摧的容器安全防线

K8S 配置魔法:ConfigMap & Secret 的神秘世界

深入解析 Kubernetes RBAC:保障集群安全与权限管理的利器

在 K8S 中部署高可用 Redis 集群

深入解析 K8S 原理及各组件的神秘面纱

使用TLA+形式化验证Go并发程序

通过写 Kubernetes 专栏,我不断在进化

Golang面试题:写屏障

📒 后端相关

微服务架构拆分的 7 大黄金法则

想要支持百万长连接,需要调优哪些参数

手把手教你用程序 Debug TCP连接的断开流程

什么是数据库的逻辑删除?数据库的物理删除和逻辑删除有什么区别

从0到1大实战:穿透 SpringCloud 工业级 底座工程,15大圣经,实力瞬间爆表

一套万能的异步处理方案!

📒 前端相关

小红书的pc端瀑布流的效果是怎么实现的