Skip to main content

2月4日内容汇总

· 5 min read
加菲猫

alt text

封面图:图文吃透Golang net/http 标准库--服务端

🌟 AI 相关

Large Language Models for Mathematical Reasoning: Progresses and Challenges

A Comprehensive Survey of Compression Algorithms for Language Models

The Power of Noise: Redefining Retrieval for RAG Systems

Corrective Retrieval Augmented Generation

从零构建现代深度学习框架(TinyDL-0.01)

本地运行面壁智能的“贺岁模型”:MiniCPM 2B

「我在淘天做技术」2024年看AIGC是如何让1688主图焕发新春的

大模型推理框架RTP-LLM对LoRA的支持

LLM之LangChain(五)| 使用LangChain Agent分析非结构化数据

LLM之RAG理论(六)| 高级RAG指南和技巧

从零手搓MoE大模型,大神级教程来了

RAG进阶 多用户多文档

RAG 进阶 LlamaIndex多文档

RAG 进阶 多模态图片检索

RAG 进阶 半结构化数据

LlamIndex二 RAG应用开发

LlamaIndex 一 简单文档查询

使用 Docker 快速上手中文版 LLaMA2 开源大模型

部署必备—triton-inference-server的backend(一)——关于推理框架的一些讨论

TensorRT-LLM初探(一)运行llama,以及triton tensorrt llm backend服务化

H100推理飙升8倍!英伟达官宣开源TensorRT-LLM,支持10+模型

大语言模型推理提速:TensorRT-LLM 高性能推理实践

⭐️ Go & 云原生 & Rust 相关

Go1.22 新特性:性能提高、Trace 大修、工作区支持 vendor 等

json.Marshal为什么会对[]byte类型进行base64编码处理

Go调度器系列解读(二):Go 程序启动都干了些什么

Go语言中的Pinner.Pin

Kubernetes 调度器队列 - 设计与实现

Go语言通知协程退出(取消)的几种方式

Go语言中常见100问题-#97 Not relying on inlining

程序员才懂的乐趣:10亿行的挑战

Kubernetes 调度器 - 核心流程 (下篇)

Go调度器系列解读(一):什么是 GMP

Kubernetes 调度器 - 核心流程 (上篇)

图文讲透Golang标准库 net/http实现原理 -- 服务端

利用 ChatGPT 高效搜索Go问题:举一反三的思考方式,高效查找解决方案

Go语言中常见100问题-#96 Not knowing how to reduce allocations

从慢速到SIMG: 一个Go优化的故事

📒 后端相关

8种专坑同事的 SQL 写法,性能降低100倍,不来看看

批量执行Redis命令的四种方式!

阿里面试:设计一个大并发、大数据的系统架构,说说设计思路

码哥字节 124 篇优秀文章精选

Kafka性能篇:为何Kafka这么"快"

Redis 核心篇:唯快不破的秘密

链路追踪落地过程中的挑战与解决方案

美团面试:Sentinel底层滑动时间窗限流算法怎么实现的

字节二面:Spring Boot Redis 可重入分布式锁实现原理

纠正误区:这才是 SpringBoot Redis 分布式锁的正确实现方式

分库分表的 21 条法则,hold 住!

腾讯二面:epoll性能那么高,为什么

📒 前端相关

扩展你的前端知识库,毫无废话!

TypeScript 5.4 beta: NoInfer 类型、闭包类型分析优化、条件类型判断优化等

升级到 React 18 的经验和教训