Skip to main content

2月4日内容汇总

February 4, 2024 · 5 min read

前端开发 @NETEASE

alt text

封面图：图文吃透Golang net/http 标准库--服务端

🌟 AI 相关

Large Language Models for Mathematical Reasoning: Progresses and Challenges

A Comprehensive Survey of Compression Algorithms for Language Models

The Power of Noise: Redefining Retrieval for RAG Systems

Corrective Retrieval Augmented Generation

从零构建现代深度学习框架(TinyDL-0.01)

本地运行面壁智能的“贺岁模型”：MiniCPM 2B

「我在淘天做技术」2024年看AIGC是如何让1688主图焕发新春的

大模型推理框架RTP-LLM对LoRA的支持

LLM之LangChain（五）| 使用LangChain Agent分析非结构化数据

LLM之RAG理论（六）| 高级RAG指南和技巧

从零手搓MoE大模型，大神级教程来了

RAG进阶多用户多文档

RAG 进阶 LlamaIndex多文档

RAG 进阶多模态图片检索

RAG 进阶半结构化数据

LlamIndex二 RAG应用开发

LlamaIndex 一简单文档查询

使用 Docker 快速上手中文版 LLaMA2 开源大模型

部署必备—triton-inference-server的backend（一）——关于推理框架的一些讨论

TensorRT-LLM初探（一）运行llama，以及triton tensorrt llm backend服务化

H100推理飙升8倍！英伟达官宣开源TensorRT-LLM，支持10+模型

大语言模型推理提速：TensorRT-LLM 高性能推理实践

⭐️ Go & 云原生 & Rust 相关

Go1.22 新特性：性能提高、Trace 大修、工作区支持 vendor 等

json.Marshal为什么会对[]byte类型进行base64编码处理

Go调度器系列解读（二）：Go 程序启动都干了些什么

Go语言中的Pinner.Pin

Kubernetes 调度器队列 - 设计与实现

Go语言通知协程退出(取消)的几种方式

Go语言中常见100问题-#97 Not relying on inlining

程序员才懂的乐趣：10亿行的挑战

Kubernetes 调度器 - 核心流程 (下篇)

Go调度器系列解读（一）：什么是 GMP

Kubernetes 调度器 - 核心流程 (上篇)

图文讲透Golang标准库 net/http实现原理 -- 服务端

利用 ChatGPT 高效搜索Go问题：举一反三的思考方式，高效查找解决方案

Go语言中常见100问题-#96 Not knowing how to reduce allocations

从慢速到SIMG: 一个Go优化的故事

📒 后端相关

8种专坑同事的 SQL 写法，性能降低100倍，不来看看

批量执行Redis命令的四种方式！

阿里面试：设计一个大并发、大数据的系统架构，说说设计思路

码哥字节 124 篇优秀文章精选

Kafka性能篇：为何Kafka这么"快"

Redis 核心篇：唯快不破的秘密

链路追踪落地过程中的挑战与解决方案

美团面试：Sentinel底层滑动时间窗限流算法怎么实现的

字节二面：Spring Boot Redis 可重入分布式锁实现原理

纠正误区：这才是 SpringBoot Redis 分布式锁的正确实现方式

分库分表的 21 条法则，hold 住！

腾讯二面：epoll性能那么高，为什么

📒 前端相关

扩展你的前端知识库，毫无废话！

TypeScript 5.4 beta: NoInfer 类型、闭包类型分析优化、条件类型判断优化等

升级到 React 18 的经验和教训

🌟 AI 相关
⭐️ Go & 云原生 & Rust 相关
📒 后端相关
📒 前端相关