Skip to main content

7月28日内容汇总

July 28, 2024 · 13 min read

前端开发 @NETEASE

alt text

封面图：Safe by construction - Roberto Clapis

🌟 AI 相关

技术资讯

从零到一使用 Ollama、Dify 和 Docker 构建 Llama 3.1 模型服务

RAG优化: 非结构化文档解析方案汇总

OpenAI主管Lilian Weng分享RAG对抗LLM幻觉策略

ChatQA2：RAG好还是长上下文模型好

小模型狂飙！6家巨头争相发布小模型，Andrej Karpathy：大语言模型的尺寸竞争正在倒退...

SearchGPT第一波评测来了！响应速度超快还没广告，“OpenAI杀手锏”

斯坦福重磅，用这条Prompt让LLM说话之前先思考

为什么说大模型训练很难？聊聊预训练的一些经验

LLM101n 硬核代码解读：手把手教你用PyTorch实现多层感知机MLP

一大堆Llama3.1-Chinese正在袭来

为什么AI数不清Strawberry里有几个 r？Karpathy：我用表情包给你解释一下

解密企业级 AI 平台架构：从零到一构建实战指南

大模型训练方法论及Yi-Large的实践

图解Attention优化: 从Online-Softmax到FlashAttention V1/V2/V3

Meta亲自下场教学Llama3.1 Agent/RAG！

微软最新，让Prompt进化自动化，用Auto EvolInstruct来拯救你的结构化提示词

🌟 不止llama 3.1！Meta还同步开源了安全审核和提示词注入、越狱校验的2个新模型

🌟 Meta开源的Llama官方Agent：Llama-Agentic-System深度解析

大模型结构的进化：LLaMA 3.1结构及影响解析

Large Enough！Mistral Large 2开源！魔搭推理、微调最佳实战教程来啦！

打乱/跳过Transformer层会怎样？最新研究揭开其信息流动机制，一口气解答8大问题

ICML最佳论文曾被ICLR拒稿，Pika联创参与，一作已入职OpenAI

RLHF不够用了，OpenAI设计出了新的奖励机制

重磅！Mistral Large 2深夜发布！Llama3.1仅一天被超越，最强开源再易主

Llama 3.1 - 405B、70B 和 8B 的多语言与长上下文能力解析

🌟 LLama3 405B 技术解读

llama 3.1终于开源！速览技术报告中最有意思的17个新要点

Meet Llama3.1，405B赶超最强闭源模型！上魔搭社区一站体验、下载、推理、微调、部署

击败GPT-4o的开源模型如何炼成？关于Llama 3.1 405B，Meta都写在这篇论文里了

LLM 应用可观测性：从 Trace 视角展开的探索与实践之旅

CUDA性能简易优化（一）背景知识

看完Mem0的源码，它很火，我很懵

🌟 2024年推荐系统技术全面综述：历史、现状、分类、应用、展望

一篇RAG全栈技术最新综述

Llama3.1系列模型正式开源，最大405B，闭源模型的统治时代将迎来结束

使用InternVL、LMDeploy和GTE搭建多模态RAG系统

QOQA：利用TopK文档进行查询改写，平均提升RAG 1.6% 准确率

首个超越GPT4o级开源模型！Llama 3.1泄密：4050亿参数，下载链接、模型卡都有了

最强开源大模型？Qwen2 技术报告解读

盛名一时的BERT哪去了？这个问题的答案昭示了LLM范式的转变

电脑平板组AI集群，在家就能跑400B大模型，GitHub狂揽2.5K星

苹果开源7B大模型，训练过程数据集一口气全给了，网友：开放得不像苹果

关于RAG优化的几个小技巧

YC孵化项目Mem0开源：为AI插上个性化记忆的翅膀

⭐️ Go & 云原生 & Rust 相关

技术资讯

model-mapper: 这个库提供了一个宏，用于实现在不产生模板代码的情况下在各种类型（包括枚举和结构体）之间进行转换的函数
EmbedAnything: 一种极简但高性能、轻量级、多源、多模态和本地嵌入解决方案，内置 Rust
cake - 分布式推理引擎
monitor - Rust实现的编排和部署工具
[rust is best]10 亿行挑战方案。作者尝试优化 Rust 中「10 亿行挑战」的解决方案。从原始的 5 分钟优化到了 9 秒。作者的主要目标是创建一段简单、可维护且生产就绪的代码，而且没有使用不安全的操作。以下是一些关键经验：
- 使用 --release 优化构建
- 避免在关键路径中使用 println!；使用日志库进行调试
- 谨慎使用 FromIterator::collect()；它会触发新的分配
- 最小化不必要的分配，特别是避免使用 to_owned() 和 clone()
- 更换哈希函数，FxHashMap 比标准的 HashMap 稍微更快
- 对于大文件，优先使用缓冲读取而不是加载整个文件
- 当不需要 UTF-8 验证时，使用字节片段（[u8]）而不是字符串
- 只有在优化单线程性能后才进行并行化
Learn a new way to enhance error handling in your Rust projects with program flow tracing using macros and the anyhow crate. Check out this detailed guide!
Discover how GoFr accelerates microservice development with seamless config management, Pub/Sub support, and integrated auth in your Go projects
Learn how to accept Bitcoin payments using Python, Rust, and the PyO3 library. Build and test a non-trivial extension module from scratch
Discover the key to mastering Rust: lifetimes. This article dives into their importance, usage, and practical examples to ensure memory safety in your code
How to Build Your Own Distributed KV Storage System Using the etcd Raft Library (2)

Zed：未来代码编辑器的曙光，Rust实现！

threadsafe：使用Golang实现线程安全的数据结构

Quartz - 一个 Golang 的确定性时间测试库

[小布去面试]Tricky 的 Golang 面试题 - interface = nil

LazyCell 和 LazyLock: Rust 1.80.0 新同步原语

同步和异步 Rust 中的 RESTful API

高效日志管理：深入解析Go Gin框架中的日志处理

Go必知必会：异常处理的关键panic

深入 Golang 中的接口检查机制及工作原理

UUID 和 UUID v7

Go 1.23 中 errors.Is 的一点小改动

超级加速，高效、安全的Go语言代理服务器！-GoProxy

程序员刚开始带项目，要注意学习哪些要领

Go1.23 新特性：新标准库 unique，性能更好，开销更小！

Go必知必会：深入剖析Go语言中的结构体

通过 Go 开始使用 Genkit（Alpha 版）

Golang - range 迭代器揭秘

揭秘 Golang 的异常处理利器: Panic 与 Recover 的深度探索

🌟 Go-Zero 数据库实战：配置、建模与业务逻辑一体化（八）

Go 异步编程小技巧

Genkit - Google 推出 Genkit for Go, 用于以 Go 语言构建 AI 应用

Go 发布 AI 机器人 Oscar，解决开源项目的维护痛点！

Go语言中的SIMD加速：以矩阵加法为例

Rudis：用 Rust 打造的高性能内存数据库

📒 后端相关

🌟 基本功 | 一文讲清多线程和多线程同步

🌟 搜索广告召回技术在美团的实践

Spark向量化计算在美团生产环境的实践

领域驱动设计DDD在B端营销系统的实践

DDD在大众点评交易系统演进中的应用

万字解析 mysql innodb 事务实现原理

金字塔原理：掌握高效沟通的艺术

📒 前端相关

老树开新花：大模型时代的代码执行沙箱

前端打包工具Mako架构解析｜得物技术

得物AB实验平台数据驱动决策实践

「最后一次，彻底搞懂kotlin协程」(一) | 先回到线程

我写了一个ESLint插件，解决了团队棘手问题

🌟 AI 相关
⭐️ Go & 云原生 & Rust 相关
📒 后端相关
📒 前端相关