Skip to main content

8月25日内容汇总

August 25, 2024 · 9 min read

前端开发 @NETEASE

alt text

封面图：Safe by construction - Roberto Clapis

🌟 AI 相关

TC-RAG: Turing-Complete RAG--图灵完备的检索增强

🌟 Weavel Ape超过DSPy，或将成为最好用的提示（prompt）优化工具

小波降噪加持，xLSTM-TS 模型解码股市“天机”

Karpathy狂赞AI代码神器Cursor，直言回不到3年前无辅助编码了，却被指「带货」

如何解读 Yann LeCun推文建议学生不要在大模型方向工作

RAGLAB、TC-RAG、CommunityKG-RAG、W-RAG：这周怎么这么多RAG

李沐重返母校，上交大秒变追星现场，大模型趋势无保留分享

我们给大模型去掉了“AI味”-大模型微调全链路实战

以DeepSeek-VL为例，详解视觉语言模型原理及代码

用于复杂RAG任务的先进可控Agent

【LLM模型微调】LLMs-PEFT[微调]-LoRA总结笔记v5.0

如何用Prompt技巧激发无限创意

FLUX第三弹：直面天命，FLUX.1-LoRA/IP-adapter「黑神话：悟空」生图实战

微软「小而美」系列三连发！视觉小钢炮 PK GPT-4o，MoE 新秀力压 Llama 3.1｜AGI 掘金资讯

豆包“听力”水平现场开箱！看Seed-ASR如何突破语音识别瓶颈

英伟达仅用380B tokens训练刷新8B模型新SoTA，剪枝和蒸馏应该这么用

社区供稿 | 使用 Hugging Face 和 Milvus 构建 RAG 系统

大模型厂商纷纷入局的Prompt Cache技术解析

披上Agent盔甲的RAG，从此不再只是召回生成！

Plan-based Retrieval，告别AI的胡言乱语

速度与精度的结合：Faster R-CNN模型的性能剖析

Ilya Sutskever 预测：GPT-5 之后，AGI 将降临

一文看懂GraphRAG：蚂蚁集团联合各所名校出品GraphRAG综述

不花一分钱！GPT-4o微调限时免费开放，每日附赠百万训练token

多图理解，更懂中文，支持function call的Phi-3.5来了！

大模型训练实战经验总结

谢谢微软，又又又Open了！一口气发布3款Phi-3.5新模型，领先Llama3.1和谷歌同级模型

1000个样本胜过百万数据?Meta AI最新研究引发行业震动

极限套娃，Agent自动设计Agentic系统！

🌟 RAG 检索大升级：BM25 与 RRF 助力 LLMs 精准破局

使用 Dify 和 AI 大模型理解视频内容：Qwen 2 VL 72B

一文讲明白大模型显存占用（只考虑单卡）

使用FP8进行大模型量化原理及实践

大模型到底需要消耗多少GPU显存？公式和工具全都有

Multi-Meta-RAG：langchain点名，评论爆吹的新研究

RAG真的是LLM的未来吗

OpenAI 绝密项目「草莓」技术详解

AgentWrite：为什么你的模型生成的内容长度总是不超过2K

Meta-Rewarding ：LLM对齐新技术

🌟 RAG 进阶：一个 ctrl-c 就能拿走的图文检索框架

RAG 如何选择 chunksize 和 splitter

工业界Agentic RAG方案-Golden-Retriever

WeKnow-RAG:结合网络搜索和知识图谱的自适应检索增强生成方法

阿里开源通用多模态大模型mPLUG-Owl3：迈向多图长序列理解

⭐️ Go & 云原生 & Rust 相关

技术资讯

QUIC协议的一些基操解释
Rust实现的一个狭义相对论模拟
Rust中的Mutex, Atomics 和 UnsafeCell。这篇文章主要讨论了Rust中的Mutex、Atomics和UnsafeCell的实现原理和相关概念:
- 文章通过自定义实现AtomicUsize来探讨原子操作的原理。作者发现简单使用UnsafeCell并不能实现真正的原子性,因为编译器会对其进行优化。
- 真正的原子操作需要使用编译器内部函数(intrinsics)来实现,这些函数不仅生成原子指令,还会告诉编译器不要对其进行优化。
- Mutex的实现基于UnsafeCell和一个原子整数。获取锁时使用原子的compare_exchange操作,释放锁时使用原子操作配合内存顺序(memory ordering)来保证可见性。
- 内存顺序(如Acquire和Release)不仅影响生成的机器指令,还会限制编译器的优化,从而保证跨线程的内存访问顺序。
- VolatileCell用于嵌入式系统中访问内存映射I/O。它使用volatile读写操作,但仍存在一些安全性问题。
- volatile操作与原子操作不同,不能建立happens-before关系。对于DMA等操作,需要额外使用内存屏障(fence)来保证顺序。
- 文章深入探讨了UnsafeCell、原子操作、内存顺序等概念如何在底层影响Rust的并发安全性,对理解Rust的并发模型很有帮助。

Range Over Function Types

Go 1.23 is released

Go 1.18之后的语法新特性Quiz，你能做对几个

Rust的Pin类型是用来做什么的，以及为什么它很难使用

Rust 中 @ 符号的高级应用和最佳实践

[译] Range Over Function Types

探索 Go 标准库中的优雅设计模式：函数与接口的结合

Go 入门指南：5.2. 测试多返回值函数的错误

Go 项目结构的简洁实现 | GitHub 3.5k

Go GOPATH 模式未来会怎么样，会消失吗

Go1.23 新特性：再开后门，可以记录未捕获的 panic 和 throw 日志了！

🌟 Kitex Thrift Streaming 在字节跳动 Prompt 平台的实践

一款支持自动流水线和客户端缓存的 Go 语言 Redis 客户端

Go必知必会：协程（上）：进程、线程、协程的区别和联系

Golang面试题：strings 和 strconv 包

基于 Gin 框架的 Go 后端架构最佳实践

继Ollama之后，Go在AI领域再下一城

了解 Golang 中的内存管理：Stack vs Heap

Go必知必会：构建复杂数据模型的基石

Go 1.23中值得关注的几个变化

写给go开发者的gRPC教程-通信模式

Golang面试题：基本类型和运算符

📒 后端相关

互联网根服务器只有13台，是真的吗

一线实战：运维人少，我们是如何从 0 到 1 实践 DevOps 和云原生

千万级数据的全表update的正确姿势！

系统设计：在搜索系统实现缓存的策略与思考

ByteHouse高性能向量检索实践——“以图搜图”

AI 网关零代码解决 AI 幻觉问题

📒 前端相关

2024最新VSCode实用插件推荐，开发效率遥遥领先！超全面，快收藏~

把黑神话悟空视频设置为vscode背景，真的太炫酷了

🌟 AI 相关
⭐️ Go & 云原生 & Rust 相关
📒 后端相关
📒 前端相关