Skip to main content

8月25日内容汇总

· 9 min read
加菲猫

alt text

封面图:Safe by construction - Roberto Clapis

🌟 AI 相关

TC-RAG: Turing-Complete RAG--图灵完备的检索增强

🌟 Weavel Ape超过DSPy,或将成为最好用的提示(prompt)优化工具

小波降噪加持,xLSTM-TS 模型解码股市“天机”

Karpathy狂赞AI代码神器Cursor,直言回不到3年前无辅助编码了,却被指「带货」

如何解读 Yann LeCun推文建议学生不要在大模型方向工作

RAGLAB、TC-RAG、CommunityKG-RAG、W-RAG:这周怎么这么多RAG

李沐重返母校,上交大秒变追星现场,大模型趋势无保留分享

我们给大模型去掉了“AI味”-大模型微调全链路实战

以DeepSeek-VL为例,详解视觉语言模型原理及代码

用于复杂RAG任务的先进可控Agent

【LLM模型微调】LLMs-PEFT[微调]-LoRA总结笔记v5.0

如何用Prompt技巧激发无限创意

FLUX第三弹:直面天命,FLUX.1-LoRA/IP-adapter「黑神话:悟空」生图实战

微软「小而美」系列三连发!视觉小钢炮 PK GPT-4o,MoE 新秀力压 Llama 3.1|AGI 掘金资讯

豆包“听力”水平现场开箱!看Seed-ASR如何突破语音识别瓶颈

英伟达仅用380B tokens训练刷新8B模型新SoTA,剪枝和蒸馏应该这么用

社区供稿 | 使用 Hugging Face 和 Milvus 构建 RAG 系统

大模型厂商纷纷入局的Prompt Cache技术解析

披上Agent盔甲的RAG,从此不再只是召回生成!

Plan-based Retrieval,告别AI的胡言乱语

速度与精度的结合:Faster R-CNN模型的性能剖析

Ilya Sutskever 预测:GPT-5 之后,AGI 将降临

一文看懂GraphRAG:蚂蚁集团联合各所名校出品GraphRAG综述

不花一分钱!GPT-4o微调限时免费开放,每日附赠百万训练token

多图理解,更懂中文,支持function call的Phi-3.5来了!

大模型训练实战经验总结

谢谢微软,又又又Open了!一口气发布3款Phi-3.5新模型,领先Llama3.1和谷歌同级模型

1000个样本胜过百万数据?Meta AI最新研究引发行业震动

极限套娃,Agent自动设计Agentic系统!

🌟 RAG 检索大升级:BM25 与 RRF 助力 LLMs 精准破局

使用 Dify 和 AI 大模型理解视频内容:Qwen 2 VL 72B

一文讲明白大模型显存占用(只考虑单卡)

使用FP8进行大模型量化原理及实践

大模型到底需要消耗多少GPU显存?公式和工具全都有

Multi-Meta-RAG:langchain点名,评论爆吹的新研究

RAG真的是LLM的未来吗

OpenAI 绝密项目「草莓」技术详解

AgentWrite:为什么你的模型生成的内容长度总是不超过2K

Meta-Rewarding :LLM对齐新技术

🌟 RAG 进阶:一个 ctrl-c 就能拿走的图文检索框架

RAG 如何选择 chunksize 和 splitter

工业界Agentic RAG方案-Golden-Retriever

WeKnow-RAG:结合网络搜索和知识图谱的自适应检索增强生成方法

阿里开源通用多模态大模型mPLUG-Owl3:迈向多图长序列理解

⭐️ Go & 云原生 & Rust 相关

技术资讯
  • QUIC协议的一些基操解释
  • Rust实现的一个狭义相对论模拟
  • Rust中的Mutex, Atomics 和 UnsafeCell。这篇文章主要讨论了Rust中的Mutex、Atomics和UnsafeCell的实现原理和相关概念:
    • 文章通过自定义实现AtomicUsize来探讨原子操作的原理。作者发现简单使用UnsafeCell并不能实现真正的原子性,因为编译器会对其进行优化。
    • 真正的原子操作需要使用编译器内部函数(intrinsics)来实现,这些函数不仅生成原子指令,还会告诉编译器不要对其进行优化。
    • Mutex的实现基于UnsafeCell和一个原子整数。获取锁时使用原子的compare_exchange操作,释放锁时使用原子操作配合内存顺序(memory ordering)来保证可见性。
    • 内存顺序(如Acquire和Release)不仅影响生成的机器指令,还会限制编译器的优化,从而保证跨线程的内存访问顺序。
    • VolatileCell用于嵌入式系统中访问内存映射I/O。它使用volatile读写操作,但仍存在一些安全性问题。
    • volatile操作与原子操作不同,不能建立happens-before关系。对于DMA等操作,需要额外使用内存屏障(fence)来保证顺序。
    • 文章深入探讨了UnsafeCell、原子操作、内存顺序等概念如何在底层影响Rust的并发安全性,对理解Rust的并发模型很有帮助。

Range Over Function Types

Go 1.23 is released

Go 1.18之后的语法新特性Quiz,你能做对几个

Rust的Pin类型是用来做什么的,以及为什么它很难使用

Rust 中 @ 符号的高级应用和最佳实践

[译] Range Over Function Types

探索 Go 标准库中的优雅设计模式:函数与接口的结合

Go 入门指南:5.2. 测试多返回值函数的错误

Go 项目结构的简洁实现 | GitHub 3.5k

Go GOPATH 模式未来会怎么样,会消失吗

Go1.23 新特性:再开后门,可以记录未捕获的 panic 和 throw 日志了!

🌟 Kitex Thrift Streaming 在字节跳动 Prompt 平台的实践

一款支持自动流水线和客户端缓存的 Go 语言 Redis 客户端

Go必知必会:协程(上):进程、线程、协程的区别和联系

Golang面试题:strings 和 strconv 包

基于 Gin 框架的 Go 后端架构最佳实践

继Ollama之后,Go在AI领域再下一城

了解 Golang 中的内存管理:Stack vs Heap

Go必知必会:构建复杂数据模型的基石

Go 1.23中值得关注的几个变化

写给go开发者的gRPC教程-通信模式

Golang面试题:基本类型和运算符

📒 后端相关

互联网根服务器只有13台,是真的吗

一线实战:运维人少,我们是如何从 0 到 1 实践 DevOps 和云原生

千万级数据的全表update的正确姿势!

系统设计:在搜索系统实现缓存的策略与思考

ByteHouse高性能向量检索实践——“以图搜图”

AI 网关零代码解决 AI 幻觉问题

📒 前端相关

2024最新VSCode实用插件推荐,开发效率遥遥领先!超全面,快收藏~

把黑神话悟空视频设置为vscode背景,真的太炫酷了