封面图:Safe by construction - Roberto Clapis
🌟 AI 相关
TC-RAG: Turing-Complete RAG--图灵完备的检索增强
🌟 Weavel Ape超过DSPy,或将成为最好用的提示(prompt)优化工具
Karpathy狂赞AI代码神器Cursor,直言回不到3年前无辅助编码了,却被指「带货」
如何解读 Yann LeCun推文建议学生不要在大模型方向工作
RAGLAB、TC-RAG、CommunityKG-RAG、W-RAG:这周怎么这么多RAG
【LLM模型微调】LLMs-PEFT[微调]-LoRA总结笔记v5.0
FLUX第三弹:直面天命,FLUX.1-LoRA/IP-adapter「黑神话:悟空」生图实战
微软「小而美」系列三连发!视觉小钢炮 PK GPT-4o,MoE 新秀力压 Llama 3.1|AGI 掘金资讯
豆包“听力”水平现场开箱!看Seed-ASR如何突破语音识别瓶颈
英伟达仅用380B tokens训练刷新8B模型新SoTA,剪枝和蒸馏应该这么用
社区供稿 | 使用 Hugging Face 和 Milvus 构建 RAG 系统
Plan-based Retrieval,告别AI的胡言乱语
Ilya Sutskever 预测:GPT-5 之后,AGI 将降临
一文看懂GraphRAG:蚂蚁集团联合各所名校出品GraphRAG综述
不花一分钱!GPT-4o微调限时免费开放,每日附赠百万训练token
多图理解,更懂中文,支持function call的Phi-3.5来了!
谢谢微软,又又又Open了!一口气发布3款Phi-3.5新模型,领先Llama3.1和谷歌同级模型
1000个样本胜过百万数据?Meta AI最新研究引发行业震动
🌟 RAG 检索大升级:BM25 与 RRF 助力 LLMs 精准破局
使用 Dify 和 AI 大模型理解视频内容:Qwen 2 VL 72B
Multi-Meta-RAG:langchain点名,评论爆吹的新研究
AgentWrite:为什么你的模型生成的内容长度总是不超过2K
🌟 RAG 进阶:一个 ctrl-c 就能拿走的图文检索框架
工业界Agentic RAG方案-Golden-Retriever
WeKnow-RAG:结合网络搜索和知识图谱的自适应检索增强生成方法
阿里开源通用多模态大模型mPLUG-Owl3:迈向多图长序列理解
⭐️ Go & 云原生 & Rust 相关
- QUIC协议的一些基操解释
- Rust实现的一个狭义相对论模拟
- Rust中的Mutex, Atomics 和 UnsafeCell。这篇文章主要讨论了Rust中的Mutex、Atomics和UnsafeCell的实现原理和相关概念:
- 文章通过自定义实现AtomicUsize来探讨原子操作的原理。作者发现简单使用UnsafeCell并不能实现真正的原子性,因为编译器会对其进行优化。
- 真正的原子操作需要使用编译器内部函数(intrinsics)来实现,这些函数不仅生成原子指令,还会告诉编译器不要对其进行优化。
- Mutex的实现基于UnsafeCell和一个原子整数。获取锁时使用原子的compare_exchange操作,释放锁时使用原子操作配合内存顺序(memory ordering)来保证可见性。
- 内存顺序(如Acquire和Release)不仅影响生成的机器指令,还会限制编译器的优化,从而保证跨线程的内存访问顺序。
- VolatileCell用于嵌入式系统中访问内存映射I/O。它使用volatile读写操作,但仍存在一些安全性问题。
- volatile操作与原子操作不同,不能建立happens-before关系。对于DMA等操作,需要额外使用内存屏障(fence)来保证顺序。
- 文章深入探讨了UnsafeCell、原子操作、内存顺序等概念如何在底层影响Rust的并发安全性,对理解Rust的并发模型很有帮助。
Go1.23 新特性:再开后门,可以记录未捕获的 panic 和 throw 日志了!
🌟 Kitex Thrift Streaming 在字节跳动 Prompt 平台的实践
一款支持自动流水线和客户端缓存的 Go 语言 Redis 客户端
了解 Golang 中的内存管理:Stack vs Heap
📒 后端相关
一线实战:运维人少,我们是如何从 0 到 1 实践 DevOps 和云原生